Google использует адаптивный механизм для сортировки пользовательского контента (UGC), такого как комментарии или посты в социальных сетях, связанных с веб-страницей. Если страница популярна или трендовая («buzzy»), система отдает приоритет самым свежим комментариям. Если страница не является трендовой, система отдает приоритет самым качественным комментариям, основываясь на авторитете автора, длине контента и других сигналах.
Описание
Какую задачу решает
Патент решает задачу определения оптимального порядка отображения пользовательского контента (UGC) — комментариев, отзывов или постов в социальных сетях (называемых в патенте annotations) — связанного с определенным ресурсом (веб-страницей). Проблема в том, что единый метод сортировки неэффективен: для трендового, активно обсуждаемого контента пользователи хотят видеть самые свежие комментарии, тогда как для стабильного («вечнозеленого») контента более ценны самые качественные или полезные комментарии.
Что запатентовано
Запатентована система адаптивной сортировки аннотаций, которая динамически меняет логику сортировки в зависимости от текущей популярности («buzziness») связанного ресурса. Система вычисляет Popularity Score для веб-страницы и сравнивает его с пороговым значением. В зависимости от результата выбирается сортировка по времени (time-based ordering) или по качеству (quality-based ordering).
Как это работает
Ключевой механизм работы системы:
- Определение популярности: Система вычисляет Popularity Score для ресурса. Это основывается на частоте запросов к ресурсу и/или (как указано в Claim 1) частоте его упоминаний в интернет-коммуникациях (социальные сети, блоги, новости) за определенные периоды времени.
- Сравнение с порогом: Popularity Score сравнивается с пороговым значением (Threshold Popularity Score).
- Адаптивная сортировка:
- Если ресурс признан популярным («buzzy»): Аннотации сортируются по времени создания (timestamp), показывая самые свежие первыми. Качество при этом может игнорироваться.
- Если ресурс не признан популярным: Аннотации сортируются по качеству (Quality Score), показывая самые качественные первыми.
- Определение качества UGC: Quality Score аннотации определяется на основе таких факторов, как рейтинг автора, его социальный граф (например, подписчики), длина и язык контента, а также оценки пользователей.
Актуальность для SEO
Средняя. Патент основан на заявке 2010 года и упоминает ныне несуществующий продукт (Google Sidewiki) в качестве примера реализации. Однако базовый принцип — адаптация представления UGC в зависимости от его динамической популярности — остается актуальным. Описанные методы измерения «buzziness» и оценки качества UGC, вероятно, используются в других системах Google (например, сортировка обзоров на Картах, комментариев YouTube).
Важность для SEO
Влияние на SEO оценивается как низкое (3 из 10). Патент не описывает алгоритмы ранжирования основного веб-поиска. Он фокусируется исключительно на сортировке связанного пользовательского контента. Однако он предоставляет ценную информацию о том, как Google измеряет «популярность» или «трендовость» ресурса (Popularity Score) и какие факторы он считает признаками качества для UGC и их авторов (Quality Score).
Детальный разбор
Термины и определения
- Annotation Data Set (Набор данных аннотации)
- Структурированные данные, представляющие пользовательский контент (UGC), связанный с ресурсом (веб-страницей). Включает контент, автора, временную метку и рейтинг/оценку качества. Может быть создан из прямых комментариев или постов в социальных сетях.
- Popularity Score (PS) (Оценка популярности)
- Динамическая метрика, определяющая текущую популярность или «buzziness» ресурса. Рассчитывается на основе частоты запросов и/или упоминаний ресурса в интернете за период времени.
- Overall Popularity Score (Общая оценка популярности)
- Агрегированный показатель популярности. В Claim 1 определяется как агрегация оценок популярности на основе частоты упоминаний в Internet communications за разные периоды времени.
- Threshold Popularity Score (PS_THR) (Пороговая оценка популярности)
- Заданное значение, используемое для классификации ресурса как «популярного» или «непопулярного».
- Quality Score (Оценка качества)
- Метрика, оценивающая качество аннотации. Основывается на факторах автора (рейтинг, социальный граф) и контента (длина, язык, оценки пользователей).
- Time-based ordering technique (Техника сортировки по времени)
- Метод сортировки по временным меткам (свежести). Применяется, когда ресурс популярен.
- Quality-based ordering technique (Техника сортировки по качеству)
- Метод сортировки по Quality Score. Применяется, когда ресурс не популярен.
- Internet communications (Интернет-коммуникации)
- Упоминания ресурса в различных источниках (аннотации, новости, социальные сети, блоги). Используются для расчета Popularity Score.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод адаптивной сортировки пользовательских комментариев (user submitted comments) к онлайн-контенту.
- Система получает запрос на онлайн-контент.
- Определяется, является ли контент «текуще популярным» (currently popular) путем сравнения overall popularity score с порогом.
- Определение Популярности: Overall popularity score агрегируется из первой и второй оценок популярности, которые показывают, как часто контент упоминался в Internet communications за первый и второй периоды времени соответственно.
- Система выбирает технику упорядочивания на основе классификации популярности:
- Если контент популярный: Выбирается time-based ordering technique. Комментарии ранжируются по их временным меткам (timestamps).
- Если контент НЕ популярный: Выбирается quality-based ordering technique. Для этого определяется Quality Score для каждого комментария.
- Определение Качества: Quality Score определяется на основе как минимум двух из следующих факторов: (i) рейтинг комментария, (ii) длина комментария, (iii) язык комментария, (iv) социальный граф автора комментария.
- Система предоставляет комментарии, отсортированные в соответствии с выбранной техникой.
Claim 3 (Зависимый): Уточняет, что пользовательские комментарии могут включать посты, отправленные через одну или несколько социальных сетей.
Claim 6 (Зависимый): Критически важное уточнение: комментарии к контенту, классифицированному как текуще популярный, сортируются *без учета качества* (without regard to quality) содержания комментариев.
Где и как применяется
Патент описывает работу системы обработки и отображения пользовательского контента (UGC), а не основные этапы ранжирования веб-поиска. Он реализуется в рамках Annotation Information System.
INDEXING (Вне рамок основного поиска):
- Сбор UGC и Упоминаний: Система собирает прямые комментарии, посты из социальных сетей (post data sets) и другие интернет-коммуникации.
- Ассоциация с ресурсами: Система идентифицирует упоминания ресурсов (включая резолвинг сокращенных URL) и связывает UGC с соответствующими Resource ID.
- Расчет метрик: Предварительный расчет Quality Scores для аннотаций и авторов. Сбор данных для расчета Popularity Score.
RANKING (Сортировка аннотаций в реальном времени):
Когда пользователь запрашивает аннотации к ресурсу:
- Расчет популярности: Sorting Module определяет текущий Popularity Score для данного Resource ID, используя данные об упоминаниях (и/или запросах).
- Выбор логики сортировки: Модуль сравнивает Popularity Score с порогом и выбирает метод сортировки (по времени или по качеству).
- Применение сортировки: Аннотации упорядочиваются и передаются пользователю.
Входные данные:
- Запрос на аннотации с Resource ID.
- Annotation Data Sets (с временными метками и данными о качестве).
- Данные для расчета популярности (логи запросов, данные об упоминаниях).
Выходные данные:
- Отсортированный список аннотаций.
На что влияет
- Типы контента: Влияет на отображение UGC (комментариев, отзывов, социальных постов), связанного с любыми типами веб-страниц.
- Взаимодействие с пользователем: Напрямую влияет на пользовательский опыт при взаимодействии с обсуждениями. Для трендовых тем пользователи увидят самые свежие обсуждения, для стабильных тем — самые полезные.
- Основное ранжирование: Не влияет на ранжирование веб-страниц в основном поиске Google.
Когда применяется
- Условия применения: Алгоритм применяется в момент запроса пользователя на отображение аннотаций/комментариев.
- Динамичность: Применение зависит от динамического Popularity Score. Одна и та же страница может иметь сортировку по времени сегодня (если она в тренде) и сортировку по качеству завтра (если популярность спала).
- Триггеры активации: Сравнение Popularity Score с Threshold Popularity Score.
- Исключения: Пользователь может вручную переопределить (override) автоматическую сортировку.
Пошаговый алгоритм
Процесс обработки запроса на аннотации
- Получение запроса: Система получает запрос от клиента на предоставление аннотаций для определенного Resource ID.
- Извлечение аннотаций: Access Module извлекает из базы данных все Annotation Data Sets, связанные с данным Resource ID.
- Определение Популярности (PS): Sorting Module определяет текущий Popularity Score для ресурса. Это включает:
- Анализ частоты запросов к ресурсу за период времени.
- Анализ частоты упоминаний ресурса в интернет-коммуникациях за разные периоды времени.
- Вычисление комбинированной (Overall Popularity Score), возможно, взвешенной оценки.
- Сравнение с порогом (PS_THR): Система сравнивает вычисленный PS с предопределенным пороговым значением.
- Выбор метода сортировки:
- Условие 1 (PS > PS_THR): Ресурс классифицируется как популярный («buzzy»). Выбирается сортировка по времени (хронологический порядок).
- Условие 2 (PS <= PS_THR): Ресурс классифицируется как непопулярный. Выбирается сортировка по качеству (Quality Scores).
- Применение сортировки: Извлеченные аннотации упорядочиваются в соответствии с выбранным методом.
- Передача данных: Отсортированные аннотации передаются на клиентское устройство для отображения (часто в отдельном фрейме).
Какие данные и как использует
Данные на входе
Система использует данные для оценки популярности ресурса и качества аннотаций.
Для оценки популярности ресурса:
- Поведенческие факторы: Данные о количестве запросов к веб-странице (number of requests) за период времени.
- Внешние факторы / Упоминания: Данные о количестве упоминаний (number of references/discussions) ресурса в Internet communications (социальные сети, блоги, новости) за период времени.
Для оценки качества аннотаций (UGC):
- Контентные факторы: Длина контента (length of content) — более длинные аннотации могут считаться более информативными. Язык контента (language).
- Пользовательские (Авторские) факторы:
- Рейтинг автора (Author rating).
- Социальный граф автора (social graph), например, количество подписчиков (number of followers).
- Поведенческие факторы (На уровне аннотации): Рейтинг контента (Content rating), основанный на оценках пользователей.
Для сортировки:
- Временные факторы: Временная метка (timestamp) создания аннотации.
Какие метрики используются и как они считаются
- Popularity Score (PS): Может рассчитываться несколькими способами:
- На основе запросов:
- На основе упоминаний:
- Overall Popularity Score (Комбинированный): Взвешенная сумма или агрегация нескольких PS. Например: .
- Quality Score: Агрегированная оценка качества аннотации. Согласно Claim 1, основана как минимум на двух факторах (рейтинг, длина, язык, социальный граф автора). Точная формула не приводится.
- Threshold Popularity Score (PS_THR): Пороговое значение для активации режима сортировки по времени.
Выводы
- Google активно измеряет «Buzz» (Трендовость): Патент подтверждает, что Google рассчитывает метрики популярности (Popularity Score) для отдельных ресурсов в реальном времени, используя как данные о трафике (запросах), так и внешние сигналы (упоминания в социальных сетях, блогах, новостях).
- Адаптивный подход к UGC: Свежесть против Качества: Google применяет разную логику сортировки UGC в зависимости от контекста. Для трендового контента приоритет отдается свежести (Recency). Для стабильного (Evergreen) контента приоритет отдается качеству (Quality).
- Критерии качества UGC и Авторов: Патент четко определяет факторы для оценки качества UGC, которые коррелируют с принципами E-E-A-T:
- Авторитет автора: Рейтинги, количество подписчиков, социальный граф.
- Качество контента: Длина (как показатель информативности), язык, оценки пользователей.
- Обработка социальных сигналов: Система демонстрирует способность обрабатывать контент из социальных сетей, включая резолвинг сокращенных URL и ассоциацию постов с конкретными веб-ресурсами.
- Качество игнорируется при высокой популярности: Важное замечание (Claim 6) состоит в том, что при сортировке комментариев к очень популярному контенту факторы качества могут полностью игнорироваться в пользу свежести.
Практика
Best practices (это мы делаем)
Хотя патент не влияет напрямую на ранжирование в поиске, он дает важные инсайты для стратегий по работе с UGC и PR.
- Стимулирование «Buzz» для нового контента: Для продвижения нового контента важно генерировать всплеск популярности (трафик и упоминания в социальных сетях, PR). Это сигнализирует Google о трендовости ресурса (высокий Popularity Score).
- Построение авторитета авторов UGC (E-E-A-T): Если ваш сайт полагается на UGC (комментарии, обзоры), инвестируйте в построение репутации авторов. Внедряйте системы рейтингов и выделяйте экспертов. Авторитетные авторы повышают Quality Score комментариев.
- Поощрение содержательных комментариев: Поскольку длина контента является фактором качества UGC, стимулируйте пользователей оставлять развернутые и информативные комментарии, а не короткие реплики.
- Мониторинг упоминаний в социальных сетях: Активно отслеживайте упоминания ваших ресурсов, так как они напрямую влияют на расчет Popularity Score (часть, основанная на упоминаниях).
Worst practices (это делать не надо)
- Накрутка низкокачественных комментариев: Создание большого количества коротких комментариев от низкокачественных авторов (ботов). Когда страница не в тренде, такие комментарии будут отсортированы вниз из-за низкого Quality Score.
- Игнорирование качества UGC на «вечнозеленом» контенте: Для статей и руководств, которые не являются трендовыми, критически важно иметь высококачественные комментарии в топе. Плохая модерация приведет к неоптимальному отображению UGC.
- Попытки манипулировать популярностью спамом: Генерация спам-упоминаний для повышения Popularity Score может привести к временному переключению на сортировку по свежести, но не улучшит качество восприятия контента и может быть обнаружена системами защиты от спама.
Стратегическое значение
Патент подчеркивает философию Google по адаптации к контексту популярности контента. Он подтверждает важность как скорости распространения информации (для трендов), так и глубины/авторитетности (для стабильного контента). Для SEO-стратегов это напоминание о том, что Google измеряет популярность не только ссылками, но и прямым трафиком, и упоминаниями в реальном времени. Также он подтверждает важность работы над авторитетом авторов (E-E-A-T) на всех уровнях, включая UGC.
Практические примеры
Сценарий 1: Запуск нового продукта (Трендовый контент)
- Ситуация: Компания запускает новый смартфон. Страница продукта получает огромный трафик и тысячи упоминаний в социальных сетях в течение часа.
- Действие системы: Google рассчитывает высокий Popularity Score, превышающий порог. Страница классифицируется как «buzzy».
- Результат: Когда пользователи просматривают комментарии или связанные социальные посты, система сортирует их по времени (свежести). Пользователи видят самые последние реакции и обсуждения в реальном времени, независимо от авторитета комментаторов или длины их сообщений.
Сценарий 2: Руководство по инвестициям (Вечнозеленый контент)
- Ситуация: Пользователь читает подробное руководство по долгосрочному инвестированию, опубликованное год назад. Страница имеет стабильный, но не взрывной трафик.
- Действие системы: Google рассчитывает Popularity Score ниже порогового значения.
- Результат: Система сортирует комментарии по качеству (Quality Score). Вверху отображаются комментарии от проверенных финансовых аналитиков (высокий авторитет автора) и длинные, подробные комментарии с высоким рейтингом пользователей, даже если они были оставлены несколько месяцев назад.
Вопросы и ответы
Как Google рассчитывает Popularity Score для страницы?
Патент описывает два основных компонента. Первый — это частота запросов к ресурсу за период времени (скорость трафика). Второй (и основной в Claim 1) — это частота упоминаний ресурса в интернет-коммуникациях (новости, блоги, социальные сети) за определенные периоды. Система может использовать взвешенную комбинацию этих компонентов для определения общей оценки популярности.
Влияет ли этот патент на ранжирование моего сайта в поиске Google?
Напрямую нет. Этот патент описывает, как сортируются комментарии или аннотации (UGC), связанные с URL, а не как сама веб-страница ранжируется в результатах поиска. Однако метрики популярности (Popularity Score), описанные здесь, могут использоваться и другими системами Google.
Какие факторы Google считает важными для качества комментария (UGC)?
Патент выделяет несколько факторов для расчета Quality Score. К ним относятся авторитет автора (основанный на рейтингах, количестве подписчиков и социальном графе), качество самого контента (включая длину как показатель информативности и язык), а также прямые оценки (рейтинги), выставленные другими пользователями.
Что такое «buzziness» или трендовость в контексте этого патента?
«Buzziness» — это динамическое состояние, при котором Popularity Score ресурса превышает определенный порог (Threshold Popularity Score). Это указывает на то, что ресурс в данный момент активно запрашивается или обсуждается в интернете. В этом состоянии система переключает сортировку UGC на приоритет свежести.
Может ли Google использовать посты из социальных сетей как аннотации?
Да, патент прямо описывает этот механизм. Система обрабатывает посты из социальных сетей, ищет в них упоминания ресурсов (URL), может резолвить сокращенные ссылки и конвертирует эти посты в Annotation Data Sets, связанные с соответствующей веб-страницей.
Что произойдет, если страница очень популярна, но все свежие комментарии низкого качества?
Согласно патенту (Claim 6), если страница классифицирована как популярная, комментарии сортируются по времени «без учета качества». Это означает, что самые свежие комментарии будут показаны первыми, даже если их Quality Score низкий. Система предполагает, что для трендовых тем свежесть важнее качества.
Актуален ли этот патент, если Google Sidewiki (упомянутый в описании) больше не существует?
Хотя Google Sidewiki был закрыт, принципы, описанные в патенте, остаются актуальными. Адаптивная сортировка на основе популярности является универсальным подходом, который может применяться к обзорам на Google Maps, комментариям на YouTube или любым другим платформам Google, где отображается UGC.
Как SEO-специалист может использовать информацию из этого патента?
SEO-специалисты могут использовать эти данные для улучшения стратегий работы с UGC и PR. Во-первых, это подтверждает важность генерации реального «buzz» (трафика и упоминаний). Во-вторых, это дает четкие указания по повышению качества UGC на сайте: развитие авторитета авторов, стимулирование подробных комментариев и внедрение систем рейтинга.
Что такое «социальный граф автора» и почему он важен?
Социальный граф автора относится к его связям и авторитету в социальных сетях (например, количество подписчиков). Он используется как фактор для расчета Quality Score комментария. Это важно, потому что комментарии авторитетных пользователей будут более заметны при сортировке по качеству (когда тема не в тренде).
Учитывает ли система язык комментария при оценке качества?
Да, в Claim 1 явно указано, что язык комментария (language of the user submitted comments) является одним из факторов, который может использоваться для определения Quality Score, когда система выбирает сортировку по качеству.