Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
Описание
Какую задачу решает
Патент решает проблему, когда стандартные алгоритмы ранжирования могут не помещать «авторитетную» (authoritative web page) или официальную страницу на первую позицию по соответствующему запросу. Например, по запросу, содержащему имя актера, в топ могут попасть новостные сайты из-за недавних событий, в то время как биография или официальный сайт актера (авторитетная страница) окажутся ниже. Изобретение призвано гарантировать, что пользователи смогут легко идентифицировать и получить доступ к авторитетной странице, связанной с их запросом.
Что запатентовано
Запатентована система для автоматической идентификации авторитетных веб-страниц для конкретных запросов путем анализа поведения пользователей в журналах запросов (Query Logs). Суть изобретения заключается в использовании специфических поведенческих метрик — Click-Through Rate (CTR) и Click Ratio — для определения того, какой результат пользователи коллективно считают наиболее авторитетным или официальным ответом на запрос. Если эти метрики превышают определенные пороги для популярного запроса, страница помечается как авторитетная.
Как это работает
Система работает путем офлайн-анализа журналов запросов:
- Сбор данных: Извлекаются данные о запросах, показанных результатах и кликах пользователей.
- Фильтрация: Отсеиваются запросы с низкой частотностью (Query Count).
- Расчет метрик: Для топовых результатов по популярным запросам рассчитываются CTR (клики на результат / общее число запросов) и Click Ratio (клики на результат / общее число кликов по всем результатам запроса).
- Идентификация авторитетности: Результат признается авторитетным, если (Query Count выше порога 1) И ((CTR выше порога 2) ИЛИ (Click Ratio выше порога 3)).
- Хранение: Связка <запрос, адрес, заголовок> сохраняется в репозитории авторитетных страниц.
- Применение: При получении запроса пользователя система проверяет репозиторий и, если авторитетная страница найдена, отображает ее на SERP с визуальным выделением (на «более заметной позиции»).
Актуальность для SEO
Высокая. Идентификация навигационного интента и определение официальных источников (брендов, организаций) остается фундаментальной задачей поисковых систем. Механизм, основанный на анализе коллективного поведения пользователей для определения «официального» ответа, является классическим и надежным подходом, который, вероятно, продолжает использоваться в той или иной форме.
Важность для SEO
Патент имеет высокое значение (8/10) для SEO, особенно в контексте управления брендом и навигационными запросами. Он демонстрирует, что «владение» брендовым запросом определяется не только стандартными факторами ранжирования, но и, в первую очередь, поведением пользователей. Если пользователи преимущественно кликают на другой сайт (например, агрегатор, реселлер или Wikipedia) по вашему брендовому запросу, Google может идентифицировать этот сайт как авторитетный ответ, что критически снижает видимость и трафик официального сайта.
Детальный разбор
Термины и определения
- Authoritative Web Page (Авторитетная веб-страница)
- Веб-страница, которой доверяют пользователи, отправляющие определенный запрос, или страница, содержащая большой объем информации по теме запроса. В контексте патента — это страница, идентифицированная системой как основной/официальный ответ на запрос на основе поведенческих метрик.
- Click Ratio (Коэффициент кликов)
- Метрика, рассчитываемая как (Количество кликов на конкретный результат) / (Общее количество кликов на ЛЮБОЙ результат по данному запросу). Показывает долю кликов, которую забирает конкретный результат.
- Click-Through Rate (CTR, Рейтинг кликов)
- Метрика, рассчитываемая как (Количество кликов на конкретный результат) / (Общее количество отправок данного запроса). Показывает вероятность клика на результат при вводе запроса.
- Query Log (Журнал запросов)
- Хранилище данных о прошлых запросах, показанных результатах, позициях результатов и действиях пользователей (кликах/выборах).
- Query Count (Счетчик запросов)
- Количество раз, когда определенный поисковый запрос был отправлен пользователями за определенный период времени.
- Query-Address-Title Repository (Репозиторий Запрос-Адрес-Заголовок)
- База данных, хранящая идентифицированные связи между запросами и авторитетными страницами (их URL и заголовками).
- Selection Count (Счетчик выборов)
- Количество раз, когда конкретный результат был выбран (кликнут) пользователями.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод идентификации авторитетной страницы.
- Система извлекает информацию из Query Log для поискового запроса (включая данные о запросе и результатах).
- Система определяет множество метрик (plurality of metrics), основанных на выборе конкретного результата поиска, когда он был предоставлен в ответ на этот запрос.
- Эти метрики должны включать:
- Query Count (частотность запроса) выше первого порога.
- И по крайней мере одно из следующего:
- Click-Through Rate (CTR) для этого результата выше второго порога.
- Click Ratio для этого результата выше третьего порога.
- На основании этих метрик система определяет, что данный результат соответствует authoritative web page для этого запроса.
- После идентификации авторитетной страницы система определяет ее заголовок (Title).
Ядром изобретения является точное определение условий, при которых страница считается авторитетной: это комбинация популярности запроса И высокого уровня вовлеченности пользователей (через CTR или Click Ratio) с конкретным результатом.
Claim 5 (Зависимый): Детализирует расчет CTR.
CTR рассчитывается путем деления количества выборов (кликов) конкретного результата на количество отправок запроса за определенный период времени.
Claim 6 (Зависимый): Детализирует расчет Click Ratio.
Click Ratio рассчитывается путем деления количества выборов (кликов) конкретного результата на общее количество выборов любого результата по данному запросу за определенный период времени.
Claim 7 (Зависимый): Описывает применение результата.
Система предоставляет пользователю документ с результатами поиска, где информация об идентифицированной авторитетной странице (включая заголовок и ссылку) представлена на более заметном месте (more prominent location), чем информация о других результатах.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, разделяясь на офлайн-анализ и онлайн-применение.
QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Основная логика патента реализуется на этом этапе в виде периодического офлайн-процесса. Система анализирует исторические данные из Query Logs, рассчитывает поведенческие метрики (CTR, Click Ratio) и строит Query-Address-Title Repository. Это процесс глобального анализа интентов и поведения пользователей.
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Онлайн-применение)
В реальном времени, когда пользователь вводит запрос, система выполняет следующие действия:
- Проверка репозитория: Система проверяет, существует ли запись для данного запроса в Query-Address-Title Repository.
- Изменение SERP: Если запись найдена, система модифицирует страницу результатов поиска (SERP). Авторитетный результат извлекается и форматируется для отображения на заметной позиции (например, над органическими результатами) и/или с визуальным выделением (например, меткой «Authoritative page»).
Входные данные (Офлайн):
- Query Log (запросы, URL результатов, позиции, клики).
- Репозиторий Адрес-Заголовок (для получения заголовков идентифицированных страниц).
Выходные данные (Офлайн):
- Query-Address-Title Repository (база авторитетных страниц).
Входные данные (Онлайн):
- Запрос пользователя.
- Стандартный набор органических результатов.
- Данные из Query-Address-Title Repository.
Выходные данные (Онлайн):
- Модифицированная SERP с выделенным авторитетным результатом.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на Навигационные запросы (бренды, названия организаций, имена известных личностей, названия продуктов). Это запросы, где пользователи ищут конкретный, известный им ресурс.
- Конкретные типы контента: Влияет на официальные сайты, главные страницы организаций, страницы биографий (например, на Wikipedia), официальные страницы продуктов.
Когда применяется
Алгоритм идентификации (офлайн) применяется при выполнении строго определенных условий для конкретной пары Запрос-Результат:
- Условие 1 (Популярность запроса): Query Count за определенный период (например, 180 дней) должен превышать первый порог (например, 1000 запросов).
- Условие 2 (Вовлеченность пользователя): Должно выполняться ХОТЯ БЫ ОДНО из следующих условий:
- CTR результата превышает второй порог (например, 0.4000).
- Click Ratio результата превышает третий порог (например, 0.5000).
Алгоритм отображения (онлайн) применяется, когда введенный пользователем запрос точно соответствует запросу, для которого в репозитории уже сохранена авторитетная страница.
Пошаговый алгоритм
Процесс А: Офлайн-идентификация авторитетных страниц
- Извлечение данных: Система извлекает информацию из Query Log, идентифицируя запросы, показанные результаты и количество выборов (Selection Count) для каждого результата за определенный период.
- Фильтрация запросов: Отсеиваются запросы, чей Query Count ниже первого порога (Threshold 1).
- Выбор кандидата: Для оставшихся запросов выбирается кандидат (например, начиная с первого результата в выдаче).
- Расчет метрик для кандидата:
- Рассчитывается CTR = (Клики на кандидата) / (Query Count).
- Рассчитывается Click Ratio = (Клики на кандидата) / (Общее число кликов по всем результатам запроса).
- Проверка условий авторитетности: Проверяется, удовлетворяет ли кандидат условию: (Query Count > Threshold 1) AND ((CTR > Threshold 2) OR (Click Ratio > Threshold 3)).
- Принятие решения:
- Если ДА: Кандидат идентифицируется как Authoritative Web Page для данного запроса. Система переходит к шагу 8.
- Если НЕТ: Кандидат не является авторитетной страницей.
- Проверка следующих результатов (Опционально): Система может проверить следующий по рангу результат (вернуться к шагу 3), пока не найдет авторитетную страницу или не достигнет лимита проверок. Если авторитетная страница не найдена, запрос помечается как не имеющий авторитетной страницы.
- Получение заголовка: Для идентифицированной авторитетной страницы система извлекает ее заголовок (Title) из репозитория Адрес-Заголовок.
- Сохранение: Связка <Запрос, Адрес, Заголовок> сохраняется в Query-Address-Title Repository.
Процесс Б: Онлайн-отображение авторитетной страницы
- Получение запроса: Система получает запрос от пользователя.
- Поиск в репозитории: Система ищет соответствие запросу в Query-Address-Title Repository.
- Получение результатов: Параллельно генерируется стандартный набор поисковых результатов.
- Форматирование SERP: Если авторитетная страница найдена в репозитории, система форматирует SERP, размещая авторитетную страницу на заметной позиции (например, выше всех остальных результатов) и применяя визуальное выделение (например, разделитель, специальный текст).
- Предоставление SERP: Модифицированная SERP отправляется пользователю.
Какие данные и как использует
Данные на входе
Патент полностью сосредоточен на анализе поведенческих данных из журналов запросов.
- Поведенческие факторы: Это ключевые данные для работы алгоритма.
- Отправки запросов (Submissions): Используются для расчета Query Count и CTR.
- Клики (Selections/Clicks): Используются для расчета CTR и Click Ratio.
- Технические факторы:
- URL (Address): Адрес результата, который оценивается как кандидат.
- Контентные факторы:
- Заголовки (Titles): Заголовок авторитетной страницы извлекается после ее идентификации для отображения на SERP.
Другие факторы (ссылочные, контентные, технические) в данном патенте не упоминаются и не используются для идентификации авторитетности.
Какие метрики используются и как они считаются
- Query Count: Общее количество отправок запроса за период.
- Click-Through Rate (CTR):
- Click Ratio:
- Пороговые значения: Система использует три конфигурируемых порога (Threshold 1, 2, 3) для Query Count, CTR и Click Ratio соответственно.
Выводы
- Авторитетность определяется поведением пользователей: В контексте этого патента (преимущественно для навигационных запросов) «авторитетность» определяется не экспертностью контента или ссылками, а коллективным предпочтением пользователей. Сайт, который получает подавляющее большинство кликов, считается авторитетным ответом.
- Критичность поведенческих метрик (CTR и Click Ratio): Патент выделяет две ключевые метрики. Высокий CTR указывает на высокую релевантность и удовлетворенность. Высокий Click Ratio указывает на доминирование результата над всеми остальными вариантами. Достаточно превысить порог по одной из этих метрик (при условии популярности запроса).
- Переопределение стандартного ранжирования: Механизм позволяет системе идентифицировать авторитетную страницу и принудительно разместить ее на заметной позиции, даже если стандартные алгоритмы ранжирования поместили ее ниже (например, из-за временных трендов или новостей).
- Зависимость от офлайн-анализа: Идентификация авторитетных страниц происходит не в реальном времени, а в ходе периодического анализа исторических логов. Это означает, что изменения в поведении пользователей будут отражены с задержкой.
- Защита от нерелевантных запросов: Использование порога Query Count гарантирует, что система не будет пытаться найти авторитетные страницы для редких или случайных запросов, где данные статистически недостоверны.
Практика
Best practices (это мы делаем)
- Максимизация CTR по брендовым запросам: Критически важно гарантировать, что официальный сайт является наиболее привлекательным результатом по запросам, содержащим название бренда/компании. Оптимизируйте Title и Description, чтобы они четко указывали на официальный статус и мотивировали пользователя кликнуть именно на ваш сайт.
- Мониторинг Click Ratio по брендовым запросам: Необходимо отслеживать не только CTR, но и долю кликов, которую получает официальный сайт относительно других результатов (конкурентов, реселлеров, агрегаторов, Wikipedia). Цель — доминировать в кликах (высокий Click Ratio), чтобы система идентифицировала ваш сайт как авторитетный.
- Консолидация навигационного интента: Убедитесь, что пользователи, ищущие ваш бренд, попадают на одну основную страницу (обычно главную). Избегайте фрагментации интента по множеству страниц, так как это может размыть сигналы CTR и Click Ratio для каждой отдельной страницы.
- Обеспечение технической доступности и скорости: Если официальный сайт медленно загружается или недоступен, пользователи будут выбирать другие результаты. Это приведет к падению Click Ratio и потенциальной потере статуса авторитетной страницы по собственному брендовому запросу.
Worst practices (это делать не надо)
- Игнорирование поведения пользователей на SERP: Фокусироваться только на позициях по брендовым запросам недостаточно. Если позиция №1 занята вашим сайтом, но пользователи предпочитают кликать на результат №2 (например, из-за более удачного сниппета или негативного фона вокруг бренда), вы рискуете потерять статус авторитетного источника.
- Создание путаницы в брендинге: Использование разных названий или наличие нескольких сайтов, которые могут конкурировать за один и тот же навигационный запрос, может привести к тому, что ни один из них не достигнет пороговых значений CTR/Click Ratio.
- Манипуляции с CTR для получения статуса авторитетности: Попытки искусственно накрутить CTR или Click Ratio для небрендовых запросов с целью получения статуса авторитетной страницы, вероятно, будут неэффективны, так как система ищет естественное доминирование, характерное для навигационного интента, и может иметь защитные механизмы против накруток.
Стратегическое значение
Патент подтверждает стратегическую важность поведенческих факторов в определении релевантности и авторитетности для определенных типов запросов. Для SEO-стратегии это означает, что владение собственными брендовыми запросами является фундаментом, который требует постоянного мониторинга и оптимизации не только сайта, но и его представления на SERP. Система демонстрирует, как Google использует «мудрость толпы» (данные о кликах) для валидации и, при необходимости, корректировки результатов своего алгоритмического ранжирования.
Практические примеры
Сценарий: Потеря статуса авторитетного сайта из-за кризиса
- Ситуация: Крупный банк (BrandBank) сталкивается с негативными новостями о нарушении безопасности.
- Поведение пользователей: Пользователи ищут «BrandBank», но вместо того, чтобы кликать на официальный сайт brandbank.com (Результат №1), они массово кликают на новостные сайты и статьи в Wikipedia (Результаты №2-5), чтобы узнать подробности скандала.
- Изменение метрик: CTR и Click Ratio для brandbank.com резко падают ниже пороговых значений (Threshold 2 и 3).
- Офлайн-анализ Google: При следующем анализе логов система определяет, что brandbank.com больше не удовлетворяет условиям авторитетности для запроса «BrandBank».
- Результат: Google удаляет специальное выделение для brandbank.com на SERP. Если ситуация сохранится, система может даже идентифицировать другую страницу (например, статью в Wikipedia о банке) как новый авторитетный результат, если ее Click Ratio станет доминирующим.
- Действия SEO: Банку необходимо работать над восстановлением доверия и оптимизировать сниппеты, чтобы вернуть клики на официальный сайт, например, добавив в Description информацию о мерах безопасности, чтобы перехватить интент пользователей.
Вопросы и ответы
Как в этом патенте определяется «авторитетная страница»?
В данном патенте авторитетность определяется исключительно на основе анализа поведения пользователей. Страница считается авторитетной для запроса, если сам запрос популярен (высокий Query Count) И пользователи подавляюще предпочитают кликать именно на эту страницу по сравнению с другими результатами (высокий CTR и/или Click Ratio). Это отличается от определения авторитетности через E-E-A-T или ссылочный профиль.
Чем отличаются CTR и Click Ratio в контексте патента?
CTR рассчитывается как отношение кликов на результат к общему числу запросов. Click Ratio — это отношение кликов на результат к общему числу кликов по всем результатам этого запроса. Например, если запрос ввели 100 раз, ваш сайт кликнули 60 раз, а другие сайты суммарно кликнули 20 раз (итого 80 кликов), то ваш CTR = 60/100 = 0.6, а Click Ratio = 60/80 = 0.75.
Нужно ли достигать порогов и по CTR, и по Click Ratio?
Нет. Согласно патенту, необходимо превысить порог частотности запроса (Query Count) И превысить порог ЛИБО по CTR, ЛИБО по Click Ratio (или по обоим). Это делает систему более гибкой: она может идентифицировать авторитетность как в ситуациях с высокой кликабельностью в целом, так и в ситуациях, где общая кликабельность низкая, но один результат явно доминирует.
Может ли этот механизм переопределить стандартное ранжирование?
Да. Патент описывает, что идентифицированная авторитетная страница отображается на более заметном месте (more prominent location), чем другие результаты. Это может означать размещение над органической выдачей или специальное визуальное выделение. Система может выбрать страницу, которая не занимает первую позицию в стандартном ранжировании, если ее поведенческие метрики указывают на авторитетность.
Как быстро система реагирует на изменения в поведении пользователей?
Система основана на офлайн-анализе журналов запросов за определенный период (например, 180 дней). Это означает, что идентификация новых авторитетных страниц или потеря этого статуса происходит с задержкой, зависящей от частоты обновления анализа и длительности анализируемого периода. Мгновенной реакции на изменения в поведении пользователей нет.
Что делать, если Wikipedia или агрегатор получает больше кликов по моему брендовому запросу?
Это критическая ситуация. Это означает, что пользователи считают другой ресурс более релевантным или полезным ответом на запрос. Необходимо проанализировать, почему пользователи предпочитают другой сайт, улучшить сниппеты (Title/Description) официального сайта, чтобы перехватить интент, и убедиться, что сайт быстро загружается и предоставляет ожидаемую информацию. Цель — вернуть доминирующий Click Ratio.
Применяется ли этот алгоритм к информационным или коммерческим запросам?
Теоретически да, но на практике он наиболее применим к навигационным запросам. Для информационных или коммерческих запросов интент пользователя обычно более разнообразен, и редко бывает так, что один результат получает подавляющее большинство кликов (например, >70% Click Ratio). Достижение таких высоких порогов характерно именно для поиска официальных сайтов.
Может ли у одного запроса быть несколько авторитетных страниц?
Патент описывает механизм идентификации одной авторитетной страницы для запроса. Система итеративно проверяет результаты сверху вниз и останавливается, когда находит первый результат, удовлетворяющий пороговым значениям. Это подразумевает, что для одного запроса идентифицируется только один доминирующий авторитетный ответ.
Как бороться с ситуацией, когда мой бренд имеет неоднозначное название?
Если название бренда совпадает с общим термином (например, «Apple»), система будет анализировать поведение пользователей для определения доминирующего интента. Необходимо стремиться к тому, чтобы по запросу, включающему название бренда, ваш сайт имел максимально возможный Click Ratio. Если интент смешанный, достичь порогов авторитетности будет сложнее, и выдача, скорее всего, будет формироваться стандартными алгоритмами ранжирования с учетом разнообразия.
Влияют ли ссылки или E-E-A-T на этот алгоритм?
Напрямую нет. Алгоритм, описанный в этом патенте, полностью изолирован и основан исключительно на данных Query Logs (CTR, Click Ratio, Query Count). Однако косвенно ссылки и E-E-A-T влияют на стандартное ранжирование, которое определяет, какие страницы попадут в топ и смогут претендовать на статус авторитетных за счет сбора кликов.