SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность

QUERY REVISION USING KNOWN HIGHLY-RANKED QUERIES (Пересмотр запроса с использованием известных высокоранжированных запросов)
  • US7870147B2
  • Google LLC
  • 2005-11-22
  • 2011-01-11
  • Семантика и интент
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.

Описание

Какую проблему решает

Патент решает проблему неэффективных поисковых запросов, когда пользователи испытывают трудности с формулированием своих информационных потребностей, что приводит к длинным цепочкам переформулировок и неудовлетворительным результатам. Система улучшает работу поиска, автоматически предлагая альтернативные, более качественные формулировки запросов, которые доказали свою эффективность в прошлом (Known Highly-Ranked Queries).

Что запатентовано

Запатентован метод и система для автоматического предложения пересмотренных запросов на основе Query Rank. Система идентифицирует Known Highly-Ranked Queries (KHRQ) — запросы с высокой частотностью и высокой степенью удовлетворенности пользователей. Также определяются Nearby Queries (NQ) — запросы, которые часто переформулируются в KHRQ. При получении нового запроса система оценивает его схожесть с KHRQ и NQ и предлагает наиболее подходящие KHRQ в качестве альтернатив.

Как это работает

Механизм работает в двух режимах: офлайн и рантайм.

  • Офлайн (Подготовка данных): Анализируются логи сессий. Каждому запросу присваивается Query Rank (QR), основанный на частоте запроса (Query Frequency, QF) и удовлетворенности пользователей (User Satisfaction, US). Запросы с высоким QR становятся KHRQ. Запросы, которые с высокой вероятностью переформулируются в KHRQ, становятся NQ и связываются с соответствующими KHRQ.
  • Рантайм (Обработка запроса): Для входящего запроса (Given Query, GQ) вычисляется вероятность пересмотра (Revision Probability, RP) по отношению к индексированным запросам (KHRQ и NQ). Затем рассчитывается Revision Score (RS) как функция от RP и QR. Запросы с наивысшим RS выбираются как альтернативы. Если альтернатива — NQ, то предлагается связанный с ним KHRQ. Если альтернатива — KHRQ, он предлагается напрямую.

Актуальность для SEO

Высокая. Понимание интента и переписывание запросов являются центральными элементами современного поиска. Использование поведенческих данных (частота запросов, цепочки ревизий, удовлетворенность кликами) для определения «канонических» или наиболее эффективных запросов (KHRQ) остается критически важным механизмом для улучшения качества поиска, особенно в эпоху семантического поиска и NLP.

Важность для SEO

Патент имеет высокое стратегическое значение (8/10). Он описывает механизм, с помощью которого Google определяет наиболее важные и эффективные запросы в любой нише (KHRQ) на основе реального поведения пользователей. Если SEO-стратегия сфокусирована на продвижении по менее эффективным вариантам запросов (NQ), Google может активно перенаправлять пользователей на KHRQ. Понимание того, какие запросы являются KHRQ, критично для построения семантического ядра и стратегии контента.

Детальный разбор

Термины и определения

Alternative Query (AQ) (Альтернативный запрос)
Индексированный запрос (IQ), выбранный системой на основе наивысшего Revision Score (RS) по отношению к исходному запросу.
Given Query (GQ) (Исходный запрос)
Запрос, введенный пользователем или полученный от другого ревизора запросов.
Indexed Queries (IQ) (Индексированные запросы)
Множество запросов, состоящее из KHRQ и NQ, хранящееся в индексе для использования системой пересмотра запросов.
Known Highly-Ranked Query (KHRQ) (Известный высокоранжированный запрос)
Запрос, идентифицированный как имеющий высокий Query Rank (QR). Это часто встречающиеся запросы, которые удовлетворяют пользователей.
Nearby Query (NQ) (Близлежащий запрос)
Запрос, который имеет статистически значимую вероятность (Probability of Revision, PR) быть переформулированным в KHRQ. Каждый NQ имеет указатель на один или несколько KHRQ.
Probability of Revision (PR) (Вероятность пересмотра для NQ)
Метрика, используемая офлайн для определения NQ. Измеряет вероятность того, что NQ будет пересмотрен в KHRQ, основываясь на схожести (например, поведенческой схожести в логах).
Query Frequency (QF) (Частота запроса)
Частота появления запроса за единицу времени (например, в час).
Query Rank (QR) (Ранг запроса)
Метрика качества запроса. Рассчитывается как функция от Query Frequency (QF) и User Satisfaction (US). Например, QR = QF * US.
Query Reviser (Ревизор запросов)
Компонент системы, реализующий определенную стратегию пересмотра запросов. Патент описывает Query Rank Reviser.
Revision Probability (RP) (Вероятность пересмотра для GQ)
Метрика, используемая в рантайме для оценки вероятности пересмотра исходного запроса (GQ) в индексированный запрос (IQ). Основана на схожести (семантической, синтаксической, поведенческой) между GQ и IQ.
Revision Score (RS) (Оценка пересмотра)
Итоговая оценка, используемая для выбора лучших альтернативных запросов. Рассчитывается как функция от Revision Probability (RP) и Query Rank (QR). Например, RS(IQ) = RP(GQ, IQ) * QR(IQ).
User Satisfaction (US) (Удовлетворенность пользователя)
Метрика, показывающая, насколько результаты запроса удовлетворяют пользователей. Может измеряться как обратная частота пересмотра (Inverse Revision Frequency, IRF) или как оценка качества на основе кликов (например, продолжительности кликов).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предложения высокоранжированных запросов в ответ на первый запрос.

  1. Индексированные запросы (IQ) ранжируются на основе Query Rank (QR), который рассчитывается по частоте (QF) и удовлетворенности (US).
  2. IQ включают Highly-Ranked Queries (KHRQ) (выбранные на основе QR) и Nearby Queries (NQ) (запросы со статистически значимой вероятностью пересмотра в KHRQ).
  3. Для исходного запроса (GQ) рассчитывается Revision Score (RS) для каждого IQ. RS — это функция от Revision Probability (RP) (основанной на семантической и/или синтаксической схожести между GQ и IQ) и Query Rank (QR) этого IQ.
  4. Один из IQ выбирается как альтернативный запрос (AQ) на основе RS.
  5. Определяется, является ли AQ высокоранжированным (KHRQ) или близлежащим (NQ).
  6. Если AQ — это KHRQ, он предлагается как пересмотренный запрос.
  7. Если AQ — это NQ, то предлагается тот KHRQ, в который NQ с высокой вероятностью пересматривается.

Ядро изобретения заключается в использовании метрики качества самого запроса (Query Rank), основанной на поведении пользователей, для генерации альтернативных запросов. Ключевым моментом является механизм, который предлагает KHRQ, даже если исходный запрос был ближе всего к NQ.

Claim 3 (Зависимый от 1): Уточняет функцию расчета Revision Score (RS) как произведение Revision Probability (RP) и Query Rank (QR).

Claim 5 (Зависимый от 4): Детализирует офлайн-процесс расчета Query Rank для KHRQ как функцию от QF и US.

Claims 6 и 7 (Зависимые от 5): Уточняют способы измерения User Satisfaction (US): либо через данные о поведении кликов (длина кликов на результаты поиска), либо через обратную частоту пересмотра (Inverse Revision Frequency).

Где и как применяется

Изобретение в основном применяется на этапе понимания запросов, но требует значительной предварительной обработки данных на этапе индексирования/анализа логов.

INDEXING (Анализ логов)
На этом этапе происходит основная офлайн-обработка. Система анализирует Log Files, содержащие данные о сессиях пользователей (запросы, клики, время). Происходит расчет Query Rank для всех запросов, идентификация KHRQ и NQ, а также расчет вероятностей пересмотра (PR) между NQ и KHRQ. Результаты сохраняются в индекс (Indexed Queries).

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента в рантайме. Revision Server получает исходный запрос (GQ) и использует Query Rank Reviser для генерации альтернатив. Происходит расчет Revision Probability (RP) и Revision Score (RS) с использованием подготовленного индекса. Система определяет, нужно ли предложить пользователю альтернативные запросы (KHRQ).

RANKING / METASEARCH
Предложенные альтернативные запросы (KHRQ) могут быть использованы для генерации дополнительных результатов. Патент описывает архитектуру, где Revision Server получает результаты для пересмотренных запросов от Search Engine и может представить их пользователю (например, на отдельной странице помощи или интегрированно в SERP).

Входные данные:

  • Исходный запрос (GQ).
  • Индекс запросов (IQ), содержащий KHRQ, NQ, их Query Ranks (QR) и связи (PR) между NQ и KHRQ.
  • (Офлайн) Логи поисковых сессий (запросы, клики, временные метки).

Выходные данные:

  • Набор предложенных пересмотренных запросов (которые всегда являются KHRQ).
  • Меры уверенности (Confidence Measures) для каждого предложенного запроса (обычно основаны на Revision Score).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы, которые пользователи часто формулируют неоптимально: запросы с орфографическими ошибками, слишком широкие, слишком узкие или использующие неточную терминологию. Система стремится привести их к «канонической» форме (KHRQ).
  • Типы контента: Влияет на все типы контента, так как механизм работает на уровне формулировки запроса, до того как определяется тип контента для ранжирования.
  • Языковые и географические ограничения: Механизм зависит от наличия достаточного объема данных в логах для конкретного языка и региона. В высокочастотных рынках он будет работать эффективнее.

Когда применяется

Алгоритм применяется при обработке входящего запроса.

  • Условия работы: Система всегда пытается найти подходящие KHRQ для любого входящего запроса.
  • Триггеры активации: Предложение альтернативного запроса пользователю активируется, если найден KHRQ с достаточно высоким Revision Score (RS). Патент также описывает, что решение о показе и расположении предложений может зависеть от меры уверенности (RS). Если уверенность низкая, предложения могут не показываться или показываться внизу страницы. При высокой уверенности — вверху.

Пошаговый алгоритм

Процесс А: Офлайн-обработка (Создание индекса KHRQ/NQ)

  1. Сбор данных: Сбор логов поисковых сессий, включая цепочки запросов и данные о кликах.
  2. Расчет User Satisfaction (US): Для каждого запроса рассчитывается US.
    Вариант 1 (IRF): US = 1 / (Количество пересмотров запроса / Общее количество появлений запроса).
    Вариант 2 (Click Quality): US рассчитывается на основе продолжительности кликов на результаты (например, доля «длинных кликов»).
  3. Расчет Query Rank (QR): Для каждого запроса QR = QF * US.
  4. Идентификация KHRQ: Выбираются запросы с наивысшим QR (например, Топ-5000 или выше порога).
  5. Идентификация NQ: Для остальных запросов рассчитывается вероятность пересмотра (PR) в KHRQ на основе схожести (например, поведенческой схожести — как часто один запрос меняли на другой в логах). Запросы со статистически значимым PR становятся NQ.
  6. Индексирование: KHRQ и NQ сохраняются в индекс (IQ). Для NQ сохраняются указатели на соответствующие KHRQ и значения PR.

Процесс Б: Рантайм-обработка (Генерация предложений)

  1. Получение запроса: Система получает исходный запрос (GQ).
  2. Расчет Revision Probability (RP): Рассчитывается RP между GQ и индексированными запросами (IQ) на основе синтаксической, семантической или поведенческой схожести.
    Важно: Для KHRQ расчет RP может включать как прямой путь (GQ -> KHRQ), так и непрямые пути через NQ (GQ -> NQ -> KHRQ). Формула: RP(GQ,KHRQ)=RP(GQ,KHRQ)+∑NQ[RP(GQ,NQ)∗PR(NQ,KHRQ)]RP(GQ, KHRQ) = RP(GQ, KHRQ) + \sum_{NQ} [RP(GQ, NQ) * PR(NQ, KHRQ)].
  3. Расчет Revision Score (RS): Для каждого IQ рассчитывается RS(IQ) = RP(GQ, IQ) * QR(IQ).
  4. Выбор альтернатив (AQ): Выбираются IQ с наивысшими RS (например, Топ-10).
  5. Генерация предложений:
    • Если AQ является KHRQ, он становится кандидатом на предложение.
    • Если AQ является NQ, связанный с ним KHRQ становится кандидатом на предложение.
  6. Предоставление результатов: Выбранные KHRQ с их мерами уверенности (RS) передаются в Revision Server для показа пользователю.

Какие данные и как использует

Данные на входе

Патент полностью полагается на поведенческие данные, собранные в логах поисковых сессий.

  • Поведенческие факторы:
    • Цепочки запросов (Query Chains): Последовательности запросов, введенных пользователем в рамках одной сессии. Используются для определения частоты пересмотра (Revision Frequency) и поведенческой схожести (Behavioral Similarity).
    • Частота запросов (Query Frequency, QF): Как часто запрос вводится пользователями.
    • Данные о кликах (Click Data): Какие результаты были выбраны для запроса.
    • Продолжительность кликов (Click Duration / Dwell Time): Время между кликом на результат и последующим действием (например, следующим кликом). Используется для оценки User Satisfaction (US).

Какие метрики используются и как они считаются

  • User Satisfaction (US): Рассчитывается одним из двух способов:
    • Inverse Revision Frequency (IRF): Чем реже запрос пересматривают, тем выше US.
    • Quality Score (на основе кликов): Оценка на основе продолжительности кликов. Патент упоминает S-образную кривую, где более длинные клики получают оценку, приближающуюся к 1. Пример формулы: 1

      Выводы

      1. Google определяет «качество» самого запроса: Патент вводит концепцию Query Rank. Это не оценка качества результатов, а оценка качества формулировки запроса, основанная на том, насколько часто он используется и насколько он удовлетворяет пользователей (низкий процент переформулировок, длинные клики).
      2. Идентификация «идеальных» запросов (KHRQ): Система активно выявляет Known Highly-Ranked Queries (KHRQ) — эталонные формулировки для различных информационных потребностей.
      3. Перенаправление с неэффективных запросов (NQ): Запросы, которые часто ведут к KHRQ (Nearby Queries, NQ), рассматриваются как менее эффективные варианты. Система стремится перенаправить пользователя с NQ на связанный KHRQ.
      4. Поведенческие данные — основа всего: Весь механизм построен на анализе логов: частота запросов, цепочки ревизий и данные о кликах (особенно продолжительность кликов) являются критически важными входными данными.
      5. Сложный расчет вероятности пересмотра: Расчет Revision Probability (RP) учитывает не только прямую схожесть между исходным запросом и KHRQ, но и непрямые пути через промежуточные запросы (NQ). Это позволяет связывать семантически близкие, но синтаксически разные запросы.
      6. Приоритет качества запроса над схожестью: Поскольку Revision Score (RS) является произведением вероятности (RP) и ранга запроса (QR), запрос с очень высоким QR может быть предложен, даже если его прямая схожесть (RP) с исходным запросом не самая высокая среди всех кандидатов.

      Практика

      Best practices (это мы делаем)

      • Идентификация KHRQ в вашей нише: Ключевая задача — определить, какие запросы Google считает высокоранжированными (KHRQ) в вашей тематике. Это запросы, которые генерируют наибольший трафик и показывают высокую удовлетворенность. Они должны составлять ядро вашей SEO-стратегии.
      • Анализ поведенческих метрик и удовлетворенности (US): Необходимо оптимизировать контент так, чтобы он максимально удовлетворял интент KHRQ, способствуя «длинным кликам» и минимизируя возврат на выдачу (pogo-sticking). Это косвенно подтверждает статус запроса как KHRQ и улучшает ранжирование по нему.
      • Оптимизация под KHRQ, а не NQ: Фокусируйтесь на продвижении по KHRQ. Не стоит тратить ресурсы на создание отдельных страниц под каждую мелкую вариацию запроса (потенциальные NQ), если Google все равно перенаправит пользователя на KHRQ. Лучше создать одну сильную страницу, отвечающую на KHRQ.
      • Использование KHRQ в структуре и контенте: Используйте формулировки KHRQ в заголовках, Title, H1 и основном тексте, так как это наиболее эффективные и понятные пользователям формулировки по мнению Google.

      Worst practices (это делать не надо)

      • Игнорирование интента и удовлетворенности: Создание контента, который формально релевантен запросу, но не удовлетворяет пользователя (приводит к быстрым отказам или коротким кликам), снижает User Satisfaction (US). Это может привести к понижению Query Rank для данного запроса и негативно сказаться на ранжировании сайта.
      • Фокус исключительно на длинном хвосте (Long Tail) без анализа KHRQ: Стратегия, направленная только на низкочастотные вариации (потенциальные NQ) без понимания основных KHRQ кластера, неэффективна. Google может переписать эти запросы в KHRQ, по которым сайт не оптимизирован.
      • Манипуляции с частотой запросов: Попытки искусственно увеличить Query Frequency (QF) для продвижения запроса в статус KHRQ, скорее всего, будут неэффективны, так как Query Rank также требует высокой User Satisfaction (US), которую сложно симулировать.

      Стратегическое значение

      Патент подчеркивает стратегическую важность анализа поведения пользователей для понимания того, как Google интерпретирует и классифицирует запросы. Он показывает, что не все запросы равны; существуют «привилегированные» запросы (KHRQ), к которым система стремится привести пользователя. SEO-стратегия должна строиться вокруг идентификации этих KHRQ и обеспечения максимальной удовлетворенности пользователей при переходе по ним. Это также подтверждает важность построения Topical Authority вокруг кластеров, связанных с ключевыми KHRQ.

      Практические примеры

      Сценарий: Определение KHRQ и оптимизация контента

      1. Задача: Оптимизировать сайт по теме выбора ноутбука для программирования.
      2. Анализ запросов (Предположение на основе патента):
        • GQ: "какой ноут для кодинга купить 2025"
        • NQ (Низкий QR, высокий PR): "ноутбук для java разработчика", "лучший лэптоп для python"
        • KHRQ (Высокий QF, Высокий US): "лучший ноутбук для программирования"
      3. Механизм в действии: Пользователь вводит NQ "ноутбук для java разработчика". Система рассчитывает высокий Revision Score для KHRQ "лучший ноутбук для программирования" (из-за высокого QR и значительного PR от NQ к KHRQ). Google предлагает пользователю KHRQ или использует его для ранжирования.
      4. SEO-действие: Вместо создания отдельных статей под Java, Python и т.д. (NQ), создать одну фундаментальную статью, оптимизированную под KHRQ "лучший ноутбук для программирования". Внутри статьи рассмотреть требования для разных языков.
      5. Результат: Сайт ранжируется по основному KHRQ и получает трафик от множества NQ, которые Google перенаправляет на этот KHRQ.

      Вопросы и ответы

      Что такое Known Highly-Ranked Query (KHRQ) простыми словами?

      KHRQ — это «идеальный» или «канонический» запрос по мнению Google. Это формулировка, которую пользователи используют часто (высокая Query Frequency) и которая хорошо решает их задачу — они редко переформулируют этот запрос и долго изучают результаты (высокая User Satisfaction). Например, [погода в москве] скорее всего KHRQ, а [какая температура сейчас на улице в мск] — нет.

      Как Google измеряет удовлетворенность пользователя (User Satisfaction, US) для расчета ранга запроса?

      Патент предлагает два основных метода. Первый — это Inverse Revision Frequency (IRF): если пользователи часто меняют запрос А на запрос Б, то удовлетворенность запросом А низкая. Второй — анализ качества кликов: если пользователи кликают на результат и остаются на странице долго («длинный клик»), удовлетворенность высокая. Google использует эти сигналы для определения качества самого запроса.

      Что такое Nearby Query (NQ) и почему он важен?

      NQ — это неоптимальная версия запроса, которую пользователи часто исправляют на KHRQ. Например, запрос с опечаткой или слишком узкая формулировка. Важность NQ в том, что система идентифицирует их и использует как мост: если пользователь вводит NQ, система предложит связанный с ним KHRQ, даже если сам NQ имеет низкий Query Rank.

      Как этот патент влияет на сбор семантического ядра?

      Он радикально меняет подход. Вместо сбора максимального количества ключевых слов, нужно фокусироваться на идентификации KHRQ в каждом кластере. Длинный хвост запросов (потенциальные NQ) может быть менее приоритетным для прямой оптимизации, так как Google может автоматически перенаправлять их на KHRQ. Стратегия должна быть направлена на доминирование по KHRQ.

      Может ли запрос с низкой частотностью быть KHRQ?

      Это маловероятно. Query Rank (QR) рассчитывается как произведение частоты (QF) и удовлетворенности (US). Даже если удовлетворенность максимальна (US=1), низкая частота (QF) приведет к низкому общему рангу (QR). KHRQ по определению являются популярными запросами.

      Как система определяет, какой KHRQ предложить, если их несколько?

      Система рассчитывает Revision Score (RS) для каждого кандидата. RS учитывает как вероятность пересмотра исходного запроса в кандидата (Revision Probability, RP), так и ранг самого кандидата (Query Rank, QR). Предлагаются KHRQ с наивысшим RS. Это баланс между релевантностью альтернативы и ее общим качеством.

      Что означает сложная формула расчета Revision Probability (RP) с учетом непрямых путей?

      Это означает, что Google учитывает не только прямую схожесть вашего запроса (GQ) с KHRQ, но и то, насколько ваш запрос похож на промежуточные запросы (NQ), которые, в свою очередь, часто ведут к KHRQ. Это позволяет системе связывать запросы, которые могут сильно отличаться по написанию, но ведут к одной и той же информационной потребности через цепочки ревизий.

      Как SEO-специалист может повлиять на Query Rank запроса?

      Напрямую повлиять сложно, так как он зависит от глобального поведения пользователей. Однако косвенно можно повлиять на компонент User Satisfaction (US). Если ваш сайт находится в топе по запросу и предоставляет контент, который полностью удовлетворяет пользователей (длинные клики, нет возврата на выдачу), вы повышаете US этого запроса. Это укрепляет его статус как KHRQ и помогает вашему сайту удержать позиции.

      Является ли этот механизм просто исправлением опечаток?

      Нет, это гораздо шире. Исправление опечаток — лишь один из возможных результатов. Механизм также обрабатывает семантические вариации, слишком широкие или слишком узкие запросы, замену синонимов и любые другие случаи, когда исходная формулировка менее эффективна, чем существующий KHRQ.

      Где на выдаче пользователь видит работу этого механизма?

      Патент описывает разные варианты отображения в зависимости от уверенности системы (Revision Score). Это могут быть блоки «Возможно, вы имели в виду» (при высокой уверенности) или блоки «Похожие запросы» / «Related Searches» (при средней уверенности). Также возможно, что Google молча использует KHRQ для ранжирования, не уведомляя пользователя о пересмотре.

      Похожие патенты

      Как Google использует анализ сессий и CTR для переписывания низкоэффективных запросов в высокоэффективные
      Google анализирует поведение пользователей внутри поисковых сессий. Если пользователь быстро переходит от запроса с низким CTR (низкоэффективный) к запросу с высоким CTR (высокоэффективный), система связывает их как относящиеся к одному интенту. В дальнейшем, при получении низкоэффективного запроса, Google использует связанный высокоэффективный запрос для поиска и подмешивания более релевантного контента.
      • US8234265B1
      • 2012-07-31
      • Семантика и интент

      • Поведенческие сигналы

      • SERP

      Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов
      Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.
      • US7617205B2
      • 2009-11-10
      • Поведенческие сигналы

      • Семантика и интент

      • SERP

      Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности
      Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.
      • US8868591B1
      • 2014-10-21
      • Семантика и интент

      Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
      Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
      • US8965875B1
      • 2015-02-24
      • Поведенческие сигналы

      • Семантика и интент

      • EEAT и качество

      Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
      Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
      • US9128945B1
      • 2015-09-08
      • SERP

      • Поведенческие сигналы

      • EEAT и качество

      Популярные патенты

      Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
      Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
      • US8738612B1
      • 2014-05-27
      • Семантика и интент

      • Поведенческие сигналы

      • SERP

      Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса
      Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.
      • US9454621B2
      • 2016-09-27
      • Семантика и интент

      • SERP

      • Поведенческие сигналы

      Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
      Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
      • US20150261858A1
      • 2015-09-17
      • Local SEO

      • Семантика и интент

      • Поведенческие сигналы

      Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
      Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
      • US8856124B2
      • 2014-10-07
      • Безопасный поиск

      • Поведенческие сигналы

      • Семантика и интент

      Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
      Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
      • US8959093B1
      • 2015-02-17
      • Поведенческие сигналы

      • Ссылки

      • SERP

      Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
      Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
      • US8498974B1
      • 2013-07-30
      • Поведенческие сигналы

      • Мультиязычность

      • Персонализация

      Как Google использует свой индекс для автоматического обновления устаревших ссылок в закладках, истории поиска и на веб-страницах
      Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
      • US20130144836A1
      • 2013-06-06
      • Ссылки

      • Индексация

      • Техническое SEO

      Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
      Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
      • US8495483B1
      • 2013-07-23
      • Индексация

      • Ссылки

      • SERP

      Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
      Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
      • US11568274B2
      • 2023-01-31
      • Knowledge Graph

      • Семантика и интент

      • EEAT и качество

      Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
      Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
      • US8868565B1
      • 2014-10-21
      • Поведенческие сигналы

      • SERP

      seohardcore