Как Google использует данные о поведении пользователей для определения и продвижения наиболее успешных запросов (KHRQ)

Google анализирует частоту запросов и удовлетворенность пользователей (низкий процент уточнений, долгое время клика), чтобы выявить «Known Highly-Ranked Queries» (KHRQ). Система перенаправляет пользователей с менее успешных или неоднозначных запросов (Nearby Queries) на эти KHRQ. Это механизм для каноникализации интента пользователя на основе агрегированных поведенческих данных.

Описание

Какую задачу решает

Патент решает проблему неэффективности пользовательских запросов. Пользователи часто испытывают трудности с формулировкой запросов, которые точно отражают их информационные потребности, что приводит к сериям уточнений (расширение, сужение, перефразирование). Изобретение предлагает метод ревизии запросов, основанный на анализе исторических данных о поведении пользователей, чтобы предложить альтернативы, которые статистически лучше удовлетворяют информационные потребности.

Что запатентовано

Запатентована система и метод предложения пересмотренных запросов путем использования Known Highly-Ranked Queries (KHRQ) — запросов, которые являются частыми и доказали свою эффективность в удовлетворении пользователей. Система ранжирует сами запросы (Query Rank) на основе их частотности и показателей удовлетворенности (например, низкая частота последующих уточнений или длительное время клика на результаты). Определяются запросы, которые часто приводят к KHRQ (Nearby Queries, NQ). При получении нового запроса система предлагает KHRQ в качестве альтернативы, если исходный запрос похож на NQ или сам KHRQ.

Как это работает

Система работает в два этапа:

Офлайн:

Все запросы ранжируются на основе частоты (QF) и удовлетворенности пользователей (US) для определения Query Rank (QR).
Идентифицируются KHRQ (высокий QR).
Идентифицируются NQ (запросы, часто пересматриваемые в KHRQ) на основе сходства (поведенческого, семантического, синтаксического) и рассчитывается вероятность пересмотра (PR).
KHRQ и NQ индексируются.

Рантайм:

При получении данного запроса (GQ) рассчитывается вероятность пересмотра (RP) между GQ и индексированными запросами (IQ).
Рассчитывается оценка пересмотра (Revision Score, RS) для каждого IQ (например, RS = RP * QR).
IQ с наивысшими RS выбираются в качестве альтернативных запросов. Если альтернатива является NQ, предлагается связанный с ним KHRQ.

Актуальность для SEO

Высокая. Понимание и пересмотр запросов остаются центральными задачами поиска. Использование агрегированных поведенческих данных (данных сессий, кликов) для выявления успешных запросов и каноникализации интента является фундаментальным методом в современных поисковых системах, что видно по функциям типа «Связанные запросы» и механизмам понимания интента.

Важность для SEO

Влияние на SEO значительно (8/10). Патент подчеркивает, что Google активно идентифицирует «канонические» или «главные» запросы (KHRQ), которые удовлетворяют пользователей, и направляет на них трафик с связанных, менее успешных вариаций (NQ). SEO-стратегии должны фокусироваться на выявлении и захвате этих KHRQ, а не полагаться исключительно на длиннохвостые вариации, которые могут быть переписаны системой. Также критически важна оптимизация под удовлетворенность пользователя (длительные клики).

Детальный разбор

Термины и определения

Known Highly-Ranked Query (KHRQ) (Известный высокоранжированный запрос): Запрос, идентифицированный как имеющий высокий Query Rank (часто встречающийся и с высокой степенью удовлетворенности пользователей).
Nearby Query (NQ) (Близлежащий запрос): Запрос с высокой вероятностью пересмотра (PR) в KHRQ, определяемой на основе показателей сходства (часто поведенческого).
Indexed Queries (IQ) (Индексированные запросы): Коллекция KHRQ и NQ, хранящаяся в индексе.
Query Rank (QR) (Ранг запроса): Мера важности и качества запроса, рассчитываемая как функция частоты запроса (QF) и удовлетворенности пользователей (US). Например, QR = QF * US.
User Satisfaction (US) (Удовлетворенность пользователей): Мера того, насколько хорошо запрос удовлетворяет потребности пользователя. Измеряется с помощью Inverse Revision Frequency (IRF) или Quality (Q), полученной из поведения кликов (например, длительные клики).
Inverse Revision Frequency (IRF) (Обратная частота пересмотра): Показатель удовлетворенности. Низкая частота пересмотра запроса пользователем подразумевает высокую удовлетворенность.
Probability of Revision (PR) (Вероятность пересмотра для NQ): Предварительно рассчитанная вероятность того, что Nearby Query (NQ) будет пересмотрен в Known Highly-Ranked Query (KHRQ). Рассчитывается офлайн.
Revision Probability (RP) (Вероятность пересмотра для GQ): Вероятность того, что данный запрос (GQ) связан с индексированным запросом (IQ), основанная на показателях сходства (семантическом, синтаксическом, поведенческом). Рассчитывается в рантайме.
Revision Score (RS) (Оценка пересмотра): Итоговая оценка, используемая для выбора альтернативных запросов. Рассчитывается как функция RP и QR (например, RS(IQ) = RP(GQ, IQ) * QR(IQ)). Используется как мера уверенности.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предложения ревизий, фокусируясь на измерении удовлетворенности через клики.

Система ранжирует индексированные запросы (IQ) на основе Query Rank (QR). QR рассчитывается на основе частоты встречаемости (QF) и оценки удовлетворенности пользователей (US).
IQ включают высокоранжированные запросы (KHRQ) и близлежащие запросы (NQ), которые имеют статистически значимую вероятность быть пересмотренными в KHRQ.
Ключевой элемент: US определяется по оценкам продолжительности кликов по результатам поиска. Продолжительность основана на времени между выбором результата и последующим выбором другого результата (измерение long clicks).
Для первого запроса (GQ) рассчитывается Revision Score (RS) для каждого IQ как функция вероятности пересмотра (RP) GQ в IQ и QR самого IQ.
RP основана на семантическом или синтаксическом сходстве между GQ и IQ.
Один из IQ выбирается в качестве альтернативного запроса на основе RS и предоставляется в качестве предлагаемого пересмотра.

Claim 3 (Зависимый от 1): Уточняет функцию для RS как произведение RP и QR. (RS = RP * QR).

Claim 6 и 7 (Зависимые): Определяют альтернативный метод расчета User Satisfaction (US) на основе Inverse Revision Frequency (IRF). IRF определяется как величина, обратная (количеству пересмотров запроса / частоте встречаемости запроса).

Claim 8 (Зависимый от 1): Упоминает процесс сбора данных: логирование данных запросов из пользовательских сессий и использование этих данных для генерации индексированных запросов.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, преимущественно в фазе понимания запроса, используя данные, собранные и обработанные на этапе индексирования.

INDEXING / Офлайн-обработка (Сбор данных и обработка)
На этом этапе собираются и хранятся лог-файлы, фиксирующие пользовательские сессии, последовательности запросов, ревизии и поведение кликов (клики, время пребывания/продолжительность между кликами). Происходит офлайн-анализ этих логов для расчета QF, US и QR, идентификации KHRQ и NQ, расчета PR и построения индекса IQ.

QUNDERSTANDING – Понимание Запросов (Рантайм)
Это основная область применения. Компонент Query Rank Reviser действует во время обработки запроса для предложения альтернатив. Когда поступает GQ, система рассчитывает RP между GQ и IQ, вычисляет RS, выбирает лучшие альтернативные запросы и предоставляет соответствующие KHRQ в качестве ревизий.

RANKING / RERANKING (Ранжирование / Переранжирование)
Предложенные ревизии представляются пользователю. Патент также упоминает Revision Server, который может оценивать результаты пересмотренного запроса перед его представлением пользователю, обеспечивая разнообразие и минимальное количество новых результатов по сравнению с исходным запросом.

Входные данные:

Исходный запрос пользователя (GQ).
Индекс IQ (включая QR, PR и указатели от NQ к KHRQ).
(Офлайн) Логи запросов и данные о поведении пользователей.

Выходные данные:

Предлагаемые пересмотренные запросы (KHRQ) с соответствующими мерами уверенности (RS).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на неоднозначные, с ошибками, слишком широкие или слишком узкие запросы (потенциальные NQ), с которыми пользователи обычно испытывают трудности. Механизм направлен на переадресацию этих запросов к запросам с высокой степенью удовлетворенности (KHRQ).
Длиннохвостые запросы (Long-Tail): Влияет на длинный хвост запросов, которые могут быть классифицированы как NQ. Система консолидирует трафик с этих NQ на соответствующие KHRQ.

Когда применяется

Триггеры активации: Система активируется для данного запроса (GQ), когда существуют индексированные запросы (IQ) с достаточно высокими оценками пересмотра (Revision Scores, RS). RS должен превысить определенный порог уверенности.
Условия применения: Ревизия предлагается, если RS достаточно высок. Дополнительно, Revision Server может применять условия валидации перед показом ревизии: минимальное количество результатов, минимальное количество «новых» результатов (разнообразие) и максимальное количество показанных ревизий.

Пошаговый алгоритм

Процесс А: Офлайн-генерация индекса

Сбор данных: Сбор данных пользовательских сессий, включая последовательности запросов и поведение кликов (продолжительность).
Расчет ранга запросов:
- Расчет частоты запросов (QF).
- Расчет удовлетворенности пользователей (US). Это может быть IRF или Quality, основанная на длительных кликах. Патент описывает применение S-образной кривой к продолжительности клика. Пример формулы: 1/(1+e^(-(x-40s)/10s)). Упомянуты точки перегиба: 20с (оценка 0.1), 40с (оценка 0.5), 60с (оценка 0.9).
- Расчет ранга запроса (QR) (например, QR = QF * US).
Идентификация KHRQ: Определение запросов с высоким QR как Known Highly-Ranked Queries.
Идентификация NQ:
- Для остальных запросов расчет вероятности пересмотра (PR) в KHRQ на основе сходства (часто поведенческого).
- Определение запросов со статистически значимым PR как Nearby Queries (NQ).
Индексирование: Сохранение всех KHRQ и NQ (IQ). Сохранение указателей от NQ к соответствующим KHRQ вместе с PR.

Процесс Б: Пересмотр запросов в рантайме

Получение запроса: Получение данного запроса (GQ).
Расчет вероятности пересмотра (RP): Определение RP между GQ и IQ на основе показателей сходства. RP может рассчитываться прямо и косвенно через NQ: RP(GQ, KHRQ) = Direct_RP + Sum[ RP(GQ, NQ) * PR(NQ, KHRQ) ].
Расчет оценки пересмотра (RS): Расчет RS для каждого IQ (например, RS(IQ) = RP(GQ, IQ) * QR(IQ)).
Выбор альтернативных запросов (AQ): Извлечение IQ с наивысшими RS.
Генерация кандидатов на пересмотр:
- Если AQ является KHRQ, он становится кандидатом.
- Если AQ является NQ, KHRQ, на который он указывает, становится кандидатом.
Постобработка (Revision Server): Валидация кандидатов (например, разнообразие результатов). Выбор и упорядочивание финальных ревизий на основе мер уверенности (RS).
Представление: Предоставление предложенных ревизий пользователю.

Какие данные и как использует

Данные на входе

Поведенческие факторы (User Behavior/Session Data): Критически важны для всего механизма.
- Логи запросов / Данные сессий: Используются для определения последовательностей запросов и ревизий (для расчета IRF и поведенческого сходства/PR).
- Данные о кликах и их продолжительность: Используются для оценки удовлетворенности пользователей (Quality). Конкретно измеряется продолжительность кликов (время между выбором одного результата и последующим выбором другого) — long clicks.
Контентные/Лингвистические факторы:
- Термины запроса: Используются для расчета семантического и синтаксического сходства (например, расстояние редактирования, перекрытие терминов, лексическое сходство, кластеры слов) между GQ, NQ и KHRQ при расчете RP и PR.

Какие метрики используются и как они считаются

Query Rank (QR): QR = QF * US.
User Satisfaction (US): Описаны два основных метода:
1. Inverse Revision Frequency (IRF): Основана на том, как редко запрос пересматривается по отношению к его частоте.
2. Quality (Q) / Длительность кликов: Основана на продолжительности клика. К продолжительности (x) между кликами применяется S-образная кривая. Пример формулы: 1/(1+e^(-(x-40s)/10s)) с точками перегиба, где 40 секунд дают оценку 0.5, а 60 секунд — 0.9.
Probability of Revision (PR): Вероятность NQ -> KHRQ. Основана на сходстве. В одном из вариантов используется поведенческое сходство (BS): PR = BS = (Количество раз, когда NQ пересмотрен в KHRQ) / QF(NQ).
Revision Probability (RP): Вероятность связи GQ с IQ. Основана на сходстве (семантическом, синтаксическом, поведенческом). Может рассчитываться прямо и косвенно.
Revision Score (RS): RS(IQ) = RP(GQ, IQ) * QR(IQ). Используется как мера уверенности для предложенной ревизии.

Выводы

Идентификация канонических запросов (Интентов): Google активно идентифицирует «канонические» или высокоуспешные запросы (KHRQ) на основе агрегированного поведения пользователей (высокая частота + высокая удовлетворенность).
Детализированные метрики удовлетворенности пользователей: Патент явно определяет, как измеряется удовлетворенность: низкие показатели пересмотра (IRF) и/или длительные клики (Quality/время пребывания). Длительные клики количественно оцениваются с использованием S-образной кривой с конкретными временными порогами (40-60 секунд).
Перенаправление трафика и консолидация: Система предназначена для перенаправления пользователей с менее успешных запросов (GQ или NQ) на эти KHRQ, консолидируя трафик вокруг наиболее эффективных формулировок.
Важность ранга запроса (QR) в выборе альтернативы: Выбор ревизии сильно зависит от абсолютного ранга целевого запроса (QR). Очень похожий запрос (высокий RP) может не быть предложен, если его QR низок. И наоборот, менее похожий запрос может быть предложен, если его QR чрезвычайно высок (баланс в формуле RS).
Многогранное сходство и косвенные связи: Система использует комбинацию поведенческого, семантического и синтаксического сходства и учитывает косвенные пути пересмотра через NQ для установления отношений между запросами.

Практика

Best practices (это мы делаем)

Ориентация на KHRQ (Канонические интенты): Сосредоточьте SEO-стратегию на выявлении и ранжировании по KHRQ в вашей нише. Это запросы, которые, по мнению Google, наиболее эффективно удовлетворяют пользователей. Анализируйте высокочастотные запросы и сопоставляйте их с данными об удовлетворенности (длительное время пребывания, низкий показатель отказов).
Оптимизация для удовлетворенности пользователей (Dwell Time/Long Clicks): Поскольку KHRQ определяются высокой удовлетворенностью (включая длительные клики), оптимизация контента для искреннего вовлечения пользователей критически важна. Патент предоставляет конкретные метрики (например, 40-60+ секунд) как индикаторы качественных кликов. Контент должен полностью решать задачу пользователя и минимизировать pogo-sticking.
Анализ цепочек запросов и связанных поисков: Изучите, как пользователи уточняют свои поиски (например, в GSC или анализируя «Связанные запросы» в SERP). Это помогает идентифицировать NQ, которые ведут к KHRQ, и обеспечивает комплексный охват пути к основному интенту.
Построение тематического авторитета вокруг KHRQ: Убедитесь, что сайт является исчерпывающим ресурсом для KHRQ. Это увеличивает вероятность того, что сайт станет пунктом назначения для трафика, перенаправленного с различных связанных NQ.

Worst practices (это делать не надо)

Чрезмерная зависимость от неясных длиннохвостых ключевых слов (NQ): Ориентация только на очень специфические, низкочастотные длиннохвостые запросы (потенциальные NQ) рискованна. Google может идентифицировать их как неудовлетворительные и пересмотреть их до более широкого KHRQ, уводя трафик на страницы конкурентов.
Оптимизация для кликов без удовлетворения (Short Clicks): Генерация кликов, которые приводят к короткому времени пребывания (например, кликбейт, вводящие в заблуждение заголовки/сниппеты), снизит оценку User Satisfaction для этого запроса. Это уменьшает шанс того, что запрос станет KHRQ, и негативно влияет на общую производительность сайта для этого кластера.
Игнорирование канонических формулировок: Попытки продвигать неестественные или переоптимизированные формулировки запросов вместо общепринятых (KHRQ) будут бороться с системой, которая предпочитает статистически проверенные успешные запросы.

Стратегическое значение

Этот патент подчеркивает сдвиг от сопоставления ключевых слов к сопоставлению интентов на основе поведенческих данных. Он подтверждает, что Google использует подход, основанный на данных, для определения «лучшей» формулировки запроса (KHRQ) и активно направляет на него трафик. Стратегическое последствие заключается в том, что SEO должно фокусироваться на центре кластера интентов (KHRQ) и приоритизировать метрики удовлетворенности пользователей (такие как время пребывания) как ключевые показатели эффективности, поскольку они напрямую влияют на алгоритмы, определяющие ранжирование запросов.

Практические примеры

Сценарий 1: Использование поведенческих данных для улучшения US

Ситуация: Сайт ранжируется по запросу [как настроить гитару]. Но пользователи быстро уходят со страницы (короткий клик, менее 20 сек) и ищут [тюнер для гитары онлайн].
Работа системы: Google фиксирует низкую US для запроса [как настроить гитару] (низкая длительность кликов, высокий процент пересмотров). QR этого запроса снижается.
Действие SEO: Проанализировать причины ухода. Добавить на страницу видео-инструкцию и встроить простой онлайн-тюнер. Улучшить структуру текста.
Результат: Длительность кликов увеличивается (достигая порогов 40-60 сек), процент пересмотров падает. US и QR запроса [как настроить гитару] растут, укрепляя его позиции как KHRQ.

Сценарий 2: Косвенное перенаправление (Пример из патента)

Ситуация: Пользователь ищет [шампуры для барбекю] (GQ).
Системный анализ (Офлайн):
- Google идентифицирует [Williams-Sonoma] (бренд магазина посуды) как KHRQ (высокий QR).
- Google идентифицирует [деревянные шампуры] как NQ, который часто ведет к [Williams-Sonoma] (высокий PR).
Системное действие (Рантайм):
- Система находит высокое сходство (RP) между [шампуры для барбекю] (GQ) и [деревянные шампуры] (NQ).
- Используя косвенный путь (GQ -> NQ -> KHRQ), система рассчитывает высокий Revision Score для [Williams-Sonoma].
Результат: Система предлагает [Williams-Sonoma] в качестве альтернативного поиска для пользователя, искавшего [шампуры для барбекю].

Вопросы и ответы

Что такое «Known Highly-Ranked Query» (KHRQ) и почему это важно для SEO?

KHRQ — это запрос, который Google определил как очень успешный. Это основано на двух факторах: он часто используется (высокая Query Frequency) и он хорошо удовлетворяет пользователей (высокая User Satisfaction). Для SEO это критически важно, потому что система активно пытается перенаправить трафик с менее успешных, похожих запросов (Nearby Queries) на эти KHRQ. По сути, KHRQ действуют как канонические интенты, и оптимизация под них должна быть приоритетом.

Как Google измеряет «Удовлетворенность пользователей» (User Satisfaction) согласно патенту?

Патент описывает два основных метода. Первый — это Inverse Revision Frequency (IRF): если пользователи редко уточняют запрос после его ввода, это считается признаком удовлетворенности. Второй метод — Quality, основанный на продолжительности кликов (Dwell Time/Long Clicks). Если пользователь кликает на результат и остается там надолго перед следующим кликом, это считается высоким показателем удовлетворенности.

Патент упоминает конкретные временные пороги для «длительных кликов». Что они означают?

Да, патент описывает использование S-образной кривой для оценки качества клика на основе его продолжительности. Приведены примеры точек перегиба: 20 секунд дают оценку качества 0.1, 40 секунд — 0.5, а 60 секунд — 0.9. Это означает, что для достижения высокой оценки удовлетворенности контент должен удерживать внимание пользователя значительно дольше, чем несколько секунд, причем прирост оценки замедляется после 60 секунд.

Что такое «Nearby Query» (NQ) и как он используется?

NQ — это запрос, который сам по себе может не иметь высокого ранга, но он тесно связан с KHRQ и часто пересматривается пользователями в этот KHRQ. Система использует NQ как посредника. Если пользователь вводит запрос (GQ), который очень похож на NQ, система предложит связанный с этим NQ высококачественный KHRQ в качестве альтернативы.

Как рассчитывается итоговая оценка для предложения альтернативного запроса (Revision Score)?

Revision Score (RS) рассчитывается для индексированного запроса (IQ) путем умножения двух факторов: Revision Probability (RP) и Query Rank (QR). RP — это мера того, насколько исходный запрос похож на IQ. QR — это мера общей важности и качества IQ. Таким образом, RS = RP * QR. Это означает, что для предложения альтернативы запрос должен быть одновременно релевантным (высокий RP) и высококачественным (высокий QR).

Может ли система предложить альтернативный запрос, который текстово сильно отличается от оригинала?

Да. Сходство (RP) может быть не только синтаксическим (текстовым), но и семантическим или поведенческим. Кроме того, система может использовать косвенные пути через NQ. Также, если целевой запрос имеет чрезвычайно высокий Query Rank (QR), он может быть предложен, даже если сходство (RP) относительно невелико, при условии, что итоговый Revision Score (RS) высок.

Как этот патент влияет на стратегию работы с длиннохвостыми (long-tail) запросами?

Он предполагает, что стратегия, основанная исключительно на множестве узких длиннохвостых запросов, может быть рискованной. Если эти запросы определены как NQ с низкой удовлетворенностью, трафик с них будет перенаправлен на более общий KHRQ. Необходимо убедиться, что вы также хорошо ранжируетесь по этому KHRQ, а не только по его вариациям.

Насколько важны поведенческие факторы (Dwell Time) в контексте этого патента?

Они критически важны. Поведенческие данные являются основой для определения Query Rank и User Satisfaction. Длительное время пребывания (Dwell Time/Long Clicks) напрямую способствует тому, чтобы запрос считался KHRQ. Оптимизация контента для вовлечения и удовлетворения пользователя напрямую влияет на работу этого механизма.

Применяется ли этот механизм ко всем запросам?

Механизм потенциально может оценивать все запросы, но предложения генерируются только тогда, когда система находит индексированный запрос (IQ) с достаточно высоким Revision Score (RS). Офлайн-процесс фокусируется на идентификации и индексировании только тех запросов, которые достигают статуса KHRQ или NQ.

Как SEO-специалист может определить, какие запросы являются KHRQ в его нише?

Патент не предлагает способа для внешнего доступа к этим данным. Однако SEO-специалисты могут аппроксимировать KHRQ, ища запросы с высокой частотностью, которые также демонстрируют признаки высокой удовлетворенности в SERP (например, стабильные топы с авторитетными сайтами) и анализируя собственные данные сайта на предмет запросов, ведущих к длительному времени пребывания и низким показателям отказов.