Как Google использует цепочки запросов пользователей для добавления "желаемых результатов" в выдачу

Google анализирует исторические данные о том, как пользователи переформулируют запросы (цепочки запросов), пока не найдут нужный контент. Если многие пользователи начинают с запроса А, переходят к запросу Б и кликают на результат Х, система может добавить результат Х напрямую в выдачу по запросу А и повысить его в ранжировании, основываясь на частоте такого поведения.

Описание

Какую задачу решает

Патент решает проблему неэффективности поисковой выдачи, когда стандартные алгоритмы ранжирования не предоставляют пользователю желаемый результат по его первоначальному запросу. Это вынуждает пользователя вручную переформулировать и уточнять запрос несколько раз (создавая chain of related search queries), пока нужный контент не будет найден. Изобретение направлено на автоматизацию этого процесса уточнения путем изучения исторических паттернов поведения пользователей.

Что запатентовано

Запатентована система, которая использует исторические данные поисковых сессий (historical search query data) для выявления паттернов, когда первоначальный запрос (Q1) систематически приводит к серии уточнений, заканчивающихся выбором конкретного результата (D – desired search result). Система рассчитывает частоту (frequency или transition rate), с которой Q1 приводит к выбору D. Если эта частота достаточно высока, система модифицирует выдачу по запросу Q1, добавляя или повышая в ней результат D.

Как это работает

Механизм работает в двух режимах: офлайн и онлайн.

Офлайн-анализ логов: Система анализирует логи поисковых сессий, выявляя последовательности запросов и кликов.
Идентификация цепочек: Определяются chains of related search queries. Цепочка продолжается, если время между кликом по результату и вводом следующего запроса короткое (нарушение timing criterion), что указывает на неудовлетворенность. Цепочка заканчивается, когда это время превышает порог, что указывает на нахождение желаемого результата.
Агрегация данных: Данные о цепочках (Первый запрос -> Желаемый результат) агрегируются, рассчитывается частота переходов.
Онлайн-корректировка (Reranking): Когда поступает новый запрос, система проверяет, не является ли он частым началом цепочки. Если да, она извлекает соответствующий желаемый результат и внедряет его в выдачу. Позиция внедрения определяется путем сравнения частоты выбора желаемого результата с частотами выбора стандартных результатов выдачи.

Актуальность для SEO

Высокая. Понимание истинного намерения пользователя и оценка удовлетворенности результатами поиска (User Satisfaction) являются центральными задачами современных поисковых систем. Этот патент описывает конкретный механизм использования поведенческих сигналов (последовательности запросов, короткие и длинные клики) для прямой корректировки ранжирования, что полностью соответствует текущему вектору развития Google.

Важность для SEO

Патент имеет высокое значение для SEO (85/100). Он демонстрирует механизм, при котором контент, являющийся конечной целью поисковой сессии, получает преимущество над контентом, который релевантен только промежуточным этапам. Это подчеркивает критическую важность полного удовлетворения интента пользователя (минимизация pogo-sticking) и анализа всего пути пользователя (customer journey), а не только отдельных запросов.

Детальный разбор

Термины и определения

Chain of related search queries (Цепочка связанных запросов): Последовательность запросов, введенных пользователем в рамках одной сессии, где первоначальный запрос последовательно уточняется до тех пор, пока не будет найден желаемый результат. Характеризуется тем, что все запросы в цепочке, кроме последнего, нарушают timing criterion.
Desired search result (Желаемый результат, D): Результат поиска, выбранный пользователем по последнему запросу в цепочке, после которого пользователь не вводил новый запрос в течение определенного времени (удовлетворил timing criterion).
Filtering Rules (Правила фильтрации): Набор эвристик, применяемых к выявленным цепочкам запросов для удаления шума и повышения качества агрегированных данных (например, требование наличия общих терминов, фильтрация спама).
Frequency / Transition Rate (Частота / Коэффициент перехода): Метрика, показывающая, как часто первый запрос в цепочке приводил к выбору конкретного желаемого результата. Рассчитывается как отношение количества таких переходов к общему количеству использований первого запроса.
Historical search query data (Исторические данные поисковых запросов): Логи поисковых сессий, включающие введенные запросы, выбранные результаты и временные метки.
Query Database (База данных запросов): Хранилище агрегированных данных о цепочках запросов, содержащее связи между первыми запросами, последними запросами, желаемыми результатами и частотами переходов.
Timing Criterion / Search result selection criterion (Временной критерий / Критерий выбора результата): Пороговое значение времени (tₛ). Если время между кликом на результат и вводом следующего запроса превышает tₛ, считается, что критерий выполнен (пользователь удовлетворен). Если время меньше tₛ, критерий нарушен (пользователь продолжает поиск).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод идентификации и внедрения результатов поиска.

Система получает набор ранжированных результатов по запросу пользователя.
Используя historical search query data, система идентифицирует desired search result (D), который исторически выбирался пользователями, начинавшими с этого же запроса, но нашедшими D через chain of related search queries.
Ключевое условие определения цепочки: каждый запрос в цепочке, кроме последнего, нарушает timing criterion (т.е. после клика быстро следовал новый запрос).
Определяется frequency (F_D), с которой исходный запрос приводил к выбору D.
Происходит внедрение (inserting) результата D в исходный набор. Механизм внедрения детализирован:
- Определяются частоты выбора (F_R) для каждого результата (R) в исходном наборе.
- Идентифицируется результат (R_high) с наивысшим рангом, у которого частота выбора F_R меньше, чем частота F_D желаемого результата.
- Результат D вставляется в набор на позицию выше, чем позиция R_high.
Модифицированный набор результатов возвращается пользователю.

Этот механизм гарантирует, что исторически более предпочтительный результат (D) будет показан выше, чем стандартные результаты, которые имеют меньшую вероятность быть выбранными.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, собранные и обработанные заранее, для влияния на финальное ранжирование.

INDEXING – Индексирование и сбор данных
На этом этапе происходит сбор и хранение historical search query data (логов сессий), включая запросы, клики и временные метки.

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Система периодически анализирует логи для выявления chains of related search queries. Происходит расчет frequencies (transition rates) и генерация Query Database. Это позволяет системе понять взаимосвязи между разными формулировками запросов и конечными целями пользователей.

RANKING / RERANKING – Ранжирование и Переранжирование (Онлайн)
Основное применение патента. После того как стандартная система ранжирования сгенерировала первоначальный набор результатов:

Система проверяет Query Database на наличие агрегированных данных для текущего запроса.
Если существуют desired search results с высокой частотой перехода, они извлекаются.
Применяется механизм сравнения частот (Claim 1) для определения оптимальной позиции вставки этих результатов в SERP. Происходит переранжирование.

METASEARCH – Метапоиск и Смешивание
Патент также описывает использование последних запросов из цепочек для генерации блока «Related Searches» (Связанные запросы) в выдаче по первому запросу.

Входные данные:

Исходный запрос пользователя.
Первоначальный набор ранжированных результатов.
Query Database (агрегированные исторические данные).
Данные о частоте выбора (CTR) для первоначального набора результатов.

Выходные данные:

Модифицированный набор ранжированных результатов (с внедренными желаемыми результатами).
Список связанных запросов (Related Searches).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на широкие, неоднозначные или плохо сформулированные запросы, которые пользователи часто уточняют. Это могут быть информационные запросы (например, поиск решения проблемы) или сложные коммерческие запросы (например, выбор продукта).
Типы контента: Влияет на любой тип контента, который является конечной целью поисковой сессии.

Когда применяется

Условия работы: Алгоритм применяется динамически для запросов, по которым в Query Database существует достаточно статистических данных.
Триггеры активации: Наличие записи в Query Database для данного запроса, где frequency (transition rate) к желаемому результату достаточно высока, чтобы превзойти частоту выбора стандартных результатов выдачи.

Пошаговый алгоритм

Процесс А: Офлайн-генерация Базы данных запросов

Сбор данных: Получение historical search query data (логи сессий).
Идентификация цепочек: Анализ последовательностей запросов и кликов. Применение timing criterion (tₛ) для определения начала и конца chain of related search queries. Выделение первого запроса (Q1), последнего запроса (QN) и желаемого результата (D).
Фильтрация (Опционально): Применение Filtering Rules для очистки цепочек (например, удаление цепочек без общих терминов, с низким количеством повторений, содержащих локальные термины или спам).
Агрегация: Группировка цепочек по общему первому запросу (Q1) и общему желаемому результату (D).
Расчет метрик: Подсчет общего числа использований Q1 и числа переходов Q1 -> D. Расчет Frequency.
Сохранение: Запись агрегированных данных в Query Database.

Процесс Б: Обработка запроса и внедрение результатов

Получение запроса и первичных результатов: Система получает запрос (Q) и генерирует стандартный набор ранжированных результатов (R).
Поиск желаемых результатов: Запрос к Query Database для поиска desired search results (D), связанных с Q, и их частот (F_D).
Определение частот выбора: Определение частот выбора (F_R) для стандартных результатов R (на основе исторических данных).
Идентификация точки вставки: Поиск результата с наивысшим рангом (R_high) в наборе R, у которого F_R < F_D.
Внедрение и переранжирование: Вставка результата D на позицию выше, чем R_high.
Возврат результатов: Предоставление модифицированного набора пользователю.

Какие данные и как использует

Данные на входе

Патент полностью полагается на поведенческие данные для реализации описанного механизма.

Поведенческие факторы:
- Последовательности запросов: Тексты запросов, введенных пользователем в рамках одной сессии.
- Выбранные результаты (Клики): Идентификаторы документов (URL), на которые кликнул пользователь.
- Временные метки (Timestamps): Точное время ввода каждого запроса и совершения каждого клика. Критически важны для определения timing criterion.
- Идентификаторы сессий/пользователей: Анонимные идентификаторы для связывания действий в цепочки.

Контентные, ссылочные или технические факторы в данном патенте не упоминаются как входные данные для этого конкретного механизма корректировки.

Какие метрики используются и как они считаются

Timing Criterion (tₛ): Предопределенный временной интервал (например, несколько минут). Используется для различения коротких кликов (неудовлетворенность) и длинных кликов (удовлетворенность).
Frequency (Transition Rate): Рассчитывается как (# Q1 → D) / (# Q1). Показывает вероятность того, что пользователь, введя запрос Q1, на самом деле ищет результат D.
Selection Frequency (Частота выбора): Стандартная метрика (похожая на CTR), используемая для сравнения популярности стандартных результатов и желаемого результата.
Метрики фильтрации:
- Количество общих терминов между Q1 и QN, или между Q1 и заголовком D.
- Минимальное количество поисковых сессий, в которых наблюдалась цепочка.
- Порог для минимального Transition Rate.

Выводы

Google активно учится на паттернах уточнения запросов (Pogo-sticking): Система не просто фиксирует факт возврата к выдаче, но анализирует всю цепочку последующих действий, чтобы понять, к какому результату пользователь стремился изначально.
Сигналы удовлетворенности (длинные клики) напрямую влияют на ранжирование: Идентификация desired search result основана на timing criterion (длительное время до следующего запроса). Это подтверждает, что длинные клики являются сильным сигналом качества и релевантности.
Точный механизм повышения в ранжировании: Патент описывает не простое добавление результата в топ, а точный алгоритм вставки (Claim 1). Позиция определяется сравнением Frequency (Transition Rate) желаемого результата с частотой выбора (CTR) стандартных результатов. Желаемый результат вставляется выше самого высокоранжированного результата, который кликают реже, чем его.
Преимущество контента, решающего конечную задачу: Контент, который является конечной целью пользователя, может начать ранжироваться по более широким или ранним запросам в цепочке, даже если он не был идеально оптимизирован под их формулировку.
Генерация связанных запросов: Система использует последние запросы в цепочках для формирования блока «Related Searches», что дает SEO-специалистам понимание того, как пользователи уточняют свои потребности.

Практика

Best practices (это мы делаем)

Фокус на полном удовлетворении интента (User Satisfaction): Создавайте контент, который максимально полно отвечает на запрос и предотвращает необходимость дальнейшего поиска (pogo-sticking). Цель – стать desired search result, который удовлетворяет timing criterion (обеспечивает длинный клик).
Анализ пути пользователя (Customer Journey Mapping): Изучайте, как пользователи приходят к вашему контенту. Если они часто начинают с более широкого запроса и затем уточняют его до вашего целевого запроса, этот механизм может помочь вам ранжироваться по широкому запросу напрямую.
Изучение блока «Related Searches»: Анализируйте запросы в этом блоке. Согласно патенту, они могут представлять собой последние запросы в цепочках. Это дает инсайты о том, как пользователи уточняют интент и какой контент им нужен в конечном итоге.
Оптимизация под поведенческие факторы (CTR и Длинные клики): Работайте над привлекательностью сниппетов для повышения Selection Frequency и над качеством контента для удержания пользователя. Высокие поведенческие метрики защищают от вытеснения результатами, внедряемыми этим алгоритмом.

Worst practices (это делать не надо)

Создание поверхностного контента (Thin Content): Контент, который соответствует ключевым словам, но не удовлетворяет интент, будет генерировать короткие клики и стимулировать пользователей к уточнению запроса. Это приведет к тому, что ваш контент будет идентифицирован как промежуточный, а не желаемый результат.
Использование кликбейта: Привлечение трафика с помощью заголовков, не соответствующих содержанию, приведет к быстрому возврату в выдачу (нарушение timing criterion). Система научится, что этот контент не является удовлетворительным.
Игнорирование широких запросов в нише: Фокусировка только на узких НЧ-запросах может привести к потере трафика по ВЧ-запросам, если конкурент лучше удовлетворяет конечный интент и система начинает подмешивать его контент в выдачу по ВЧ-запросам.

Стратегическое значение

Патент подтверждает стратегию Google по переходу от ранжирования на основе ключевых слов к ранжированию на основе удовлетворенности пользователя и решения его задачи. Поведенческие сигналы, такие как последовательность запросов и время между действиями, используются как прямые факторы для переопределения релевантности. Для SEO это означает, что анализ данных о поведении пользователей на сайте и в выдаче становится критически важным элементом стратегии продвижения.

Практические примеры

Сценарий: Поиск решения технической проблемы

Первый запрос (Q1): «не работает wifi на ноутбуке». Выдача содержит общие статьи.
Поведение пользователя: Пользователь кликает на статью, быстро просматривает, возвращается в выдачу (время < tₛ).
Второй запрос (Q2): «сброс сетевого адаптера windows 10».
Поведение пользователя: Пользователь кликает на детальное руководство на авторитетном сайте (D), читает его и решает проблему. Следующий запрос не вводится (время > tₛ).
Действие системы (Офлайн): Система фиксирует цепочку Q1 -> Q2 -> D. После накопления статистики рассчитывается высокая Frequency для перехода Q1 -> D.
Действие системы (Онлайн): Когда новый пользователь вводит Q1, система сравнивает Frequency результата D с частотами кликов общих статей. Если F_D выше, детальное руководство (D) внедряется в ТОП выдачи по запросу «не работает wifi на ноутбуке».

Вопросы и ответы

Как именно система определяет, что пользователь удовлетворен результатом (Desired Search Result)?

Система использует Timing Criterion (временной критерий tₛ). Если после клика на результат пользователь не вводит следующий запрос в течение времени, превышающего порог tₛ, система считает, что результат удовлетворил потребность пользователя. Это эквивалентно концепции «длинного клика» (long click) в SEO.

Что такое «Цепочка связанных запросов» (Chain of related search queries)?

Это последовательность запросов в рамках одной сессии, где каждый шаг (кроме последнего) характеризуется неудовлетворенностью пользователя. Технически это означает, что время между кликом и следующим запросом было коротким (меньше порога tₛ). Система интерпретирует это как процесс последовательного уточнения первоначального интента.

На какую позицию будет вставлен «Желаемый результат»?

Позиция вставки определяется динамически и очень точно. Система сравнивает частоту перехода к желаемому результату (F_D) с частотами выбора (CTR) стандартных результатов (F_R). Желаемый результат вставляется выше самого высокоранжированного стандартного результата, у которого F_R меньше, чем F_D. Это может быть как первая позиция, так и любая другая в топе.

Означает ли это, что CTR является фактором ранжирования?

Да, в контексте этого патента частота выбора (Selection Frequency, функциональный эквивалент CTR) используется напрямую для принятия решения о переранжировании. Результаты с низкой частотой выбора рискуют быть пониженными в пользу результатов, которые исторически лучше удовлетворяли пользователей, даже если те находили их через уточняющие запросы.

Как этот патент связан с Pogo-sticking?

Патент напрямую использует механику Pogo-sticking (быстрый возврат к выдаче и выбор другого результата или ввод нового запроса) для идентификации неудовлетворенности пользователя. Pogo-sticking является триггером для продолжения chain of related search queries. Цель SEO-специалиста — минимизировать Pogo-sticking со своего сайта.

Может ли этот механизм помочь моему сайту ранжироваться по более широким запросам?

Да. Если ваш контент является конечной целью (desired search result) для пользователей, которые начинают с широкого запроса и затем уточняют его, система может научиться этому паттерну и начать показывать ваш контент напрямую по широкому запросу, сокращая путь пользователя.

Как система защищается от накруток или нерелевантных внедрений?

Патент описывает использование Filtering Rules. К ним относятся: требование наличия общих терминов между первым запросом и желаемым результатом, минимальное количество сессий, в которых наблюдалась цепочка, фильтрация локально-зависимых терминов и проверка на спам/неприемлемый контент. Это гарантирует статистическую значимость и релевантность.

Какое значение этот патент имеет для блока «Related Searches»?

Патент указывает, что последние запросы в цепочках (те, которые привели к желаемому результату) используются для генерации предложений в блоке «Related Searches» для первого запроса. Это означает, что «Related Searches» часто показывают, как другие пользователи успешно уточнили исходный запрос.

Влияет ли этот алгоритм на все запросы?

Нет. Он влияет только на те запросы, по которым накоплено достаточно исторических данных и где наблюдаются четкие паттерны переформулирования, ведущие к конкретным желаемым результатам с высокой частотой (Transition Rate).

Что важнее в контексте этого патента: оптимизация под ключевые слова или удовлетворение интента?

Удовлетворение интента критически важно. Если страница оптимизирована под ключевые слова, но не удовлетворяет пользователя (генерирует короткие клики), она будет понижена в пользу контента, который решает задачу пользователя, даже если тот изначально формулировал запрос иначе.

Как Google использует цепочки запросов пользователей для добавления «желаемых результатов» в выдачу