Как Google использует историю поиска в текущей сессии для уточнения и переписывания неоднозначных запросов

Google анализирует последовательность запросов пользователя в рамках одной сессии. Если текущий запрос неоднозначен или содержит отсылки (например, местоимения), система пытается связать его с предыдущими запросами. Затем она генерирует и оценивает варианты переписанного запроса, объединяя контекст, чтобы предоставить более точные результаты.

Описание

Какую задачу решает

Патент решает проблему обработки неоднозначных, неполных или контекстно-зависимых запросов, которые сами по себе не содержат достаточно информации для точного определения намерения пользователя. Это особенно актуально для разговорного поиска (Conversational Search) и запросов, содержащих референциальные термины (например, местоимения «он», «это», «там»), которые ссылаются на объекты или темы, упомянутые в предыдущих запросах той же сессии.

Что запатентовано

Запатентована система для контекстного переписывания запросов (Query Rewriting). Суть изобретения заключается в использовании истории предыдущих запросов (Prior Search Queries) в рамках текущей пользовательской сессии (User Session) для уточнения и обогащения текущего запроса. Система генерирует кандидатов на переписывание, оценивает их по комплексу критериев и выбирает наилучший вариант для выполнения поиска, если он превосходит заданный порог качества.

Как это работает

Система работает следующим образом:

Сбор контекста: Отслеживаются все запросы и время их ввода в рамках одной сессии.
Генерация кандидатов: При получении нового запроса система генерирует кандидатов на переписывание (Candidate Query Rewrites), комбинируя текущий запрос с каждым из предыдущих запросов сессии (например, путем конкатенации или лингвистической замены).
Оценка (Scoring): Каждый кандидат оценивается по нескольким факторам, включая: свежесть предыдущего запроса (чем новее, тем лучше), популярность переписанной фразы среди всех пользователей, лингвистические сигналы (например, совпадение типа сущности с местоимением) и ожидаемое качество результатов поиска по переписанному запросу.
Выбор и выполнение: Если лучший кандидат имеет оценку выше установленного порога, он используется для поиска. В противном случае используется исходный запрос.

Актуальность для SEO

Высокая. С ростом доли мобильного и голосового поиска, а также развитием диалоговых интерфейсов (Google Assistant, SGE), понимание контекста сессии становится критически важным. Пользователи все чаще взаимодействуют с поиском в режиме диалога, задавая уточняющие вопросы. Этот патент описывает фундаментальный механизм, позволяющий Google обрабатывать такие последовательные и контекстно-зависимые запросы.

Важность для SEO

Влияние на SEO – 7/10. Патент имеет высокое значение для понимания того, как Google интерпретирует намерения пользователей в рамках сессии (User Journey). Он не описывает факторы ранжирования контента напрямую, но критически важен для стратегий, ориентированных на оптимизацию под разговорный поиск и длинный хвост запросов. Понимание этого механизма помогает осознать, как контекст сессии определяет, будет ли контент вообще рассмотрен как релевантный для уточняющих запросов.

Детальный разбор

Термины и определения

Candidate Query Rewrite (Кандидат на переписывание запроса): Потенциальная новая формулировка запроса, сгенерированная путем объединения текущего запроса с одним из предыдущих запросов сессии.
Entity Correlation (Корреляция сущностей): Связь между определенными терминами в запросе и типами сущностей. Например, термин «вместимость» сильно коррелирует с сущностями типа «спортивные сооружения».
Prior Search Query (Предыдущий поисковый запрос): Запрос, введенный пользователем ранее в рамках той же сессии. Включает текст запроса и временную метку (timestamp).
Quality Measure (Мера качества): Оценка качества кандидата на переписывание, основанная на анализе поисковых результатов, которые он возвращает (например, количество результатов, частота кликов, качество ресурсов в выдаче).
Query Rewriting Engine (Система переписывания запросов): Компонент поисковой системы, отвечающий за анализ контекста сессии и генерацию переписанных запросов.
Referential Term (Референциальный термин): Слово в запросе, которое ссылается на ранее упомянутый объект (например, местоимения «он», «она», «это», «там»).
User Session (Пользовательская сессия): Последовательность запросов от одного пользователя в течение определенного периода времени или в рамках одного сеанса браузера.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс переписывания запроса на основе контекста сессии.

Система получает поисковый запрос в рамках текущей сессии.
Получает список предыдущих запросов этой же сессии.
Определяет, связан ли предыдущий запрос с текущим. Это определение включает:
- Генерацию кандидатов на переписывание (Candidate Query Rewrites), которые являются комбинацией текущего и одного из предыдущих запросов.
- Оценку (Scoring) каждого кандидата с применением множества факторов (plurality of scoring factors).
- Выбор лучшего кандидата, если его оценка удовлетворяет пороговому значению.
Предоставление результатов поиска в ответ на выбранный переписанный запрос.

Claim 3 (Зависимый): Детализирует один из факторов оценки.

Каждый предыдущий запрос имеет временную метку (timestamp). Оценка кандидатов включает взвешивание на основе возраста соответствующего предыдущего запроса. Это означает, что более свежие запросы в сессии имеют больший вес при определении контекста.

Claim 5 (Зависимый): Детализирует фактор популярности.

Применение факторов оценки включает определение меры популярности (measure of popularity) для каждого кандидата на основе коллекции запросов от множества пользователей (общие логи поиска). Если переписанный запрос часто встречается в логах, его оценка повышается.

Claims 6 и 7 (Зависимые): Детализируют обработку референциальных терминов.

Система определяет, содержит ли текущий запрос референциальный термин определенного типа (например, местоимение, указывающее на человека). Оценка кандидата повышается, если он содержит сущность (Entity) соответствующего типа (например, имя человека).

Claims 8 и 9 (Зависимые): Детализируют корреляцию терминов и сущностей.

Система определяет, содержит ли текущий запрос термины, которые сильно коррелируют с определенными сущностями (например, «текст песни» и «название песни»). Оценка кандидата повышается, если он включает сущность, сильно коррелирующую с этим термином.

Описание патента (Abstract/Description): Детализирует оценку качества результатов.

Применение факторов оценки включает определение меры качества (quality measure) для каждого кандидата на основе анализа поисковых результатов, отвечающих этому кандидату.

Где и как применяется

Изобретение применяется на ранних этапах обработки запроса и является ключевой частью системы понимания намерений пользователя.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Query Rewriting Engine анализирует текущий запрос в контексте User Session. Система использует данные из Session logs для определения контекста и генерации Candidate Query Rewrites. Этот процесс происходит до того, как запрос отправляется в основные системы ранжирования.

INDEXING – Индексирование и извлечение признаков
Система переписывания использует данные, подготовленные на этом этапе, в частности, информацию о сущностях и их типах (Knowledge Graph), чтобы выполнять лингвистический анализ и проверять корреляции (Entity Correlation).

RANKING – Ранжирование
Патент напрямую не изменяет алгоритмы ранжирования, но критически влияет на их работу, изменяя входные данные. Система ранжирования получает на вход уже уточненный (переписанный) запрос, что приводит к формированию совершенно другой выдачи.

Входные данные:

Текущий поисковый запрос пользователя.
История предыдущих запросов в сессии (Prior Search Queries) с временными метками.
Данные общих логов запросов (для оценки популярности и корреляций).
Данные о сущностях и их типах.

Выходные данные:

Переписанный поисковый запрос (если порог удовлетворен).
Исходный поисковый запрос (если порог не удовлетворен).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на уточняющие, неоднозначные и разговорные запросы. Особенно на запросы, содержащие местоимения («сколько ему лет?», «какая у него вместимость?»).
Типы контента: Влияет на любой тип контента, так как изменяет сам запрос. Особенно важно для контента, отвечающего на конкретные вопросы о характеристиках сущностей.
Пользовательские факторы: Влияет на пользователей, которые выполняют несколько связанных поисков подряд (исследовательские сессии, сравнение продуктов).

Когда применяется

Условия работы: Алгоритм активируется при получении любого запроса в рамках активной User Session, где есть хотя бы один предыдущий запрос.
Триггеры активации: Хотя система может проверять все запросы, в патенте упоминается, что определенные правила могут использоваться для предварительного определения контекстуального намерения, например, наличие референциальных терминов (местоимений).
Пороговые значения: Переписывание применяется только тогда, когда оценка (Score) лучшего кандидата превышает установленный порог (Threshold Value). Это гарантирует, что переписывание происходит только тогда, когда система уверена в контексте.

Пошаговый алгоритм

Процесс обработки запроса в реальном времени:

Получение запроса: Система получает текущий запрос от пользователя.
Получение контекста сессии: Система извлекает список предыдущих запросов (Prior Search Queries) с их временными метками из Session logs.
Генерация кандидатов: Система генерирует Candidate Query Rewrites. Методы включают:
- Конкатенация (объединение) текущего запроса с каждым из предыдущих.
- Лингвистическая замена: идентификация сущностей в предыдущих запросах и подстановка их вместо референциальных терминов в текущем запросе.
- Использование похожих популярных запросов из общих логов.
Оценка кандидатов (Scoring): Каждый кандидат оценивается с использованием функции, агрегирующей несколько факторов:
- Recency (Свежесть): Применение штрафа (penalty weight) или бустинга (boost) в зависимости от возраста предыдущего запроса. Чем старее запрос, тем ниже вес.
- Popularity (Популярность): Оценка частоты встречаемости кандидата в общих логах запросов.
- Referential Analysis (Анализ отсылок): Проверка наличия местоимений в текущем запросе и соответствующих типов сущностей в предыдущем. Совпадение повышает оценку.
- Entity Correlation (Корреляция сущностей): Проверка наличия терминов, коррелирующих с типами сущностей, и наличия этих сущностей в предыдущих запросах. Совпадение повышает оценку.
- Quality Measure (Мера качества): Анализ ожидаемых результатов поиска по кандидату (например, количество, качество сайтов, кликабельность).
Проверка порога: Оценка лучшего кандидата сравнивается с пороговым значением (Threshold Value).
Выбор и выполнение:
- Если порог превышен: Выбирается лучший кандидат. Система выполняет поиск по переписанному запросу.
- Если порог не превышен: Система выполняет поиск по исходному запросу.

Какие данные и как использует

Данные на входе

Система использует несколько типов данных для принятия решения о переписывании:

Поведенческие факторы (в рамках сессии): История запросов пользователя в текущей сессии (Prior Search Queries). Это основной источник контекста.
Временные факторы: Временные метки (timestamps) предыдущих запросов используются для оценки свежести контекста.
Поведенческие факторы (глобальные): Логи запросов от множества пользователей. Используются для определения популярности (Popularity) переписанных запросов и выявления корреляций между терминами и сущностями.
Данные о сущностях (Knowledge Graph): Информация о сущностях и их типах (Человек, Место, Организация и т.д.). Используется для анализа референциальных терминов и Entity Correlation.

Какие метрики используются и как они считаются

Патент не приводит конкретных формул, но описывает ключевые метрики, используемые в функции оценки (Scoring Function):

Recency Weight (Вес свежести): Функция от времени, прошедшего с момента предыдущего запроса. Вес уменьшается с возрастом запроса.
Popularity Score (Оценка популярности): Относительная частота встречаемости Candidate Query Rewrite в глобальных логах запросов.
Referential Match Score (Оценка совпадения отсылок): Метрика, которая повышается, если тип референциального термина в текущем запросе (например, «он» -> Человек) совпадает с типом сущности в предыдущем запросе.
Entity Correlation Score (Оценка корреляции сущностей): Метрика, основанная на силе связи между терминами в текущем запросе и типами сущностей из предыдущих запросов (например, насколько часто «вместимость» появляется с названием стадиона).
Quality Measure of Results (Мера качества результатов): Агрегированная метрика качества выдачи по переписанному запросу. Может включать количество результатов, показатели вовлеченности (клики) и оценки качества ресурсов в выдаче.
Threshold Value (Пороговое значение): Фиксированное значение, которое должна превысить итоговая оценка кандидата для его принятия.

Выводы

Контекст сессии критичен для понимания запроса: Google активно использует историю недавних действий пользователя для интерпретации его текущего намерения. Это не просто добавление ключевых слов, а сложный процесс анализа взаимосвязей между последовательными запросами.
Многофакторная оценка переписывания: Решение о переписывании запроса принимается на основе комбинации сигналов: временных (свежесть контекста), поведенческих (популярность запроса), лингвистических (анализ местоимений и сущностей) и качественных (ожидаемое качество выдачи).
Важность сущностей и их типов: Система активно использует понимание сущностей (Entities) и их типов для разрешения неоднозначности. Если система может связать местоимение или термин с конкретной сущностью из предыдущего запроса, она это сделает и повысит оценку такого переписывания.
Предпочтение проверенным формулировкам: Система отдает предпочтение тем вариантам переписывания, которые уже популярны среди пользователей (высокий Popularity Score). Это снижает риск неправильной интерпретации контекста.
Защитный механизм через порог: Использование Threshold Value гарантирует, что запрос будет переписан только в случае высокой уверенности системы. Если контекст неясен или кандидаты низкого качества, используется исходный запрос.

Практика

Best practices (это мы делаем)

Оптимизация под User Journey и сессии: Необходимо анализировать не только отдельные ключевые слова, но и последовательности запросов, которые пользователи используют для решения своей задачи. Создавайте контент, который логически связан и покрывает как общие, так и уточняющие интенты в рамках одной темы (Topical Authority).
Усиление связи с сущностями (Entity Optimization): Работайте над тем, чтобы ваш контент и сайт были четко ассоциированы с релевантными сущностями в Knowledge Graph. Используйте структурированные данные (Schema.org) для однозначного определения сущностей, их типов и характеристик. Это поможет Google правильно интерпретировать контекст, когда пользователи ищут вашу сущность и затем задают уточняющие вопросы.
Создание контента под уточняющие запросы: Убедитесь, что на вашем сайте есть ответы на потенциальные следующие вопросы пользователя. Например, если вы описываете стадион, укажите его вместимость, адрес, расписание игр. Это повышает вероятность ранжирования по переписанным запросам типа [вместимость <название стадиона>].
Использование естественных и популярных формулировок: Поскольку Popularity Score является фактором оценки, используйте в контенте те формулировки вопросов и фраз, которые активно используются пользователями в поиске.

Worst practices (это делать не надо)

Изолированная оптимизация под «Head» запросы: Фокусировка только на высокочастотных общих запросах без учета последующих шагов пользователя. Если контент не отвечает на уточняющие вопросы, он упустит трафик из контекстных сессий.
Игнорирование структурированных данных и сущностей: Отсутствие четких сигналов о типе и характеристиках сущностей на странице усложняет для Google возможность использовать этот контент для ответа на контекстные запросы с референциальными терминами.
Создание разрозненного контента: Публикация статей на разные темы без глубокой проработки и взаимосвязи снижает вероятность того, что сайт будет рассмотрен как авторитетный источник в рамках исследовательской сессии пользователя.

Стратегическое значение

Патент подтверждает стратегический фокус Google на понимании естественного языка, разговорном поиске и переходе от отдельных запросов к контекстуальным сессиям. Для SEO это означает, что оптимизация должна смещаться от уровня ключевых слов к уровню сущностей, тем и задач пользователя (User Journey). Построение Topical Authority становится ключевым, так как позволяет сайту «участвовать» во всей поисковой сессии пользователя, отвечая как на первичные, так и на все последующие уточняющие запросы.

Практические примеры

Сценарий: Поиск продукта и уточнение характеристик

Действия пользователя: Пользователь вводит запрос (Q1): [Samsung Galaxy S25]. Через минуту он вводит второй запрос (Q2): [какая у него камера].
Анализ системы: Google распознает Q2 в контексте сессии.
- Генерируются кандидаты, например: [какая камера у Samsung Galaxy S25] и другие.
- Оценка: Кандидат получает высокий балл за свежесть (Recency), совпадение сущности (Samsung S25 — продукт) и местоимения «него/у него» (Referential Analysis), а также за популярность такой формулировки (Popularity).
Действия SEO специалиста: Убедиться, что на странице продукта Samsung Galaxy S25 (или в обзоре) четко и доступно описаны характеристики камеры, используется микроразметка Product с указанием всех свойств. Текст должен содержать естественные формулировки, отвечающие на вопрос «какая камера у…».
Ожидаемый результат: Страница сайта появляется в выдаче по запросу Q2, хотя технически она оптимизирована под переписанный запрос [какая камера у Samsung Galaxy S25].

Вопросы и ответы

Как Google определяет границы пользовательской сессии (User Session)?

Патент упоминает несколько способов определения сессии. Это могут быть все запросы, отправленные в течение определенного времени после первого запроса (например, 1 час). Также это могут быть запросы, отправленные во время работы определенного сеанса браузера. Сессия может быть связана с идентификатором пользователя или идентификатором устройства.

Насколько важна свежесть предыдущего запроса для определения контекста?

Свежесть (Recency) является одним из ключевых факторов оценки. Патент указывает, что система применяет штраф к старым запросам или бустинг к новым. Чем больше времени прошло между запросами, тем меньше вероятность, что они связаны общим контекстом. Это позволяет системе адаптироваться к смене темы поиска в рамках одной сессии.

Как этот патент влияет на исследование ключевых слов (Keyword Research)?

Он подчеркивает необходимость перехода от анализа изолированных запросов к анализу поисковых сессий и пути пользователя (User Journey). Необходимо исследовать, какие уточняющие вопросы задают пользователи после ввода основного запроса. Также важно обращать внимание на разговорные формулировки и запросы с местоимениями, даже если их частотность кажется низкой.

Как система определяет, что текущий запрос связан с предыдущим?

Система не ищет прямую «связь» как таковую. Вместо этого она генерирует кандидатов на переписывание, комбинируя текущий запрос со всеми предыдущими, а затем оценивает качество этих кандидатов. Если оценка высока (превышает порог), это считается подтверждением наличия связи и контекста.

Что такое «Мера качества» (Quality Measure) переписанного запроса?

Это оценка того, насколько хороша будет поисковая выдача по переписанному запросу. Патент упоминает, что анализ может включать определение количества возвращаемых результатов, частоту выбора этих результатов пользователями (кликабельность) или оценку качества самих ресурсов в выдаче. Кандидаты с более высокой мерой качества получают преимущество.

Как Google использует сущности (Entities) в этом механизме?

Сущности критически важны для двух факторов оценки. Первый – анализ референциальных терминов: система проверяет, соответствует ли тип местоимения (например, «он» -> человек) типу сущности из предыдущего запроса. Второй – корреляция терминов: система проверяет, связан ли термин в запросе (например, «вместимость») с типом сущности (например, стадион).

Стоит ли специально оптимизировать страницы под запросы с местоимениями?

Нет, не стоит искусственно добавлять местоимения в текст. Вместо этого следует сосредоточиться на четком определении сущностей на странице (с помощью микроразметки и качественного контента) и предоставлении исчерпывающей информации об их характеристиках. Система сама свяжет местоимение с вашей сущностью, если посчитает ваш контент релевантным ответу.

Применяется ли этот механизм только к голосовому поиску?

Нет. Хотя механизм особенно полезен для разговорного и голосового поиска, где часто встречаются неполные или уточняющие запросы, он применяется к любым запросам (текстовым или голосовым), поступающим в рамках активной пользовательской сессии.

Что произойдет, если пользователь сменил тему поиска в середине сессии?

Система должна распознать это благодаря многофакторной оценке. Кандидаты, объединяющие запросы из разных контекстов (например, [Барак Обама] и [вместимость]), получат низкие оценки по факторам корреляции сущностей, популярности и меры качества. Кроме того, фактор свежести (Recency) поможет отдать приоритет самым последним запросам.

Как фактор популярности (Popularity) влияет на переписывание?

Если сгенерированный переписанный запрос часто встречается в глобальных логах поиска Google, его оценка повышается. Это служит подтверждением того, что такая комбинация контекста и текущего запроса является естественной и востребованной среди пользователей. Система предпочитает безопасные и проверенные интерпретации.