Как Google интерпретирует последовательные запросы для автоматического уточнения поискового намерения пользователя

Google использует механизм для понимания контекста сессии, анализируя последовательные запросы (например, Q1: [рестораны в Москве], затем Q2: [итальянские]). Система автоматически объединяет их в уточненный запрос (Q3: [итальянские рестораны в Москве]), основываясь на исторических данных о том, как пользователи обычно уточняют запросы. Это позволяет системе лучше понимать намерение пользователя в диалоговом режиме.

Описание

Какую задачу решает

Патент решает проблему сложности и неэффективности ввода уточненных поисковых запросов, особенно на мобильных устройствах или при использовании голосового ввода. Пользователи часто вводят запросы последовательно, уточняя свой интент в диалоговом режиме (например, сначала общий запрос, затем модификатор). Система призвана автоматически распознавать эту последовательность как единое намерение и объединять запросы, избавляя пользователя от необходимости вручную вводить полный комбинированный запрос.

Что запатентовано

Запатентована система для автоматического определения и выбора уточненного запроса (Query Refinement) на основе последовательности из двух запросов (Q1 и Q2), полученных в рамках одной пользовательской сессии. Система использует исторические данные (Query Logs), чтобы найти общие паттерны уточнений для Q1, а затем фильтрует их, чтобы найти уточнение, которое наилучшим образом сочетает элементы как Q1, так и Q2. Цель — предсказать и выполнить наиболее вероятный комбинированный запрос (Q3).

Как это работает

Механизм активируется при получении двух последовательных запросов (Q1, затем Q2) в одной сессии:

Сбор кандидатов: Система извлекает из Query Logs набор исторических уточнений, которые пользователи ранее вводили после Q1.
Фильтрация (Intersection): Система фильтрует этот набор, оставляя только те уточнения, которые содержат n-grams, семантически похожие (similar) как на n-grams из Q1, так и на n-grams из Q2.
Ограничение (Topic Drift Prevention): В некоторых вариантах система дополнительно исключает уточнения, содержащие n-grams, которых нет ни в Q1, ни в Q2, чтобы предотвратить смещение темы.
Оценка и Выбор: Оставшиеся кандидаты оцениваются (scoring). Уточнение с наивысшей оценкой сравнивается с пороговым значением (Threshold Score). Если порог превышен, это уточнение становится третьим запросом (Q3) и выполняется. В противном случае система выполняет исходный второй запрос (Q2).

Актуальность для SEO

Высокая. Патент описывает фундаментальные механизмы для реализации контекстного и разговорного поиска (Conversational Search). Понимание контекста сессии и интерпретация последовательных запросов являются ключевыми элементами современных поисковых систем, особенно в эпоху Google Assistant и голосового поиска. Участие Behshad Behzadi (ключевая фигура в развитии Google Search и Assistant) подчеркивает значимость этого изобретения для развития диалогового поиска.

Важность для SEO

Патент имеет значительное влияние на стратегию контента и исследование ключевых слов (7.5/10). Хотя он не описывает алгоритмы ранжирования, он критически важен для понимания того, как Google интерпретирует пользовательские сессии и формирует итоговый запрос (Q3), который поступает в систему ранжирования. Это подчеркивает необходимость оптимизации не под отдельные изолированные запросы, а под целые поисковые пути и финальное, уточненное намерение пользователя.

Детальный разбор

Термины и определения

First Query (Q1) / Second Query (Q2): Последовательность запросов, введенных пользователем в рамках одной сессии без промежуточных запросов.
Third Query (Q3): Итоговый запрос, выбранный системой для выполнения поисковой операции. Это может быть либо автоматически сгенерированное уточнение, либо исходный Q2.
Historical Data / Query Logs: База данных, хранящая историю поисковых запросов и сессий. Используется для определения общих паттернов уточнения запросов.
N-gram: Последовательность из N элементов (обычно слов) из текста запроса.
Query Refinement (Уточнение запроса): Запрос, который является модификацией предыдущего запроса. В патенте выделяются наборы: R_m (все исторические уточнения Q1), R_n (уточнения, содержащие элементы Q1 и Q2) и R_o (строго отфильтрованный R_n).
Refinement Generator: Компонент системы, отвечающий за генерацию и фильтрацию наборов уточнений запросов.
Refinement Scoring System: Компонент, отвечающий за оценку (scoring) кандидатов в уточнения на основе их сходства с Q1 и Q2.
Semantic Class (Семантический класс): Категория, к которой принадлежат n-grams. Например, «Москва» и «Лондон» принадлежат к классу <city>. Используется для определения сходства и обобщения паттернов запросов.
Similarity (Сходство n-grams): Метрика, определяющая близость двух n-grams. Включает точное совпадение, синонимы, аббревиатуры, акронимы, расшифровки, альтернативное написание, принадлежность к одному семантическому классу или разное грамматическое число (единственное/множественное).
Threshold Score (Пороговая оценка): Минимальная оценка, которую должно набрать уточнение, чтобы быть выбранным в качестве Q3 вместо исходного Q2.
User Session (Пользовательская сессия): Последовательность взаимодействий пользователя с поисковой системой за ограниченный период времени.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод обработки последовательных запросов.

Система получает первый запрос (Q1) и второй запрос (Q2) в рамках одной сессии, причем Q2 следует сразу за Q1 без промежуточных запросов.
Из исторических данных (historical data) определяется первый набор уточнений для Q1.
Определяется второй набор уточнений (подмножество первого). Критерий включения: каждое уточнение должно содержать хотя бы один n-gram, похожий на n-gram из Q1, И хотя бы один n-gram, похожий на n-gram из Q2.
Патент детально определяет, что значит «похожий» (similar): точное совпадение, акроним, расшифровка, синоним, аббревиатура, альтернативное написание, тот же семантический класс (n-gram from the same class) или другое грамматическое число.
Каждое уточнение во втором наборе оценивается (scoring).
На основе оценок выбирается третий запрос (Q3) из группы, состоящей из второго набора уточнений и Q2.
Q3 используется как входные данные для поисковой операции.

Claim 3 (Зависимый от 2): Вводит механизм предотвращения смещения темы (Topic Drift).

После определения кандидатов (второй набор), система исключает из него все уточнения, которые содержат n-gram, НЕ являющийся похожим ни на один n-gram из Q1, ни на один n-gram из Q2.

Это критически важное ограничение: итоговое уточнение должно состоять исключительно из элементов, присутствующих (или семантически схожих) в исходных двух запросах.

Claim 8 (Зависимый от 2): Детализирует механизм оценки.

Оценка (score) для конкретного уточнения основывается на его n-grams, которые похожи на n-grams из Q1 или Q2.

Claim 9 и 10 (Зависимые от 8): Описывают процесс выбора Q3 с использованием порога.

Определяется, превышает ли наивысшая оценка (highest score) пороговое значение (Threshold Score).
Если ДА (Claim 9): В качестве Q3 выбирается уточнение с наивысшей оценкой.
Если НЕТ (Claim 10): В качестве Q3 выбирается исходный второй запрос (Q2).

Claim 13, 14, 15 (Зависимые от 8): Описывают использование весовых коэффициентов при оценке.

(13) N-grams, похожие на Q2, могут иметь больший вес (greater weight value), чем n-grams, похожие на Q1.
(14) Нераспространенные (uncommon) n-grams могут иметь больший вес, чем распространенные (common).
(15) N-grams, похожие и на Q1, и на Q2 одновременно, могут иметь больший вес, чем те, что похожи только на один из запросов.

Где и как применяется

Изобретение применяется преимущественно на этапе понимания запроса для интерпретации пользовательского ввода перед передачей его в систему ранжирования.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система работает как механизм переписывания и интерпретации запросов в реальном времени (или использует предварительно вычисленные данные).

Мониторинг сессии: Система отслеживает последовательность запросов в рамках одной User Session.
Интерпретация ввода: При получении Q2 сразу после Q1 активируется Refinement Generator.
Генерация и Оценка: Система генерирует, фильтрует и оценивает кандидатов для Q3, используя Refinement Scoring System.
Выбор запроса: Refinement Selector определяет финальный запрос (Q3), который будет обработан поисковой системой.

RANKING – Ранжирование
Патент напрямую не влияет на алгоритмы ранжирования, но он определяет, КАКОЙ запрос будет ранжироваться. Вместо ранжирования результатов для Q1 или Q2, система ранжирует результаты для автоматически сгенерированного Q3.

Входные данные:

Первый запрос (Q1).
Второй запрос (Q2).
Данные сессии (для подтверждения последовательности).
Query Logs (исторические данные о паттернах уточнений).
База данных семантического сходства (синонимы, аббревиатуры, семантические классы).

Выходные данные:

Третий запрос (Q3), который передается как входные данные для поисковой операции (этап RANKING).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, которые пользователи склонны уточнять: коммерческие (выбор товара с характеристиками), локальные (поиск места с типом кухни или услугой), информационные (поиск сущности с атрибутом).
Типы контента: Влияет на все типы контента, где применимы уточнения (товары, локальные страницы, статьи).
Устройства и ввод: Механизм особенно критичен для мобильных устройств и голосового поиска (Voice Search), где ввод длинных запросов затруднен и пользователи чаще используют последовательные, разговорные запросы.

Когда применяется

Триггеры активации: Получение двух разных запросов (Q1 и Q2) последовательно, без промежуточных запросов, в рамках одной User Session.
Условия применения: Наличие в Query Logs исторических данных об уточнениях для Q1, которые также пересекаются с Q2.
Пороговые значения: Финальное применение уточнения (выбор его в качестве Q3) происходит только в том случае, если его оценка (score) превышает установленный Threshold Score.

Пошаговый алгоритм

Процесс обработки запроса в реальном времени

Получение Q1: Система получает первый запрос от пользователя и возвращает результаты поиска SR1.
Получение Q2: Система получает второй запрос от того же пользователя в той же сессии сразу после Q1.
Генерация первого набора уточнений (R_m): Refinement Generator извлекает из Query Logs исторические уточнения, которые следовали за Q1 в прошлых сессиях.
Фильтрация по пересечению (R_n): Refinement Generator создает второй набор уточнений R_n (подмножество R_m). В R_n включаются только те уточнения, которые содержат n-grams, похожие на Q1, И n-grams, похожие на Q2.
(Опционально) Фильтрация по ограничению (R_o): Refinement Generator создает третий набор R_o (подмножество R_n), исключая уточнения, содержащие любые n-grams, не похожие ни на Q1, ни на Q2.
Оценка кандидатов: Refinement Scoring System рассчитывает оценку (score) для каждого уточнения в наборе R_n (или R_o). При расчете могут использоваться весовые коэффициенты (например, предпочтение терминам из Q2 или редким терминам).
Выбор Q3: Refinement Selector определяет уточнение с наивысшей оценкой (R_p).
- Сравнение с порогом: Если оценка R_p > Threshold Score, то Q3 = R_p.
- Откат: Если оценка R_p ≤ Threshold Score, то Q3 = Q2.
Выполнение поиска: Система выполняет поисковую операцию, используя Q3, и возвращает результаты SRp пользователю.
(Опционально) Обратная связь: Система может предложить пользователю опцию отката к Q2, если Q3 был выбран неверно (например, элемент интерфейса «Incorrect Query?»).

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке запросов и исторических данных о поведении пользователей.

Поведенческие факторы (User Behavior): Query Logs являются основным источником данных. Система анализирует исторические последовательности запросов в сессиях, чтобы выявить паттерны уточнений.
Контентные факторы (Query Content): N-grams из текущих запросов Q1 и Q2. Анализируется состав запросов для последующего сопоставления.
Лингвистические данные: Данные для определения семантического сходства (Similarity): словари синонимов, аббревиатур, альтернативных написаний, а также данные о Semantic Classes (например, списки городов, брендов, характеристик).

Какие метрики используются и как они считаются

Score (Оценка уточнения): Агрегированная метрика, показывающая, насколько хорошо кандидат в уточнение сочетает элементы Q1 и Q2. Рассчитывается путем суммирования весов n-grams кандидата, которые похожи на n-grams в Q1 и/или Q2.
Весовые коэффициенты (Weights): Используются для модуляции оценки. Патент предлагает несколько стратегий взвешивания:
- Предпочтение Q2: Вес(n-gram похожий на Q2) > Вес(n-gram похожий на Q1).
- Предпочтение пересечения: Вес(n-gram похожий на Q1 И Q2) > Вес(n-gram похожий только на Q1 ИЛИ Q2).
- Предпочтение редкости: Вес(Uncommon n-gram) > Вес(Common n-gram). Редкость может определяться на основе частоты встречаемости в Query Logs.
Threshold Score (Пороговая оценка): Предопределенное значение, используемое для принятия решения о замене Q2 на автоматически сгенерированное уточнение. Обеспечивает контроль качества автозамены.
Similarity (Сходство): Используется на этапах фильтрации. Определяется (похож/не похож) на основе лингвистических и семантических правил (синонимы, классы и т.д.).

Выводы

Контекст сессии имеет приоритет: Google активно пытается понять намерение пользователя в рамках всей сессии, а не обрабатывает каждый запрос изолированно. Последовательные запросы интерпретируются как уточнение единого намерения.
Автоматическое переписывание запросов: Система может автоматически переписать и выполнить запрос (Q3), который пользователь не вводил, если она достаточно уверена (Score > Threshold), что этот запрос лучше отражает комбинированное намерение Q1 и Q2.
Зависимость от исторических данных: Способность системы генерировать релевантные уточнения напрямую зависит от наличия и качества данных в Query Logs. Уточнения основаны на том, что делали другие пользователи в прошлом.
Строгие правила для предотвращения ошибок: Механизм включает несколько уровней защиты от неверной интерпретации:
- Уточнение должно включать элементы ИЗ ОБОИХ запросов (Claim 1).
- Уточнение НЕ ДОЛЖНО включать элементы, отсутствующие в обоих запросах (Claim 3, опционально, для предотвращения Topic Drift).
- Должен быть превышен порог уверенности (Threshold Score).
Семантическое понимание для сопоставления: Система полагается не только на точное совпадение текста, но и на глубокое семантическое понимание (синонимы, аббревиатуры, Semantic Classes) для идентификации сходства между n-grams.
Основа для разговорного поиска: Этот механизм является фундаментальным для поддержки естественного диалога с поисковой системой.

Практика

Best practices (это мы делаем)

Анализ поисковых путей (Search Journeys): Необходимо исследовать, как пользователи уточняют запросы в вашей нише. Понимать, какие модификаторы (Q2) они обычно добавляют к общим запросам (Q1). Используйте инструменты анализа SERP и логи сервера для выявления этих паттернов.
Оптимизация под уточненный интент (Q3): Убедитесь, что ваш контент оптимизирован под финальный, комбинированный запрос (Q3), а не только под начальный (Q1). Если Q1=[кроссовки], а Q2=[для бега по пересеченной местности], ваш контент должен быть высоко релевантен Q3=[кроссовки для бега по пересеченной местности].
Структурирование контента для поддержки уточнений: Организуйте контент и архитектуру сайта таким образом, чтобы она отражала естественные пути уточнения. В E-commerce это означает четкую иерархию категорий и логичные фасетные фильтры, соответствующие атрибутам, которые пользователи используют в Q2. В контентных проектах — логичное покрытие темы от общего к частному.
Использование семантического сходства: Включайте в контент синонимы, распространенные аббревиатуры и различные формулировки, которые пользователи могут использовать на разных этапах поиска. Поскольку Google использует широкое определение Similarity, это поможет распознать вашу страницу как релевантную для Q3.
Оптимизация под семантические классы: Если ваш бизнес зависит от переменных атрибутов (например, локации, модели, цвета), убедитесь, что Google понимает структуру вашего контента и принадлежность сущностей к классам. Это поможет системе сопоставлять паттерны (например, [услуга] в [город]).

Worst practices (это делать не надо)

Изолированная оптимизация под Head Terms: Фокусировка только на высокочастотных общих запросах (Q1) без учета того, как пользователи их уточняют. Это приводит к привлечению трафика, который плохо конвертируется, так как не удовлетворяет финальный интент (Q3).
Игнорирование контекста сессии: Рассмотрение каждого ключевого слова как отдельной цели, игнорируя взаимосвязи между запросами и путь пользователя.
Создание запутанной структуры сайта: Архитектура, которая не поддерживает логичные пути уточнения (например, отсутствие фильтров по ключевым атрибутам), затрудняет пользователям поиск нужной информации и может снижать релевантность страниц для автоматически сгенерированных уточненных запросов (Q3).

Стратегическое значение

Этот патент подтверждает стратегический приоритет Google на понимание контекста и развитие разговорного поиска (Conversational Search). Для SEO это означает, что анализ изолированных ключевых слов уступает место анализу пользовательских сессий и интентов. Долгосрочная стратегия должна фокусироваться на построении тематического авторитета и создании контента, который сопровождает пользователя на всем пути поиска, от первоначального интереса до финального уточненного запроса. Понимание того, как Google комбинирует запросы, позволяет более точно прогнозировать трафик и оптимизировать контент под реальные потребности пользователей.

Практические примеры

Сценарий: Оптимизация локального бизнеса (Кафе)

Анализ паттернов: SEO-специалист определяет, что пользователи часто ищут Q1=[кафе рядом со мной] или Q1=[кафе в центре], а затем уточняют Q2=[с верандой] или Q2=[где тихо поработать].
Идентификация Q3: Система Google, вероятно, сгенерирует Q3=[кафе с верандой в центре] или Q3=[тихое кафе для работы рядом со мной].
Действия SEO: Необходимо убедиться, что на сайте кафе и в его профиле (Google Business Profile) явно указана информация о наличии веранды и атмосфере, подходящей для работы (используя соответствующие n-grams). Создать контент, оптимизированный под эти уточненные интенты (Q3).
Ожидаемый результат: Повышение видимости кафе не только по общим запросам, но и для пользователей с конкретными потребностями, когда Google автоматически выполняет уточненный запрос Q3.

Сценарий: E-commerce (Магазин электроники)

Анализ паттернов: Пользователь ищет Q1=[купить телевизор Samsung], затем Q2=[4K 55 дюймов].
Идентификация Q3: Google генерирует Q3=[купить телевизор Samsung 4K 55 дюймов].
Действия SEO: Убедиться, что листинги товаров или страницы категорий/фильтров точно соответствуют этому Q3. Использовать структурированные данные для четкой передачи характеристик (разрешение, диагональ). Архитектура сайта должна позволять легко найти эту комбинацию характеристик.
Ожидаемый результат: Сайт появляется в выдаче по точному запросу Q3, что повышает вероятность конверсии, так как контент точно соответствует уточненному намерению.

Вопросы и ответы

Как этот патент влияет на исследование ключевых слов?

Он смещает фокус с анализа изолированных запросов на анализ поисковых путей и сессий. SEO-специалистам необходимо понимать, как пользователи двигаются от общих запросов (Q1) к более конкретным (Q2) и какие комбинации (Q3) являются финальным интентом. Это требует более глубокого анализа связанных запросов, «People Also Ask» и паттернов поведения пользователей для выявления типичных уточнений в нише.

Применяется ли этот механизм только для голосового поиска?

Нет, он применяется ко всем типам ввода (текст, голос), но его ценность особенно высока для голосового и мобильного поиска. В этих сценариях пользователям неудобно вводить длинные, сложные запросы, и они чаще используют последовательные, разговорные фразы. Система помогает интерпретировать эти фразы как единый сложный запрос.

Как Google определяет, что два n-grams «похожи» (similar)?

Патент определяет сходство очень широко (Claim 1). Оно включает не только точное текстовое совпадение, но и синонимы, аббревиатуры (Москва/МСК), акронимы, альтернативное написание, разное грамматическое число (ресторан/рестораны), а также принадлежность к одному семантическому классу (например, распознавание разных городов как <city>).

Что такое «Семантический класс» (Semantic Class) и как он используется?

Это категория сущностей. Например, Q1=[авиабилеты в Париж]. Система распознает «Париж» как <city>. Если в Query Logs есть паттерн уточнений для [авиабилеты в <city>], система может применить эти паттерны к Парижу. Это позволяет обобщать поведение пользователей и применять паттерны даже к запросам, которые ранее не встречались в точной формулировке.

Что произойдет, если система не найдет подходящих уточнений в Query Logs?

Если система не находит исторических уточнений для Q1, которые также пересекаются с Q2, или если ни одно из найденных уточнений не превышает Threshold Score, система откатывается к стандартному поведению. В этом случае она просто выполнит второй запрос (Q2) так, как он был введен пользователем.

Как механизм предотвращает смещение темы (Topic Drift)?

Патент описывает строгий механизм фильтрации (Claim 3). Система может исключить любое уточнение, которое содержит термины, отсутствующие как в Q1, так и в Q2. Например, если Q1=[рестораны в Москве] и Q2=[итальянские], уточнение [итальянские рестораны в Москве с караоке] может быть исключено, так как «караоке» не присутствовало в исходных запросах.

Как влияют весовые коэффициенты на выбор уточнения?

Веса определяют, какие элементы запроса важнее. Патент предлагает повышать вес терминов из Q2 (так как это текущее уточнение), редких терминов (так как они более специфичны) и терминов, присутствующих в обоих запросах (Claims 13-15). Это помогает выбрать наиболее релевантное и точное уточнение среди нескольких кандидатов.

Может ли пользователь контролировать этот процесс?

Да. Патент упоминает возможность предоставления пользователю интерфейсного элемента (например, кнопки «Incorrect Query?»), позволяющего запросить результаты для исходного Q2, если автоматически сгенерированный Q3 оказался неверным. Это обеспечивает механизм обратной связи и контроля.

Как SEO-специалисту адаптировать контент под этот механизм?

Необходимо структурировать контент так, чтобы он логично отвечал на уточняющие вопросы. Используйте четкую иерархию, фасетную навигацию (для e-commerce) и семантически богатое наполнение. Убедитесь, что страницы, предназначенные для узких интентов (Q3), содержат все необходимые элементы из общих запросов (Q1) и модификаторов (Q2).

Влияет ли этот патент на ранжирование?

Напрямую нет, он не описывает факторы ранжирования. Однако он критически влияет на то, КАКОЙ запрос поступает в систему ранжирования (этап QUNDERSTANDING). Если система выбирает Q3 вместо Q2, то ранжирование будет происходить именно по Q3. Следовательно, понимание этого механизма необходимо для обеспечения релевантности контента итоговому запросу.