Google использует механизм для поддержания контекста разговора (Discourse Context). Система анализирует ранее предоставленную информацию (например, блок с ответом или уведомление), чтобы извлечь ключевые атрибуты (время, местоположение). Если следующий запрос пользователя относится к этому контексту, Google незаметно переписывает его (Discourse Query), добавляя атрибуты из предыдущего взаимодействия для повышения точности ответа.
Описание
Какую задачу решает
Патент решает проблему обработки многоэтапных (multi-turn) разговорных поисковых сессий, особенно при использовании голосового ввода. Пользователи часто формулируют последующие запросы в неполной или неоднозначной форме, полагаясь на контекст предыдущего взаимодействия (например, после запроса погоды в Атланте спрашивают: «А как насчет Нью-Йорка?»). Система решает задачу интерпретации таких запросов путем определения контекста на основе ранее предоставленной информации и соответствующей модификации запроса для поддержания связности диалога.
Что запатентовано
Запатентована система для модификации запросов в контексте дискурса (Discourse Context). Система определяет, устанавливает ли информация, недавно предоставленная пользователю (First Information, например, результат поиска, Answer Box или уведомление), определенный контекст. Если да, и если последующий запрос (Subsequent Query) принадлежит к этому контексту, система генерирует модифицированный Discourse Query. Этот новый запрос объединяет термины исходного запроса с атрибутами из установленного контекста для повышения точности поиска.
Как это работает
Механизм работает следующим образом:
- Установление контекста: Система анализирует First Information (например, блок с ответом о погоде), чтобы определить, содержит ли она предопределенные атрибуты, указывающие на Discourse Context (например, время и местоположение).
- Анализ последующего запроса: При получении Subsequent Query система определяет, относится ли он к установленному контексту. Это делается путем проверки наличия связанных терминов или через семантический анализ.
- Модификация запроса: Если контекст установлен и запрос к нему относится, система переписывает запрос. Например, если контекст – погода в Атланте, а запрос – «А как насчет Нью-Йорка?», система создаст Discourse Query, включающий «погода» и «Нью-Йорк».
- Выполнение поиска: Поиск выполняется с использованием модифицированного Discourse Query, а не исходного запроса пользователя, при этом модифицированный запрос пользователю не показывается.
Актуальность для SEO
Высокая. Развитие разговорного поиска, голосовых ассистентов и многоэтапных взаимодействий является стратегическим направлением для Google. Этот патент описывает базовую логику, необходимую для поддержания связного диалога в поиске, и имеет недавнюю дату публикации (Ноябрь 2024).
Важность для SEO
Влияние на SEO оценивается как высокое (75/100). Хотя патент фокусируется на этапе Понимания Запросов (Query Understanding), он имеет важное стратегическое значение. Он подчеркивает переход к сессионному и диалоговому поиску. Это напрямую влияет на критическую важность структурированных данных и необходимость попадания в блоки с ответами (Answer Boxes/Featured Snippets), так как именно они часто устанавливают Discourse Context, определяющий обработку последующих запросов пользователя.
Детальный разбор
Термины и определения
- Attributes (Атрибуты)
- Структурированные данные, содержащиеся в First Information. Предопределенные наборы атрибутов (например, время и местоположение; финансовый тикер) используются для определения наличия Discourse Context.
- Discourse Context (Контекст дискурса)
- Контекст, применяемый к паре First Information и Subsequent Query. Указывает на то, что определенная тема или семантическое значение первой информации применяется к последующему запросу.
- Discourse Context Detector (Детектор контекста дискурса)
- Компонент системы, который определяет, содержит ли First Information атрибуты контекста и принадлежит ли Subsequent Query к этому контексту.
- Discourse Query (Дискурсивный запрос)
- Модифицированный запрос, сгенерированный системой. Он основан на терминах Subsequent Query и значениях атрибутов из First Information. Используется для поиска вместо исходного запроса.
- First Information (Первая информация)
- Информация, предоставленная пользователю для ознакомления до ввода последующего запроса. Это может быть результат поиска (включая Answer Box), уведомление (notification), текстовое сообщение и т.д.
- Pre-associated terms (Предварительно связанные термины)
- Термины, которые заранее связаны с определенными типами контекста. Например, «погода», «зонтик» связаны с контекстом события; «рыночная капитализация» связана с финансовым контекстом.
- Query Modifier (Модификатор запроса)
- Компонент, отвечающий за генерацию Discourse Query, если контекст обнаружен.
- Subsequent Query (Последующий запрос)
- Запрос, полученный от пользователя после предоставления First Information.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод обработки последующего запроса на основе контекста, установленного предыдущей информацией.
- Система получает первый запрос и предоставляет в ответ первую информацию (First Information).
- Система получает последующий запрос (Subsequent Query).
- Проводится проверка: содержит ли First Information значение атрибута, указывающее на определенный Discourse Context (из множества различных типов контекста).
- Если ДА, проводится вторая проверка: принадлежит ли Subsequent Query к этому контексту. Это определяется на основе того, содержит ли запрос один или несколько терминов, которые ассоциированы с атрибутом из First Information.
- Если ДА (запрос принадлежит контексту), система генерирует Discourse Query. Он включает термины из Subsequent Query И дополнительные термины, определенные на основе значения атрибута из First Information.
- Система инициирует поиск на основе Discourse Query вместо (in lieu of) Subsequent Query.
- Система предоставляет результаты поиска, при этом избегая отображения самого Discourse Query пользователю.
Claim 2 (Зависимый): Уточняет типы атрибутов, которые могут указывать на контекст: атрибут времени, атрибут местоположения, пара время/местоположение, пара время/погода, пара погода/местоположение.
Claim 3 (Зависимый): Описывает альтернативный метод определения принадлежности запроса к контексту (в дополнение к связанным терминам из Claim 1):
- Определяется семантическое значение (semantic meaning) последующего запроса (используя NLP).
- Определяется, связано ли это семантическое значение контекстуально с атрибутом из First Information.
Claim 6 (Зависимый): Уточняет, что First Information может представлять собой результат поиска или Answer Box.
Где и как применяется
Изобретение применяется для обеспечения связности разговорного поиска и обработки сессий.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна извлекать и индексировать структурированные атрибуты (сущности, время, местоположение) из контента. Это необходимо для того, чтобы при формировании First Information (например, Answer Box) эти атрибуты были доступны для установления контекста.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Discourse Context Detector и Query Modifier работают здесь. После того как пользователю была показана First Information и он ввел Subsequent Query, система анализирует контекст предыдущего взаимодействия и принимает решение о необходимости переписывания текущего запроса (Query Rewriting) на основе сессионного контекста.
RANKING – Ранжирование
Этап ранжирования получает на вход результат работы этапа QUNDERSTANDING. Если контекст был обнаружен, ранжирование будет производиться на основе Discourse Query, а не исходного запроса пользователя.
Входные данные:
- First Information и ее структурированные атрибуты (например, данные из показанного Answer Box или уведомления).
- Subsequent Query, введенный пользователем.
- Context Data (предопределенные списки атрибутов и связанных терминов).
Выходные данные:
- Discourse Query (если контекст обнаружен и применен).
- Или исходный Subsequent Query (если контекст не обнаружен или не применен).
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на разговорные (conversational), уточняющие и голосовые запросы (Voice Search), где пользователи склонны к многоэтапным взаимодействиям и использованию неполных фраз или местоимений.
- Конкретные типы контента и форматы: Влияет на взаимодействие с форматами, богатыми структурированными данными, такими как Answer Boxes, Knowledge Panels, Featured Snippets. Эти форматы чаще всего выступают в роли First Information, устанавливающей контекст.
- Конкретные ниши или тематики: Влияет на тематики, где контекст четко определен атрибутами, такими как Погода, Финансы (акции), События, Фильмы, Локальный поиск (места и маршруты).
Когда применяется
Алгоритм применяется при выполнении двух обязательных условий в рамках одной сессии:
- Триггер 1 (Наличие контекста): Информация (First Information), показанная пользователю непосредственно перед вводом запроса, должна содержать предопределенный набор атрибутов, указывающих на Discourse Context (например, это блок с погодой, содержащий атрибуты времени и места).
- Триггер 2 (Принадлежность запроса): Последующий запрос (Subsequent Query) должен быть определен как принадлежащий к этому контексту. Это происходит, если:
- Запрос содержит Pre-associated terms для данного типа контекста.
- ИЛИ семантическое значение запроса контекстуально связано с атрибутами First Information.
Исключения: Если пользователь резко меняет тему (например, спрашивает о погоде, а затем о рецепте печенья), система определяет, что второй запрос не принадлежит к контексту, и обрабатывает его стандартным образом.
Пошаговый алгоритм
Процесс обработки пары «Первая информация» и «Последующий запрос» (на основе FIG. 4).
- Определение пары: Система определяет пару: First Information (I), предоставленная пользователю, и последующий Subsequent Query (SQ), полученный от него.
- Проверка наличия контекста в I: Система определяет, содержит ли I атрибуты, указывающие на Discourse Context (например, проверяет, является ли I блоком погоды или финансовой сводкой).
- Если НЕТ: Перейти к шагу 4а.
- Если ДА: Контекст (C) установлен. Перейти к шагу 3.
- Проверка принадлежности SQ к контексту C: Система определяет, принадлежит ли SQ к установленному контексту C. Это делается путем поиска Pre-associated terms в SQ или анализа семантического значения SQ.
- Если НЕТ: Перейти к шагу 4а.
- Если ДА: Перейти к шагу 4b.
- Генерация и использование запроса:
4а. (Контекст не применен): Использовать исходный SQ в качестве входных данных для поисковой операции.
4b. (Контекст применен): Сгенерировать Discourse Query (DQ) на основе SQ и значений атрибутов из I. Использовать DQ в качестве входных данных для поисковой операции. - Предоставление результатов: Предоставить пользователю результаты поиска (в ответ на SQ), при этом не показывая пользователю сам DQ (если он использовался).
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании структурированных данных из предыдущего взаимодействия и анализе текста нового запроса.
- Структурные факторы (из First Information): Критически важные данные. Система ищет конкретные Attributes в ранее предоставленной информации. Упоминаются: Time attribute, Location attribute, Weather attributes. Также приводятся примеры атрибутов для других контекстов: Stock symbol (финансы), Event (события), Movie title (фильмы).
- Контентные факторы (из Subsequent Query): Текст запроса анализируется на наличие Pre-associated terms или для определения семантического значения.
- Поведенческие/Сессионные факторы: Используется последовательность взаимодействий в рамках сессии для определения пары First Information и Subsequent Query.
Какие метрики используются и как они считаются
Патент не использует числовые метрики или пороги ранжирования, а полагается на логические условия и предопределенные наборы данных.
- Предопределенные наборы атрибутов: Списки атрибутов, которые определяют тот или иной Discourse Context (например, {Время, Место} = Контекст События). Наличие этих атрибутов в First Information проверяется логически (Да/Нет).
- Pre-associated terms (Связанные термины): Заранее составленные списки слов, которые связывают запрос с определенным контекстом (например, Контекст События -> {«погода», «зонтик»}). Наличие этих терминов в Subsequent Query проверяется логически (Да/Нет).
- Методы анализа текста (NLP): Упоминается использование Natural Language Processor для определения семантического значения (semantic meaning) последующего запроса, чтобы проверить его контекстуальную связь с атрибутами First Information.
Выводы
- Контекст определяется показанной информацией, а не только предыдущим запросом: Ключевая особенность патента в том, что Discourse Context устанавливается на основе First Information (информации, показанной пользователю, например, конкретного блока в выдаче или уведомления), а не только на основе текста предыдущего запроса пользователя.
- Зависимость от структурированных данных и Rich Results: Система полагается на наличие четких, распознаваемых атрибутов (время, место, название сущности) в First Information для установления контекста. Контент, представленный в структурированном виде (Answer Boxes, Knowledge Panels), с большей вероятностью активирует этот механизм.
- Механизм поддержания диалога (Multi-turn Search): Патент описывает конкретный механизм для реализации многоэтапного разговорного поиска. Он позволяет системе «помнить» тему разговора и интерпретировать неоднозначные последующие запросы.
- Два метода определения связности: Система может определять, продолжается ли диалог, двумя способами: (1) с помощью жестко заданных списков связанных терминов (Pre-associated terms) для каждого типа контекста, и (2) с помощью NLP для анализа семантического значения запроса.
- Скрытое переписывание запроса: Модификация запроса (генерация Discourse Query) происходит незаметно для пользователя. Пользователь видит свой исходный запрос, но результаты соответствуют переписанному, более точному запросу.
Практика
Best practices (это мы делаем)
- Максимизация использования структурированных данных (Schema.org): Необходимо тщательно размечать все ключевые атрибуты контента – сущности (Entities), даты, время, местоположение, характеристики. Это повышает вероятность того, что Google распознает эти атрибуты, если контент будет показан как First Information, и сможет установить Discourse Context.
- Стратегия захвата Answer Boxes и Featured Snippets: Эти элементы выдачи часто служат источником First Information. Завоевание этих позиций не только дает трафик по первому запросу, но и устанавливает контекст для следующего шага пользователя, повышая шансы удержать его в рамках вашей тематики или на вашем сайте.
- Оптимизация под разговорный поиск (Conversational Search): Создавайте контент, который предвосхищает и отвечает на естественные последующие вопросы (follow-up questions). Если вы пишете о событии, убедитесь, что информация о месте и времени четко структурирована, и подготовьте контент, отвечающий на вопросы о логистике или погоде в этот день.
- Построение Topical Authority и четкое определение сущностей: Становитесь авторитетным источником по конкретной теме или сущности. Если Google идентифицирует ваш ресурс как основной источник информации о сущности (например, о компании или продукте), он с большей вероятностью будет использовать атрибуты из вашего контента для переписывания последующих запросов об этой сущности.
Worst practices (это делать не надо)
- Игнорирование микроразметки и структуры: Отсутствие четкой структуры и разметки сущностей снижает способность Google извлекать атрибуты, необходимые для установления Discourse Context.
- Создание контента без четкого фокуса на сущностях: Неоднозначный контент, в котором сложно выделить ключевые атрибуты (кто, что, где, когда), не сможет эффективно участвовать в механизме поддержания дискурса.
- Оптимизация только под изолированные запросы: Фокусироваться только на отдельных ключевых словах без учета пути пользователя (user journey) и потенциальных последующих запросов в рамках сессии неэффективно в эпоху разговорного поиска.
Стратегическое значение
Патент подтверждает стратегическую важность инвестиций Google в разговорный ИИ, голосовой поиск и понимание контекста сессии. Для SEO это означает, что успех зависит не только от ранжирования по отдельным ключевым словам, но и от способности предоставить структурированные, авторитетные ответы, которые поисковая система может использовать в качестве основы для диалога с пользователем. Стратегически важно не просто ранжироваться, а предоставлять информацию в формате, который Google может использовать для установления контекста.
Практические примеры
Сценарий 1: Финансовый поиск и оптимизация под Answer Box
- Действие SEO: Финансовый портал оптимизирует страницу компании Google (GOOG) с четкой структурой и микроразметкой, чтобы попасть в Answer Box по запросу «Цена акции Google».
- Результат (First Information): Google показывает Answer Box с ценой и тикером GOOG. Установлен финансовый контекст с атрибутом Stock Symbol=GOOG.
- Последующий запрос (Subsequent Query): Пользователь спрашивает: «Какова ее рыночная капитализация?».
- Обработка Google: Система видит термин «рыночная капитализация», который является Pre-associated term для финансового контекста.
- Переписывание: Система генерирует скрытый Discourse Query: «Рыночная капитализация GOOG».
- Итог: Пользователь получает точный ответ, потенциально снова с финансового портала, который оптимизирован под этот интент.
Сценарий 2: Поиск событий и проактивное уведомление
- Первое взаимодействие: Пользователь получает уведомление от Google Assistant (First Information) о концерте в «Madison Square Garden» сегодня в 20:00. Установлен контекст события с атрибутами Location=MSG и Time=Сегодня 20:00.
- Последующий запрос (Subsequent Query): Пользователь спрашивает ассистента: «Мне понадобится зонтик?».
- Обработка Google: Система видит термин «зонтик», который связан с контекстом погоды/события.
- Переписывание: Система генерирует Discourse Query: «Погода Madison Square Garden сегодня вечером».
- Итог: Пользователь получает прогноз погоды для места и времени концерта, хотя не упоминал их в запросе.
Вопросы и ответы
Что такое «First Information» в контексте этого патента? Это только предыдущий результат поиска?
Нет, это не только результат поиска. First Information — это любая информация, предоставленная поисковой системой пользователю непосредственно перед вводом следующего запроса. Это может быть блок с ответом (Answer Box), Featured Snippet, панель знаний, стандартный результат поиска или даже проактивное уведомление (notification) от системы.
Как система определяет, что начался «Discourse Context»?
Контекст устанавливается, если First Information содержит предопределенный набор структурированных атрибутов. В патенте упоминаются такие атрибуты, как время, местоположение, погода, финансовые тикеры или названия событий. Например, показ блока с финансовой сводкой устанавливает финансовый контекст.
Как система понимает, что новый запрос является продолжением разговора, а не сменой темы?
Патент описывает два метода. Первый — использование Pre-associated terms: если новый запрос содержит термины, заранее связанные с типом установленного контекста (например, «зонтик» связан с погодой). Второй — использование NLP для определения семантического значения запроса и проверки его связи с атрибутами контекста. Если связи нет, система считает, что тема сменилась.
Влияет ли этот патент больше на голосовой поиск, чем на текстовый?
Да, в значительной степени. В патенте отмечается, что пользователи склонны к «разговорному» поведению именно при голосовом вводе запросов, используя менее структурированные фразы и многоэтапные взаимодействия. Механизм направлен на обработку именно таких естественных диалогов.
Какова роль структурированных данных (Schema.org) в этом патенте?
Структурированные данные играют ключевую роль. Система полагается на наличие четких атрибутов (Attributes) в First Information для установления контекста. Использование микроразметки помогает Google корректно извлекать эти атрибуты (сущности, даты, локации) из вашего контента, тем самым позволяя ему участвовать в этом механизме.
Если мой сайт занял Featured Snippet, как это влияет на следующий запрос пользователя?
Если ваш Featured Snippet содержит четкие атрибуты, он становится First Information и устанавливает Discourse Context. Следующий запрос пользователя будет интерпретироваться в этом контексте. Например, если ваш сниппет описывает рецепт, а пользователь спросит «Сколько калорий?», Google перепишет запрос как «[Название вашего рецепта] калорийность», повышая ваши шансы ответить и на этот вопрос.
Видит ли пользователь, что его запрос был переписан (Discourse Query)?
Нет. В патенте (Claim 1) явно указано, что система предоставляет результаты, «избегая предоставления дискурсивного запроса (Discourse Query) для отображения». Пользователь видит свой исходный разговорный запрос, но получает результаты, соответствующие переписанному, более точному запросу.
Какие типы контента наиболее важны для оптимизации под этот механизм?
Наиболее важен контент, отвечающий на фактологические вопросы и связанный с четко определенными сущностями или событиями: рецепты, финансовые данные, расписания мероприятий, биографии, обзоры фильмов, локальная информация и погода. То есть контент, который часто попадает в блоки с ответами и панели знаний.
Что важнее для SEO в контексте этого патента: ключевые слова или структурированные данные?
Структурированные данные приобретают дополнительную важность. Чтобы система могла установить Discourse Context на основе вашего контента, она должна легко извлечь атрибуты (время, место и т.д.). Микроразметка (Schema.org) и четкая структура страницы являются основными инструментами для этого.
Означает ли это, что Google хранит и использует историю сессии для ранжирования?
Да, этот патент описывает механизм использования данных текущей сессии (предыдущего ответа/информации) для переписывания текущего запроса. Это напрямую влияет на то, какие документы будут отобраны и как они будут ранжироваться в ответ на текущий запрос пользователя в рамках этой сессии.