Как Яндекс определяет контекст в голосовом поиске: уточнение предыдущего запроса или начало нового поиска

Яндекс патентует механизм для управления контекстом в последовательном голосовом поиске. Система определяет, является ли вторая голосовая команда уточнением первой или новым поиском. Для этого сравнивается качество («относительный вес») выдачи по комбинированному запросу (Q1+Q2) и по второму запросу отдельно (Q2). Если комбинированный запрос дает лучшие результаты, команда считается уточнением и может использоваться для взаимодействия с интерактивными сниппетами (виджетами) на выдаче.

Описание

Какую задачу решает

Патент решает фундаментальную проблему диалогового (conversational) и голосового поиска: неоднозначность последовательных команд пользователя. Когда пользователь вводит запрос (Q1), а затем вводит второй запрос (Q2), системе необходимо понять, является ли Q2 уточнением Q1 (т.е. пользователь сужает область поиска в рамках той же темы) или Q2 — это совершенно новый поиск, не связанный с предыдущим контекстом. Корректная интерпретация критична для поддержания связности диалога и предоставления релевантных результатов.

Что запатентовано

Запатентован метод определения того, является ли второй голосовой запрос (Second Search Query) уточнением (refinement) первого (First Search Query). Суть изобретения заключается в использовании качества поисковой выдачи как арбитра для определения намерения пользователя. Система сравнивает «относительный вес» (Relative Weight) результатов поиска для комбинированного запроса (Q1+Q2) и результатов поиска только для второго запроса (Q2).

Как это работает

Система получает последовательность голосовых запросов Q1 и Q2. Она выполняет два внутренних «псевдопоиска» (Pseudo Search):

Первый псевдопоиск: по комбинации Q1 и Q2.
Второй псевдопоиск: только по Q2.

Затем система оценивает Relative Weight (качество/релевантность) результатов обоих поисков, используя стандартные алгоритмы ранжирования. Если вес результатов Первого псевдопоиска (Q1+Q2) выше, чем Второго (Q2), система классифицирует Q2 как уточнение Q1. В случае уточнения система может использовать Q2 для обновления SERP или для заполнения полей в интерактивных сниппетах (Widgets), показанных в ответ на Q1.

Актуальность для SEO

Средняя/Высокая. Голосовой поиск и диалоговые интерфейсы (например, Алиса) крайне актуальны, и поддержание контекста критически важно. Однако конкретный механизм, описанный в патенте (сравнение результатов двух псевдопоисков), может быть ресурсоемким и, вероятно, дополнен или частично заменен более современными нейросетевыми моделями (трансформерами) для управления контекстом. Кроме того, фокус на интерактивных сниппетах (схожих с Yandex Islands) может быть менее приоритетным сегодня, но базовая концепция разрешения неоднозначности запросов остается актуальной.

Важность для SEO

Влияние на SEO ограничено (4/10). Патент описывает механизм обработки запросов и UI/UX в голосовом поиске, а не алгоритм ранжирования контента. Он не дает прямых рекомендаций по органической оптимизации. Однако он подчеркивает важность структурированных данных и потенциал интерактивных сниппетов (Виджетов). Для сайтов, которые предоставляют функциональность для таких виджетов (например, e-commerce, агрегаторы), этот механизм обеспечивает более гладкое голосовое взаимодействие, что может косвенно влиять на вовлеченность и конверсии.

Детальный разбор

Термины и определения

First/Second Voice Command (Первая/Вторая голосовая команда)

Последовательные голосовые вводы от пользователя, содержащие указания на поисковые запросы (Q1 и Q2).

Pseudo Search (Псевдопоиск)

Внутренний поиск, выполняемый системой для оценки гипотез, результаты которого не обязательно сразу показываются пользователю.

First Pseudo Search: Поиск на основе комбинации Q1 и Q2.
Second Pseudo Search: Поиск на основе только Q2.

Refinement (Уточнение)

Ситуация, когда второй поисковый запрос (Q2) модифицирует, сужает или дополняет контекст предыдущего запроса (Q1), а не начинает новый поиск.

Relative Weight (Относительный вес)

Метрика, оценивающая общее качество, релевантность или значимость набора результатов поиска. Используется для сравнения результатов первого и второго псевдопоисков. Рассчитывается с использованием стандартных алгоритмов ранжирования.

Widget (Виджет / Интерактивный сниппет)

Специальный элемент на SERP, связанный с конкретным результатом. Содержит интерактивные элементы (например, поля формы) и позволяет осуществлять двустороннюю связь между пользователем на SERP и ресурсом, не покидая страницу поиска.

Interactive Element (Интерактивный элемент)

Компонент виджета (например, выпадающий список, поле ввода), с которым пользователь может взаимодействовать.

Trigger (Триггер)

Инструкция, отправляемая сервером на устройство пользователя после определения того, что второй запрос является уточнением. Триггер инициирует обновление интерфейса (например, заполнение полей виджета).

Ключевые утверждения (Анализ Claims)

Ядром изобретения является метод определения связи между последовательными голосовыми запросами путем сравнения результатов гипотетических поисков.

Claim 1 (Независимый пункт): Описывает основной процесс, выполняемый на сервере.

Получение первой голосовой команды (содержащей Q1).
Получение второй голосовой команды (содержащей Q2).
Определение, является ли Q2 уточнением Q1. Этот шаг включает:

Выполнение Первого псевдопоиска (PS1) на основе комбинации Q1 и Q2.
Выполнение Второго псевдопоиска (PS2) на основе только Q2 (Q2 alone).
Определение относительного веса результатов PS1 и результатов PS2.
Вывод (Deducing):

(i) Q2 является уточнением Q1, если относительный вес результатов PS1 ВЫШЕ, чем у результатов PS2.
(ii) Q2 является совершенно новым запросом (brand new query), независимым от Q1, если относительный вес результатов PS1 НИЖЕ, чем у результатов PS2.

Claim 3 и 4 (Зависимые пункты): Уточняют контекст применения метода.

После выполнения поиска по Q1 система может отправить пользователю SERP, содержащий Widget для одного из результатов (Claim 3).
Этот виджет содержит интерактивные элементы для двусторонней связи с ресурсом (Claim 4). Это важно для сценариев использования, таких как заполнение формы бронирования.

Claim 7 (Зависимый пункт): Описывает действие системы после определения связи.

Если система определила, что Q2 является уточнением Q1, она отправляет Trigger на устройство пользователя.
Этот триггер инструктирует устройство обновить интерактивный элемент виджета, используя информацию из Q2 (например, заполнить поле фильтра).

Claim 16 и 17 (Зависимые пункты): Уточняют механизм определения относительного веса.

Сравнение весов выполняется с применением алгоритма ранжирования (Claim 16).
Этот алгоритм может быть алгоритмом машинного обучения, используемым для ранжирования результатов поиска при генерации SERP (Claim 17). Это означает, что Яндекс использует свою основную инфраструктуру ранжирования для оценки качества псевдопоисков.

Где и как применяется

Изобретение применяется на стыке нескольких слоев поиска, преимущественно связанных с обработкой запроса и формированием выдачи в контексте голосового взаимодействия.

QUERY PROCESSING – Понимание Запросов
На этом этапе система принимает последовательные голосовые команды, выполняет распознавание речи и интерпретирует полученные запросы. Ключевым моментом является активация логики определения контекста (является ли Q2 уточнением Q1) сразу после получения Q2. Система использует результаты ранжирования как способ разрешения неоднозначности.

RANKING – Ранжирование (Внутреннее использование)
Хотя патент не меняет публичное ранжирование, он активно использует инфраструктуру ранжирования для внутренних нужд. Система выполняет два псевдопоиска (PS1 и PS2) и использует основные алгоритмы ранжирования (ML-модели) для оценки Relative Weight результатов этих поисков. Ранжирование используется для принятия решения об интерпретации запроса.

BLENDER – Метапоиск и Смешивание (Генерация SERP и Виджетов)
На этапе формирования SERP по запросу Q1 система может включить в выдачу Widget. Если Q2 интерпретируется как уточнение, система может не генерировать новый SERP, а отправить Trigger для обновления существующего виджета на клиенте, используя данные из Q2.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на последовательные голосовые запросы, особенно в коммерческих и транзакционных сценариях, где первый запрос общий (например, «купить билеты»), а второй уточняет параметры (например, «в Бангкок на завтра»).
Конкретные типы контента и ниши: Влияет на взаимодействие с сайтами, для которых Яндекс формирует Виджеты — обычно это E-commerce, Travel, Недвижимость, где распространены фильтры и формы.
Пользовательский опыт (UX): Улучшает опыт голосового взаимодействия, делая его более диалоговым и контекстно-зависимым.

Когда применяется

Условия работы: Алгоритм активируется, когда система получает второй голосовой ввод вскоре после первого в рамках одной сессии.
Триггеры активации: Получение последовательного голосового запроса (Q2 после Q1). Особенно актуально, если на SERP по Q1 присутствует интерактивный виджет.

Пошаговый алгоритм

Получение Q1 и генерация SERP:
- Система получает первую голосовую команду, извлекает запрос Q1.
- Выполняется поиск по Q1. Система генерирует SERP, который может включать Виджет. SERP отправляется пользователю.
Получение Q2:
- Система получает вторую голосовую команду и извлекает запрос Q2.
Выполнение Псевдопоисков:
- Система выполняет First Pseudo Search (PS1) по комбинированному запросу (Q1+Q2).
- Система выполняет Second Pseudo Search (PS2) только по запросу Q2.
Оценка и Сравнение Весов:
- Используя основные алгоритмы ранжирования (ML), система оценивает Relative Weight (качество/релевантность) результатов для PS1 и PS2.
- Сравнение: Weight(PS1) vs Weight(PS2).
Принятие Решения и Действие:
- Сценарий А (Уточнение): Если Weight(PS1) > Weight(PS2). Система делает вывод, что Q2 уточняет Q1.
  - Если на SERP есть Виджет, система отправляет Trigger для обновления полей Виджета данными из Q2.
  - Альтернативно (Claim 12), система может отправить обновленный SERP, соответствующий результатам PS1.
- Сценарий Б (Новый запрос): Если Weight(PS1) < Weight(PS2). Система делает вывод, что Q2 — это новый запрос.
  - Система генерирует новый SERP на основе Q2 (результаты PS2) и отправляет его пользователю.

Какие данные и как использует

Данные на входе

Пользовательские факторы (Ввод): Последовательные голосовые команды (аудио).
Контентные факторы (Текстовые): Текстовые представления запросов Q1 и Q2 после распознавания речи.
Структурные факторы (Виджеты): Информация о структуре Интерактивных Сниппетов, отображаемых на SERP (например, доступные поля формы и их типы), необходимая для генерации триггера обновления.
Индексные данные: Вся база данных поискового индекса используется для выполнения псевдопоисков.

Какие метрики используются и как они считаются

Relative Weight (Относительный вес): Ключевая метрика в патенте. Она не определена формулой, но указано (Claim 16, 17), что она рассчитывается с использованием стандартных алгоритмов ранжирования, включая ML-алгоритмы, применяемые для генерации SERP.
Метод расчета: Система оценивает результаты псевдопоисков так же, как она оценивает реальные поиски, вычисляя скоры релевантности и качества для найденных документов. Сравнение весов, вероятно, является сравнением агрегированных скоров (например, среднего скора Топ-N результатов или метрик типа Proxima) для PS1 и PS2.

Выводы

Ранжирование как инструмент интерпретации запросов: Ключевой вывод — использование существующей инфраструктуры ранжирования для оценки качества гипотетических поисков (псевдопоисков). Решение о том, как интерпретировать запрос (как уточнение или новый), принимается на основе того, какой сценарий приводит к более качественной выдаче.
Определение непрерывности интента в голосовом поиске: Яндекс разработал механизм для поддержания контекста диалога в голосовых сессиях, что критически важно для UX.
Фокус на Интерактивных Сниппетах (Виджетах): Основное практическое применение, описанное в патенте, связано с голосовым взаимодействием с интерактивными элементами на SERP. Система позволяет пользователям заполнять формы или применять фильтры прямо в выдаче с помощью последовательных голосовых команд.
SERP как транзакционный интерфейс: Патент подтверждает стратегию по превращению страницы выдачи из списка ссылок в интерфейс для выполнения задач (Actions on SERP).

Практика

Best practices (это мы делаем)

Хотя патент имеет ограниченное прямое влияние на стандартные SEO-практики, он дает важные указания для оптимизации под SERP-фичи и голосовой поиск.

Оптимизация под длиннохвостые (уточненные) запросы: Убедитесь, что ваш сайт высоко релевантен не только общим запросам (Q1, например, «купить авиабилеты»), но и комбинированным, уточненным запросам (Q1+Q2, например, «купить авиабилеты в Бангкок на 7 дней до 1000 долларов»). Высокое качество вашего сайта по комбинированному запросу увеличит Relative Weight Первого псевдопоиска, что необходимо для работы механизма.
Внедрение Интерактивных Сниппетов (Виджетов): Для коммерческих сайтов необходимо стремиться к получению Интерактивных Сниппетов. Это позволяет пользователям взаимодействовать с функционалом сайта прямо на SERP с помощью голосовых уточнений.
Оптимизация форм и структуры сайта: Убедитесь, что основные формы на сайте (поиск, фильтры, заказ) имеют четкую структуру и логичные названия полей. Это облегчает Яндексу парсинг функционала для создания Виджета и корректное сопоставление голосовых уточнений (Q2) с соответствующими полями.
Использование структурированных данных: Внедряйте микроразметку (Schema.org) для товаров, предложений и действий (Actions), чтобы предоставить поисковой системе больше информации о возможностях взаимодействия с вашим контентом.

Worst practices (это делать не надо)

Фокус только на высокочастотные общие запросы: Если сайт оптимизирован только под Q1, но плохо отвечает на уточнения Q2, система может не справиться с обработкой комбинированного запроса (Q1+Q2), что ухудшит взаимодействие пользователя с сайтом через голосовой интерфейс.
Игнорирование SERP-фич и микроразметки: Пренебрежение возможностями Интерактивных Сниппетов и отсутствие структурированных данных снижает потенциал для интерактивного взаимодействия, которое является основным контекстом применения этого патента.
Сложные и нестандартные формы взаимодействия: Использование запутанных форм или нестандартных интерфейсов для фильтрации усложняет для Яндекса возможность интеграции этого функционала в Виджеты.

Стратегическое значение

Патент подчеркивает важность голосового взаимодействия и стратегию Яндекса по удержанию пользователя на SERP, предоставляя ему возможность выполнять действия без перехода на сайт (Task Completion on SERP). Для SEO это означает, что оптимизация присутствия в специальных элементах выдачи (Виджеты, Интерактивные Ответы) становится критически важной. В долгосрочной перспективе сайты должны быть готовы предоставлять свой функционал для интеграции с поисковыми интерфейсами.

Практические примеры

Сценарий: Поиск авиабилетов (на основе примера из патента)

Q1 (Голосовая команда): Пользователь говорит: «Найти дешевые билеты» («Search cheap tickets»).
Ответ системы: Яндекс показывает SERP, где присутствует виджет (интерактивный сниппет) агрегатора билетов с полями: Страна, Цена, Длительность, Тип тура.
Q2 (Голосовая команда): Пользователь говорит: «Ривьера Майя Мексика, на 1 неделю, до 1000 долларов, все включено» («Riviera Maya Mexico, for 1 week, price range under $1,000, all inclusive tour»).
Анализ системы:
- Первый псевдопоиск (Q1+Q2): «Дешевые билеты Ривьера Майя Мексика 1 неделя 1000 долларов все включено». Результаты высокорелевантны (Высокий Relative Weight).
- Второй псевдопоиск (Q2): «Ривьера Майя Мексика 1 неделя 1000 долларов все включено». Результаты менее специфичны (Средний Relative Weight).
Решение: Вес(1) > Вес(2). Система считает Q2 уточнением.
Результат: Яндекс отправляет триггер на устройство. Браузер автоматически заполняет поля виджета: Страна=Мексика (Ривьера Майя), Длительность=1 неделя, Цена=<1000, Тип=Все включено. Пользователь видит заполненную форму и может подтвердить поиск.

Вопросы и ответы

Что такое «Псевдопоиск» (Pseudo Search) в контексте этого патента?

Псевдопоиск — это внутренний поисковый процесс, который система выполняет для проверки гипотезы, но не показывает его результаты пользователю напрямую. В данном патенте выполняются два псевдопоиска: первый по комбинации двух последовательных запросов (Q1+Q2) и второй только по последнему запросу (Q2). Это делается для того, чтобы сравнить качество их результатов и понять намерение пользователя.

Как определяется «Относительный вес» (Relative Weight) результатов поиска?

Патент указывает, что для этого используются стандартные алгоритмы ранжирования поисковой системы, включая модели машинного обучения (Claim 17). На практике это означает, что система оценивает релевантность и качество документов, найденных в ходе псевдопоисков, используя те же метрики (например, Proxima, скоры ML-моделей), что и при обычном поиске. Сравнивается агрегированное качество выдачи.

Почему система считает запрос уточнением, если вес Q1+Q2 выше, чем вес Q2?

Логика заключается в том, что если комбинация запросов дает более релевантные и качественные результаты, чем второй запрос сам по себе, значит, первый запрос обеспечивает необходимый контекст. Например, поиск по Q2=»на завтра» даст общие результаты. Но поиск по Q1+Q2=»Билеты в кино + на завтра» дает гораздо более релевантные результаты. Следовательно, «на завтра» было уточнением к «Билетам в кино».

Влияет ли этот патент на ранжирование моего сайта в органической выдаче?

Напрямую нет. Патент не описывает изменение формул ранжирования. Он описывает механизм интерпретации голосовых запросов и взаимодействия с интерфейсом поиска (UI). Он влияет на то, как пользователь может взаимодействовать с вашим сайтом через SERP (особенно через виджеты), но не на позицию вашего сайта в стандартном списке результатов.

Что такое Widget или Интерактивный Сниппет, упомянутый в патенте?

Это специальный блок на странице выдачи Яндекса, который предоставляет расширенный функционал конкретного сайта. Например, это может быть форма поиска авиабилетов, калькулятор или фильтры каталога. Патент описывает, как голосовые команды могут использоваться для заполнения полей в этих виджетах прямо на SERP.

Как я могу оптимизировать свой сайт под этот механизм?

Основная рекомендация — стремиться к получению Интерактивных Сниппетов для вашего сайта, если вы работаете в коммерческой нише. Для этого необходимо иметь четкую структуру сайта, логичные формы поиска/заказа и использовать микроразметку. Также важно оптимизировать сайт под длиннохвостые (комбинированные) запросы, чтобы обеспечить высокий Relative Weight при псевдопоиске Q1+Q2.

Применяется ли этот механизм только к голосовым запросам?

Да, патент сфокусирован именно на обработке голосового ввода (Voice-Based User-Input). Спецификация патента (Claim 1) явно указывает на получение голосовых команд (Voice Command). В патенте не упоминается применение этой логики к последовательным текстовым запросам.

Что произойдет, если система ошибется и посчитает новый запрос уточнением?

Если система ошибочно посчитает Q2 уточнением (Weight(Q1+Q2) > Weight(Q2), хотя пользователь имел в виду новый поиск), она может некорректно обновить виджет на текущем SERP или показать результаты комбинированного поиска (Q1+Q2). Это запутает пользователя, так как результаты не будут соответствовать его новому интенту.

Актуален ли этот механизм, учитывая развитие нейросетей типа YATI/BERT?

Метод, основанный на сравнении весов псевдопоисков, может быть ресурсоемким по сравнению с современными трансформерными моделями, которые могут оценивать контекст диалога напрямую. Вероятно, текущие системы Яндекса используют более сложные механизмы для понимания conversational search, но описанный подход может по-прежнему использоваться как один из сигналов или в специфических вертикалях с виджетами.

Актуален ли этот патент для Алисы?

Да, крайне актуален. Алиса является основным голосовым интерфейсом Яндекса. Способность поддерживать диалог, понимать контекст и корректно обрабатывать уточняющие команды, описанная в этом патенте, является базовой функциональностью для любого современного голосового ассистента.