Как Яндекс определяет, является ли голосовой запрос уточнением предыдущего или новым поиском

Яндекс патентует метод для понимания контекста последовательных голосовых запросов. Система сравнивает качество результатов поиска по комбинированному запросу (предыдущий + текущий) и по текущему запросу отдельно. Если комбинированный поиск дает лучшие результаты (имеет больший «относительный вес»), новый запрос считается уточнением. Этот механизм используется для улучшения диалогового поиска и голосового взаимодействия с интерактивными сниппетами (виджетами) в выдаче.

Описание

Какую задачу решает

Патент решает проблему интерпретации намерения пользователя при последовательном вводе голосовых команд (voice-based user-input). Основная задача — определить, является ли новый голосовой запрос уточнением (refinement) предыдущего запроса в рамках текущей сессии, или же это совершенно новый, независимый поиск. Это критически важно для поддержания контекста в диалоговом поиске (Conversational Search) и корректного взаимодействия с интерфейсом поисковой выдачи.

Что запатентовано

Запатентован метод определения контекстуальной связи между последовательными голосовыми запросами (Q1 и Q2). Суть изобретения заключается в использовании основного алгоритма ранжирования поисковой системы для оценки качества результатов поиска по разным интерпретациям запросов. Система сравнивает «вес» (качество/релевантность) результатов для комбинированного запроса (Q1+Q2) с «весом» результатов только для второго запроса (Q2).

Как это работает

Система получает два последовательных голосовых запроса (Q1 и Q2). Для определения их взаимосвязи выполняются два внутренних «псевдопоиска» (Pseudo Search): первый по комбинации Q1+Q2, второй только по Q2. Затем система оценивает «относительный вес» (Relative Weight) результатов обоих псевдопоисков, используя стандартный алгоритм ранжирования (например, ML-алгоритм, генерирующий SERP). Если относительный вес результатов комбинированного поиска (Q1+Q2) выше, чем вес результатов изолированного поиска (Q2), система делает вывод, что Q2 является уточнением Q1. В патенте это часто применяется для заполнения полей в Виджетах (Интерактивных сниппетах) на SERP с помощью голоса.

Актуальность для SEO

Средняя/Высокая. Диалоговый поиск и голосовые ассистенты (такие как Алиса) активно развиваются, и задача определения контекста крайне актуальна. Базовая идея использования сигналов ранжирования для оценки когерентности запросов остается релевантной. Хотя современные нейросетевые модели могут использовать более сложные методы управления диалогом, описанный механизм взаимодействия с интерактивными элементами в SERP также сохраняет свою значимость.

Важность для SEO

Влияние на SEO опосредованное (4/10). Патент относится к слою Понимания Запросов (Query Understanding) и улучшению UX голосового поиска, а не к Ранжированию. Он не вводит новых факторов ранжирования. Его основное значение для SEO заключается в демонстрации функциональной важности Интерактивных Сниппетов (Виджетов). Для ниш, где такие виджеты распространены (туризм, e-commerce), понимание этого механизма важно для оптимизации под диалоговый поиск и обеспечения взаимодействия с сайтом прямо из SERP.

Детальный разбор

Термины и определения

First/Second Voice Command (Первая/Вторая голосовая команда)

Последовательные голосовые вводы от пользователя, содержащие поисковые запросы.

First/Second Search Query (Q1/Q2) (Первый/Второй поисковый запрос)

Текстовое представление голосовых команд после распознавания речи.

Pseudo Search (Псевдопоиск)

Внутренний поисковый процесс, выполняемый для оценки потенциальных результатов запроса. Используется два типа:

First Pseudo Search: Поиск на основе комбинации Q1 и Q2.
Second Pseudo Search: Поиск на основе только Q2.

Refinement (Уточнение)

Интерпретация второго запроса (Q2) как сужающего или модифицирующего область поиска, заданную первым запросом (Q1).

Relative Weight (Относительный вес)

Метрика качества, релевантности или общей силы набора результатов поиска. В патенте указано, что этот вес определяется с использованием стандартных алгоритмов ранжирования.

Ranking Algorithm (Алгоритм ранжирования)

Основной алгоритм (в патенте указан как machine-learning algorithm), используемый для ранжирования результатов при генерации SERP. Он же используется для определения Relative Weight.

Widget / Interactive Snippet (Виджет / Интерактивный сниппет)

Специализированный элемент SERP, который обеспечивает двустороннее взаимодействие между пользователем и веб-ресурсом непосредственно на странице результатов поиска. Содержит Interactive Elements (поля ввода, фильтры).

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методе определения контекста голосового запроса путем сравнения качества потенциальных результатов.

Claim 1 (Независимый пункт): Определяет основной метод обработки последовательных голосовых запросов на сервере.

Получение первого голосового запроса (Q1).
Получение второго голосового запроса (Q2).
Определение того, является ли Q2 уточнением Q1. Этот процесс включает:

Выполнение первого псевдопоиска на основе комбинации Q1 и Q2.
Выполнение второго псевдопоиска, включающего только Q2 (Q2 alone).
Определение относительного веса (Relative Weight) результатов первого и второго псевдопоисков.
Принятие решения:

(i) Q2 является уточнением Q1, если относительный вес результатов первого псевдопоиска (Q1+Q2) ВЫШЕ, чем у второго (Q2).
(ii) Q2 является новым независимым запросом, если относительный вес результатов первого псевдопоиска (Q1+Q2) НИЖЕ, чем у второго (Q2).

Claim 3, 4, 6, 7 (Зависимые пункты): Описывают применение метода в контексте интерактивных сниппетов.

Если в ответ на Q1 был показан SERP, содержащий Виджет (Claim 3) с Интерактивными элементами (Claim 4), и Q2 определен как уточнение, то Q2 используется для заполнения (populating) этих элементов (Claim 6). Система отправляет триггер (trigger) на устройство пользователя, который вызывает обновление интерактивных элементов виджета данными из Q2 (Claim 7).

Claim 16, 17 (Зависимые пункты): Уточняют механизм определения веса.

Определение Relative Weight включает применение Алгоритма Ранжирования (Claim 16). Этот алгоритм является алгоритмом машинного обучения (machine-learning algorithm), используемым для ранжирования результатов поиска при генерации SERP (Claim 17).

Где и как применяется

Изобретение применяется на нескольких этапах обработки поискового запроса, преимущественно при голосовом вводе.

QUERY PROCESSING – Понимание Запросов
Это основной этап применения патента. Система анализирует последовательность голосовых запросов для определения интента и контекста сессии. Здесь принимается решение, следует ли интерпретировать новый ввод как продолжение текущего поиска (уточнение) или как начало нового.

RANKING – Ранжирование
Компоненты ранжирования используются как инструмент оценки. Система запускает два внутренних Псевдопоиска и использует основной ML-алгоритм ранжирования для расчета Relative Weight (качества) их результатов. Качество потенциальной выдачи используется как сигнал для понимания запроса.

BLENDER – Метапоиск и Смешивание (Генерация SERP)
Патент тесно связан с подсистемами, отвечающими за Интерактивные Сниппеты (Виджеты), например, Wizards (Колдунщики). Если запрос признан уточнением, система может сгенерировать триггер для обновления этих виджетов на стороне клиента (заполнение полей, обновление данных) вместо генерации нового SERP.

На что влияет

Специфические запросы: В первую очередь влияет на обработку голосовых запросов и диалоговые поисковые сессии (Conversational Search).
Конкретные форматы контента и ниши: Наибольшее влияние оказывается на ниши, где пользователи решают задачи, требующие уточнения параметров (e-commerce, путешествия, бронирование) и где применимы интерактивные сниппеты (Виджеты). Пример в патенте использует сайт по продаже туров.

Когда применяется

Условия работы: Алгоритм активируется, когда система получает второй (или последующий) голосовой запрос в рамках одной поисковой сессии.
Триггеры активации: Получение последовательного голосового ввода. Активация логики обновления виджета зависит от наличия интерактивного сниппета в выдаче по первому запросу.

Пошаговый алгоритм

Получение Q1: Система получает и распознает первую голосовую команду (Q1). Выполняется поиск, пользователю отправляется SERP (возможно, с Виджетом).
Получение Q2: Система получает и распознает вторую голосовую команду (Q2).
Первый Псевдопоиск: Система выполняет внутренний поиск по комбинированному запросу (Q1 + Q2).
Второй Псевдопоиск: Система выполняет внутренний поиск только по второму запросу (Q2).
Оценка Веса: Система применяет стандартные алгоритмы ранжирования (ML-алгоритмы) для оценки Relative Weight (общего качества/релевантности) наборов результатов обоих псевдопоисков.
Сравнение и Решение: Сравниваются веса результатов.
- Если Вес(Q1+Q2) > Вес(Q2), то Q2 интерпретируется как Refinement (уточнение).
- Если Вес(Q1+Q2) < Вес(Q2), то Q2 интерпретируется как новый независимый запрос.
Выполнение Действия:
- Если это уточнение: Система может отправить обновленный SERP (Q1+Q2) ИЛИ, если в SERP был виджет, отправить триггер для заполнения полей виджета данными из Q2.
- Если это новый запрос: Выполняется стандартный поиск по Q2.

Какие данные и как использует

Данные на входе

Контентные факторы (Запросы): Текстовое представление первого (Q1) и второго (Q2) голосовых запросов после распознавания речи.
Системные данные: Поисковый индекс и все данные, необходимые для работы основных алгоритмов ранжирования (используются для выполнения псевдопоисков и оценки их веса). Данные о структуре текущего SERP (наличие и конфигурация Виджетов).

Какие метрики используются и как они считаются

Relative Weight (Относительный вес): Ключевая метрика патента. Это агрегированная оценка качества и релевантности набора результатов псевдопоиска.
Методы вычисления: Патент не предоставляет конкретной формулы, но явно указывает (Claims 16, 17), что для расчета используется стандартный Алгоритм Ранжирования, а именно алгоритм машинного обучения (machine-learning algorithm), применяемый для генерации SERP. Это означает, что система использует основную формулу ранжирования Яндекса для оценки качества выдачи в целом.
Сравнение Весов: Решение принимается на основе простого сравнения: $W_{Q1+Q2} > W_{Q2}$ или $W_{Q1+Q2} < W_{Q2}$.

Выводы

Качество выдачи как мера понимания интента: Ключевая идея патента — использовать качество потенциальной поисковой выдачи (Relative Weight) для интерпретации связи между последовательными голосовыми запросами. Если комбинация запросов дает лучшие результаты, система предполагает, что пользователь намеревался уточнить поиск.
Использование ML-ранжирования для Query Understanding: Патент демонстрирует, как основные алгоритмы машинного обучения (используемые для ранжирования) применяются для решения задач понимания запроса. Ранжирование используется как универсальный инструмент оценки качества.
Фокус на диалоговом поиске и Интерактивных Сниппетах: Система разработана для поддержки диалогового режима поиска и тесно связывает механизм уточнений с взаимодействием через Виджеты на SERP. Цель — не просто показать ссылки, а выполнить задачу (например, заполнить форму бронирования голосом).
Инфраструктурный характер: Патент описывает инфраструктуру обработки голосовых запросов и не вводит новых факторов ранжирования для SEO. Его ценность заключается в понимании того, как Яндекс обрабатывает голосовой трафик и взаимодействует с интерактивными элементами выдачи.

Практика

Best practices (это мы делаем)

Хотя патент носит инфраструктурный характер (Query Understanding), он подчеркивает важность интерактивных элементов выдачи и оптимизации под голосовой поиск (VSO).

Оптимизация под Интерактивные Сниппеты (Виджеты): В релевантных нишах (туризм, бронирование, e-commerce) необходимо стремиться к получению интерактивных сниппетов на выдаче. Это позволяет пользователям взаимодействовать с вашим ресурсом напрямую через SERP, в том числе с помощью голосовых команд уточнения, как описано в патенте.
Четкая структура интерактивных элементов сайта: Убедитесь, что формы и фильтры на вашем сайте имеют логичную структуру и понятные названия полей. Это облегчит поисковой системе создание Виджета и позволит корректно сопоставлять голосовые команды с элементами управления.
Четкая информационная архитектура, поддерживающая уточнения: Структура сайта должна логично поддерживать уточняющие запросы (например, через фасетную навигацию). Это увеличивает вероятность того, что комбинированный запрос (Q1+Q2) даст высокий Relative Weight.
Внедрение структурированных данных: Использование Schema.org для формирования расширенных и потенциально интерактивных сниппетов остается важным для обеспечения взаимодействия с вашим сайтом через SERP.

Worst practices (это делать не надо)

Игнорирование SERP-фич и интерактивности: Отсутствие оптимизации под интерактивные сниппеты в нишах, где они доступны, означает упущенную возможность взаимодействия с пользователем прямо на SERP.
Сложные и нестандартные формы/фильтры: Использование сложных, нелогичных систем фильтрации или форм с неочевидными названиями полей затрудняет создание интерактивного виджета и снижает эффективность голосового взаимодействия с ним.

Стратегическое значение

Патент подтверждает стратегический приоритет Яндекса на развитие голосового поиска (Conversational Search) и переход от информационной выдачи к выполнению задач пользователя (Task Completion). Поисковые сессии рассматриваются как диалог, где система должна корректно интерпретировать контекст. Для SEO это означает необходимость адаптации к более естественным формам взаимодействия и фокус на предоставлении структурированной информации, которая может быть использована в интерактивных интерфейсах SERP.

Практические примеры

Сценарий: Голосовое заполнение фильтров в Интерактивном Сниппете (Туризм)

Действие SEO: Сайт по бронированию туров оптимизирован для получения интерактивного виджета в выдаче Яндекса.
Взаимодействие пользователя (Q1): Пользователь говорит: «Туры в Турцию». Яндекс показывает SERP с интерактивным виджетом этого сайта.
Взаимодействие пользователя (Q2): Пользователь говорит: «На двоих, 7 дней, все включено».
Работа системы (Анализ):
- Псевдопоиск 1: «Туры в Турцию + На двоих, 7 дней, все включено».
- Псевдопоиск 2: «На двоих, 7 дней, все включено».
- Сравнение: Вес(1) > Вес(2). Система классифицирует Q2 как уточнение.
Результат: Система отправляет триггер. Виджет на SERP автоматически заполняет поля: Количество человек = 2, Длительность = 7 дней, Тип = Все включено. Пользователь видит уточненные результаты прямо на SERP или переходит на сайт с примененными фильтрами.

Вопросы и ответы

Что такое «Псевдопоиск» (Pseudo Search) в контексте этого патента?

Псевдопоиск — это внутренний процесс, который система запускает для оценки потенциальных результатов по разным интерпретациям запроса, не показывая их пользователю. Когда пользователь задает второй запрос (Q2) после первого (Q1), система выполняет два псевдопоиска: один по комбинации (Q1+Q2) и один только по Q2. Это необходимо для последующего сравнения качества полученных результатов.

Как рассчитывается «Относительный вес» (Relative Weight) результатов поиска?

Патент указывает, что Относительный вес определяется с помощью стандартного алгоритма машинного обучения, который используется для ранжирования результатов при генерации SERP. По сути, Яндекс использует свою основную формулу ранжирования для оценки того, насколько качественным и релевантным является набор документов, найденных в ходе псевдопоиска. Чем выше оценка, тем выше вес.

Как система решает, является ли запрос уточнением или новым поиском?

Решение принимается на основе сравнения Относительных весов. Если вес результатов комбинированного поиска (Q1+Q2) выше, чем вес результатов поиска только по новому запросу (Q2), то новый запрос считается уточнением. Если же вес комбинированного поиска ниже, система считает, что пользователь начал новый, независимый поиск.

Влияет ли этот патент на ранжирование моего сайта?

Прямого влияния нет. Патент не вводит новых факторов ранжирования. Он описывает, как Яндекс интерпретирует последовательные голосовые запросы (Query Processing) и улучшает пользовательский опыт (UX). Ранжирование остается прежним, но способ ввода и интерпретации запроса обрабатывается более интеллектуально.

Какова роль Интерактивных Сниппетов (Виджетов) в этом патенте?

Они играют центральную роль в практическом применении изобретения. Патент детально описывает сценарий, когда первый запрос приводит к показу виджета (например, формы бронирования), а второй голосовой запрос (уточнение) используется для автоматического заполнения полей этого виджета. Это позволяет пользователю взаимодействовать с сайтом голосом прямо из SERP.

Как я могу оптимизировать свой сайт под этот механизм?

Основная рекомендация — оптимизировать сайт для получения Интерактивных Сниппетов. Это включает внедрение микроразметки и обеспечение того, чтобы интерактивные элементы на сайте (формы, фильтры) имели четкую структуру и понятные названия полей. Это упростит системе создание виджета и корректное сопоставление голосовых команд с элементами управления.

Применяется ли этот механизм только к голосовым запросам?

Да, согласно тексту патента (Claims 1, 18, 35), метод специфичен для обработки голосового ввода (voice command / voice-based user-input). Патент не описывает применение этого механизма для текстовых запросов, хотя базовая логика определения уточнений может использоваться шире.

Использует ли Яндекс лингвистический анализ для определения связи между запросами в этом патенте?

В данном патенте акцент сделан не на лингвистическом анализе самих текстов запросов, а на анализе качества результатов поиска (Relative Weight). Система полагается на то, что если запросы связаны по смыслу (интенту), то их комбинация даст более качественную выдачу. Это подход, основанный на данных ранжирования, а не чистой лингвистике.

Насколько актуален этот метод с учетом развития больших языковых моделей (LLM) и YATI?

Концепция определения уточнений актуальна. Однако методы могли эволюционировать. Современные трансформерные модели (как YATI) и LLM (как YandexGPT) способны лучше понимать контекст диалога напрямую, возможно, уменьшая необходимость в выполнении и сравнении полноценных псевдопоисков. Тем не менее, использование качества выдачи как сигнала для понимания интента остается мощным подходом.

Что происходит, если система ошибочно распознала речь?

Патент предусматривает возможность корректировки. Если система неверно распознала запрос (например, из-за ошибки Speech-to-Text), пользователь может дать третью голосовую команду (Q3) для исправления. Система проанализирует Q3 относительно Q1 и Q2, используя тот же механизм псевдопоисков, чтобы определить, что это корректировка предыдущего уточнения.