Яндекс патентует метод для улучшения понимания запросов в диалоговых системах (IPA), таких как голосовые помощники. Система решает проблему неоднозначных последующих запросов (например, «А в Лондоне?» после вопроса о погоде). Текущий интент определяется путем комбинирования вероятности самого запроса и вероятности перехода от предыдущего интента к новому, что позволяет поддерживать контекст диалога.
Описание
Какую задачу решает
Патент решает задачу корректного определения намерения пользователя (intent) в контексте диалоговых систем или Intelligent Personal Assistant (IPA) (например, Яндекс Алиса). Ключевая проблема — обработка intent-dependent queries или «последующих запросов» (follow-up queries), чей смысл неясен в отрыве от контекста предыдущего диалога. Например, запрос «А в Лондоне?» может относиться к погоде или путешествиям в зависимости от того, что спрашивали до этого. Система призвана повысить точность интерпретации таких запросов, сохраняя контекст сессии.
Что запатентовано
Запатентован метод определения текущего интента запроса (Current Intent) путем учета интента предыдущего запроса (Preceding Intent). Суть изобретения заключается в расчете двух ключевых метрик: Intent-Association Parameter (вероятность связи запроса с интентом вне контекста) и Intent-Transition Parameter (вероятность перехода от предыдущего интента к новому). Итоговая оценка (Adjusted Intent-Association Parameter) получается путем перемножения этих двух параметров.
Как это работает
Система работает в контексте диалога. При получении нового запроса она анализирует его вместе с известным интентом предыдущего запроса. Используются три основных компонента (реализуемые как Machine Learning Algorithms, MLA):
- Первый MLA оценивает вероятность связи текущего запроса с каждым возможным интентом (IAP), игнорируя контекст.
- Второй MLA (или эвристики) оценивает вероятность того, что пользователь сменит предыдущий интент на новый (ITP).
- Система перемножает эти две вероятности (IAP * ITP) и выбирает интент с наивысшей итоговой оценкой.
- Третий MLA используется для извлечения сущностей (слотов) из запроса для заполнения «цифровой формы» (Digital Form), необходимой для генерации ответа.
Актуальность для SEO
Высокая. Патент напрямую связан с развитием диалоговых интерфейсов и голосовых помощников (например, Алиса). По мере роста использования этих технологий точность понимания контекста и обработки последовательных запросов становится критически важной для пользовательского опыта.
Важность для SEO
Влияние на традиционное SEO ограничено (4/10), но значительно для оптимизации под голосовой поиск (VSO) и диалоговые интерфейсы (8/10). Патент не описывает ранжирование веб-документов. Однако он раскрывает, как Яндекс подходит к анализу сессий и последовательности интентов (User Journey). Понимание этого механизма критично для создания контента или навыков (Skills), которые эффективно взаимодействуют с пользователем в рамках диалога, и для стратегического планирования контента, поддерживающего последовательные интенты.
Детальный разбор
Термины и определения
- Adjusted Intent-Association Parameter (Скорректированный параметр ассоциации с интентом)
- Итоговая оценка вероятности интента. Рассчитывается как произведение Intent-Association Parameter и Intent-Transition Parameter. Используется для финального выбора текущего интента.
- Current Intent / Preceding Intent (Текущий / Предыдущий интент)
- Намерение пользователя, связанное с текущим или предыдущим запросом в диалоге соответственно.
- Digital-Form (Цифровая форма)
- Структура данных или алгоритм, связанный с конкретным интентом. Содержит поля (Form-Fields), которые необходимо заполнить значениями (Form-Values) для генерации ответа (например, для интента «погода» форма требует заполнения поля «локация»). Поля могут быть обязательными (mandatory) или вспомогательными (auxiliary).
- First MLA (Первый алгоритм машинного обучения)
- Алгоритм, обученный определять Intent-Association Parameter на основе характеристик самого запроса, без учета контекста.
- Intent-Association Parameter (IAP) (Параметр ассоциации с интентом)
- Метрика, указывающая на вероятность того, что текущий запрос связан с определенным потенциальным интентом, рассчитанная без учета предыдущего контекста.
- Intent-Transition Parameter (ITP) (Параметр перехода интента)
- Метрика, указывающая на вероятность смены предыдущего интента на новый потенциальный интент в рамках диалога.
- IPA (Intelligent Personal Assistant)
- Интеллектуальный персональный помощник (чат-бот, голосовой ассистент).
- Second MLA (Второй алгоритм машинного обучения)
- Алгоритм, обученный определять Intent-Transition Parameter на основе пар последовательных запросов и их интентов.
- Third MLA (Третий алгоритм машинного обучения)
- Алгоритм, обученный извлекать значения (Form-Values) из запросов и ассоциировать их с полями (Form-Fields) цифровых форм (извлечение сущностей / слот-филлинг).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает базовый метод определения текущего интента (Current Intent) на основе предыдущего (Preceding Intent).
- Система получает текущий запрос и предыдущий интент.
- Для каждого потенциального интента определяется Intent-Association Parameter (IAP).
- Для каждого потенциального интента определяется Intent-Transition Parameter (ITP).
- Для каждого потенциального интента вычисляется Adjusted Intent-Association Parameter путем перемножения IAP и ITP.
- Выбирается интент с наилучшими скорректированными параметрами.
Claim 2 (Зависимый от 1): Уточняет, что IAP определяется с помощью First MLA. Этот алгоритм обучается на исторических данных, размеченных асессорами (human-assessor).
Claim 3 и 4 (Зависимые от 1): Уточняют, как определяется ITP. Возможны два варианта:
- Claim 3: С помощью эвристической процедуры (heuristic-based routine) на основе заранее определенных правил.
- Claim 4: С помощью Second MLA. Этот алгоритм обучается на последовательностях запросов и интентов, чтобы предсказывать вероятность перехода.
Claim 7, 8, 10 (Зависимые): Описывают генерацию ответа.
Каждый интент связан с Digital-Form (Claim 7). Система должна заполнить поля формы (Form-Fields) значениями (Form-Values) из запроса (Claim 8). Это заполнение выполняется с помощью Third MLA (Claim 10).
Где и как применяется
Патент применяется исключительно в рамках систем обработки естественного языка для диалоговых интерфейсов (IPA), таких как голосовые помощники или чат-боты.
QUERY PROCESSING – Понимание Запросов
Изобретение является ключевым компонентом слоя понимания запросов в диалоговых системах. Оно отвечает за разрешение неоднозначности и определение контекстуального интента пользователя.
- Входные данные: Текущий запрос (текст) и Предыдущий интент (ID интента).
- Процесс: Система использует First MLA для анализа лингвистических характеристик запроса и Second MLA (или эвристики) для анализа вероятности смены темы. Ключевой особенностью является комбинирование этих двух независимых оценок (IAP и ITP).
- Выходные данные: Определенный Текущий интент (ID интента) и заполненная Digital Form для генерации ответа.
BLENDER – Метапоиск и Смешивание (Wizards/Колдунщики)
Механизм связан с генерацией спецответов. После определения интента и извлечения параметров с помощью Third MLA, система активирует соответствующую Digital-Form (сценарий Колдунщика) для генерации финального ответа.
Патент не описывает применение этого механизма в основном ранжировании веб-документов (RANKING).
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на короткие, неоднозначные, контекстно-зависимые запросы (follow-up queries) в рамках диалоговой сессии.
- Типы контента: Влияет на выбор типа ответа (например, погода, маршрут, справка), который генерирует IPA.
Когда применяется
Алгоритм применяется при обработке запросов в рамках активной диалоговой сессии, когда существует история взаимодействия.
- Триггеры активации: Поступление нового запроса при наличии предыдущего запроса и его интента в текущей сессии.
- Пороговые значения (Claim 6): Если все Adjusted Intent-Association Parameters ниже определенного порога (association-significance threshold), система может сгенерировать запасной ответ (fallback response), признавая, что не уверена в интенте.
Пошаговый алгоритм
Этап 1: Получение данных
- Система получает текущий запрос от пользователя.
- Система извлекает контекст диалога: предыдущий запрос и определенный для него предыдущий интент (Preceding Intent).
Этап 2: Вычисление вероятности ассоциации (Intent-Association)
- Текущий запрос подается на вход Первому MLA.
- Первый MLA анализирует характеристики запроса (лексические, грамматические, семантические признаки).
- На выходе генерируется набор Intent-Association Parameters (IAP) — по одному для каждого потенциального интента.
Этап 3: Вычисление вероятности перехода (Intent-Transition)
- Предыдущий интент (и, возможно, текущий и предыдущий запросы) подаются на вход Второму MLA или эвристической процедуре.
- Система оценивает вероятность смены предыдущего интента на каждый из потенциальных интентов.
- На выходе генерируется набор Intent-Transition Parameters (ITP).
Этап 4: Корректировка и выбор интента
- Для каждого потенциального интента вычисляется Adjusted Intent-Association Parameter путем перемножения IAP и ITP.
- Потенциальные интенты ранжируются, и интент с наивысшим значением выбирается как текущий интент.
Этап 5: Проверка порога и фоллбэк
- Наивысшее значение сравнивается с порогом значимости.
- Если значение ниже порога, система генерирует стандартный (fallback) ответ.
Этап 6: Извлечение параметров и генерация ответа
- Если порог пройден, система выбирает Digital-Form, соответствующую текущему интенту.
- Третий MLA анализирует текущий запрос и контекст диалога для извлечения значений (Form-Values) и заполнения полей (Form-Fields). Упоминается (Claim 9), что ответ генерируется, только если все обязательные поля (mandatory form-fields) заполнены.
- Система генерирует ответ, используя заполненную форму.
Какие данные и как использует
Данные на входе
- Контентные факторы (Текстовые): Текст текущего запроса, тексты предыдущих запросов и ответов в диалоге. Характеристики запросов, используемые для обучения MLA, включают: лексические категории слов (части речи), грамматические и семантические признаки, длину запроса.
- Временные факторы: Время подачи запроса (упоминается в описании как возможный признак для MLA).
- Географические факторы: Местоположение пользователя (упоминается как возможный признак для MLA или как значение по умолчанию для заполнения Digital Form).
- Системные данные (Контекст): Интент предыдущего запроса (Preceding Intent).
- Данные для обучения (Офлайн): Логи прошлых диалогов, размеченные асессорами (human-assessed information). Разметка включает интенты для запросов и выделение сущностей (Form-Values).
Ссылочные или поведенческие факторы веб-поиска в данном патенте не используются.
Какие метрики используются и как они считаются
Система вычисляет три ключевые метрики для определения интента:
- Intent-Association Parameter ($P_{assoc}$): Вероятность P(Intent | Query). Вычисляется с помощью First MLA.
- Intent-Transition Parameter ($P_{trans}$): Вероятность P(Current Intent | Preceding Intent). Вычисляется с помощью Second MLA или эвристик.
- Adjusted Intent-Association Parameter ($P_{adj}$): Итоговая оценка. Рассчитывается по формуле:
$$ P_{adj} = P_{assoc} \times P_{trans} $$
- Алгоритмы машинного обучения: В патенте упоминается, что MLA могут быть реализованы, например, как модели на основе решающих деревьев (decision tree model).
- Association-Significance Threshold: Пороговое значение для $P_{adj}$, используемое для определения уверенности системы в выбранном интенте.
Выводы
- Контекст диалога имеет математическое выражение: Яндекс формализовал влияние предыдущего интента на текущий через параметр вероятности перехода (ITP). Интерпретация запроса в IPA — это анализ текста, скорректированный контекстом диалога.
- Приоритет сохранения темы: Механизм умножения IAP на ITP позволяет системе отдавать предпочтение сохранению текущей темы разговора. Если вероятность перехода на новую тему (ITP) низка, то даже при высоком соответствии текста новому интенту (IAP), система может предпочесть сохранение предыдущего интента.
- Сложная архитектура понимания запросов (3 MLA): Система использует три специализированные модели: классификация интента по тексту (MLA 1), анализ последовательности интентов (MLA 2) и извлечение сущностей/слот-филлинг (MLA 3).
- Ориентация на выполнение задач (Digital Forms): Цель системы — заполнить структурированную форму для выполнения действия или предоставления точного ответа. Это подчеркивает важность наличия конкретных данных (сущностей) для успешного взаимодействия.
- Значение для SEO-стратегии: Хотя патент не описывает ранжирование, он раскрывает подход Яндекса к пониманию User Journey и сессий. Понимание того, как пользователи переходят от одного интента к другому, является ключом к долгосрочной контент-стратегии.
Практика
Best practices (это мы делаем)
Рекомендации применимы для оптимизации под голосовой поиск (VSO), диалоговые системы (Алиса, чат-боты) и стратегического планирования контента.
- Оптимизация под User Journey (Путь пользователя): Анализируйте и оптимизируйте целые сценарии поиска, а не отдельные запросы. Понимайте естественную последовательность интентов в вашей тематике (например, от обзора к сравнению и затем к покупке). Это соответствует тому, как Second MLA оценивает вероятности переходов (ITP).
- Проектирование логической архитектуры контента: Структурируйте сайт так, чтобы он поддерживал логичные переходы между связанными интентами. Создавайте контентные хабы и используйте перелинковку, чтобы вести пользователя от одного шага к следующему.
- Четкое структурирование информации для извлечения: Поскольку Third MLA используется для заполнения Digital Forms, информация должна быть представлена так, чтобы ее можно было легко извлечь как сущность (Form-value). Используйте микроразметку (Schema.org), таблицы, списки. Это повышает шансы на использование контента в ответах ассистента.
- Проектирование диалоговых навыков с учетом контекста: При разработке навыков для голосовых ассистентов необходимо явно управлять контекстом, предвидеть follow-up запросы и обеспечивать естественное взаимодействие, соответствующее логике патента.
Worst practices (это делать не надо)
- Рассмотрение запросов в изоляции: Оптимизация под отдельные ключевые слова без учета контекста сессии и возможных последующих шагов пользователя.
- Создание тупикового контента: Страницы, которые не предвосхищают возможные следующие вопросы пользователя и не предлагают логического продолжения изучения темы, хуже удовлетворяют потребность пользователя в рамках сессии.
- Предоставление неструктурированной информации: Сплошной текст, из которого сложно извлечь конкретные параметры (Form-Values), будет плохо работать в системах IPA, которые полагаются на заполнение Digital-Forms.
Стратегическое значение
Патент подтверждает стратегический фокус Яндекса на понимании контекста сессии и развитии диалоговых интерфейсов. Он показывает, что для Яндекса важно не просто ответить на текущий вопрос, но и поддержать связный диалог или эффективную поисковую сессию. Долгосрочная SEO-стратегия должна быть направлена на построение ресурсов, которые помогают пользователю пройти весь путь решения задачи, поддерживая различные последовательные интенты.
Практические примеры
Сценарий 1: Сохранение интента при неоднозначном запросе (Пример из патента)
- Диалог: Пользователь: «Какая погода в Москве?» (Предыдущий интент = «Погода»). Пользователь: «А как там в Монреале?».
- Анализ (First MLA): Запрос «А как там в Монреале?» может быть связан с интентами «Путешествие» (высокий IAP) или «Погода» (средний IAP).
- Анализ (Second MLA): Система оценивает вероятность перехода от «Погоды» к «Путешествию» (низкий ITP) и от «Погоды» к «Погоде» (высокий ITP).
- Результат: За счет высокого ITP, итоговый Adjusted IAP для «Погоды» оказывается выше, чем для «Путешествия». Интент сохранен как «Погода».
- Извлечение данных (Third MLA): Извлекает локацию «Монреаль» для заполнения Digital Form.
- Ответ: Система сообщает погоду в Монреале.
Сценарий 2: Оптимизация контента с учетом переходов интентов (ITP)
- Анализ User Journey: SEO-специалист определяет, что пользователи часто переходят от запроса (Интент 1: Обзор) к запросу (Интент 2: Сравнение). Это означает, что ITP между ними высок.
- Действие SEO: Необходимо убедиться, что на сайте есть как обзорная статья, так и детальное сравнение.
- Реализация: В обзорную статью добавляется блок с прямыми ссылками или кратким сравнением топовых моделей, предвосхищая следующий шаг пользователя.
- Ожидаемый результат: Сайт лучше удерживает пользователя в рамках сессии и соответствует логике системы, описанной в патенте, что улучшает поведенческие факторы и общее качество ресурса.
Вопросы и ответы
Применим ли этот патент к стандартному веб-поиску Яндекса?
Напрямую нет. Патент явно описывает технологии для Intelligent Personal Assistants (IPA) — голосовых помощников (как Алиса) и чат-ботов, где критически важно поддерживать контекст диалога. Он фокусируется на выполнении задач и генерации прямых ответов, а не на ранжировании веб-документов. Однако он дает стратегическое понимание того, как Яндекс анализирует сессии пользователей.
В чем разница между Intent-Association Parameter (IAP) и Intent-Transition Parameter (ITP)?
IAP — это вероятность того, что запрос соответствует интенту, если рассматривать его в изоляции (определяется First MLA). ITP — это вероятность того, что пользователь переключился с предыдущего интента на новый (определяется Second MLA или эвристиками). Система перемножает эти два параметра, чтобы определить наиболее вероятный интент в текущем контексте диалога.
В патенте упоминаются три алгоритма машинного обучения (MLA). За что они отвечают?
First MLA отвечает за расчет IAP (классификация интента без контекста). Second MLA отвечает за расчет ITP (вероятность смены темы). Third MLA отвечает за извлечение сущностей или слот-филлинг — он определяет, какие данные из запроса (например, город, дата) нужно использовать для выполнения задачи и заполнения Digital Form.
Что такое «Цифровая форма» (Digital Form) и как она связана с SEO?
Digital Form — это структура данных для конкретного интента, содержащая слоты (Form-fields), которые нужно заполнить для ответа. Связь с SEO (особенно VSO) в том, что информация на сайте должна быть структурирована так (микроразметка, таблицы), чтобы Third MLA мог легко извлечь эти данные (Form-values). Чем легче извлечь данные, тем выше шанс, что ваш контент будет использован в ответе ассистента.
Может ли система извлекать данные из предыдущих запросов?
Да. В подробном описании патента указано, что Third MLA может анализировать контекст разговора для заполнения полей Digital Form. Это позволяет системе использовать информацию, упомянутую ранее в диалоге (например, название города), для ответа на текущий запрос, даже если в нем эта информация опущена.
Как система определяет вероятность перехода интентов (ITP)?
Патент предлагает два способа. Основной — использование Second MLA, который обучается на больших объемах исторических диалогов, размеченных асессорами, чтобы изучить паттерны переключения между темами. Альтернативный способ — использование эвристических правил (heuristic-based routine), заданных вручную операторами системы.
Что произойдет, если система не уверена в интенте?
В патенте описан механизм порога значимости (Association-Significance Threshold). Если итоговая оценка (Adjusted IAP) для лучшего интента ниже этого порога, система считает, что интент определен ненадежно. В этом случае она генерирует запасной ответ (fallback response), например, переспрашивает пользователя.
Как этот патент влияет на контент-стратегию сайта?
Он подчеркивает необходимость анализа User Journey и создания контента, который поддерживает естественное развитие информационной потребности пользователя. Необходимо понимать типичные последовательности интентов (высокий ITP) и убедиться, что ваш сайт удовлетворяет эти последовательные потребности, облегчая переходы между связанными темами.
Что такое обязательные поля формы (Mandatory Form-Fields)?
Это параметры, без которых невозможно сгенерировать ответ. Например, для построения маршрута необходим пункт назначения. Патент (Claim 9) указывает, что специфичный для интента ответ генерируется, только если все обязательные поля заполнены. Если они не заполнены из диалога, система может попытаться использовать данные по умолчанию (например, текущую локацию) или переспросить пользователя.
Используются ли поведенческие факторы (клики, CTR) в этом патенте?
В этом конкретном патенте поведенческие факторы пользователей в веб-выдаче (клики, CTR) напрямую не упоминаются. Система полагается на текст запросов, историю интентов в рамках текущей сессии и данные обучения, основанные на асессорской разметке прошлых диалогов. Это отличает его от патентов, сфокусированных на ранжировании веб-результатов.