Яндекс патентует метод уточнения намерения пользователя в диалоговых системах (например, Алиса). Система учитывает не только текущий запрос, но и предыдущий, анализируя вероятность связи запроса с конкретным намерением и вероятность смены одного намерения на другое. Это позволяет точнее поддерживать контекст диалога и генерировать релевантные ответы или выполнять действия.
Описание
Какую задачу решает
Патент решает задачу повышения точности определения намерения (интента) пользователя при обработке последовательных запросов. Основная проблема — это разрешение неоднозначности (ambiguity) и предотвращение потери контекста в диалоговых системах, где смысл текущего высказывания часто зависит от предыдущего взаимодействия. Изобретение улучшает способность системы поддерживать контекст диалога и генерировать точный зависящий от намерения ответ, что особенно важно для умных цифровых помощников (IPA) (п. 11).
Что запатентовано
Запатентован способ определения текущего намерения пользователя с учетом контекста сессии. Суть изобретения заключается в комбинировании двух вероятностных оценок: вероятности намерения на основе анализа текущего запроса и вероятности перехода к этому намерению от предыдущего намерения. Это позволяет системе моделировать эволюцию интента пользователя во время диалога и точнее интерпретировать текущий запрос.
Как это работает
Система получает текущий и предыдущий запросы пользователя. Для каждого потенциального намерения рассчитываются два ключевых показателя: (1) Параметр связи с намерением — насколько вероятно данное намерение, исходя из текста текущего запроса; и (2) Параметр перехода намерения — насколько вероятен переход от предыдущего намерения к данному новому намерению. Эти два параметра перемножаются для получения Уточненного параметра связи с намерением (п. 1). Намерение с наивысшим уточненным параметром выбирается как текущее (п. 5).
Актуальность для SEO
Высокая для области диалоговых систем (Conversational AI) и голосовых помощников (например, Яндекс Алиса). Управление контекстом (Dialogue State Tracking) и точное определение интента являются критически важными для развития таких систем. Описанный подход к моделированию последовательности интентов актуален.
Важность для SEO
Влияние на традиционное SEO минимально (3/10). Патент не описывает механизмы ранжирования веб-документов. Он целиком сосредоточен на логике работы диалоговых систем (IPA), что прямо указано в тексте (п. 11, 12), и фокусируется на выполнении действий (Action Fulfillment). Однако он имеет стратегическое значение для оптимизации под голосовой поиск (VSO) и для понимания того, как Яндекс анализирует последовательность действий пользователя (User Journey).
Детальный разбор
Термины и определения
- IPA (Intelligent Personal Assistant) / Умный цифровой помощник
- Приложение (например, Яндекс Алиса), взаимодействующее с пользователем через естественный язык для выполнения задач (п. 11).
- MLA (Machine Learning Algorithm) / Алгоритм машинного обучения
- В патенте упоминаются три различных MLA:
- Первый MLA: Классификатор запросов. Определяет Параметр связи с намерением (п. 2).
- Второй MLA: Модель переходов. Определяет Параметр перехода намерения (п. 4).
- Третий MLA: Извлечение сущностей (Slot Filling). Используется для заполнения Цифровой формы (п. 10).
- Намерение (Intent)
- Цель или задача пользователя (например, «Заказать такси», «Узнать погоду»).
- Параметр перехода намерения (Intent Transition Parameter)
- Вероятность изменения предыдущего намерения на соответствующее новое намерение из множества потенциальных намерений (п. 1).
- Параметр связи с намерением (Intent Association Parameter)
- Вероятность того, что текущий запрос связан с соответствующим потенциальным намерением, рассчитанная на основе анализа самого запроса (п. 1).
- Уточненный параметр связи с намерением (Refined Intent Association Parameter)
- Финальная оценка вероятности намерения, результат умножения Параметра связи и Параметра перехода (п. 1).
- Цифровая форма (Digital Form)
- Структурированное представление задачи, связанной с намерением. Включает поля (слоты), которые нужно заполнить для выполнения действия (например, поля «Адрес» и «Время» для заказа такси) (п. 7).
Ключевые утверждения (Анализ Claims)
Ядром изобретения является метод уточнения классификации интента с использованием контекста предыдущего шага диалога.
Claim 1 (Независимый пункт): Описывает основной способ определения текущего намерения.
- Сервер получает текущий запрос и предыдущий запрос (связанный с предыдущим намерением).
- Определяется Параметр связи с намерением для каждого потенциального намерения на основе текущего запроса.
- Определяется Параметр перехода намерения для каждого потенциального намерения (вероятность смены предыдущего намерения на новое).
- Вычисляется Уточненный параметр связи с намерением как результат умножения двух предыдущих параметров. Это ключевой шаг интеграции анализа текста и контекста сессии.
- Выбирается текущее намерение на основе Уточненных параметров.
Claim 2 (Зависимый от п. 1): Уточняет определение Параметра связи с намерением.
Он определяется Первым MLA. Этот алгоритм обучается на исторических данных (запрос -> намерение), размеченных человеком-асессором.
Claims 3 и 4 (Зависимые от п. 1): Уточняют определение Параметра перехода намерения.
Он может определяться двумя способами: эвристической процедурой (Claim 3) или Вторым MLA (Claim 4). Второй MLA обучается на последовательностях запросов и соответствующих им последовательностях намерений, также размеченных асессорами. Он изучает типичные паттерны смены задач пользователями.
Claim 6 (Зависимый от п. 1): Описывает механизм контроля качества и обработки неопределенности.
Если все Уточненные параметры ниже порога значимости связи (система не уверена), создается резервный ответ (fallback response) вместо зависящего от намерения ответа.
Claims 7, 8, 10 (Зависимые): Описывают механизм выполнения задач (Action Fulfillment).
Намерения связаны с Цифровыми формами (п. 7). Система пытается извлечь значения из запроса и заполнить поля формы (п. 8). Это делается с помощью Третьего MLA (п. 10), обученного асессорами для извлечения сущностей и заполнения слотов (Slot Filling).
Claims 11 и 12 (Зависимые): Определяют контекст применения.
Явно указано, что способ применяется в приложениях умного цифрового помощника (IPA) с интерфейсом на естественном языке, включая обработку произнесенных высказываний (голос).
Где и как применяется
Изобретение применяется на этапе понимания запроса и управления диалогом, преимущественно в контексте диалоговых систем (Яндекс Алиса), и не связано с ранжированием веб-документов.
QUERY PROCESSING – Понимание Запросов
Это основной слой применения патента. Система выполняет классификацию намерения (Intent Classification) и отслеживание состояния диалога (Dialogue State Tracking) в инфраструктуре IPA.
- Взаимодействие компонентов: Система координирует работу трех MLA (Первый, Второй, Третий) и доступ к базе Цифровых форм.
- Данные на входе: Текст текущего запроса, текст предыдущего запроса, предыдущее определенное намерение.
- Данные на выходе: Определенное текущее намерение и заполненная Цифровая форма, которые используются для генерации ответа или выполнения действия.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на неоднозначные, короткие или уточняющие (follow-up) запросы в рамках диалога. Например, запрос «А завтра?» после запроса о погоде.
- Типы контента: Влияет на генерацию прямых ответов ассистента и выполнение команд (Task Completion), а не на ранжирование веб-страниц (статей, листингов).
- Форматы и Ниши: Голосовое взаимодействие, чат-боты (IPA). Ниши, связанные с выполнением действий: заказ такси/еды, навигация, бронирование.
Когда применяется
- Условия работы: Алгоритм применяется, когда пользователь взаимодействует с системой (IPA) в режиме диалога и доступна история предыдущего взаимодействия (предыдущий запрос и намерение) в текущей сессии.
- Исключения: Если уверенность системы низкая (Уточненный параметр ниже порога значимости), система генерирует резервный ответ (п. 6).
Пошаговый алгоритм
Процесс определения намерения и генерации ответа:
- Получение данных: Система получает текущий запрос (Qc). Из истории сессии извлекаются предыдущий запрос (Qp) и связанное с ним предыдущее намерение (Ip).
- Базовая классификация (Первый MLA): Первый MLA обрабатывает Qc и вычисляет Параметр связи с намерением (P_assoc) для каждого потенциального намерения (I1, I2…).
- Анализ перехода (Второй MLA или Эвристики): Система анализирует Ip и вычисляет Параметр перехода намерения (P_trans) для перехода от Ip к каждому потенциальному намерению (I1, I2…).
- Уточнение оценки: Система вычисляет Уточненный параметр связи с намерением (P_refined) для каждого потенциального намерения по формуле (п. 1):
$P_{\text{refined}}(I_i) = P_{\text{assoc}}(I_i) \times P_{\text{trans}}(I_p \to I_i)$ - Выбор намерения: Выбирается намерение с максимальным значением P_refined в качестве текущего намерения (Ic) (п. 5).
- Проверка порога: Система сравнивает максимальный P_refined с порогом значимости связи. Если он ниже порога, генерируется резервный ответ (п. 6).
- Извлечение данных (Третий MLA): Если порог пройден, система активирует Цифровую форму, связанную с Ic. Третий MLA извлекает значения из Qc и заполняет поля формы (Slot Filling) (п. 8, 10).
- Генерация ответа: Система создает зависящий от намерения ответ (например, выполняет действие).
Какие данные и как использует
Данные на входе
- Контентные факторы (Текстовые): Текст текущего и предыдущего запросов. Запросы могут быть получены как текст или как результат распознавания речи (произнесенные вслух высказывания, п. 11).
- Пользовательские факторы (Контекст сессии): Информация о предыдущем намерении, определенном системой на предыдущем шаге диалога.
- Данные для обучения (Офлайн): Логи предыдущих запросов и последовательностей запросов. Критически важно, что эти данные размечены человеком-асессором для обучения всех трех MLA (п. 2, 4, 10) с указанием правильных намерений и значений для Цифровых форм.
Какие метрики используются и как они считаются
Система оперирует вероятностными метриками, полученными из моделей машинного обучения.
- Параметр связи с намерением (P_assoc): Вероятность P(Intent|Current Query). Выдается Первым MLA (классификатором).
- Параметр перехода намерения (P_trans): Вероятность P(Intent|Previous Intent). Выдается Вторым MLA (моделью переходов) или рассчитывается по эвристическим правилам.
- Уточненный параметр связи с намерением (P_refined): Рассчитывается как произведение P_assoc и P_trans.
- Порог значимости связи: Предопределенное значение для фильтрации неуверенных классификаций и активации резервного ответа.
- Алгоритмы машинного обучения: Три различных MLA для классификации, моделирования переходов и извлечения сущностей. Все они обучаются под контролем (Supervised Learning).
Выводы
- Специализация на диалоговых системах (IPA): Патент описывает механизм, явно предназначенный для умных помощников (IPA), таких как Яндекс Алиса, и интерфейсов на естественном языке (п. 11, 12). Он не относится к алгоритмам ранжирования веб-документов в основном поиске.
- Контекст диалога имеет решающее значение: Ключевая идея — использование предыдущего взаимодействия (предыдущего интента) для уточнения текущего запроса. Яндекс математически моделирует вероятность смены темы или продолжения текущей задачи через Параметр перехода намерения.
- Двухфакторная модель определения интента: Итоговое решение принимается на основе комбинации (умножения) двух независимых оценок: анализа текста запроса и анализа потока диалога (перехода интентов).
- Комплексное использование ML и асессоров: Система полагается на три различных алгоритма машинного обучения (MLA), каждый из которых обучен на данных, размеченных асессорами, для выполнения разных задач (классификация, переход, извлечение данных).
- Фокус на выполнении действий (Action Fulfillment): Конечная цель механизма — не предоставить ссылки, а выполнить действие, что подтверждается детальным описанием механизма Цифровых форм и заполнения их полей (Slot Filling).
Практика
Патент является инфраструктурным и описывает логику работы диалоговых систем (Яндекс Алиса). Прямых рекомендаций для традиционного SEO продвижения сайтов в веб-поиске он не дает.
Best practices (это мы делаем)
Хотя патент не влияет на ранжирование, он важен для VSO (Voice Search Optimization) и понимания стратегии Яндекса.
- Структурирование данных для извлечения (Slot Filling): Механизм Цифровых форм и Третьего MLA (п. 10) подчеркивает важность четкого представления информации. Использование микроразметки (Schema.org) помогает ассистентам извлекать факты (цены, адреса, характеристики), которые могут быть использованы для заполнения этих форм и генерации ответов.
- Понимание последовательности интентов (User Journey): Патент подтверждает, что Яндекс анализирует поведение как последовательность действий. При проектировании сайта полезно учитывать логичные переходы между смежными задачами (например, от обзора товара к покупке), облегчая пользователю путь к цели и поддерживая всю сессию.
- Разработка диалоговых сценариев (для Навыков Алисы): Если бизнес использует Яндекс Диалоги, этот патент критически важен. Необходимо проектировать логичные сценарии, учитывая возможные переходы между интентами (Intent Transitions), чтобы система корректно обрабатывала запросы.
Worst practices (это делать не надо)
- Сложная и запутанная структура данных: Представление информации в виде, затрудняющем автоматическое извлечение (например, отсутствие микроразметки, данные только в изображениях), снижает вероятность использования этой информации в диалоговых системах для заполнения Цифровых форм.
- Создание тупиковых страниц: Проектирование сайта, который не поддерживает логическое развитие сессии пользователя и затрудняет переход к следующему шагу (связанному намерению).
Стратегическое значение
Патент подтверждает стратегические инвестиции Яндекса в развитие Conversational AI (Алиса). Он демонстрирует сложный подход к пониманию естественного языка и управлению контекстом. Для SEO-стратегии это подчеркивает растущее разделение между информационным поиском (Web Search) и поиском, ориентированным на выполнение действий (Action Fulfillment). Долгосрочная стратегия должна учитывать рост значимости голосового взаимодействия, где ключевую роль играют структурированные данные и оптимизация под сущности.
Практические примеры
Практических примеров для SEO продвижения сайтов нет. Ниже приведен пример того, как описанный механизм может работать в Яндекс Алисе.
Сценарий: Уточнение неоднозначного запроса в диалоге
- Предыдущий запрос пользователя: «Алиса, какая погода завтра в Москве?»
- Предыдущее намерение (Ip): Прогноз погоды (Weather_Forecast).
- Текущий запрос пользователя (Qc): «А в Питере?»
- Анализ текущего запроса (Первый MLA): Запрос «А в Питере?» неоднозначен. Параметр связи с намерением (P_assoc) может быть невысоким для любого конкретного интента.
- Анализ перехода намерения (Второй MLA): Система оценивает Параметр перехода намерения (P_trans). Вероятность перехода от интента Weather_Forecast к тому же интенту Weather_Forecast (с другими параметрами) очень высока.
- Уточнение оценки: Умножение P_assoc на очень высокий P_trans дает высокий Уточненный параметр для интента Weather_Forecast.
- Выполнение действия (Третий MLA): Система выбирает интент Weather_Forecast. Третий MLA извлекает значение «Питер» и заполняет поле «Город» в Цифровой форме.
- Ответ Алисы: «Завтра в Санкт-Петербурге…»
Вопросы и ответы
Влияет ли этот патент на ранжирование моего сайта в органической выдаче Яндекса?
Нет, напрямую не влияет. Патент описывает способ определения намерения пользователя в контексте диалоговых систем (Intelligent Personal Assistant), таких как Яндекс Алиса (это прямо указано в п. 11 и 12 патента). Он не затрагивает алгоритмы ранжирования веб-документов в основном поиске, а фокусируется на выполнении команд и управлении диалогом.
Что такое «Параметр перехода намерения» и зачем он нужен?
Это оценка вероятности того, что пользователь сменит свое предыдущее намерение на новое. Например, если пользователь только что искал ресторан, вероятность того, что его следующий запрос будет связан с вызовом такси, высока. Этот параметр позволяет системе учитывать контекст разговора и точнее интерпретировать короткие или неоднозначные фразы, опираясь на логику поведения пользователя.
Как именно система рассчитывает итоговую уверенность в интенте?
Система рассчитывает «Уточненный параметр связи с намерением». Он вычисляется путем умножения двух оценок: (1) вероятности интента на основе текста текущего запроса («Параметр связи с намерением») и (2) вероятности перехода к этому интенту от предыдущего («Параметр перехода намерения»). Эта комбинация позволяет сбалансировать информацию из самого запроса и из контекста диалога.
В патенте упоминаются три разных алгоритма машинного обучения (MLA). Зачем так много?
Они выполняют специализированные задачи для точного понимания диалога. Первый MLA — это базовый классификатор интента по тексту запроса. Второй MLA специализируется на анализе последовательностей и предсказывает вероятность перехода между интентами. Третий MLA отвечает за извлечение конкретных данных (сущностей, например, адресов или дат) из текста для выполнения действия (Slot Filling).
Как Яндекс обучает эти алгоритмы?
Патент многократно подчеркивает (п. 2, 4, 10), что для обучения всех трех MLA используются исторические данные (запросы, последовательности запросов, связанные с ними интенты и значения полей), которые были размечены человеком-асессором. Это указывает на подход обучения с учителем (Supervised Learning) на основе экспертной разметки.
Что такое «Цифровая форма» и как это связано с SEO?
Цифровая форма — это структурированный шаблон для выполнения задачи (например, форма заказа с полями Адрес и Время). Система извлекает данные из запроса (с помощью Третьего MLA), чтобы заполнить эти формы. Для SEO это подчеркивает важность микроразметки (Schema.org) и структурирования данных на сайте. Чем легче Яндексу извлечь параметры ваших услуг или товаров, тем выше вероятность их использования в ответах Алисы или Колдунщиках.
Имеет ли этот патент значение для оптимизации под голосовой поиск (VSO)?
Да, он имеет высокое значение для оптимизации взаимодействия с Яндекс Алисой, например, при разработке навыков через Яндекс Диалоги. Патент раскрывает механизм, который Алиса использует для поддержания контекста и понимания последовательных команд. Понимание того, как моделируются переходы между интентами, критически важно для проектирования эффективных голосовых приложений.
Что произойдет, если система не уверена в намерении пользователя?
Система сравнивает рассчитанный «Уточненный параметр» с заданным порогом значимости (п. 6). Если оценка ниже порога (уверенность низкая), патент предусматривает генерацию «резервного ответа» (fallback response). На практике это может быть уточняющий вопрос или сообщение об ошибке понимания, вместо попытки выполнить неверное действие.
Как SEO-специалисту использовать знания из этого патента на практике, если он не влияет на ранжирование?
Ключевое применение — это понимание важности User Journey. Патент подтверждает, что Яндекс анализирует сессии целиком, моделируя переходы между намерениями. Необходимо строить архитектуру сайта и контент так, чтобы поддерживать логичные переходы пользователя между задачами (например, от информации к транзакции). Это улучшает поведенческие факторы и повышает общую полезность ресурса.
Означает ли этот патент, что в веб-поиске Яндекс тоже учитывает предыдущий запрос для ранжирования текущего?
Хотя известно, что поисковые системы используют контекст сессии для персонализации, данный патент описывает очень специфический механизм (умножение вероятности интента на вероятность перехода), разработанный и описанный в контексте диалоговых систем (IPA) (п. 11, 12). Нельзя утверждать на основе только этого документа, что точно такой же механизм применяется в ранжировании веб-поиска.