Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google классифицирует интент в диалогах: различение светской беседы и поисковых запросов в Google Assistant

    AUTOMATICALLY AUGMENTING MESSAGE EXCHANGE THREADS BASED ON TONE OF MESSAGE (Автоматическое дополнение потоков обмена сообщениями на основе тона сообщения)
    • US12093270B2
    • Google LLC
    • 2024-09-17
    • 2016-05-17
    2016 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

    Анализ патента Google, описывающего, как персональные ассистенты используют машинное обучение для определения «тона» сообщения. Система рассчитывает оценки «светской беседы» (Idle Chatter Score) и «пригодности для поиска» (Search Query Suitability Score). Это позволяет ассистенту решить, поддержать ли разговор или выполнить поиск и внедрить результаты в диалог.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему интерпретации намерений пользователя в диалоговых интерфейсах (Conversational AI), таких как чаты, мессенджеры или взаимодействие с Google Assistant. Система должна точно определить, является ли сообщение пользователя светской беседой (idle chatter или chatty), требующей разговорного ответа, или же оно содержит информационный интент (searchy), требующий выполнения поискового запроса. Цель — обеспечить адекватную реакцию ассистента, не предоставляя неуместные результаты поиска в ответ на болтовню и не игнорируя запросы на информацию.

    Что запатентовано

    Запатентована система для автоматического дополнения потоков обмена сообщениями (message exchange threads). Ядром изобретения является механизм классификации тона сообщения с использованием моделей машинного обучения для расчета двух ключевых метрик: Idle Chatter Score (ICS) и Search Query Suitability Score (SQSS). На основе сравнения этих оценок система принимает бинарное решение: предоставить conversational response или выполнить поиск и вернуть результаты.

    Как это работает

    Система функционирует в несколько этапов:

    • Анализ сообщения: Сообщение, направленное персональному ассистенту (Personal Assistant Module), анализируется моделями машинного обучения.
    • Расчет оценок: Вычисляются ICS (вероятность того, что это болтовня) и SQSS (пригодность для поиска).
    • Сравнение и Классификация: Система сравнивает оценки между собой или с пороговыми значениями.
    • Выбор ответа: Если доминирует ICS, система выбирает разговорный ответ. Если доминирует SQSS, система генерирует поисковый запрос, обращается к Knowledge System (поисковая инфраструктура) и внедряет полученные результаты в диалог.

    Актуальность для SEO

    Высокая. Патент опубликован в 2024 году (являясь продолжением заявок с 2016 года) и описывает фундаментальную технологию для Conversational AI. Точная классификация интента критически важна для работы Google Assistant, Gemini и интеграции поиска в диалоговые интерфейсы, что является стратегическим направлением развития Google.

    Важность для SEO

    Влияние на традиционное SEO (ранжирование веб-сайтов) минимальное. Однако патент имеет высокое стратегическое значение (6.5/10) для AEO (Answer Engine Optimization) и оптимизации под голосовой поиск/ассистентов. Он раскрывает механизм, который определяет, будет ли вообще выполнен поиск в ответ на разговорный запрос. Понимание факторов, повышающих SQSS (например, наличие сущностей и ожидание качественных прямых ответов), напрямую влияет на стратегию создания контента для диалоговых интерфейсов.

    Детальный разбор

    Термины и определения

    Conversational Response (Разговорный ответ)
    Ответ ассистента, направленный на поддержание диалога (small talk). Не содержит результатов поиска и часто выбирается из предопределенных пар сообщение/ответ.
    Idle Chatter Score (ICS) / Chatter Score (Оценка светской беседы/болтовни)
    Метрика, указывающая на вероятность того, что сообщение является неформальным, субъективным разговором (idle chatter) и не предназначено для поиска объективной информации.
    Knowledge System (Система знаний)
    Бэкенд-инфраструктура (Information Retrieval System), включающая поисковый индекс (Indexing Engine), базу знаний/фактов (Information Engine) и движок ранжирования (Ranking Engine).
    Message Exchange Thread (Поток/Цепочка обмена сообщениями)
    Среда диалога: SMS, мессенджер, чат, голосовой интерфейс.
    Personal Assistant Module (PAM) (Модуль персонального ассистента)
    Программный агент (например, Google Assistant), взаимодействующий с пользователем в диалоге.
    Search Query Suitability Score (SQSS) (Оценка пригодности для поискового запроса)
    Метрика, указывающая на вероятность того, что сообщение содержит информационный интент (searchy) и подходит для генерации поискового запроса.
    Surfaced Features (Выделенные элементы выдачи)
    Контент, отображаемый на видном месте в результатах поиска (прямые ответы, Featured Snippets, навигационные результаты). Их наличие в потенциальной выдаче может повышать SQSS.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод работы ассистента в диалоге.

    1. Система определяет сообщение в Message Exchange Thread, направленное участником к Personal Assistant Module (PAM).
    2. Сообщение обрабатывается одной или несколькими моделями машинного обучения для расчета Chatter Score (ICS) и Search Query Suitability Score (SQSS).
      • ICS определяется как сходство с предыдущим контентом, известным как светская беседа.
      • SQSS определяется как сходство с предыдущими сообщениями, которые направлялись PAM для инициирования поиска.
    3. Система сравнивает ICS и SQSS.
    4. На основе сравнения система формирует новый контент, выборочно выполняя ОДНО из следующих действий:
      • (A) Формирование поискового запроса, получение результатов и формирование нового контента с их использованием.
      • (B) Формирование conversational response, который НЕ ВКЛЮЧАЕТ результаты поиска.
    5. Новый контент внедряется в диалог как сообщение от PAM.

    Claim 6 (Зависимый): Описывает обучение моделей.

    Модели обучаются на положительных примерах (positive training examples) — случаях, когда участники предыдущих диалогов позитивно реагировали на внедрение разговорного ответа или результатов поиска.

    Claim 7 (Зависимый): Уточняет расчет SQSS.

    SQSS может дополнительно рассчитываться на основе известных сущностей (known entities) или типов сущностей, упомянутых в сообщении. Присутствие распознанных сущностей усиливает сигнал поискового интента.

    Где и как применяется

    Патент описывает технологию, применяемую в системах Conversational AI (Google Assistant), и затрагивает следующие этапы поисковой архитектуры:

    QUNDERSTANDING – Понимание Запросов
    Это центральный этап применения патента. Система выполняет глубокий анализ интента разговорного сообщения. Ключевая задача — классификация тона сообщения как chatty (высокий ICS) или searchy (высокий SQSS) с использованием ML-моделей.

    INDEXING – Индексирование и извлечение признаков
    Система полагается на существующую инфраструктуру Knowledge System (поисковый индекс и базу знаний/Knowledge Graph) для извлечения информации и идентификации сущностей, что необходимо как для расчета SQSS, так и для ответа на поисковые запросы.

    RANKING – Ранжирование
    Если сообщение классифицировано как searchy (высокий SQSS), Personal Assistant Engine генерирует поисковый запрос и обращается к стандартным механизмам ранжирования для выбора наилучшего ответа.

    METASEARCH / RERANKING (Контекстное применение)
    Финальный этап включает внедрение (blending) выбранного ответа (разговорного или поискового) обратно в контекст диалога (Message Exchange Thread).

    Входные данные:

    • Текст или аудио сообщения пользователя.
    • Контекстные сигналы (местоположение, время).
    • Данные из Knowledge Base для распознавания сущностей.

    Выходные данные:

    • Ответ ассистента, внедренный в диалог (Conversational Response или результаты поиска).

    На что влияет

    • Специфические запросы: Влияет на обработку всех запросов на естественном языке в диалоговых интерфейсах (голосовой поиск, чаты с ассистентами). Разделяет субъективные/разговорные запросы от объективных/информационных.
    • Типы контента и форматы: Повышает значимость контента, который может служить прямым ответом (Surfaced Features), так как его наличие может положительно влиять на SQSS и итоговое качество ответа.

    Когда применяется

    • Условия работы: Алгоритм активируется каждый раз при взаимодействии пользователя с Personal Assistant Module в диалоговом интерфейсе.
    • Триггеры и пороги: Решение принимается на основе сравнения ICS и SQSS. Используются абсолютные пороги для каждой оценки или пороги для разницы (Δ) между ними.

    Пошаговый алгоритм

    Процесс обработки сообщения ассистентом:

    1. Получение сообщения: Система получает сообщение от участника диалога.
    2. Предварительная обработка: NLP-анализ сообщения, включая идентификацию сущностей (Entity Resolution).
    3. Параллельный расчет оценок интента:
      • Расчет ICS: Используется ML-модель, обученная на примерах болтовни, ИЛИ сравнение с базой пар сообщение/разговорный ответ.
      • Расчет SQSS: Используется ML-модель, обученная на примерах поисковых запросов. Учитывается наличие известных сущностей (Claim 7) и контекст.
    4. Сравнение и классификация: Система сравнивает ICS и SQSS и проверяет выполнение пороговых условий.
    5. Принятие решения (Точка ветвления):
      • Если ICS доминирует: Перейти к шагу 6 (Разговорный ответ).
      • Если SQSS доминирует: Перейти к шагу 7 (Поисковый ответ).
    6. Генерация Разговорного Ответа: Система идентифицирует наилучший Conversational Response. Переход к шагу 9.
    7. Генерация и Выполнение Поиска:
      • Система генерирует поисковый запрос.
      • Запрос отправляется в Knowledge System.
      • Система получает релевантный контент.
    8. Валидация Результатов Поиска (Опционально, из описания патента): Система оценивает качество полученного контента (например, наличие Surfaced Features). Если качество низкое, система может вернуться к шагу 6 (Разговорный ответ).
    9. Внедрение Ответа: Выбранный ответ (разговорный или поисковый) внедряется в поток сообщений от имени ассистента.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Текст сообщения. Для ML-моделей используются различные представления текста: термины, токены, пары терминов, NLP-аннотации (части речи).
    • Структурные факторы (Сущности): Идентификация известных сущностей (known entities) в сообщении с использованием базы знаний. Наличие сущностей влияет на расчет SQSS (Claim 7).
    • Географические и Пользовательские факторы (Контекст): Упоминаются контекстуальные сигналы (местоположение, местное время). Патент указывает, что интерпретация тона (ICS/SQSS) может отличаться в разных странах.
    • Данные для обучения (Офлайн): Логи предыдущих диалогов и поисковых запросов. Положительные и отрицательные примеры (positive/negative training examples) на основе реакций пользователей на предыдущие ответы ассистента.

    Какие метрики используются и как они считаются

    • Idle Chatter Score (ICS): Рассчитывается с помощью ML-модели (ICS Machine Learning Model) или путем оценки сходства (fuzzy searching) с предопределенными парами сообщение/ответ.
    • Search Query Suitability Score (SQSS): Рассчитывается с помощью ML-модели (SQSS Machine Learning Model). Оценка повышается при наличии известных сущностей и если ожидается, что поиск вернет Surfaced Features.
    • Search Results Score (Оценка результатов поиска) (Упоминается в Description): Оценка качества контента, полученного в ответ на запрос. Используется для валидации результатов; низкая оценка может привести к отказу от показа поиска в пользу разговорного ответа.
    • Алгоритмы машинного обучения: Упоминаются классификаторы (classifiers), обученные на контролируемых (supervised) и неконтролируемых (unsupervised) данных для определения интента.

    Выводы

    1. Сложная классификация интента для Conversational AI: Патент описывает сложный механизм, позволяющий Google Assistant различать светскую беседу (ICS) и информационные запросы (SQSS) в диалоговых интерфейсах, используя специализированные модели машинного обучения.
    2. Обучение на обратной связи пользователей: Модели ML обучаются на реальных реакциях пользователей (positive/negative training examples) на предыдущие ответы ассистента, что позволяет системе постоянно совершенствовать понимание тона диалога.
    3. Сущности как ключевой триггер поиска: Присутствие распознанных известных сущностей (known entities) в сообщении является сильным фактором, повышающим SQSS (Claim 7). Это подтверждает критическую важность Entity-Based SEO для видимости в диалоговых интерфейсах.
    4. Качество ожидаемых результатов влияет на решение о поиске: Система может предварительно оценивать качество потенциальных результатов поиска. Наличие Surfaced Features (прямых ответов, сниппетов) повышает вероятность того, что запрос будет обработан как поисковый и ответ будет показан.
    5. Контекстуальная зависимость интента: Интерпретация сообщения (ICS vs SQSS) может зависеть от контекста пользователя (например, местоположения), что указывает на персонализированный подход к пониманию диалога.

    Практика

    Практическое применение в SEO

    Патент не дает рекомендаций для традиционного SEO (ранжирования сайтов), но он критически важен для AEO (Answer Engine Optimization) и оптимизации под голосовой поиск и Google Assistant.

    Best practices (это мы делаем)

    • Оптимизация под Сущности (Entity-Based SEO) и Knowledge Graph: Поскольку наличие известных сущностей повышает SQSS (Claim 7), необходимо фокусироваться на четком определении сущностей в контенте и использовании структурированных данных (Schema.org). Это помогает Google связать ваш контент с Knowledge Graph и увеличивает вероятность его использования ассистентом.
    • Оптимизация под прямые ответы (Featured Snippets): Патент указывает, что наличие Surfaced Features (к которым относятся прямые ответы) может повышать SQSS и итоговое качество ответа. Контент, оптимизированный для предоставления четких, кратких ответов, с большей вероятностью будет выбран ассистентом для информационных запросов.
    • Создание контента для объективных запросов (FAQ): Фокусируйтесь на создании контента, который дает объективные ответы на фактические вопросы (Кто, Что, Где). Такие запросы классифицируются как searchy (высокий SQSS). Формат FAQ идеально подходит для использования ассистентом.
    • Учет региональных и контекстуальных особенностей: Поскольку контекст (например, страна) может влиять на расчет ICS/SQSS, при международном SEO важно учитывать локальные нюансы формулировок разговорных запросов.

    Worst practices (это делать не надо)

    • Игнорирование структурированных данных: Отсутствие разметки мешает распознаванию сущностей, что снижает потенциальный SQSS для релевантных запросов и уменьшает видимость контента в ответах ассистентов.
    • Создание двусмысленного контента: Контент, смешивающий факты и мнения или использующий чрезмерно «разговорный» стиль для объективной информации, может запутать классификаторы и повысить ICS, снижая вероятность его использования в качестве ответа на информационный запрос.

    Стратегическое значение

    Патент подтверждает стратегический сдвиг в сторону диалоговых интерфейсов (Conversational AI). Для долгосрочной SEO-стратегии это означает необходимость глубокого понимания того, как Google интерпретирует диалоговый ввод. Стратегия должна быть направлена на создание объективной, хорошо структурированной, основанной на сущностях информации, которая может быть легко извлечена и использована ассистентами (AEO).

    Практические примеры

    Сценарий: Оптимизация контента для ответа через Google Assistant (AEO)

    1. Запрос пользователя (к Ассистенту): «Мне интересно, кто женат на Томе Брэди?»
    2. Анализ системы (согласно патенту):
      • Система распознает сущность «Tom Brady». Это повышает SQSS (Claim 7).
      • Система оценивает, что по этому запросу доступны качественные Surfaced Features (прямой ответ из Knowledge Graph). Это также повышает SQSS.
      • ICS оценивается как низкий.
    3. Решение системы: Выполнить поиск (Приоритет SQSS).
    4. Действия SEO-специалиста (для сайта о знаменитостях): Убедиться, что информация о семейном положении Тома Брэди представлена четко, связана с его сущностью через микроразметку (Schema.org/Person) и оптимизирована для попадания в Featured Snippet/Knowledge Panel.
    5. Результат: Ассистент использует оптимизированный контент или данные из Knowledge Graph (на который повлиял оптимизированный контент) для формирования ответа: «Том Брэди женат на [Имя]».

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в обычном поиске Google?

    Нет, напрямую не влияет. Патент не описывает алгоритмы ранжирования веб-страниц. Он фокусируется на том, как персональные ассистенты (например, Google Assistant) интерпретируют сообщения в диалогах и решают, когда следует выполнить поиск, а когда просто поддержать беседу.

    Что такое Idle Chatter Score (ICS) и Search Query Suitability Score (SQSS)?

    ICS — это оценка того, насколько сообщение похоже на «пустую болтовню» или светскую беседу, не требующую поиска информации. SQSS — это оценка того, насколько сообщение подходит для формирования поискового запроса и содержит ли оно информационное намерение. Система сравнивает эти две оценки для принятия решения о типе ответа.

    Какое значение этот патент имеет для SEO, если он не о ранжировании?

    Он имеет важное значение для AEO (Answer Engine Optimization) и оптимизации под голосовой поиск/ассистентов. Патент раскрывает факторы, которые побуждают ассистента выполнить поиск. Понимание этих факторов (например, важность сущностей и прямых ответов) помогает оптимизировать контент для появления в диалоговых интерфейсах.

    Как упоминание сущностей (Entities) влияет на этот процесс?

    Влияние значительное. Патент явно утверждает (Claim 7), что если система распознает в сообщении известную сущность (known entity), это повышает Search Query Suitability Score (SQSS). Это увеличивает вероятность того, что ассистент интерпретирует сообщение как запрос информации и выполнит поиск.

    Что такое «Surfaced Features» и как они связаны с этим патентом?

    Surfaced Features — это выделенные элементы выдачи, такие как прямые ответы (Featured Snippets) или панели знаний. В патенте указано, что если система ожидает найти качественный прямой ответ на запрос, это может повысить SQSS. Это подчеркивает важность оптимизации контента под сниппеты для успеха в AEO.

    Использует ли Google машинное обучение в этом механизме?

    Да, машинное обучение играет центральную роль. Система использует одну или несколько ML-моделей для расчета ICS и SQSS. Эти модели обучаются на больших объемах данных о предыдущих взаимодействиях пользователей с ассистентом и их реакциях на ответы (Claim 6).

    Что происходит, если Ассистент запустил поиск, но результаты низкого качества?

    В описании патента предусмотрен механизм валидации (Search Results Score). Если полученный контент не удовлетворяет пороговым значениям качества или релевантности, система может принять решение не показывать его. Вместо этого она может откатиться к использованию безопасного разговорного ответа (Conversational Response).

    Учитывает ли система контекст пользователя, например, местоположение?

    Да, в описании патента упоминается, что контекстуальные сигналы, такие как местоположение и время, могут влиять на расчет ICS и SQSS. Одно и то же сообщение может быть интерпретировано по-разному в зависимости от контекста или страны пользователя.

    Применяется ли этот механизм только к текстовым чатам?

    Нет. Патент описывает применение в различных средах обмена сообщениями (Message Exchange Threads), которые включают не только текстовые чаты и SMS, но и голосовые команды и интерфейсы (voice input). Логика классификации интента применима ко всем этим форматам.

    Какова главная рекомендация для SEO-специалиста, исходя из этого патента?

    Главная рекомендация — сосредоточиться на стратегиях AEO: оптимизации под сущности (Entity SEO) и создании контента для прямых ответов (Featured Snippets). Это максимизирует вероятность того, что при взаимодействии с ассистентом запрос пользователя получит высокий SQSS, и система выберет ваш контент в качестве ответа.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.