Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google понимает контекст и неоднозначность в последовательных голосовых запросах

    RESOLVING PRONOUN AMBIGUITY IN VOICE QUERIES (Разрешение неоднозначности местоимений в голосовых запросах)
    • US10635860B1
    • Google LLC
    • 2020-04-28
    • 2013-02-22
    2013 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

    Google анализирует акустические сигналы (например, ударение) и грамматическую структуру в последующих голосовых запросах, чтобы понять, к чему относятся местоимения (например, «он», «это») или неоднозначные фразы из предыдущих поисковых сессий. Это позволяет системе поддерживать контекст разговора, внутренне переписывать неоднозначный запрос и предоставлять точные ответы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неоднозначности (ambiguity) в контекстном или разговорном поиске, особенно при использовании голосового ввода. Когда пользователи задают серию последовательных запросов, они часто используют местоимения («он», «она», «оно») или неоднозначные фразы («тот», «этот»), ссылаясь на сущности или концепции из предыдущих запросов или ответов. Система должна точно определить, к какому предыдущему концепту (concept) относится неоднозначный термин, чтобы предоставить релевантный ответ. Это улучшает работу голосовых ассистентов и систем вопрос-ответа.

    Что запатентовано

    Запатентована система для разрешения неоднозначности местоимений и фраз в голосовых запросах путем анализа контекста предыдущих взаимодействий. Система использует два основных подхода: анализ акустических параметров (acoustic parameters) голосового ввода, таких как ударение (stress) на местоимении, и анализ грамматической структуры (grammatical structure) запроса, включая использование гипонимов/гипернимов (hypernyms) для связи фраз с предыдущими концепциями. Цель — точно идентифицировать сущность, на которую ссылается пользователь, и внутренне переписать запрос.

    Как это работает

    Система работает путем анализа текущего голосового запроса в контексте предыдущих запросов сессии.

    • Акустический анализ: Система измеряет акустические параметры (громкость, высота тона, длительность) местоимения. На основе этого вычисляется оценка ударения (Stress Score). Уровень ударения помогает определить, ссылается ли пользователь на самый последний концепт или на более ранний (например, отсутствие ударения может указывать на продолжение исходной темы, а наличие ударения — на переход к последней упомянутой сущности).
    • Грамматический анализ: Если запрос содержит неоднозначную фразу (например, «тот вкусный скотч»), система идентифицирует определяющее слово («тот») и объект («скотч»). Затем она находит гипернимы для объекта (скотч -> виски, алкоголь) и сравнивает их с концепциями из предыдущих запросов (например, «Laphroaig»), чтобы найти соответствие.

    После идентификации концепта система ассоциирует его с неоднозначным термином и модифицирует исходный запрос для поиска.

    Актуальность для SEO

    Высокая. Разговорный поиск, голосовые ассистенты (Google Assistant) и контекстное понимание запросов являются центральными направлениями развития поиска Google. Способность поддерживать связный диалог и понимать контекстные ссылки критически важна для современных поисковых систем и больших языковых моделей.

    Важность для SEO

    Влияние на SEO значительно, особенно в контексте оптимизации под голосовой поиск (Voice Search Optimization) и сущностного поиска (Entity SEO). Хотя патент не описывает алгоритмы ранжирования, он раскрывает механизмы понимания запросов (Query Understanding). Это подчеркивает необходимость структурирования контента таким образом, чтобы он мог отвечать на последовательные, разговорные запросы. Понимание того, как Google связывает концепции и гипернимы, критично для построения тематического авторитета и обеспечения того, чтобы контент был распознан как релевантный ответ на последующие вопросы в диалоге.

    Детальный разбор

    Термины и определения

    Acoustic Parameters (Акустические параметры)
    Измеряемые характеристики аудиосигнала голосового запроса. В патенте упоминаются громкость (volume), высота тона (pitch), частота (frequency), длительность между словами (duration between each spoken word) и длительность произнесения слова (spoken duration).
    Concept (Концепт/Сущность)
    Существительное или предмет (человек, место, вещь), на который ссылается неоднозначное местоимение или фраза. Концепты извлекаются из предыдущих запросов или ответов системы.
    Determiner (Определяющее слово)
    Слово, которое вводит существительное или фразу и выражает его референцию в контексте (например, «тот», «этот», «какой»).
    Hypernyms (Гипернимы)
    Слова с более широким значением, которые выражают общее родовое понятие по отношению к другому слову (например, «алкоголь» является гипернимом для «скотч»). Используются для установления связи между неоднозначной фразой и предыдущим концептом.
    Object Word (Объектное слово)
    Основное существительное в неоднозначной фразе, которое является объектом определяющего слова (например, «скотч» во фразе «тот скотч»).
    Phrase (Фраза)
    Группа слов в запросе, которая в совокупности ссылается на концепт из предыдущего взаимодействия (например, «тот вкусный скотч»).
    Pronoun Resolution System (Система разрешения местоимений)
    Компонент поисковой системы, отвечающий за идентификацию референта неоднозначного термина в контексте диалога.
    Stress Score (Оценка ударения/стресса)
    Метрика, вычисляемая на основе акустических параметров, которая указывает на вероятность того, что местоимение было выделено (подчеркнуто) говорящим. Может определяться с помощью машинного обучения.
    Voice Query (Голосовой запрос)
    Запрос, введенный пользователем посредством речи.

    Ключевые утверждения (Анализ Claims)

    Патент US10635860B1 является продолжением (continuation) более ранних патентов. Описание (Description) патента подробно рассматривает два метода (акустический и грамматический), однако Формула изобретения (Claims) данного конкретного патента фокусируется преимущественно на методе грамматического анализа с использованием гипернимов.

    Claim 1 (Независимый пункт): Описывает метод разрешения неоднозначности фразы в голосовом запросе на основе грамматического анализа и сравнения с предыдущими запросами.

    1. Система получает голосовой запрос (particular voice query).
    2. Определяется, что запрос содержит фразу (phrase), ссылающуюся на концепт из предыдущих запросов.
    3. Фраза извлекается.
    4. Во фразе идентифицируется определяющее слово (determiner word).
    5. Идентифицируется объектное слово (object word) этого определяющего слова.
    6. Определяется набор гипернимов (set of hypernyms) для объектного слова.
    7. Вычисляется значение, отражающее уровень схожести (level of similarity) между полученной фразой/гипернимами и каждым из предыдущих запросов.
    8. На основе этого значения схожести идентифицируется конкретный предыдущий запрос (first query).
    9. Генерируется структура данных, представляющая ассоциацию между концептом этого предыдущего запроса и текущим голосовым запросом.

    Ядро изобретения в этом пункте — использование грамматического разбора (определитель/объект) в сочетании с семантическим расширением (гипернимы) для точного сопоставления неоднозначной фразы с контекстом сессии.

    Claim 3 (Зависимый от 1): Уточняет, как происходит сравнение для определения схожести.

    Сравнение включает оценку одного или нескольких факторов: расстояние между терминами (distance between terms), количество общих гипернимов (number of shared hypernyms) или сравнение самых длинных терминов (longest term).

    Claim 4 (Зависимый от 1): Уточняет результат процесса ассоциации.

    Генерация структуры данных включает генерацию второго поискового запроса (second search query), основанного на концепте из первого запроса и текущем запросе (т.е. переписывание запроса).

    Где и как применяется

    Изобретение применяется на этапе QUNDERSTANDING – Понимание Запросов.

    Система разрешения местоимений (Pronoun Resolution System) действует как препроцессор или компонент модуля понимания запросов перед тем, как запрос передается на этапы ранжирования.

    Взаимодействие с компонентами:

    • Модуль преобразования текста (Text Conversion Module): Получает аудиосигнал, преобразует его в текст и извлекает акустические параметры.
    • Модуль определения ударения (Stress Determine Module): Анализирует акустические параметры для вычисления Stress Score (если используется акустический метод).
    • Модуль ассоциации концептов (Concept Association Module): Использует Stress Score и/или грамматический анализ (с доступом к базе данных гипернимов) и историю сессии для идентификации референта.
    • Search Engine (Поисковая система): Получает на вход разрешенный (переписанный) запрос.

    Входные данные:

    • Текущий голосовой запрос (аудиосигнал и/или текст).
    • Акустические параметры запроса.
    • История сессии (предыдущие запросы и извлеченные из них концепты/ответы).
    • База данных гипернимов (для грамматического метода).

    Выходные данные:

    • Разрешенный запрос (Resolved Query) — модифицированная версия исходного запроса, где местоимение или фраза заменены или дополнены идентифицированным концептом.

    На что влияет

    • Специфические запросы: Наибольшее влияние оказывается на информационные запросы в формате диалога (вопрос-ответ), где пользователь ищет дополнительную информацию о ранее упомянутых сущностях.
    • Типы контента: Влияет на контент, который структурирован для предоставления прямых ответов (например, блоки с ответами, панели знаний), так как система стремится найти конкретный ответ на уточняющий вопрос.
    • Технологии: Влияет на работу голосовых ассистентов и устройств, где голосовой ввод является основным (смартфоны, умные колонки).

    Когда применяется

    Алгоритм применяется при выполнении следующих условий:

    • Режим ввода: Запрос получен через голосовой ввод (особенно для акустического метода).
    • Контекст сессии: Текущему запросу предшествовал один или несколько других запросов в рамках той же сессии.
    • Наличие неоднозначности: Текущий запрос содержит местоимение (например, «his», «her») или фразу с определяющим словом (например, «that scotch»), которые требуют контекстного разрешения.

    Пошаговый алгоритм

    Патент описывает два основных варианта реализации (embodiments) для разрешения неоднозначности.

    Вариант А: На основе акустических параметров (описан в Description)

    1. Получение запроса: Система получает голосовой запрос, следующий за одним или несколькими предыдущими запросами.
    2. Извлечение параметров: Голосовой запрос преобразуется в текст, и одновременно идентифицируются акустические параметры (громкость, частота, длительность) для слов в запросе, особенно для местоимений.
    3. Вычисление ударения: Система определяет Stress Score для местоимения, используя акустические параметры (возможно, с помощью обученной модели машинного обучения).
    4. Идентификация концепта: На основе Stress Score и правил система выбирает референт из концептов, извлеченных из предыдущих запросов.
      • Если ударение высокое (превышает порог): Концепт может быть ассоциирован с самым последним запросом/ответом.
      • Если ударение низкое: Концепт может быть ассоциирован с исходным или более ранним запросом в сессии.
    5. Ассоциация и модификация: Идентифицированный концепт ассоциируется с местоимением. Исходный запрос модифицируется (переписывается), включая этот концепт.
    6. Предоставление результатов: Модифицированный запрос используется для поиска, и результаты предоставляются пользователю.

    Вариант Б: На основе грамматического анализа (описан в Description и Claims)

    1. Получение запроса: Система получает голосовой запрос в контексте сессии.
    2. Грамматический анализ: Анализируется грамматическая структура запроса для извлечения неоднозначной фразы, ссылающейся на предыдущий концепт.
    3. Извлечение компонентов фразы: Из фразы извлекается определяющее слово (determiner) и его объектное слово (object word).
    4. Поиск гипернимов: Система находит набор гипернимов для объектного слова.
    5. Идентификация концепта: Система сравнивает фразу и набор гипернимов с концептами из предыдущих запросов. Вычисляется level of similarity.
    6. Ассоциация и модификация: Концепт с наивысшей схожестью ассоциируется с фразой. Исходный запрос модифицируется.
    7. Предоставление результатов: Модифицированный запрос используется для поиска.

    Какие данные и как использует

    Данные на входе

    Система использует несколько типов данных для разрешения неоднозначности:

    • Акустические факторы (для Варианта А):
      • Volume (Громкость)
      • Pitch (Высота тона)
      • Frequency (Частота)
      • Spoken duration (Длительность произнесения слова)
      • Duration between words (Паузы между словами)
    • Лингвистические и структурные факторы (для Варианта Б):
      • Грамматическая структура запроса (Part-of-speech tagging).
      • Идентификация Determiners и Object Words.
      • Данные о семантических связях (Hypernyms).
    • Пользовательские и сессионные факторы:
      • История предыдущих запросов в рамках текущей сессии.
      • Ответы системы на предыдущие запросы.
      • Концепты (сущности), извлеченные из предыдущих взаимодействий.
    • Другие факторы:
      • Гендерные признаки концептов (упоминается в описании как дополнительный сигнал для разрешения местоимений типа «he»/«she»).

    Какие метрики используются и как они считаются

    • Stress Score (Оценка ударения): Вычисляется для местоимений на основе акустических параметров. Патент предполагает использование обученной системы машинного обучения (machine learning system), которая принимает на вход акустические параметры (в виде векторов признаков) и выдает оценку ударения. Обучение происходит на данных, размеченных асессорами (human raters).
    • Пороги ударения (Predetermined threshold): Stress Score сравнивается с порогом, чтобы определить, было ли местоимение выделено пользователем или нет.
    • Level of Similarity (Уровень схожести): Метрика, используемая в грамматическом методе для оценки того, насколько хорошо неоднозначная фраза (и ее гипернимы) соответствует концептам из предыдущих запросов. Расчет может учитывать такие эвристики, как расстояние между терминами, количество общих гипернимов и длину терминов.
    • Gender Score (Гендерная оценка): Упоминается как возможная метрика для определения пола концепта, используемая для разрешения гендерно-специфичных местоимений.

    Выводы

    1. Контекст критичен для понимания запросов: Патент демонстрирует, что Google рассматривает запросы не изолированно, а как часть диалога или сессии. Понимание истории взаимодействия является ключом к разрешению неоднозначности.
    2. Голосовой поиск использует уникальные сигналы: В отличие от текстового поиска, голосовой поиск позволяет Google анализировать акустические сигналы (интонацию, ударение). То, как пользователь говорит, предоставляет системе подсказки о его намерениях.
    3. Агрессивное переписывание запросов для разрешения неоднозначности: Система не пытается ранжировать результаты по неоднозначному запросу. Вместо этого она стремится точно определить референт и полностью переписать запрос (Resolved Query), заменив местоимение или фразу конкретной сущностью.
    4. Использование семантических связей (Гипернимы): Метод грамматического анализа полагается на понимание отношений «является» (is-a) между сущностями (гипернимия). Это подчеркивает важность Графа Знаний (Knowledge Graph) и структурированных данных для понимания связей между концептами.
    5. Комбинация сигналов и машинное обучение: Система использует комбинацию лингвистических, акустических и контекстуальных сигналов. Определение таких метрик, как Stress Score, основано на машинном обучении, обученном на человеческих оценках.

    Практика

    Best practices (это мы делаем)

    • Оптимизация под сущности и связи (Entity SEO): Необходимо четко определять основные сущности в контенте и использовать структурированные данные (Schema.org). Это помогает Google корректно извлекать Concepts и понимать отношения между ними (гипернимы/гипонимы), что критично для работы описанного механизма.
    • Структурирование контента для диалога: Создавайте контент, который предвосхищает последующие вопросы. Используйте формат Вопрос-Ответ (FAQ) или четкую иерархию информации. Если вы описываете две сущности, сделайте различия между ними явными, чтобы системе было легче разрешать последующие ссылки на них.
    • Построение тематического авторитета (Topical Authority): Полное раскрытие темы, включая описание связанных сущностей, синонимов и различных аспектов концепта. Если ваш сайт четко связывает «Laphroaig» с его гипернимами («скотч», «виски», «алкоголь»), это повышает вероятность того, что Google сможет связать последующий запрос о «скотче» с вашим контентом о «Laphroaig».
    • Оптимизация под голосовой поиск: Используйте естественный язык и разговорные фразы. Поскольку этот патент направлен исключительно на голосовые запросы, важно, чтобы контент соответствовал тому, как люди задают вопросы вслух.

    Worst practices (это делать не надо)

    • Изолированный подход к ключевым словам: Оптимизация страниц под отдельные запросы без учета контекста и семантических связей между страницами и темами. Это снижает вероятность ранжирования по цепочке последовательных запросов.
    • Неоднозначное представление информации: Контент, в котором границы между различными сущностями размыты или отсутствует четкая структура, затрудняет для системы извлечение Concepts и последующее разрешение местоимений.
    • Игнорирование структурированных данных: Отсутствие микроразметки снижает способность Google быстро идентифицировать сущности и их свойства, что усложняет процесс сопоставления с гипернимами.

    Стратегическое значение

    Этот патент подтверждает стратегический курс Google на развитие разговорного поиска и голосовых ассистентов. Для SEO это означает, что оптимизация смещается от простого сопоставления ключевых слов к обеспечению участия в диалоге. Стратегия должна фокусироваться на создании семантически богатого контента, который позволяет пользователям глубоко погружаться в тему через серию взаимодействий. Понимание того, как Google использует гипернимы для связи концептов, подчеркивает важность построения сильной информационной архитектуры и глубокого понимания семантики вашей ниши.

    Практические примеры

    Сценарий: Оптимизация страницы рецепта для последовательных запросов

    1. Цель: Обеспечить, чтобы страница рецепта могла отвечать на последующие уточняющие вопросы в голосовом поиске.
    2. Исходный запрос пользователя (Голос): «Как приготовить пасту Карбонара?»
    3. Действие SEO: Создать страницу с четким рецептом, используя Recipe schema. Убедиться, что ключевые ингредиенты (например, «Гуанчале», «Пармезан») четко определены как сущности.
    4. Ответ системы: Система предоставляет рецепт с вашего сайта (Concept 1: Карбонара, Concept 2: Гуанчале).
    5. Последующий запрос пользователя (Голос): «Сколько калорий в ней?» (Неоднозначное местоимение «ней»).
    6. Работа системы: Система анализирует запрос. Предполагая отсутствие сильного акустического ударения, она ассоциирует «ней» с основной темой (Карбонара). Запрос переписывается: «Сколько калорий в пасте Карбонара?».
    7. Действие SEO: Убедиться, что информация о пищевой ценности присутствует в контенте и в разметке NutritionInformation.
    8. Альтернативный последующий запрос: «Где купить этот ингредиент?» (Неоднозначная фраза «этот ингредиент»).
    9. Работа системы: Система использует грамматический анализ. Определитель «этот», объект «ингредиент». Гиперним: компонент еды. Система ищет соответствие с последними упомянутыми ингредиентами (например, Гуанчале) и переписывает запрос.
    10. Результат: Сайт успешно обслуживает всю цепочку разговорного интента.

    Вопросы и ответы

    Влияет ли этот патент на обычный текстовый поиск?

    Патент сфокусирован на голосовых запросах (Voice Queries). Метод, основанный на акустических параметрах (ударении), применим только к голосовому вводу. Однако метод, основанный на грамматическом анализе и использовании гипернимов для разрешения неоднозначных фраз в контексте сессии, может быть применим и к текстовому разговорному поиску (например, в чат-ботах или при последовательных запросах в строке поиска), хотя в патенте это явно не указано.

    Как Google определяет, на какой из предыдущих концептов ссылается пользователь?

    Патент описывает два основных механизма. Первый — анализ ударения (Stress Score) на местоимении: разный уровень ударения может указывать на разные референты (например, последний упомянутый или исходный). Второй — грамматический анализ фразы: система ищет гипернимы для объекта во фразе и сравнивает их с предыдущими концептами, вычисляя уровень схожести (level of similarity).

    Как этот патент связан с Графом Знаний (Knowledge Graph)?

    Связь очень тесная, особенно в методе грамматического анализа. Система должна знать гипернимы (отношения «is-a») для объектных слов (например, что «скотч» это «виски», а «виски» это «алкоголь»). Эта информация о семантических связях между сущностями хранится и обрабатывается в рамках Графа Знаний. Эффективность этого метода напрямую зависит от полноты и точности данных в Графе Знаний.

    Как SEO-специалист может оптимизировать контент под разрешение местоимений?

    Ключевой подход — это ясность и структурированность. Используйте четкую информационную архитектуру, логичную иерархию заголовков и микроразметку Schema.org для точного определения сущностей. Создавайте контент в формате, который естественно поддерживает диалог и отвечает на возможные последующие вопросы. Это помогает системе корректно извлекать концепты и разрешать ссылки на них.

    Что такое акустические параметры и как они измеряются?

    Акустические параметры — это физические характеристики звуковой волны голоса. В патенте упоминаются громкость, высота тона, частота и длительность произнесения слов или пауз между ними. Они измеряются путем анализа аудиосигнала, например, с помощью Быстрого преобразования Фурье (FFT), для определения амплитуд и частот в разные моменты времени.

    Использует ли Google машинное обучение в этом процессе?

    Да. Патент упоминает использование обученной системы машинного обучения для определения Stress Score на основе акустических параметров. Эта система обучается на данных, размеченных людьми-асессорами, которые оценивали уровень ударения в различных голосовых запросах. Также упоминается возможность использования машинного обучения для определения гендерной принадлежности концепта.

    Что важнее для SEO: акустический или грамматический метод?

    Для SEO-специалиста важнее понять implications грамматического метода. Мы не можем повлиять на то, как пользователь произносит запрос (акустика), но мы можем повлиять на то, насколько хорошо наш контент структурирован и связан семантически (грамматика и гипернимы). Понимание использования гипернимов помогает строить более эффективную контент-стратегию.

    Может ли этот механизм ошибаться в определении контекста?

    Да, как и любая автоматизированная система. Ошибки могут возникать из-за неверной интерпретации акустического ударения, неполноты данных о гипернимах или сложности самого диалога. Например, если пользователь использует сарказм или нестандартную интонацию, Stress Score может быть рассчитан неверно.

    Как проверить, работает ли мой контент для последовательных запросов?

    Протестируйте это вручную с помощью Google Assistant. Задайте исходный вопрос, на который ваш сайт дает ответ, а затем задайте серию уточняющих вопросов, используя местоимения («где это?», «когда он родился?»). Если система поддерживает контекст и предоставляет корректные ответы с вашего ресурса, значит, контент структурирован хорошо.

    Насколько важен этот патент для E-E-A-T?

    Он косвенно связан с E-E-A-T через построение тематического авторитета. Создание контента, который глубоко раскрывает тему и четко определяет связи между сущностями (что необходимо для работы этого патента), способствует укреплению авторитетности ресурса в глазах поисковой системы. Экспертный контент обычно лучше структурирован и семантически богаче.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.