Как Google использует популярность прошлых запросов для понимания местоимений в голосовом поиске

Google использует механизм разрешения неоднозначности в последовательных голосовых запросах. Если пользователь использует местоимение (например, «он», «оно»), которое может относиться к разным сущностям из предыдущего диалога, Google генерирует несколько вариантов запроса и выбирает тот, который чаще всего задавался пользователями в прошлом (на основе исторических логов).

Описание

Какую задачу решает

Патент решает проблему неоднозначности (ambiguity) при обработке последовательных запросов, особенно в контексте голосового (voice query) и диалогового поиска. Проблема возникает, когда пользователь задает последующий запрос, используя анафору (например, местоимения «он», «она», «оно»), а в контексте предыдущего взаимодействия упоминалось несколько сущностей, к которым эта анафора может относиться. Система должна определить правильную связь (разрешить анафору), чтобы корректно интерпретировать намерение пользователя.

Что запатентовано

Запатентован метод разрешения анафоры в последовательных голосовых запросах, когда существует несколько потенциальных сущностей-кандидатов. Система генерирует несколько candidate queries, подставляя каждую сущность вместо анафоры. Затем эти запросы оцениваются с помощью query-ranking engine, который использует исторические данные о популярности и частоте запросов (past query logs). Наиболее популярный запрос выбирается как правильная интерпретация и отправляется в поисковую систему.

Как это работает

Механизм активируется при получении последующего голосового запроса (follow-up voice query).

Обнаружение анафоры: Система анализирует запрос на наличие анафоры (например, местоимения).
Идентификация сущностей: Анализируется предыдущий запрос и/или его результаты для поиска сущностей (entities), к которым может относиться анафора.
Проверка неоднозначности: Если найдено более одной подходящей сущности, активируется механизм разрешения.
Генерация кандидатов: Формируются несколько запросов-кандидатов, где анафора заменяется каждой из потенциальных сущностей.
Ранжирование запросов: Запросы-кандидаты отправляются в query-ranking engine, который оценивает их популярность на основе past query logs.
Выбор и поиск: Выбирается запрос с наивысшим рейтингом популярности, и он используется для выполнения поиска.

Актуальность для SEO

Высокая. С ростом использования голосовых ассистентов и диалоговых интерфейсов способность поддерживать контекст и разрешать неоднозначности становится критически важной. Этот патент (являющийся продолжением заявки от 2013 года и специально сфокусированный на голосовых запросах в Claims от 2017 года) описывает фундаментальный механизм для улучшения понимания естественного языка в реальных сценариях использования Google Assistant.

Важность для SEO

Влияние на SEO оценивается как среднее (65/100). Патент не описывает алгоритмы ранжирования контента, а фокусируется исключительно на этапе понимания и переписывания запроса (Query Understanding). Однако он критически важен для видимости в диалоговом и голосовом поиске. Понимание этого механизма позволяет SEO-специалистам понять, что Google отдает предпочтение тем интерпретациям запросов, которые статистически более популярны среди пользователей.

Детальный разбор

Термины и определения

Anaphora (Анафора): Слово или фраза (например, местоимение), которое ссылается на слово, использованное ранее в контексте (сущность), чтобы избежать повторения. В патенте это, как правило, pronoun (местоимение) в последующем запросе.
Candidate Queries (Запросы-кандидаты): Набор запросов, сгенерированных системой путем замены анафоры в исходном запросе на одну из потенциальных сущностей из предыдущего контекста.
Entity (Сущность): Объект или концепция (человек, место, вещь), идентифицированная в предыдущем запросе или в результатах поиска.
Entity Identifier Module (Модуль идентификации сущностей): Компонент системы, отвечающий за распознавание и извлечение сущностей из текста запроса или результатов.
Follow-up voice query (Последующий голосовой запрос): Запрос, заданный пользователем после первоначального запроса, часто относящийся к той же теме или контексту. В данном патенте Claims сфокусированы именно на голосовых запросах.
Grammar Analyzing Module (Модуль грамматического анализа): Компонент, который анализирует структуру запроса для идентификации частей речи (существительных, местоимений и т.д.).
N-grams (N-граммы): Последовательности из N слов в запросе. Патент предлагает использовать частоту n-грамм в исторических логах для оценки популярности запроса-кандидата.
Past Query Logs (Журналы прошлых запросов): Исторические данные о запросах, которые пользователи вводили в поисковую систему. Используются как основа для определения популярности и частоты запросов.
Query-Ranking Engine (Механизм ранжирования запросов): Система, которая оценивает запросы-кандидаты на основе их популярности или частоты в past query logs, а не на основе релевантности контента.
Rewrite Engine (Механизм переписывания запросов): Общий компонент, который модифицирует исходный запрос пользователя для улучшения результатов поиска, включая разрешение анафоры.

Ключевые утверждения (Анализ Claims)

Патент US10083226B1 является продолжением (continuation) более ранней заявки и специально фокусирует изобретение на контексте голосового поиска.

Claim 1 (Независимый пункт): Описывает основной процесс обработки последовательных голосовых запросов.

Получение первого голосового запроса.
Получение второго, последующего голосового запроса.
Определение наличия анафоры во втором запросе (конкретно, местоимения, ссылающегося на сущность, отсутствующую во втором запросе).
В ответ на это, определение того, что первый запрос связан с множеством возможных сущностей (т.е. существует неоднозначность).
Генерация множества запросов-кандидатов путем замены местоимения на каждую возможную сущность.
Определение того, какая сущность в одном из запросов-кандидатов является правильной ассоциацией для анафоры (этот шаг включает механизм разрешения неоднозначности).
На основании этого определения, предоставление выбранного запроса-кандидата поисковой системе и получение результатов.

Claim 4 (Зависимый от 1): Уточняет, как происходит разрешение неоднозначности (шаг 6 из Claim 1).

Разрешение неоднозначности включает:

Предоставление запросов-кандидатов ranking engine.
Получение ранжирования этих запросов.
Определение того, что запрос с наивысшим рангом является правильной интерпретацией.

Claim 5 (Зависимый от 4): Уточняет данные, используемые ranking engine.

Ranking engine использует data repository, содержащий past query logs. Эти логи связаны с метаданными, описывающими популярность (popularity), частоту использования (frequency of use) или общность (commonality) запросов.

Claim 6 и 7 (Зависимые от 4): Описывают возможность модификации запросов-кандидатов перед ранжированием.

Модификация может включать удаление терминов, замену терминов синонимами или добавление новых терминов. Это делается для повышения вероятности нахождения соответствия в исторических данных.

Claim 8 (Зависимый от 4): Предлагает метод ранжирования запросов.

Ранжирование запросов-кандидатов может осуществляться путем ранжирования n-grams, содержащихся в этих запросах.

Где и как применяется

Изобретение применяется преимущественно на этапе понимания запроса.

QUNDERSTANDING – Понимание Запросов

Это основной этап применения патента. Система работает как часть Rewrite Engine для интерпретации и модификации входящего запроса до того, как он будет передан на этап ранжирования.

Взаимодействие: Система взаимодействует с Grammar Analyzing Module для разбора запросов, с Entity Identifier Module для извлечения контекстуальных сущностей и с Query-Ranking Engine для оценки популярности интерпретаций.
Данные на входе: Первый голосовой запрос, второй голосовой запрос, контекст сессии (включая, возможно, результаты первого запроса), доступ к Past Query Logs.
Данные на выходе: Единственный, переписанный запрос (выбранный запрос-кандидат), в котором анафора заменена на наиболее вероятную сущность.

RANKING – Ранжирование

Патент также описывает альтернативный вариант реализации (в описании, не в Claims), где разрешение анафоры происходит на этапе ранжирования. Вместо предварительного выбора лучшего запроса система генерирует один сложный запрос с использованием логического оператора OR (например, [сущность А] OR [сущность Б]). Утверждается, что стандартные алгоритмы ранжирования естественно отдадут приоритет результатам для более релевантной или авторитетной интерпретации.

На что влияет

Специфические запросы: В первую очередь влияет на диалоговые и последовательные запросы, особенно заданные на естественном языке (голосовой поиск). Влияет на информационные запросы, где пользователи уточняют информацию о ранее упомянутых сущностях.
Конкретные типы контента: Влияет на контент, отвечающий на прямые вопросы (FAQ, биографии, характеристики продуктов), так как именно такой контент часто ищут с помощью последовательных запросов.

Когда применяется

Триггеры активации:
- Пользователь задает последовательный запрос (в данном патенте Claims фокусируются на голосовом).
- Во втором запросе обнаружена анафора (местоимение).
- В контексте предыдущего взаимодействия (первый запрос или его результаты) идентифицировано более одной сущности, которая может соответствовать этой анафоре (например, два человека мужского пола для местоимения «он»).

Пошаговый алгоритм

Основной процесс (Разрешение через ранжирование запросов)

Получение контекста: Система получает первый голосовой запрос и обрабатывает его. Идентифицируются и сохраняются сущности из запроса и/или его результатов.
Получение последующего запроса: Система получает второй голосовой запрос.
Анализ анафоры: Второй запрос анализируется на наличие анафоры (местоимений).
Проверка контекста: Если анафора найдена, система проверяет сохраненные сущности из шага 1, чтобы найти потенциальных кандидатов, соответствующих анафоре (например, по полу или типу).
Проверка неоднозначности: Определяется, найдено ли более одной сущности-кандидата.
- Если НЕТ (одна сущность): Сгенерировать модифицированный запрос, заменив анафору этой сущностью. Перейти к шагу 10.
- Если ДА (несколько сущностей): Перейти к шагу 6.
Генерация кандидатов: Сформировать множество запросов-кандидатов. Каждый кандидат создается путем замены анафоры на одну из сущностей-кандидатов.
Модификация кандидатов (Опционально): Запросы-кандидаты могут быть модифицированы (упрощены, использованы синонимы, удалены вопросительные конструкции) для лучшего соответствия формату исторических логов.
Ранжирование запросов: Запросы-кандидаты (или их n-граммы) отправляются в Query-Ranking Engine для оценки их популярности на основе Past Query Logs.
Разрешение неоднозначности: Выбирается запрос-кандидат с наивысшим рейтингом популярности.
Выполнение поиска: Выбранный запрос отправляется в основную поисковую систему.

Какие данные и как использует

Данные на входе

Контентные/Структурные факторы (Косвенно): Система полагается на Entity Identifier Module, который использует данные о сущностях (Knowledge Graph) для идентификации контекста.
Поведенческие факторы (Ключевые): Past Query Logs являются основой для разрешения неоднозначности. Система анализирует историческую популярность, частоту и общность запросов.
Пользовательские факторы: Контекст текущей сессии (предыдущий запрос и его результаты). Специфика ввода (голосовой запрос).

Какие метрики используются и как они считаются

Query Popularity/Frequency Score (Оценка популярности/частоты запроса): Основная метрика, используемая Query-Ranking Engine. Рассчитывается на основе анализа Past Query Logs.
N-gram Frequency (Частота N-грамм): В одном из вариантов реализации система может оценивать не весь запрос целиком, а частоту встречаемости ключевых n-grams из запроса в исторических логах.
Методы анализа текста (NLP): Используются для грамматического разбора (определение частей речи, обнаружение анафоры) и идентификации сущностей (Entity Extraction).

Выводы

Приоритет статистической популярности при интерпретации: Ключевой вывод патента заключается в том, что при наличии неоднозначности в диалоговом поиске Google полагается на статистику. Интерпретация, которая чаще встречалась в прошлом (в Past Query Logs), считается наиболее вероятной.
Важность точных формулировок (N-grams): Патент подчеркивает, что оценка популярности может проводиться на уровне n-grams. Это подтверждает важность использования естественных и распространенных языковых конструкций в контенте, соответствующих реальным пользовательским запросам.
Контекст и сущности – основа диалогового поиска: Весь механизм зависит от способности системы корректно идентифицировать сущности (Entity Identifier Module) и поддерживать контекст между запросами. Без четкого понимания сущностей система не сможет сгенерировать корректные запросы-кандидаты.
Два пути разрешения неоднозначности: Google рассматривает два метода: (1) Ранжирование запросов до поиска (основной метод в Claims) и (2) Использование запроса с оператором OR и разрешение неоднозначности во время ранжирования результатов (альтернативный метод в описании). Оба метода полагаются на то, что более популярная интерпретация победит.
Фокус на голосовом поиске: Данная версия патента (B1) в своих Claims специально адаптирована под голосовые запросы (voice query), что указывает на стратегическую важность этой технологии для Google Assistant и подобных интерфейсов.

Практика

Best practices (это мы делаем)

Оптимизация под популярные формулировки запросов: Необходимо анализировать данные из блока «People Also Ask» (PAA) и автодополнения (Autocomplete), так как они являются лучшим доступным прокси для Past Query Logs. Создавайте контент, который отвечает на эти популярные вопросы, используя именно те формулировки (n-grams), которые используют пользователи.
Укрепление идентификации сущностей: Используйте структурированные данные (Schema.org), чтобы помочь Google однозначно идентифицировать ключевые сущности на вашем сайте (людей, продукты, организации). Это критически важно для того, чтобы Entity Identifier Module корректно установил контекст для последующих запросов.
Четкое разграничение связанных сущностей: Если ваш контент обсуждает тесно связанные сущности (например, компанию и ее основателя, продукт и его изобретателя), убедитесь, что контент четко разграничивает информацию о них. Это поможет системе правильно интерпретировать последующие уточняющие вопросы о каждой из сущностей.
Создание контента для диалогового поиска (FAQ): Разрабатывайте разделы FAQ и статьи, которые отвечают на последовательность связанных вопросов. Это соответствует поведению пользователей в диалоговом поиске и увеличивает шансы на видимость по уточняющим запросам.

Worst practices (это делать не надо)

Использование неестественных или редких формулировок: Создание контента, оптимизированного под сложные или редко используемые ключевые фразы, может снизить видимость. Если интерпретация запроса неоднозначна, Google предпочтет более популярную и естественную формулировку.
Игнорирование контекста сущностей: Публикация неструктурированного контента без четкого указания на основные сущности затрудняет для Google поддержание контекста в диалоговой сессии.

Стратегическое значение

Этот патент подтверждает стратегический фокус Google на развитии диалогового и голосового поиска. Для SEO это означает необходимость перехода от модели «один запрос – один ответ» к пониманию поисковой сессии как диалога. Стратегия должна включать глубокую проработку сущностей и оптимизацию под естественный язык (Natural Language Optimization). Понимание того, что популярность запроса может определить его интерпретацию, подчеркивает важность инструментов анализа реальных пользовательских запросов.

Практические примеры

Сценарий: Оптимизация биографического контента (на основе примера из патента)

Задача: Улучшить видимость контента в диалоговом поиске о Кевине Бейконе и его отце Эдмунде Бейконе.
Анализ контекста: Пользователь спрашивает: «Кто отец Кевина Бейкона?» (Q1). Система отвечает: «Эдмунд Бейкон». В контексте теперь две мужские сущности.
Применение патента: Пользователь спрашивает: «В каком последнем фильме он снимался?» (Q2). Система обнаруживает неоднозначность («он»). Генерируются кандидаты: (A) «…Кевин Бейкон…» и (B) «…Эдмунд Бейкон…».
Разрешение: Система проверяет Past Query Logs. Запрос (A) значительно популярнее запроса (B). Система выбирает (A).
Действия SEO:
- Убедиться, что на сайте есть четкие ответы на популярные вопросы о Кевине Бейконе, используя естественные формулировки.
- Внедрить разметку Person для обеих персон, четко указав их профессии и связь (parent/children).
Ожидаемый результат: Повышение вероятности того, что Google выберет ваш контент в качестве ответа на популярные последующие голосовые запросы, так как контент соответствует популярной интерпретации, выбранной системой.

Вопросы и ответы

Что такое анафора в контексте поиска?

Анафора – это использование слов, чаще всего местоимений (он, она, оно, их), которые ссылаются на сущность, упомянутую ранее в диалоге. В поиске это происходит, когда пользователь задает последующий запрос, например, сначала «Где находится Эйфелева башня?», а затем «Какова ее высота?». Здесь «ее» – это анафора, ссылающаяся на Эйфелеву башню.

Как именно Google решает, к чему относится местоимение, если есть несколько вариантов?

Патент описывает механизм, основанный на популярности запросов. Если есть два варианта (например, «он» относится к Человеку А или Человеку Б), система генерирует два запроса-кандидата. Затем она проверяет в своих исторических логах (Past Query Logs), какой из этих двух запросов чаще задавался пользователями в прошлом. Более популярный запрос выбирается как правильная интерпретация.

Что такое Query-Ranking Engine?

Это специальный компонент системы, который ранжирует не результаты поиска, а сами текстовые формулировки запросов. Он оценивает, насколько популярен или часто встречается тот или иной запрос в исторических данных. Это отличается от основного поискового движка, который ранжирует веб-страницы по релевантности.

Как SEO-специалист может использовать знание об этом патенте на практике?

Ключевое применение – это оптимизация под естественный язык и популярные формулировки. Используйте данные из PAA (People Also Ask) и автодополнения, чтобы понять, какие вопросы и в каких именно формулировках (n-grams) наиболее популярны. Создавая контент под эти популярные запросы, вы повышаете шансы на видимость, особенно в голосовом и диалоговом поиске.

Влияет ли этот патент на ранжирование моего сайта?

Напрямую на алгоритмы ранжирования контента он не влияет. Он влияет на то, какой запрос в итоге будет обработан поисковой системой. Если Google неправильно интерпретирует неоднозначный запрос пользователя, он может не найти ваш релевантный контент. Правильная интерпретация запроса – это первый шаг к ранжированию.

Патент упоминает n-граммы. Что это значит для контент-стратегии?

Это означает, что важны не просто отдельные ключевые слова, а их устойчивые сочетания и естественные фразы. Система может оценивать популярность именно фраз (n-грамм) из запроса. Контент должен использовать те же языковые конструкции, которые используют пользователи при поиске, а не искусственно переоптимизированный текст.

Насколько важна разметка Schema.org в контексте этого патента?

Хотя Schema.org не упоминается в патенте напрямую, она критически важна для его работы. Механизм зависит от Entity Identifier Module – системы, которая распознает сущности в контексте. Разметка Schema.org является основным способом помочь Google точно и быстро идентифицировать сущности и их связи, что необходимо для генерации корректных запросов-кандидатов.

Патент сфокусирован только на голосовом поиске?

Данная конкретная версия патента (US10083226B1) в своих Claims специально ограничивает изобретение голосовыми запросами (voice query). Однако базовая технология разрешения анафоры, описанная в оригинальной заявке (от 2013 года), применима к любому типу последовательного поиска, включая текстовый диалоговый поиск на мобильных устройствах или десктопе.

Что происходит, если оба варианта интерпретации одинаково популярны?

Патент не детализирует этот случай для основного метода. Однако в описании упоминается альтернативный подход: если запрос легитимно неоднозначен, система может сгенерировать смешанную выдачу (используя запрос с оператором OR) или предложить пользователю уточнить, какую сущность он имел в виду (например, через визуальное или голосовое уведомление).

Может ли система использовать сам текст местоимения в финальном запросе?

Да, патент упоминает, что в некоторых случаях местоимение может быть частью названия, слогана или использоваться в общем смысле (например, запрос «he man movie»). В таких случаях система может сравнить популярность модифицированного запроса (где местоимение заменено сущностью) и оригинального запроса (с местоимением) и выбрать более популярный вариант.