
Google позволяет пользователям исправлять ошибки распознавания голоса естественным образом (например, фразой «Нет, я имел в виду...»). Система анализирует исходный запрос и последующее уточнение, генерирует кандидатов на исправление, оценивает их популярность и фонетическое сходство, и формирует новый, корректный поисковый запрос.
Патент решает проблему ошибок автоматического распознавания речи (Automatic Speech Recognition, ASR) при голосовом поиске. Когда система неверно распознает голосовой запрос, пользователю часто приходится начинать процесс заново. Изобретение улучшает взаимодействие с пользователем, позволяя исправлять ошибки распознавания естественным, разговорным способом, без необходимости повторять весь запрос.
Запатентована система обработки естественного языка, которая интерпретирует последующий голосовой ввод как коррекцию предыдущего запроса. Система определяет, содержит ли второй запрос команду на исправление (например, «Нет, я имел в виду...»), идентифицирует ошибочно распознанную часть первого запроса и заменяет ее на основе информации из второго запроса, формируя скорректированный запрос (corrected recognition output).
Механизм активируется, когда пользователь после первого голосового запроса вводит второй.
correction prefix (например, «No I meant») или соответствие одной из грамматик коррекции (например, повторение части запроса, указание на категорию, диктовка по буквам).candidate corrections). Используются различные источники: прямое распознавание второго запроса, альтернативные гипотезы распознавания, фонетически похожие термины из Misrecognition Index, а также анализ типа/категории.phonetic quality) между исправлением и ошибкой, а также популярность (query popularity) итогового скорректированного запроса на основе логов.Высокая. Голосовой поиск и диалоговые интерфейсы (Conversational AI) являются стратегическими направлениями развития. Способность системы корректно обрабатывать ошибки распознавания речи и поддерживать контекст разговора критически важна для удобства пользователей современных голосовых ассистентов.
Влияние на SEO минимальное (2/10). Патент описывает инфраструктурные процессы на этапе понимания запроса (Query Understanding), а именно — обработку голосового ввода до того, как запрос поступит в систему ранжирования. Он не содержит информации об алгоритмах ранжирования, индексирования или факторах качества контента. Для SEO-специалистов он дает понимание того, как Google обрабатывает фонетическую неоднозначность и использует данные о популярности запросов для уточнения ввода пользователя.
query logs) и его семантическом качестве.Claim 1 (Независимый пункт): Описывает основной метод обработки последовательных голосовых запросов.
correction prefix.Claim 2 (Зависимый): Детализирует процесс генерации кандидатов.
misrecognition portion) первого результата распознавания.Claim 3 (Зависимый): Указывает источники для получения кандидатных n-грамм.
Misrecognition index, содержащий фонетически похожие n-граммы.Claim 4 (Зависимый): Указывает фактор оценки.
phonetic distance между кандидатом на исправление и первым голосовым вводом.Claim 5, 6, 7 (Зависимые): Указывают дополнительные факторы оценки.
query popularity (Claim 5).query log (Claim 6).Изобретение полностью находится на этапе обработки ввода пользователя.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система (в частности, Voice Query Correction Engine) работает в режиме реального времени сразу после получения голосового ввода и его первичной транскрипции с помощью Voice Recognition Engine (ASR).
correction prefix.RANKING.Входные данные:
Misrecognition Index (фонетические данные).Query Logs (статистические данные о популярности запросов).Выходные данные:
corrected recognition output).correction prefix («No I meant...»).Этап 1: Получение и первичное распознавание
Этап 2: Детекция коррекции
correction prefix.Этап 3: Генерация кандидатов (Candidate Generation)
Misrecognition Index терминов, которые фонетически похожи на ошибочный термин.Этап 4: Оценка кандидатов (Candidate Scoring)
query logs).Этап 5: Выбор и применение
corrected recognition output.Патент фокусируется исключительно на обработке ввода и не упоминает традиционные SEO-факторы (контентные, ссылочные, технические).
Voice Queries) от пользователя.Recognition Output) и альтернативные гипотезы распознавания речи.Misrecognition Index — база данных фонетически схожих n-грамм и их фонетических представлений.Query Logs — исторические данные о частоте использования запросов, используемые для определения Query Popularity.Correction Prefix) для идентификации намерения коррекции.phonetic distance), например, с использованием фонетического редакционного расстояния (phonetic edit distance) между n-граммами.query logs.Query Popularity, семантическое качество запроса (pattern of the query) и вероятность того, что запрос приведет к прямому ответу (answer box).Query Quality исходного запроса и скорректированного запроса. Оценивает степень улучшения запроса после перезаписи.Misrecognition Index, Phonetic Distance) и статистических данных (Query Popularity) для интерпретации намерений пользователя.Query Popularity) является ключевым фактором для валидации исправлений. Система предпочитает исправления, которые приводят к часто используемым запросам.Type/Category analysis показывает, что Google использует понимание сущностей и их типов для разрешения неоднозначностей (например, если пользователь говорит «я имел в виду страну», система ищет сущности типа «Country»).Хотя патент является инфраструктурным и направлен на улучшение распознавания речи, он дает некоторое понимание приоритетов Google, которое можно учитывать в SEO-стратегии:
Query Popularity как важный сигнал для подтверждения корректности запроса. Это подтверждает важность оптимизации под запросы, которые реально используются аудиторией, а не под искусственно созданные или крайне редкие формулировки.Type/Category analysis показывает, что система может использовать категории для исправления ошибок. Использование структурированных данных (Schema.org) и четкое позиционирование контента помогает Google правильно идентифицировать тип сущности (например, продукт, место, организация), что может косвенно помочь в разрешении неоднозначностей при голосовом вводе.Патент подтверждает стратегический курс Google на развитие голосового поиска и диалоговых систем. Для SEO это означает необходимость адаптации стратегий к миру, где ввод информации все чаще осуществляется голосом. Понимание того, как Google обрабатывает ошибки и уточнения на лету, подчеркивает важность не только точного соответствия ключевым словам, но и глубокого понимания интента, контекста пользователя, а также использования данных о популярности запросов для валидации этого интента.
Сценарий: Исправление названия бренда через указание категории (использование Type/Category Analysis)
correction prefix «No, I meant» и определяет категорию «security company».phonetic quality и соответствующим типом.Влияет ли этот патент на ранжирование сайтов?
Нет, напрямую не влияет. Патент описывает процесс обработки и исправления голосового ввода пользователя (Query Understanding) до того, как запрос поступит в систему ранжирования. Он определяет, *какой именно* текстовый запрос будет использоваться для поиска, но не описывает, *как* будут ранжироваться результаты по этому запросу.
Что такое «Misrecognition Index» и как он формируется?
Это база данных, которая содержит фонетически похожие n-граммы. Она используется для быстрого поиска слов, которые звучат похоже на ошибочно распознанный термин. Индекс может формироваться путем анализа фонетических представлений слов и, возможно, на основе исторических данных о том, какие слова часто путаются системами ASR.
Почему Google использует популярность запроса (Query Popularity) для оценки исправлений?
Query Popularity, основанная на Query Logs, служит статистической валидацией. Если исправление приводит к запросу, который часто используется людьми (например, [Baroque artists]), это значительно повышает уверенность системы в том, что исправление верно, по сравнению с запросом, который никто не ищет (например, [Broke artists]).
Что такое грамматики коррекции (Correction Grammars)?
Это предопределенные шаблоны фраз, которые пользователи естественным образом используют для исправления ошибок. Примеры включают использование префиксов («Нет, я имел в виду X»), указание на замену («Не X, а Y»), уточнение категории («Я имел в виду страну») или диктовку по буквам. Система ищет соответствие этим грамматикам во втором голосовом запросе.
Как система обрабатывает ситуацию, когда второй (корректирующий) запрос тоже распознан неверно?
Патент учитывает это. Система использует альтернативные гипотезы распознавания речи (Hypothesis of correcting query). Если основной вариант распознавания не дает хороших кандидатов, система проверяет другие вероятные транскрипции того же аудиоввода, чтобы найти корректное исправление.
Что означает «Type/Category analysis» в контексте этого патента?
Это механизм, который активируется, если пользователь уточняет запрос, указывая на тип или категорию объекта, а не повторяя само слово. Например, если после ошибки [president of friends] пользователь говорит «Я имел в виду страну», система будет искать сущности типа «Country», которые фонетически похожи на «friends» (например, «France»).
Есть ли смысл оптимизировать контент под фонетические вариации ключевых слов?
Нет, этот патент направлен на то, чтобы исправить фонетические ошибки на этапе ввода, а не на то, чтобы искать контент, соответствующий ошибкам. Цель системы — определить истинное намерение пользователя и сформировать корректный текстовый запрос. Оптимизировать нужно под корректные формулировки.
Как этот патент связан с оптимизацией под голосовой поиск (Voice Search Optimization)?
Он помогает понять, как Google обрабатывает голосовой ввод. Для VSO это подчеркивает важность использования естественного языка и ориентации на популярные запросы (Query Popularity), так как они с большей вероятностью будут корректно интерпретированы и валидированы системой.
Что произойдет, если система не уверена в предложенном исправлении?
Если ни один из кандидатов на исправление не набирает оценку выше установленного порога (threshold value), система может проигнорировать попытку коррекции. В этом случае она может либо использовать исходный (ошибочный) результат первого запроса, либо обработать второй запрос как новый поиск, в зависимости от реализации.
Может ли использование микроразметки помочь этому алгоритму?
Косвенно да. Если система использует Type/Category analysis, ей необходимо знать типы сущностей. Микроразметка (Schema.org) помогает Google лучше понимать сущности и их типы (например, отличать компанию от продукта или места). Это может улучшить способность системы находить правильные замены в нужной категории при голосовой коррекции.

Семантика и интент
Поведенческие сигналы

Семантика и интент
Мультиязычность

Семантика и интент

Семантика и интент
Персонализация

SERP
Антиспам
EEAT и качество

Поведенческие сигналы
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Семантика и интент
Структура сайта
Ссылки

Семантика и интент
Индексация
Структура сайта

Поведенческие сигналы
SERP

Мультимедиа
Поведенческие сигналы
SERP

Техническое SEO
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Local SEO
Поведенческие сигналы
Семантика и интент

Индексация
Краулинг
Ссылки
