SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google улучшает интерфейс голосового поиска, предлагая альтернативные варианты распознавания при ошибке ввода

METHOD FOR PROVIDING ALTERNATIVE INTERPRETATIONS OF A VOICE INPUT TO A USER (Метод предоставления пользователю альтернативных интерпретаций голосового ввода)
  • US8249876B1
  • Google LLC
  • 2012-01-03
  • 2012-08-21
  • Семантика и интент
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм улучшения пользовательского опыта в голосовом поиске. Если система неверно распознала голосовой запрос и пользователь кликает в строку поиска для исправления, Google автоматически показывает другие вероятные варианты распознавания (n-best list) в области подсказок, облегчая коррекцию ошибки.

Описание

Какую проблему решает

Патент решает проблему пользовательского опыта (UX) при ошибках автоматического распознавания речи (ASR). Когда система неверно интерпретирует голосовой ввод (voice input), пользователи часто разочаровываются и переключаются на ручной ввод текста, кликая в строку поиска. Это снижает вероятность повторного использования голосового поиска. Изобретение направлено на улучшение процесса исправления ошибок, делая его интуитивным и быстрым.

Что запатентовано

Запатентован метод улучшения интерфейса голосового поиска. Система отслеживает действия пользователя после голосового ввода. Если пользователь совершает действие, указывающее на ошибку распознавания (конкретно — клик в строке поиска), система динамически заменяет стандартные поисковые подсказки на альтернативные варианты интерпретации голоса (alternative interpretations) из предварительно сгенерированного списка (n-best list).

Как это работает

Система работает следующим образом:

  • Распознавание: Пользователь произносит запрос. Система ASR генерирует список наиболее вероятных интерпретаций (n-best list).
  • Отображение: Наиболее вероятная интерпретация отображается в строке поиска (Search Box Display Area), а связанные с ней поисковые подсказки — в области подсказок (Suggestion Display Area).
  • Обнаружение ошибки: Если пользователь кликает в строку поиска (сигнал о намерении редактировать), система интерпретирует это как признак ошибки распознавания.
  • Коррекция: Система немедленно заменяет содержимое области подсказок на альтернативные варианты из n-best list.

Актуальность для SEO

Средняя. Базовые концепции использования n-best list для обработки ошибок распознавания речи остаются фундаментальными. Однако конкретные реализации пользовательского интерфейса (UI) и триггеры (например, клик в поле поиска) могли эволюционировать с 2012 года, особенно с развитием мобильных интерфейсов и Google Assistant. Механизм актуален как принцип UI/UX.

Важность для SEO

Влияние на SEO минимальное (1/10). Патент описывает исключительно аспекты пользовательского интерфейса (UI/UX) и обработки ошибок распознавания речи на стороне клиента. Он не содержит информации об алгоритмах ранжирования, индексирования, понимания контента или факторах, влияющих на позиции сайтов в выдаче. Для разработки SEO-стратегии он не несет практической ценности.

Детальный разбор

Термины и определения

N-best list (Список N лучших вариантов)
Набор множества возможных интерпретаций голосового ввода, сгенерированный системой распознавания речи (ASR). Каждый вариант сопровождается оценкой вероятности (likelihood) или уверенности.
Voice Input (Голосовой ввод)
Аудиоданные, полученные от пользователя, содержащие поисковый запрос.
Interpretation (Интерпретация)
Слово или фраза, которую система распознала из голосового ввода пользователя.
Search Box Display Area (Область отображения строки поиска)
Поле пользовательского интерфейса, предназначенное для ввода текстовых запросов и отображения наиболее вероятной интерпретации голосового ввода.
Suggestion Display Area (Область отображения подсказок)
Область интерфейса (обычно под строкой поиска), где отображаются поисковые подсказки или альтернативные интерпретации.
Search Phrase Suggestions (Поисковые подсказки/фразы)
Предлагаемые поисковые запросы (например, автодополнение, URL-адреса, история поиска), соответствующие распознанной интерпретации.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления альтернативных интерпретаций голоса.

  1. Система получает голосовой ввод (voice input) для поиска.
  2. Определяется n-best list возможных интерпретаций.
  3. Пользователю предоставляется первая (наиболее вероятная) интерпретация.
  4. В области подсказок (Suggestion Display Area) отображаются поисковые подсказки (Search Phrase Suggestions), связанные с первой интерпретацией.
  5. Система получает индикацию того, что первая интерпретация неверна.
  6. В ответ на эту индикацию система предоставляет одну или более альтернативных интерпретаций в той же области подсказок.
  7. Ключевой аспект: альтернативные интерпретации отображаются вместо изначальных поисковых подсказок при получении индикации ошибки.

Claim 3 (Зависимый от 2, который зависит от 1): Уточняет, что является индикацией ошибки.

Индикация неверной интерпретации заключается в том, что пользователь кликает внутри области строки поиска (Search Box Display Area), где отображается первая интерпретация.

Claim 7 (Зависимый от 1): Описывает смешанное отображение.

Система может предоставлять не только альтернативные интерпретации, но и поисковые подсказки, связанные с этими альтернативными интерпретациями, одновременно в области подсказок.

Claim 9 (Зависимый от 7): Детализирует смешанное отображение для нескольких альтернатив.

Если отображаются подсказки для двух или более альтернативных интерпретаций, количество подсказок для каждой интерпретации может быть пропорционально вероятности (likelihood), связанной с этой интерпретацией.

Где и как применяется

Патент чисто технический и описывает внутренние процессы интерфейса Google без прямых рекомендаций для SEO.

Механизм применяется на этапе взаимодействия пользователя с поисковой системой до финальной отправки запроса на ранжирование.

QUNDERSTANDING – Понимание Запросов
Это основная область применения, затрагивающая компонент автоматического распознавания речи (ASR) и уровень взаимодействия с пользовательским интерфейсом (UI).

  1. ASR: Голосовой ввод обрабатывается для генерации n-best list.
  2. Интерфейс и обработка ошибок: Система интерпретирует действия пользователя в интерфейсе (клик в строке поиска) как обратную связь по качеству распознавания и использует n-best list для корректировки запроса до того, как он будет окончательно сформулирован и отправлен в системы ранжирования.

Входные данные:

  • Голосовой ввод (аудиоданные) от пользователя.
  • N-best list от службы распознавания речи.
  • Действия пользователя в UI (клик мышью или касание).

Выходные данные:

  • Текстовая интерпретация запроса в строке поиска.
  • Динамически изменяемое содержимое области подсказок (сначала подсказки к первой интерпретации, затем альтернативные интерпретации).

На что влияет

Патент сфокусирован исключительно на механизме ввода запроса и не оказывает влияния на обработку контента или ранжирование.

  • Взаимодействие с интерфейсом: Влияет на то, как пользователь взаимодействует со строкой поиска и областью подсказок при использовании голосового ввода.
  • Типы запросов: Применимо к любым запросам, вводимым голосом, независимо от их типа (информационные, транзакционные и т.д.), тематики или языка.

Когда применяется

Алгоритм применяется при выполнении следующих условий:

  • Условие 1: Пользователь использовал голосовой ввод для генерации поискового запроса.
  • Условие 2: Система отобразила наиболее вероятную интерпретацию и соответствующие ей подсказки.
  • Триггер активации: Пользователь совершает действие, интерпретируемое как намерение исправить результат распознавания. В патенте это действие конкретизировано как клик в строке поиска (Search Box Display Area).

Пошаговый алгоритм

Процесс обработки голосового ввода и коррекции ошибок.

  1. Получение ввода: Система получает голосовой поисковый запрос от пользователя.
  2. Интерпретация и генерация списка: Голосовой ввод обрабатывается для генерации n-best list слов и фраз, соответствующих вводу. Каждая интерпретация имеет оценку вероятности.
  3. Отображение первичного результата: Наиболее вероятная интерпретация из списка отображается в строке поиска.
  4. Отображение первичных подсказок: В области подсказок (Suggestion Display Area) отображаются поисковые подсказки, связанные с этой интерпретацией.
  5. Мониторинг взаимодействия: Система отслеживает действия пользователя.
  6. Обнаружение индикации ошибки: Если пользователь кликает в строке поиска, это интерпретируется как сигнал о несоответствии (ошибке распознавания).
  7. Предоставление альтернатив: Если обнаружен сигнал о несоответствии, система заменяет содержимое области подсказок на список альтернативных интерпретаций из n-best list.
  8. Смешанное отображение (Опционально): Система может также отображать поисковые подсказки для этих альтернативных интерпретаций, распределяя их количество пропорционально оценкам вероятности (согласно Claim 9).

Какие данные и как использует

Данные на входе

Патент фокусируется на интерфейсном взаимодействии и использует следующие данные:

  • Мультимедиа факторы: Голосовой ввод (voice input) пользователя (аудиоданные).
  • Пользовательские факторы (Поведенческие в UI): Сигналы взаимодействия пользователя с интерфейсом. Конкретно — клик пользователя в строке поиска после выполнения голосового ввода.
  • Системные данные (ASR): Предварительно сгенерированный n-best list интерпретаций, полученный от системы распознавания речи.

Контентные, ссылочные, технические и другие факторы ранжирования в патенте не используются.

Какие метрики используются и как они считаются

В патенте упоминается одна ключевая метрика, используемая для принятия решений:

  • Likelihood / Confidence Score (Оценка вероятности / Уверенности): Метрика, присваиваемая каждой интерпретации в n-best list системой ASR. Патент не описывает, как эта метрика рассчитывается, но указывает, как она используется:
    • Для определения «наиболее вероятной интерпретации» (интерпретация с наивысшей оценкой).
    • Для ранжирования альтернативных интерпретаций при их отображении.
    • (Опционально) Для определения количества поисковых подсказок, отображаемых для каждой альтернативной интерпретации (пропорционально оценке).

Выводы

  1. Патент строго о UI/UX и ASR, а не о SEO: Изобретение описывает механизм улучшения пользовательского опыта при голосовом поиске путем упрощения процесса исправления ошибок распознавания речи. Он не имеет отношения к ранжированию веб-ресурсов.
  2. Использование неявных поведенческих сигналов: Google использует естественные действия пользователя в интерфейсе (клик для редактирования) как неявный сигнал (indication) того, что распознавание речи было неверным.
  3. Динамическое использование области подсказок: Область подсказок (Suggestion Display Area) используется динамически. Она переключается между показом подсказок для текущего текста и показом альтернативных вариантов распознавания из n-best list в зависимости от действий пользователя.
  4. Цель — снижение трения: Основная цель — снизить барьер для использования голосового поиска и предотвратить переключение пользователя на ручной ввод текста при первой же ошибке.
  5. Отсутствие влияния на SEO-стратегию: Патент не содержит информации об алгоритмах ранжирования или факторах качества. Для SEO-специалистов этот патент не предоставляет практических выводов по оптимизации сайтов.

Практика

Best practices (это мы делаем)

Патент является инфраструктурным (описывает UI/ASR) и не дает практических выводов для SEO.

Патент описывает внутренние процессы интерфейса Google без прямых рекомендаций для SEO-оптимизации веб-сайтов. Он подтверждает, что Google инвестирует в удобство голосового поиска, что косвенно подчеркивает важность оптимизации под естественно звучащие запросы, но сам механизм не меняет принципов этой оптимизации.

Worst practices (это делать не надо)

Патент не выявляет неэффективных или опасных SEO-тактик, так как не связан с ранжированием, оценкой качества контента или борьбой со спамом.

Стратегическое значение

Стратегическое значение для SEO минимально. Патент интересен с точки зрения понимания того, как Google совершенствует свои интерфейсы и технологии распознавания речи (ASR). Более качественное распознавание и удобное исправление ошибок означают, что система ранжирования получает более точный запрос пользователя. Однако это не меняет того, как SEO-специалистам следует оптимизировать контент для ответа на эти запросы.

Практические примеры

Практических примеров применения для SEO нет. Патент описывает работу интерфейса.

Пример работы интерфейса (не SEO):

  1. Пользователь говорит: "Spice" (Специи).
  2. Система распознает (ASR): Генерирует n-best list. Например: 1. Pies (Пироги) - 80% уверенности; 2. Prize (Приз) - 15% уверенности; 3. Spice (Специи) - 5% уверенности.
  3. Отображение (UI): В строке поиска появляется текст "Pies". В области подсказок появляются варианты: "Pies recipes", "Pies near me".
  4. Реакция пользователя: Пользователь видит ошибку и кликает курсором в строку поиска после слова "Pies", намереваясь его исправить.
  5. Активация механизма: Система обнаруживает клик и интерпретирует его как сигнал ошибки.
  6. Коррекция (UI): Содержимое области подсказок меняется. Теперь там отображаются альтернативы из n-best list: "Prize", "Spice".
  7. Результат: Пользователь быстро выбирает правильный вариант "Spice" из списка, не прибегая к ручному вводу.

Вопросы и ответы

Влияет ли этот патент на то, как Google ранжирует сайты?

Нет, этот патент не влияет на ранжирование. Он описывает исключительно пользовательский интерфейс (UI) и механизм исправления ошибок автоматического распознавания речи (ASR). Процесс происходит на стороне клиента до того, как финальный запрос отправляется в систему ранжирования.

Что такое "N-best list" в контексте голосового поиска?

N-best list — это список наиболее вероятных текстовых интерпретаций того, что произнес пользователь, сгенерированный системой распознавания речи (ASR). Каждому варианту присваивается оценка уверенности. Система обычно показывает вариант с наивысшей оценкой, но использует остальные в качестве альтернатив на случай ошибки.

Как система понимает, что распознала голос неверно?

Согласно патенту, система использует неявный поведенческий сигнал. Если после голосового ввода пользователь кликает в строку поиска (Search Box Display Area), где отображается распознанный текст, система интерпретирует это как намерение исправить ошибку и активирует показ альтернативных вариантов.

Меняет ли этот патент подход к оптимизации под голосовой поиск (Voice Search Optimization)?

Нет, этот патент не меняет принципы SEO-оптимизации. Рекомендации по созданию контента, отвечающего на естественно звучащие запросы, остаются прежними. Патент лишь описывает, как Google старается точнее понять, что именно спросил пользователь, если возникла ошибка ввода.

Где именно отображаются альтернативные варианты распознавания?

Альтернативные варианты отображаются в той же области интерфейса, где обычно показываются поисковые подсказки (Suggestion Display Area), расположенной под строкой поиска. При активации механизма они заменяют собой стандартные подсказки.

Показывает ли система только альтернативные слова или также подсказки к ним?

Патент описывает оба варианта. Система может показать только список альтернативных интерпретаций. Также она может показать смешанный вид: альтернативные интерпретации вместе с поисковыми подсказками (например, "Искать [альтернатива]") для каждой из них.

Если система показывает подсказки для нескольких альтернатив, как она решает, сколько подсказок показать для каждой?

В патенте (Claim 9) указано, что количество подсказок может быть пропорционально оценке уверенности (likelihood) или вероятности этой альтернативной интерпретации. Для более вероятных альтернатив может быть показано больше подсказок.

Актуален ли этот механизм в эпоху Google Assistant?

Принцип использования n-best list для исправления ошибок остается актуальным. Однако конкретный триггер (клик в строке поиска) может быть менее релевантным в чисто диалоговых интерфейсах (Voice User Interfaces), где строка поиска отсутствует. Интерфейсы эволюционировали с момента подачи патента.

Какую пользу этот патент несет SEO-специалисту?

Практическая польза минимальна. Патент дает понимание того, как работает интерфейс Google и как обрабатываются ошибки ввода, но не предоставляет инструментов или стратегий для влияния на ранжирование или видимость сайта.

Может ли этот механизм привести к тому, что пользователь увидит результаты по нерелевантному запросу?

Теоретически да, если система ASR неверно распознает запрос и пользователь не заметит ошибку. Задача этого патента как раз в том, чтобы минимизировать такие ситуации, облегчая пользователю выбор правильной интерпретации до начала поиска.

Похожие патенты

Как Google исправляет ошибки распознавания голосовых запросов с помощью последующих уточнений пользователя
Google позволяет пользователям исправлять ошибки распознавания голоса естественным образом (например, фразой «Нет, я имел в виду...»). Система анализирует исходный запрос и последующее уточнение, генерирует кандидатов на исправление, оценивает их популярность и фонетическое сходство, и формирует новый, корректный поисковый запрос.
  • US9514743B2
  • 2016-12-06
  • Семантика и интент

Как Google исправляет грамматически некорректные запросы пользователей, изучающих язык, предлагая альтернативы
Патент описывает систему, преимущественно для голосовых ассистентов, которая определяет, что пользователь сформулировал запрос грамматически некорректно («плохо сформированная фраза») на неродном для него языке. Вместо выполнения команды система предлагает корректный вариант («хорошо сформированную фразу»), используя для этого предварительно рассчитанные векторные представления (embeddings) и анализ языковой компетентности пользователя.
  • US12019999B2
  • 2024-06-25
  • Семантика и интент

  • Мультиязычность

Как Google визуально и аудиально сигнализирует об уверенности в подсказках автозаполнения (Auto-Complete)
Google использует систему для улучшения UX при вводе запроса, рассчитывая вероятность того, что подсказка автозаполнения соответствует намерению пользователя. Если вероятность для лучшей подсказки превышает определенный порог, Google может визуально или аудиально выделить ее (например, подсветкой, гистограммой или звуком), чтобы ускорить выбор пользователя.
  • US8412728B1
  • 2013-04-02
  • Семантика и интент

Как Google предлагает несколько вариантов исправления опечаток в запросе и динамически обновляет выдачу без перезагрузки страницы
Google использует механизм для улучшения пользовательского опыта при обработке неоднозначных опечаток. Система предлагает несколько вариантов исправления, включая «агрессивные» (сильно отличающиеся от оригинала). При выборе варианта результаты поиска обновляются динамически, часто без перезагрузки страницы, в том числе в режиме «Живого поиска» (Search as you type).
  • US8583672B1
  • 2013-11-12
  • SERP

  • Семантика и интент

Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности
Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.
  • US8868591B1
  • 2014-10-21
  • Семантика и интент

Популярные патенты

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников
Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.
  • US8745067B2
  • 2014-06-03
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
  • US8583675B1
  • 2013-11-12
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

seohardcore