SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google исправляет ошибки распознавания голосовых запросов с помощью последующих уточнений пользователя

QUERY REWRITE CORRECTIONS (Коррекция путем перезаписи запроса)
  • US9514743B2
  • Google LLC
  • 2015-07-29
  • 2016-12-06
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google позволяет пользователям исправлять ошибки распознавания голоса естественным образом (например, фразой «Нет, я имел в виду...»). Система анализирует исходный запрос и последующее уточнение, генерирует кандидатов на исправление, оценивает их популярность и фонетическое сходство, и формирует новый, корректный поисковый запрос.

Описание

Какую проблему решает

Патент решает проблему ошибок автоматического распознавания речи (Automatic Speech Recognition, ASR) при голосовом поиске. Когда система неверно распознает голосовой запрос, пользователю часто приходится начинать процесс заново. Изобретение улучшает взаимодействие с пользователем, позволяя исправлять ошибки распознавания естественным, разговорным способом, без необходимости повторять весь запрос.

Что запатентовано

Запатентована система обработки естественного языка, которая интерпретирует последующий голосовой ввод как коррекцию предыдущего запроса. Система определяет, содержит ли второй запрос команду на исправление (например, «Нет, я имел в виду...»), идентифицирует ошибочно распознанную часть первого запроса и заменяет ее на основе информации из второго запроса, формируя скорректированный запрос (corrected recognition output).

Как это работает

Механизм активируется, когда пользователь после первого голосового запроса вводит второй.

  • Обнаружение триггера: Система анализирует второй запрос на наличие correction prefix (например, «No I meant») или соответствие одной из грамматик коррекции (например, повторение части запроса, указание на категорию, диктовка по буквам).
  • Генерация кандидатов: Если триггер обнаружен, система генерирует кандидатов на исправление (candidate corrections). Используются различные источники: прямое распознавание второго запроса, альтернативные гипотезы распознавания, фонетически похожие термины из Misrecognition Index, а также анализ типа/категории.
  • Оценка кандидатов: Кандидаты оцениваются по нескольким факторам, включая фонетическое сходство (phonetic quality) между исправлением и ошибкой, а также популярность (query popularity) итогового скорректированного запроса на основе логов.
  • Выбор и перезапись: Кандидат с наивысшей оценкой, превышающей порог, используется как новый поисковый запрос.

Актуальность для SEO

Высокая. Голосовой поиск и диалоговые интерфейсы (Conversational AI) являются стратегическими направлениями развития. Способность системы корректно обрабатывать ошибки распознавания речи и поддерживать контекст разговора критически важна для удобства пользователей современных голосовых ассистентов.

Важность для SEO

Влияние на SEO минимальное (2/10). Патент описывает инфраструктурные процессы на этапе понимания запроса (Query Understanding), а именно — обработку голосового ввода до того, как запрос поступит в систему ранжирования. Он не содержит информации об алгоритмах ранжирования, индексирования или факторах качества контента. Для SEO-специалистов он дает понимание того, как Google обрабатывает фонетическую неоднозначность и использует данные о популярности запросов для уточнения ввода пользователя.

Детальный разбор

Термины и определения

Candidate Corrections (Кандидаты на исправление)
Набор потенциальных исправленных запросов, сгенерированных системой путем модификации первого запроса на основе второго.
Correction Prefix (Префикс коррекции)
Начальная фраза во втором запросе, указывающая на намерение пользователя исправить предыдущий запрос (например, «No I meant», «I said»).
Correction Request (Запрос на коррекцию)
Второй голосовой запрос, который система идентифицирует как попытку исправить ошибку распознавания в первом запросе.
Misrecognition Index (Индекс ошибок распознавания)
База данных, содержащая фонетически похожие n-граммы. Используется для поиска потенциальных замен для ошибочно распознанного термина с учетом контекста или типа.
Phonetic Distance / Phonetic Quality (Фонетическое расстояние / Фонетическое качество)
Мера схожести звучания между исходным термином и термином-кандидатом. Используется для оценки вероятности того, что один термин был ошибочно распознан как другой.
Query Popularity / Query Quality (Популярность запроса / Качество запроса)
Метрика, оценивающая вероятность того, что пользователь намеревался ввести именно этот запрос. Основывается на частоте использования запроса в логах (query logs) и его семантическом качестве.
Recognition Output (Результат распознавания)
Текстовая транскрипция голосового запроса, полученная с помощью системы распознавания речи (ASR).
Voice Query (Голосовой запрос)
Аудиоввод пользователя, предназначенный для поиска.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обработки последовательных голосовых запросов.

  1. Система получает первый голосовой запрос и генерирует его текстовое распознавание.
  2. Система получает второй голосовой запрос.
  3. Определяется, что распознавание второго запроса активирует запрос на коррекцию. Ключевой момент: это определение включает парсинг второго запроса для обнаружения correction prefix.
  4. Используя распознавание первого и второго запросов, система генерирует набор кандидатов на исправление.
  5. Каждый кандидат оценивается (scoring).
  6. Генерируется скорректированный результат распознавания для кандидата, чья оценка удовлетворяет пороговому значению.

Claim 2 (Зависимый): Детализирует процесс генерации кандидатов.

  1. Определяется ошибочно распознанная часть (misrecognition portion) первого результата распознавания.
  2. Эта часть заменяется одной или несколькими кандидатными n-граммами для формирования кандидата на исправление.

Claim 3 (Зависимый): Указывает источники для получения кандидатных n-грамм.

  • Распознавание корректирующей части второго запроса.
  • Сгенерированные гипотезы (альтернативные варианты распознавания) корректирующей части второго запроса.
  • Misrecognition index, содержащий фонетически похожие n-граммы.
  • N-граммы, ассоциированные с типом или категорией, связанными с корректирующей частью второго запроса.

Claim 4 (Зависимый): Указывает фактор оценки.

  • Оценка кандидата основывается, по крайней мере частично, на phonetic distance между кандидатом на исправление и первым голосовым вводом.

Claim 5, 6, 7 (Зависимые): Указывают дополнительные факторы оценки.

  • Оценка кандидата основывается на query popularity (Claim 5).
  • Популярность определяется по количеству совпадений в query log (Claim 6).
  • Популярность основывается на изменении популярности между первым запросом и кандидатом на исправление (Claim 7).

Где и как применяется

Изобретение полностью находится на этапе обработки ввода пользователя.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система (в частности, Voice Query Correction Engine) работает в режиме реального времени сразу после получения голосового ввода и его первичной транскрипции с помощью Voice Recognition Engine (ASR).

  1. Обработка последовательности: Система анализирует два последовательных голосовых запроса в рамках одной сессии.
  2. Интерпретация намерения: Определяется, является ли второй запрос новым поиском или попыткой исправить первый. Это происходит путем анализа грамматик и поиска correction prefix.
  3. Перезапись запроса (Query Rewriting): Если это коррекция, система генерирует и оценивает альтернативные формулировки запроса, используя лингвистические, фонетические и статистические данные.
  4. Финальный запрос: Скорректированный текстовый запрос затем передается на этап RANKING.

Входные данные:

  • Аудиоданные первого и второго голосовых запросов.
  • Результаты распознавания (транскрипции) и альтернативные гипотезы ASR для обоих запросов.
  • Misrecognition Index (фонетические данные).
  • Query Logs (статистические данные о популярности запросов).

Выходные данные:

  • Единый скорректированный текстовый запрос (corrected recognition output).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на голосовые запросы, содержащие имена собственные, названия брендов, топонимы или термины, которые имеют фонетически схожие, но семантически разные варианты (омофоны или близкие по звучанию слова). Пример в патенте: [Baroque artists] vs [Broke artists].
  • Типы контента и Ниши: Патент не делает различий по типам контента или тематикам. Он применяется универсально ко всем голосовым взаимодействиям.

Когда применяется

  • Условия работы: Алгоритм применяется в рамках одной поисковой сессии при получении последовательных голосовых вводов.
  • Триггеры активации: Активация происходит, когда система обнаруживает, что второй голосовой запрос соответствует одной из предопределенных грамматик коррекции. Патент приводит примеры таких грамматик, включая:
    • Использование correction prefix («No I meant...»).
    • Команда замены («No, not X, Y»).
    • Уточнение типа или категории («I meant the country»).
    • Диктовка по буквам («It's spelled O-S-L-O»).

Пошаговый алгоритм

Этап 1: Получение и первичное распознавание

  1. Система получает первый голосовой запрос.
  2. Генерируется первый результат распознавания (транскрипция) с помощью ASR. (Например, пользователь сказал «Baroque artists», система распознала [Broke artists]).
  3. Система получает второй голосовой запрос. (Например, «No I meant baroque artists»).

Этап 2: Детекция коррекции

  1. Система анализирует распознавание второго запроса на наличие триггеров коррекции.
  2. Проверяется соответствие грамматикам коррекции, например, ищется correction prefix.
  3. Если коррекция не обнаружена, второй запрос обрабатывается как новый поиск.
  4. Если коррекция обнаружена, запускается процесс исправления.

Этап 3: Генерация кандидатов (Candidate Generation)

  1. Система определяет ошибочно распознанную часть первого запроса и корректирующую информацию из второго запроса.
  2. Генерируются кандидаты на исправление с использованием нескольких методов:
    • Прямое распознавание: Использование распознанной корректирующей части из второго запроса для замены.
    • Гипотезы ASR: Использование альтернативных вариантов распознавания второго запроса (если ASR не уверена).
    • Misrecognition Analysis: Поиск в Misrecognition Index терминов, которые фонетически похожи на ошибочный термин.
    • Spelling Analysis: Если пользователь продиктовал слово по буквам, система собирает его.
    • Type/Category Analysis: Если пользователь указал категорию (например, «I meant the country»), система ищет фонетически похожие термины в этой категории.

Этап 4: Оценка кандидатов (Candidate Scoring)

  1. Каждый кандидат оценивается для определения его достоверности. Используются следующие факторы:
    • Grammar matching: Уверенность системы в том, что грамматика коррекции была распознана верно.
    • Replacement phonetic quality: Оценка фонетического сходства. Насколько вероятно, что кандидат мог быть ошибочно распознан как исходный термин.
    • Query quality: Оценка популярности и семантического качества итогового кандидата (на основе query logs).
    • Replacement query quality: Оценка улучшения качества запроса по сравнению с исходным (например, сравнивается популярность [Baroque artists] и [Broke artists]).
  2. Факторы комбинируются (возможно, с весами) для получения итоговой оценки кандидата.

Этап 5: Выбор и применение

  1. Выбирается кандидат с наивысшей оценкой.
  2. Если оценка превышает установленный порог уверенности, этот кандидат принимается как corrected recognition output.
  3. Скорректированный запрос используется для поиска и предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на обработке ввода и не упоминает традиционные SEO-факторы (контентные, ссылочные, технические).

  • Пользовательские факторы (Ввод): Аудиоданные (Voice Queries) от пользователя.
  • Системные данные (ASR): Текстовые транскрипции (Recognition Output) и альтернативные гипотезы распознавания речи.
  • Фонетические данные: Misrecognition Index — база данных фонетически схожих n-грамм и их фонетических представлений.
  • Поведенческие факторы (Статистика): Query Logs — исторические данные о частоте использования запросов, используемые для определения Query Popularity.
  • Лингвистические данные: Предопределенные грамматики и префиксы (Correction Prefix) для идентификации намерения коррекции.

Какие метрики используются и как они считаются

  • Grammar Matching Confidence: Вероятность того, что второй запрос соответствует определенной грамматике коррекции.
  • Replacement Phonetic Quality: Рассчитывается на основе фонетического расстояния (phonetic distance), например, с использованием фонетического редакционного расстояния (phonetic edit distance) между n-граммами.
  • Query Popularity: Определяется на основе подсчета количества раз, когда запрос был введен пользователями, согласно query logs.
  • Query Quality: Агрегированная метрика, включающая Query Popularity, семантическое качество запроса (pattern of the query) и вероятность того, что запрос приведет к прямому ответу (answer box).
  • Replacement Query Quality: Сравнение Query Quality исходного запроса и скорректированного запроса. Оценивает степень улучшения запроса после перезаписи.

Выводы

  1. Фокус на диалоговом взаимодействии: Патент демонстрирует стремление Google сделать голосовой поиск более естественным и устойчивым к ошибкам распознавания речи, имитируя человеческий диалог.
  2. Комбинированный подход к пониманию: Система использует комбинацию лингвистических правил (грамматики, префиксы), фонетического анализа (Misrecognition Index, Phonetic Distance) и статистических данных (Query Popularity) для интерпретации намерений пользователя.
  3. Важность Query Logs: Популярность запроса (Query Popularity) является ключевым фактором для валидации исправлений. Система предпочитает исправления, которые приводят к часто используемым запросам.
  4. Использование семантики для уточнений: Механизм Type/Category analysis показывает, что Google использует понимание сущностей и их типов для разрешения неоднозначностей (например, если пользователь говорит «я имел в виду страну», система ищет сущности типа «Country»).
  5. Инфраструктурный характер: Патент описывает внутренние механизмы обработки ввода (ASR/NLP) и не дает прямых практических рекомендаций для SEO-оптимизации контента или сайтов.

Практика

Best practices (это мы делаем)

Хотя патент является инфраструктурным и направлен на улучшение распознавания речи, он дает некоторое понимание приоритетов Google, которое можно учитывать в SEO-стратегии:

  • Ориентация на устоявшиеся интенты: Система использует Query Popularity как важный сигнал для подтверждения корректности запроса. Это подтверждает важность оптимизации под запросы, которые реально используются аудиторией, а не под искусственно созданные или крайне редкие формулировки.
  • Использование ясного и распространенного языка: При оптимизации под голосовой поиск следует использовать естественные формулировки, которые менее подвержены фонетической неоднозначности. Это снижает риск первичного неправильного распознавания ASR-системами.
  • Четкое определение сущностей и их типов: Механизм Type/Category analysis показывает, что система может использовать категории для исправления ошибок. Использование структурированных данных (Schema.org) и четкое позиционирование контента помогает Google правильно идентифицировать тип сущности (например, продукт, место, организация), что может косвенно помочь в разрешении неоднозначностей при голосовом вводе.

Worst practices (это делать не надо)

  • Попытки манипулировать механизмом коррекции: Этот механизм работает на уровне обработки ввода пользователя и не поддается влиянию со стороны SEO-специалистов.
  • Оптимизация под фонетически сложные или двусмысленные термины без контекста: Если бренд или продукт имеет сложное название, необходимо предоставлять достаточно контекста на странице и использовать структурированные данные, чтобы помочь системам понять тематику и тип сущности.

Стратегическое значение

Патент подтверждает стратегический курс Google на развитие голосового поиска и диалоговых систем. Для SEO это означает необходимость адаптации стратегий к миру, где ввод информации все чаще осуществляется голосом. Понимание того, как Google обрабатывает ошибки и уточнения на лету, подчеркивает важность не только точного соответствия ключевым словам, но и глубокого понимания интента, контекста пользователя, а также использования данных о популярности запросов для валидации этого интента.

Практические примеры

Сценарий: Исправление названия бренда через указание категории (использование Type/Category Analysis)

  1. Ситуация: SEO-специалист продвигает сайт компании «Cybereason» (решения по кибербезопасности).
  2. Исходный голосовой запрос (Q1): Пользователь говорит «Cybereason».
  3. Распознавание Q1: Система ошибочно распознает как [Cyber raisin] (Кибер изюм).
  4. Второй голосовой запрос (Q2): Пользователь говорит «No, I meant the security company».
  5. Активация механизма: Система распознает correction prefix «No, I meant» и определяет категорию «security company».
  6. Генерация кандидатов (Type/Category Analysis): Система ищет сущности в категории «security company», которые фонетически похожи на [Cyber raisin].
  7. Выбор кандидата: «Cybereason» идентифицируется как подходящий кандидат с высоким phonetic quality и соответствующим типом.
  8. Результат: Система перезаписывает запрос на [Cybereason] и выдает релевантные результаты.
  9. Действие SEO: Убедиться, что компания четко ассоциирована с категорией «security company» в Knowledge Graph и на собственном сайте (например, через Schema.org/Organization), чтобы облегчить системе процесс идентификации типа сущности при голосовой коррекции.

Вопросы и ответы

Влияет ли этот патент на ранжирование сайтов?

Нет, напрямую не влияет. Патент описывает процесс обработки и исправления голосового ввода пользователя (Query Understanding) до того, как запрос поступит в систему ранжирования. Он определяет, *какой именно* текстовый запрос будет использоваться для поиска, но не описывает, *как* будут ранжироваться результаты по этому запросу.

Что такое «Misrecognition Index» и как он формируется?

Это база данных, которая содержит фонетически похожие n-граммы. Она используется для быстрого поиска слов, которые звучат похоже на ошибочно распознанный термин. Индекс может формироваться путем анализа фонетических представлений слов и, возможно, на основе исторических данных о том, какие слова часто путаются системами ASR.

Почему Google использует популярность запроса (Query Popularity) для оценки исправлений?

Query Popularity, основанная на Query Logs, служит статистической валидацией. Если исправление приводит к запросу, который часто используется людьми (например, [Baroque artists]), это значительно повышает уверенность системы в том, что исправление верно, по сравнению с запросом, который никто не ищет (например, [Broke artists]).

Что такое грамматики коррекции (Correction Grammars)?

Это предопределенные шаблоны фраз, которые пользователи естественным образом используют для исправления ошибок. Примеры включают использование префиксов («Нет, я имел в виду X»), указание на замену («Не X, а Y»), уточнение категории («Я имел в виду страну») или диктовку по буквам. Система ищет соответствие этим грамматикам во втором голосовом запросе.

Как система обрабатывает ситуацию, когда второй (корректирующий) запрос тоже распознан неверно?

Патент учитывает это. Система использует альтернативные гипотезы распознавания речи (Hypothesis of correcting query). Если основной вариант распознавания не дает хороших кандидатов, система проверяет другие вероятные транскрипции того же аудиоввода, чтобы найти корректное исправление.

Что означает «Type/Category analysis» в контексте этого патента?

Это механизм, который активируется, если пользователь уточняет запрос, указывая на тип или категорию объекта, а не повторяя само слово. Например, если после ошибки [president of friends] пользователь говорит «Я имел в виду страну», система будет искать сущности типа «Country», которые фонетически похожи на «friends» (например, «France»).

Есть ли смысл оптимизировать контент под фонетические вариации ключевых слов?

Нет, этот патент направлен на то, чтобы исправить фонетические ошибки на этапе ввода, а не на то, чтобы искать контент, соответствующий ошибкам. Цель системы — определить истинное намерение пользователя и сформировать корректный текстовый запрос. Оптимизировать нужно под корректные формулировки.

Как этот патент связан с оптимизацией под голосовой поиск (Voice Search Optimization)?

Он помогает понять, как Google обрабатывает голосовой ввод. Для VSO это подчеркивает важность использования естественного языка и ориентации на популярные запросы (Query Popularity), так как они с большей вероятностью будут корректно интерпретированы и валидированы системой.

Что произойдет, если система не уверена в предложенном исправлении?

Если ни один из кандидатов на исправление не набирает оценку выше установленного порога (threshold value), система может проигнорировать попытку коррекции. В этом случае она может либо использовать исходный (ошибочный) результат первого запроса, либо обработать второй запрос как новый поиск, в зависимости от реализации.

Может ли использование микроразметки помочь этому алгоритму?

Косвенно да. Если система использует Type/Category analysis, ей необходимо знать типы сущностей. Микроразметка (Schema.org) помогает Google лучше понимать сущности и их типы (например, отличать компанию от продукта или места). Это может улучшить способность системы находить правильные замены в нужной категории при голосовой коррекции.

Похожие патенты

Как Google улучшает интерфейс голосового поиска, предлагая альтернативные варианты распознавания при ошибке ввода
Google использует механизм улучшения пользовательского опыта в голосовом поиске. Если система неверно распознала голосовой запрос и пользователь кликает в строку поиска для исправления, Google автоматически показывает другие вероятные варианты распознавания (n-best list) в области подсказок, облегчая коррекцию ошибки.
  • US8249876B1
  • 2012-08-21
  • Семантика и интент

  • Поведенческие сигналы

Как Google исправляет грамматически некорректные запросы пользователей, изучающих язык, предлагая альтернативы
Патент описывает систему, преимущественно для голосовых ассистентов, которая определяет, что пользователь сформулировал запрос грамматически некорректно («плохо сформированная фраза») на неродном для него языке. Вместо выполнения команды система предлагает корректный вариант («хорошо сформированную фразу»), используя для этого предварительно рассчитанные векторные представления (embeddings) и анализ языковой компетентности пользователя.
  • US12019999B2
  • 2024-06-25
  • Семантика и интент

  • Мультиязычность

Как Google использует контекст запроса для исправления опечаток и понятийных ошибок, анализируя результаты поиска по оставшимся словам
Google использует механизм для исправления сложных, редких или понятийно ошибочных запросов. Если система идентифицирует потенциально неточный термин (опечатку или перепутанное название), она временно удаляет его и выполняет поиск по оставшимся словам. Затем анализируется контент найденных страниц (заголовки, анкоры, URL), чтобы определить правильный термин для замены, обеспечивая релевантную выдачу даже при ошибках пользователя.
  • US8868587B1
  • 2014-10-21
  • Семантика и интент

Как Google использует контекст поисковой сессии для исправления ошибок и уточнения запросов пользователя
Google использует механизм для интеллектуального исправления ошибок в запросах (опечаток или неверно употребленных слов), опираясь на контекст текущей поисковой сессии. Вместо стандартного исправления по словарю, система анализирует предыдущие запросы пользователя, чтобы понять его намерение, и предлагает вариант исправления, который соответствует теме поиска.
  • US7953746B1
  • 2011-05-31
  • Семантика и интент

  • Персонализация

Как Google визуально выделяет популярные профили в поиске и использует частоту запросов для борьбы с фейковыми аккаунтами
Google использует данные о популярности (количество связей) и качестве (вовлеченность) профилей пользователей, чтобы визуально выделить наиболее авторитетные результаты при поиске людей или брендов. Если один профиль значительно популярнее других, он отображается крупнее. Система также динамически регулирует порог качества в зависимости от частоты запроса: чем популярнее имя, тем выше требования к профилю для его отображения, что помогает бороться со спамом.
  • US8935245B1
  • 2015-01-13
  • SERP

  • Антиспам

  • EEAT и качество

Популярные патенты

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске
Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").
  • US8782030B1
  • 2014-07-15
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
  • US8538989B1
  • 2013-09-17
  • Семантика и интент

  • Индексация

  • Структура сайта

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует реальные данные о скорости загрузки страниц (RUM) для повышения быстрых и понижения медленных сайтов в выдаче
Google собирает данные о времени загрузки страниц у реальных пользователей (RUM) и использует их для корректировки ранжирования. Система сравнивает скорость сайта с глобальными порогами, основанными на процентилях. Если сайт медленнее большинства других (например, медленнее 85% или 96%), его рейтинг понижается. Очень быстрые сайты могут получать повышение. Оценка скорости учитывает географию и тип устройства пользователя.
  • US8645362B1
  • 2014-02-04
  • Техническое SEO

  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)
Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.
  • US10146829B2
  • 2018-12-04
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
  • US8041568B2
  • 2011-10-18
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
  • US10073911B2
  • 2018-09-11
  • Индексация

  • Краулинг

  • Ссылки

seohardcore