
Google использует механизм для исправления сложных, редких или понятийно ошибочных запросов. Если система идентифицирует потенциально неточный термин (опечатку или перепутанное название), она временно удаляет его и выполняет поиск по оставшимся словам. Затем анализируется контент найденных страниц (заголовки, анкоры, URL), чтобы определить правильный термин для замены, обеспечивая релевантную выдачу даже при ошибках пользователя.
Патент решает проблему неэффективности традиционных методов коррекции запросов (основанных на истории логов или словарях) при обработке сложных случаев. К ним относятся уникальные запросы, редкие запросы (long-tail queries), запросы с опечатками, которые трудно исправить (например, омофоны), и запросы типа "класс-экземпляр" (class-instance queries), где пользователи путают взаимозаменяемые понятия (например, бренды или телеканалы).
Запатентована система коррекции запросов, которая идентифицирует потенциально неточный термин (potentially inaccurate term) и генерирует "производные запросы" (derivative queries) без этого термина. Система анализирует ресурсы, найденные по этим производным запросам, чтобы определить подходящий термин для замены. Ключевая особенность — коррекция определяется на основе контента найденных ресурсов, а не на основе анализа результатов исходного (ошибочного) запроса.
Механизм работает в несколько этапов:
Resource Quality Measure).corrected query), который используется для финального поиска или предлагается пользователю.Высокая. Понимание запросов, особенно сложных, редких и содержащих ошибки, является центральной задачей поисковых систем. Способность использовать контекст оставшихся слов для исправления ошибок остается критически важной для обеспечения качества поиска, особенно с ростом голосового ввода и разнообразия пользовательских формулировок. Один из изобретателей, Trystan Upstill, является ключевым инженером в области понимания запросов Google.
Патент имеет высокое значение (8/10) для понимания механизмов обработки запросов Google. Он демонстрирует, как система использует контекст, предоставляемый точными терминами в запросе, для исправления неточных. Это подчеркивает критическую важность использования четких, общепринятых формулировок, фраз (n-грамм) и терминологии в ключевых элементах документа (Title, Anchors, URL), поскольку именно эти элементы используются для генерации и валидации терминов на замену.
commonly confused terms). Например, названия телеканалов (NBC, ABC, CBS) или омофоны.Corrected Term), найденный системой.Potentially Inaccurate Term (при типографической ошибке) или путем его замены на другой термин из того же класса (при ошибке класса).Typographic Error Criterion и Class Criterion.search scores) или авторитетности.Патент описывает два основных сценария коррекции: исправление типографических ошибок и исправление ошибок класса (понятийных ошибок).
Claim 1 (Независимый пункт): Описывает общий фреймворк.
Inaccuracy Criterion. Это определение основано, по крайней мере частично, на том, что Resource Quality Measure результатов исходного запроса НЕ достигает порогового значения (т.е. выдача низкого качества).Potentially Inaccurate Term.Derivative Queries, которые НЕ включают этот термин.Corrected Term на основе этих наборов ресурсов. Критически важно: этот выбор происходит независимо от результатов исходного запроса.Corrected Query путем замены неточного термина.Corrected Query.Сценарий 1: Типографические ошибки (Claims 2-9)
Claim 2, 3, 4: Детализируют критерий неточности как "типографически некорректный" термин. Производный запрос генерируется путем удаления неточного термина (Claim 2). Термин считается некорректным, если:
Synonym Quality Measure НЕ достигает порога (Claim 3).Usage Quality Measure (качество использования синонимов термина в контексте ресурсов) также низкая (Claim 4).Claim 5: Уточняет, что Usage Quality Measure основана на использовании синонимов в биграммах (bigram usage), заголовках (title usage) и анкорном тексте (anchor usage).
Claim 6: Описывает процесс выбора исправления.
similarity measure) с неточным термином.Claim 7, 8, 9: Уточняют источники кандидатов: заголовки ресурсов (title terms), анкорный текст (anchor terms), термины в URL (uniform resource locator terms), а также предложения запросов (term suggestions), совпадающие по основе (term stem) с неточным термином.
Сценарий 2: Ошибки класса (Claims 10-11)
Claim 10: Детализирует критерий неточности как принадлежность термина к Class of Related Terms.
Derivative Queries генерируются путем замены неточного термина на каждого из этих кандидатов.Claim 11: Описывает процесс выбора исправления.
Resource Quality Measure.Изобретение применяется на ранних этапах обработки запроса, но использует данные всего поискового стека.
INDEXING – Индексирование и извлечение признаков
На этом этапе система индексирует контент, который позже будет использоваться для генерации кандидатов на замену: заголовки, анкорный текст, текст в URL, а также вычисляет частотность n-грамм (включая биграммы). Также рассчитываются метрики авторитетности ресурсов, которые могут использоваться в Resource Quality Measure.
QUNDERSTANDING – Понимание Запросов
Основное применение патента. Это механизм коррекции и переписывания запроса (Query Correction Subsystem).
Corrected Query.RANKING / METASEARCH / RERANKING
Исправленный запрос поступает на этап ранжирования. В некоторых реализациях (Claim 12) результаты исправленного запроса могут смешиваться (blending) с результатами исходного запроса, что происходит на этапе METASEARCH или RERANKING.
Входные данные:
Class of Related Terms.Выходные данные:
Corrected Query (исправленный запрос).query suggestion).long-tail), уникальные запросы и запросы, содержащие омофоны или часто путаемые термины (бренды, названия организаций, имена собственные).Алгоритм активируется при выполнении нескольких условий:
Resource Quality Measure для исходного запроса не достигает порогового значения. Это означает, что система не уверена в качестве или релевантности выдачи по запросу в его текущем виде.Synonym Quality Measure и Usage Quality Measure для терминов. Если обе эти меры также низкие, термин считается потенциально неточным.Class of Related Terms.Общий процесс обработки запроса
Resource Quality Measure для исходного запроса.Сценарий А: Обработка типографической ошибки
Synonym Quality Measure и Usage Quality Measure термина низкие.Similarity Measure между кандидатами и исходным неточным термином (учитывая edit distance, фонетическое сходство, использование в биграммах).Сценарий Б: Обработка ошибки класса
Class of Related Terms.Resource Quality Measure.Завершение процесса
Corrected Query.verification criterion).Система использует разнообразные данные, извлеченные на этапе индексирования и доступные через различные сервисы.
Title Terms) ресурсов. Это ключевой источник кандидатов на замену.Bigram Usage) и других n-граммах в тексте ресурсов.Anchor Terms) входящих ссылок. Это также важный источник кандидатов.Resource Locator Terms).Term Suggestions), основанные на истории поисковых сессий (Query Logs).Synonym Quality Measure), данные для стемминга (term stem), данные для оценки фонетического сходства и расстояния редактирования (edit distance).Class of Related Terms. Оценки качества/авторитетности ресурсов (для расчета Resource Quality Measure).Bigram usage (частота в биграммах).Title usage (частота в заголовках).Anchor usage (частота в анкорах).Derivative Queries, игнорируя результаты исходного (ошибочного) запроса. Это позволяет находить исправления даже тогда, когда исходный запрос дает мусорную выдачу.Similarity Measure) в контексте запроса.Resource Quality Measure).Bigram Usage) явно упоминается как фактор для валидации точности термина и для оценки кандидатов на замену. Наличие общепринятых фраз помогает системе подтвердить коррекцию.Resource Quality Measure.Этот патент подтверждает стратегию Google, направленную на глубокое понимание контекста запроса и использование самого веб-корпуса как источника лингвистических данных. Для SEO это означает переход от изолированной оптимизации под ключевые слова к обеспечению того, чтобы контент соответствовал общепринятым языковым паттернам и являлся авторитетным ответом на комбинацию терминов. Стратегия должна фокусироваться на ясности, точности терминологии и построении Topical Authority, чтобы система идентифицировала ресурс как источник высококачественного контента (High Resource Quality Measure).
Сценарий 1: Исправление типографической ошибки (Опечатка в названии)
Resource Quality Measure. Термин "Flacuns" имеет низкие Synonym и Usage Quality Measures.Сценарий 2: Исправление ошибки класса (Перепутанный телеканал)
Resource Quality Measure. Термин "AMC" принадлежит к классу "Телеканалы".Resource Quality Measure для каждого варианта. Запрос с "NBC" дает наилучшие, наиболее авторитетные результаты.Что такое "Производный запрос" (Derivative Query) в контексте этого патента?
Это модифицированная версия исходного запроса, используемая для поиска исправления. Если система подозревает опечатку, производный запрос создается путем удаления неточного термина. Если система подозревает понятийную ошибку (ошибку класса), она создает несколько производных запросов, подставляя вместо неточного термина альтернативы из того же класса.
Как система решает, нужно ли вообще исправлять запрос?
Основным триггером является низкая "Мера качества ресурсов" (Resource Quality Measure) для исходного запроса. Если Google видит, что по запросу пользователя выдача получается низкокачественной, нерелевантной или её недостаточно, он активирует механизм поиска потенциально неточных терминов.
Откуда Google берет варианты для замены при исправлении опечаток?
Источники кандидатов четко определены: это термины, найденные в Заголовках (Titles), Анкорном тексте (Anchors) и URL ресурсов, которые были найдены по производному запросу (т.е. по запросу без опечатки). Также используются данные из системы Query Suggestions, основанные на частичном совпадении (stem) с неточным термином.
Что это значит для оптимизации Title и Анкоров?
Это критически важно. Ваши Titles и анкоры входящих ссылок буквально служат словарем для системы коррекции Google. Использование четких, правильных и релевантных формулировок в этих элементах помогает Google понять, как правильно интерпретировать и исправлять запросы пользователей, ведущие на ваш сайт.
Как система отличает опечатку от редкого, но правильного слова?
Для этого используются две метрики: Synonym Quality Measure и Usage Quality Measure. Если у слова есть сильные синонимы ИЛИ оно активно используется в вебе (в заголовках, анкорах, частотных биграммах), система посчитает его правильным, даже если оно редкое. Опечаткой слово считается только если обе эти метрики низкие.
Что такое "Ошибка класса" и как она исправляется?
Это ситуация, когда пользователь использует правильное слово, но оно неверно в данном контексте, и принадлежит к классу часто путаемых терминов (например, путает модель товара или название бренда). Система исправляет это путем перебора других терминов из этого класса и выбора того варианта, который дает наилучшее качество поисковой выдачи (Resource Quality Measure).
Как использование биграмм (фраз из двух слов) влияет на коррекцию?
Биграммы используются для валидации. Если замена термина создает частотную биграмму, которая активно используется в вебе (Bigram Usage), это значительно повышает уверенность системы в правильности коррекции. Это подчеркивает важность использования естественных фраз в контенте.
Может ли этот механизм помочь мне ранжироваться по запросам с опечатками?
Да, напрямую. Если пользователь допускает опечатку, а остальная часть запроса релевантна вашему контенту, система может найти ваш сайт по производному запросу. Если в вашем Title или анкорах содержится правильный термин, система использует его для коррекции и покажет ваш сайт пользователю.
Влияет ли этот патент на ранжирование напрямую?
Это патент не о ранжировании, а о понимании и переписывании запроса (Query Understanding). Однако он оказывает огромное косвенное влияние: если запрос не понят или не исправлен правильно, релевантный контент не будет найден и, следовательно, не будет ранжироваться. Правильная коррекция запроса — это первый шаг к ранжированию.
Что важнее при исправлении ошибок класса: релевантность или авторитетность?
Для выбора лучшей замены используется Resource Quality Measure. Эта метрика может включать как релевантность (IR scores), так и авторитетность ресурсов. Чтобы выиграть в сценарии исправления ошибки класса, ваш сайт должен быть признан источником наивысшего качества для правильной комбинации терминов.

Семантика и интент
Персонализация

SERP
Поведенческие сигналы
EEAT и качество

Семантика и интент
Мультиязычность

Поведенческие сигналы
Семантика и интент
EEAT и качество


Ссылки
Структура сайта
Семантика и интент

Свежесть контента
Ссылки
Техническое SEO

Персонализация
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Knowledge Graph
Семантика и интент
EEAT и качество

SERP
Персонализация
Поведенческие сигналы

Антиспам
Ссылки
Техническое SEO

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Ссылки
Knowledge Graph

SERP
EEAT и качество
Поведенческие сигналы
