
Google использует механизм для интеллектуального исправления ошибок в запросах (опечаток или неверно употребленных слов), опираясь на контекст текущей поисковой сессии. Вместо стандартного исправления по словарю, система анализирует предыдущие запросы пользователя, чтобы понять его намерение, и предлагает вариант исправления, который соответствует теме поиска.
Патент решает проблему нерелевантных результатов поиска, вызванных неточными запросами, содержащими опечатки (misspelled tokens) или слова, неверно использованные в контексте текущего поиска (misused tokens). Стандартные системы исправления ошибок часто предлагают исправления, не учитывающие текущие интересы пользователя. Изобретение направлено на улучшение пользовательского опыта за счет предложения контекстуально релевантных исправлений, основанных на анализе всей поисковой сессии.
Запатентована система контекстуальной ревизии запросов. Система анализирует текущий запрос в контексте предыдущих запросов, выполненных в рамках одной поисковой сессии. При обнаружении потенциально неточного токена (слова или фразы) система определяет возможные варианты замены и выбирает тот вариант, который наиболее соответствует контексту сессии. Этот контекст определяется путем анализа связанных терминов (Related Tokens), найденных в исторических логах запросов.
Система работает в несколько этапов:
Potentially Inaccurate Search Token в текущем запросе. Это может быть опечатка, неверно употребленное слово или новый термин, введенный пользователем при уточнении поиска.Query Log) определяются термины (Related Tokens), которые часто встречаются вместе с терминами из предыдущих запросов.Replacement Tokens) (например, исправления опечаток или семантически близкие слова).Related Tokens. Если кандидат соответствует контексту сессии, генерируется модифицированный запрос (Modified Search Query) с заменой неточного термина.Высокая. Понимание контекста поисковой сессии и намерений пользователя (Search Journey) является ключевым направлением развития поиска Google. Механизмы, описанные в патенте, лежат в основе интеллектуального понимания запросов и адаптации выдачи к текущим задачам пользователя. С развитием ИИ-моделей и фокусом на conversational search, актуальность контекстуальной ревизии только возрастает.
Патент имеет высокое значение для SEO (8/10). Он напрямую влияет на этап понимания запроса (Query Understanding). Если система решит, что пользователь допустил ошибку, соответствующую контексту сессии, запрос будет изменен, что полностью меняет поисковую выдачу. Это подчеркивает необходимость оптимизации не под отдельные запросы, а под целые поисковые сессии и тематические кластеры (Token Clusters), чтобы соответствовать контексту, который формируется у пользователя в процессе поиска.
Query Log.Query Log, которые часто встречаются вместе или статистически связаны (например, "stemmed" и "roses").Claim 1 (Независимый пункт): Описывает основной метод контекстуальной обработки запросов.
Potentially Inaccurate Search Token. В этом пункте он определяется как токен, который *не* входит в набор предыдущих токенов (т.е. новый термин, введенный пользователем).Replacement Token. Здесь он определяется как токен, которым ранее (исторически) заменялся неточный токен с минимальной заданной частотой.Related Tokens из лога запросов на основе предыдущих запросов сессии.Replacement Token в группу Related Tokens.Claim 2 и 3 (Зависимые): Уточняют, что Potentially Inaccurate Search Token может быть идентифицирован как токен с опечаткой (misspelled), а Replacement Token — как его исправленная версия.
Claim 7 (Независимый пункт): Описывает альтернативный метод, фокусирующийся на валидации нового термина по контексту.
Potentially Inaccurate Search Token как нового токена, не встречавшегося ранее в сессии.Related Tokens на основе предыдущих запросов сессии.Replacement Token *из числа* Related Tokens (основываясь на исторических частотах замены).Replacement Token.Изобретение применяется на ранних этапах обработки запроса.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система (Contextual Query Processor) работает как модуль ревизии запроса. Она анализирует входящий запрос и историю сессии, чтобы определить, нуждается ли запрос в контекстуальном исправлении или уточнении, прежде чем он будет передан основным системам ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных, необходимых для работы системы (офлайн-процессы). Анализируются исторические Query Logs для построения Token Clusters, определения Related Tokens, расчета Subject Weights и выявления частоты исторических замен токенов.
Входные данные:
Выходные данные:
Алгоритм применяется при выполнении следующих условий:
Subject Weight для тематики сессии).Related Tokens) и найти подходящий Replacement Token, который соответствует этому контексту.Патент описывает несколько вариантов реализации. Рассмотрим два основных процесса.
Процесс А: Контекстуальное исправление опечаток (на основе FIG. 5)
Replacement Tokens) из базы данных замен.Related Tokens) из лога запросов на основе предыдущих запросов в этой сессии.Replacement Tokens в группе Related Tokens.Replacement Token.Процесс Б: Валидация и замена контекстуально неверных токенов (на основе FIG. 6 и Claims 1/7)
Related Tokens на основе предыдущих запросов сессии.Potentially Inaccurate Search Token).Related Tokens. Replacement Token. Этот токен должен быть членом группы Related Tokens и быть похожим на неточный токен (например, с использованием вектора расстояния или исторических данных о заменах).Replacement Token вместо исходного неточного токена.Патент фокусируется на использовании данных о поведении пользователей и контексте сессии.
Query Logs для определения того, как пользователи ищут информацию, какие термины используются вместе (Token Clusters), и какие ошибки пользователи исправляют чаще всего (исторические частоты замен).Search Session. Эти данные используются для определения непосредственного контекста.Query Logs) для выявления Token Clusters. Понимание того, какие слова естественно сочетаются друг с другом в языке и поведении пользователей, является ключом к определению контекста.Subject Weights или отсутствию в Related Tokens), и пытается заменить их на более подходящие.Related Tokens). Это повышает вероятность того, что ваш контент будет релевантен для запросов внутри Token Cluster, даже если запрос пользователя был модифицирован системой.Related Tokens. Это помогает системе правильно интерпретировать контекст вашего контента и сопоставлять его с контекстом сессии пользователя.Related Tokens в рамках Token Cluster, снижает его видимость для пользователей, находящихся в процессе изучения темы.Token Clusters.Этот патент подчеркивает стратегический сдвиг Google от анализа изолированных запросов к пониманию контекста поисковой сессии. Для SEO это означает необходимость перехода от традиционного Keyword Research к Journey Research и Topic Research. Долгосрочная стратегия должна фокусироваться на создании контента, который удовлетворяет пользователя на всех этапах его пути поиска информации, обеспечивая полное тематическое покрытие и используя естественные языковые паттерны.
Сценарий 1: Контекстуальное исправление опечатки в ходе сессии
Related Tokens включают "plant", "leaves", "flower".Potentially Inaccurate Token). Кандидаты на замену: "flier", "flower", "flour", "fleur".Related Tokens. Кандидат "flower" присутствует в списке Related Tokens.Сценарий 2: Исправление контекстуально неверного слова (Misused Token)
Subject Weights высоки для этой темы.Subject Weight для садоводства и не входит в Related Tokens для "bulbs" и "roses".Related Tokens, которая похожа на "flour" (используя Distance Vector). Она находит "flower".Чем описанный механизм отличается от стандартной проверки орфографии в поиске?
Стандартная проверка орфографии обычно предлагает наиболее частотный или словарно правильный вариант исправления, независимо от текущих действий пользователя. Описанный механизм (Contextual Query Revision) использует контекст текущей поисковой сессии. Он выбирает исправление, которое семантически соответствует предыдущим запросам пользователя, гарантируя, что исправление релевантно текущей задаче поиска.
Что такое "Поисковая сессия" (Search Session) в контексте этого патента?
Поисковая сессия определяется как последовательность запросов от одного пользователя. Она может быть ограничена периодом времени между запросами (например, сессия завершается после 5-10 минут бездействия), временем входа/выхода пользователя из системы или семантической связью между последовательными запросами. Это позволяет системе отслеживать эволюцию намерения пользователя.
Что такое "Кластеры токенов" (Token Clusters) и как они используются?
Token Clusters — это группы слов или фраз, которые статистически связаны между собой и часто встречаются вместе в исторических логах запросов. Например, "stemmed", "roses", "bulbs" и "flower" могут образовывать кластер. Система использует эти кластеры для определения Related Tokens. Если предыдущие запросы пользователя попадают в определенный кластер, система ожидает, что последующие запросы или исправления также будут находиться в рамках этого кластера.
Как этот патент влияет на подход к сбору семантического ядра?
Он требует смещения фокуса с отдельных ключевых слов на тематические кластеры и путь пользователя (Search Journey). Необходимо собирать не только целевые запросы, но и все связанные термины (Related Tokens), которые формируют Token Cluster. Также важно понимать последовательность запросов, которые пользователи задают при изучении темы, чтобы оптимизировать контент под всю сессию.
Может ли система изменить запрос, который написан орфографически правильно?
Да. Патент описывает сценарий обработки "Misused Tokens". Если пользователь вводит слово, которое написано правильно, но не соответствует тематическому контексту сессии (например, имеет низкие Subject Weights для темы или отсутствует в Related Tokens), система может посчитать его ошибочным и заменить на более подходящее по контексту слово.
Что такое "Веса тематик" (Subject Weights) и как они влияют на ревизию запроса?
Subject Weights — это метрики, указывающие на принадлежность слова к определенной теме (например, спорт, садоводство). Система суммирует эти веса для всех слов в сессии, чтобы определить основную тему. Если новый термин имеет низкий вес для этой темы, он может быть идентифицирован как контекстуально неверный и заменен на термин с более высоким весом для этой темы.
Как система определяет, какие слова являются "Связанными токенами" (Related Tokens)?
Related Tokens определяются путем анализа исторических логов запросов (Query Log). Система ищет токены, которые часто встречались в запросах вместе с токенами из предыдущих запросов пользователя. Для этого используются методы кластеризации (например, k-means) или пороги совместной встречаемости.
Насколько агрессивно система может изменять запрос пользователя?
Если система уверена, что найдена контекстуально релевантная замена для потенциально неточного термина, она может автоматически сгенерировать модифицированный запрос и показать результаты по нему. В патенте также упоминается возможность предложить пользователю ссылку на результаты по исходному запросу (например, "Искать вместо этого...").
Как SEO-специалисту оптимизировать сайт с учетом контекста сессии?
Необходимо фокусироваться на построении тематического авторитета (Topical Authority). Это означает создание кластеров контента, которые отвечают на все возможные вопросы пользователя в рамках темы и используют естественный язык, включая синонимы и связанные термины (Related Tokens). Важно обеспечить, чтобы контент удовлетворял последовательные интенты пользователя в ходе его поискового пути.
Влияет ли этот механизм на ранжирование по длиннохвостым (long-tail) запросам?
Да, влияет значительно. Длиннохвостые запросы часто являются частью более широкой поисковой сессии и подвержены опечаткам или неточным формулировкам. Система контекстуальной ревизии может уточнять эти запросы на лету, основываясь на предыдущих действиях пользователя, что изменяет набор документов, участвующих в ранжировании по этим запросам.

Семантика и интент

Семантика и интент

Семантика и интент

Семантика и интент

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Свежесть контента
Поведенческие сигналы
SERP

SERP
Семантика и интент
Поведенческие сигналы

Knowledge Graph
EEAT и качество
Семантика и интент

SERP
Поведенческие сигналы

Ссылки
SERP
Поведенческие сигналы

Мультимедиа
EEAT и качество
Ссылки

Ссылки
Семантика и интент
Индексация

SERP
EEAT и качество
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы
