Как Google использует контекст поисковой сессии для исправления ошибок и уточнения запросов пользователя

CONTEXTUAL QUERY REVISION (Контекстуальная ревизия запроса)

US7953746B1
Google LLC
2007-12-07
2011-05-31

Google использует механизм для интеллектуального исправления ошибок в запросах (опечаток или неверно употребленных слов), опираясь на контекст текущей поисковой сессии. Вместо стандартного исправления по словарю, система анализирует предыдущие запросы пользователя, чтобы понять его намерение, и предлагает вариант исправления, который соответствует теме поиска.

Какую проблему решает

Патент решает проблему нерелевантных результатов поиска, вызванных неточными запросами, содержащими опечатки (misspelled tokens) или слова, неверно использованные в контексте текущего поиска (misused tokens). Стандартные системы исправления ошибок часто предлагают исправления, не учитывающие текущие интересы пользователя. Изобретение направлено на улучшение пользовательского опыта за счет предложения контекстуально релевантных исправлений, основанных на анализе всей поисковой сессии.

Что запатентовано

Запатентована система контекстуальной ревизии запросов. Система анализирует текущий запрос в контексте предыдущих запросов, выполненных в рамках одной поисковой сессии. При обнаружении потенциально неточного токена (слова или фразы) система определяет возможные варианты замены и выбирает тот вариант, который наиболее соответствует контексту сессии. Этот контекст определяется путем анализа связанных терминов (Related Tokens), найденных в исторических логах запросов.

Как это работает

Система работает в несколько этапов:

Обнаружение неточности: Система идентифицирует Potentially Inaccurate Search Token в текущем запросе. Это может быть опечатка, неверно употребленное слово или новый термин, введенный пользователем при уточнении поиска.
Определение контекста сессии: Анализируются предыдущие запросы в текущей сессии. На основе исторических данных (Query Log) определяются термины (Related Tokens), которые часто встречаются вместе с терминами из предыдущих запросов.
Генерация кандидатов: Для неточного токена подбираются кандидаты на замену (Replacement Tokens) (например, исправления опечаток или семантически близкие слова).
Контекстуальный выбор: Система проверяет, какие из кандидатов присутствуют среди Related Tokens. Если кандидат соответствует контексту сессии, генерируется модифицированный запрос (Modified Search Query) с заменой неточного термина.

Актуальность для SEO

Высокая. Понимание контекста поисковой сессии и намерений пользователя (Search Journey) является ключевым направлением развития поиска Google. Механизмы, описанные в патенте, лежат в основе интеллектуального понимания запросов и адаптации выдачи к текущим задачам пользователя. С развитием ИИ-моделей и фокусом на conversational search, актуальность контекстуальной ревизии только возрастает.

Важность для SEO

Патент имеет высокое значение для SEO (8/10). Он напрямую влияет на этап понимания запроса (Query Understanding). Если система решит, что пользователь допустил ошибку, соответствующую контексту сессии, запрос будет изменен, что полностью меняет поисковую выдачу. Это подчеркивает необходимость оптимизации не под отдельные запросы, а под целые поисковые сессии и тематические кластеры (Token Clusters), чтобы соответствовать контексту, который формируется у пользователя в процессе поиска.

Термины и определения

Contextual Query Processor (Процессор контекстуальных запросов): Компонент системы, отвечающий за идентификацию неточных запросов и предложение контекстуальных модификаций на основе сессии.
Potentially Inaccurate Search Token (Потенциально неточный поисковый токен): Токен (слово или фраза) в текущем запросе, который идентифицирован как возможно ошибочный. Это может быть опечатка (misspelled token), слово, неверно использованное в данном контексте (misused token), или просто новый токен, введенный пользователем в ходе сессии.
Query Log (Лог запросов): Хранилище исторических поисковых запросов и сессий, используемое для анализа поведения пользователей и выявления связанных терминов.
Related Tokens (Связанные токены): Группа токенов, которые статистически связаны с токенами из предыдущих запросов пользователя в текущей сессии. Определяются на основе анализа Query Log.
Replacement Token (Токен замены): Кандидат для замены потенциально неточного токена. Источником может быть система исправления опечаток, база синонимов или список часто путаемых слов.
Search Session (Поисковая сессия): Последовательность запросов от одного пользователя, объединенная по времени, намерению или явному указанию (логин/логаут).
Search Token (Поисковый токен): Ключевое слово или группа ключевых слов, представленных как часть поискового запроса.
Subject Weights (Веса тематик): Метрики, ассоциированные с токенами, указывающие на их принадлежность к различным тематикам (например, садоводство, спорт). Используются для определения тематического контекста сессии.
Token Cluster (Кластер токенов): Группа связанных токенов, идентифицированных из Query Log, которые часто встречаются вместе или статистически связаны (например, "stemmed" и "roses").

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод контекстуальной обработки запросов.

Система получает текущий запрос в рамках текущей поисковой сессии.
Идентифицируется набор предыдущих поисковых токенов из предыдущих запросов этой сессии.
Текущие токены сравниваются с предыдущими.
Идентифицируется Potentially Inaccurate Search Token. В этом пункте он определяется как токен, который *не* входит в набор предыдущих токенов (т.е. новый термин, введенный пользователем).
Определяется возможный Replacement Token. Здесь он определяется как токен, которым ранее (исторически) заменялся неточный токен с минимальной заданной частотой.
Идентифицируются Related Tokens из лога запросов на основе предыдущих запросов сессии.
Проверяется, входит ли возможный Replacement Token в группу Related Tokens.
Если ДА (токен замены соответствует контексту), генерируется модифицированный поисковый запрос.

Claim 2 и 3 (Зависимые): Уточняют, что Potentially Inaccurate Search Token может быть идентифицирован как токен с опечаткой (misspelled), а Replacement Token — как его исправленная версия.

Claim 7 (Независимый пункт): Описывает альтернативный метод, фокусирующийся на валидации нового термина по контексту.

Получение текущего запроса и идентификация предыдущих токенов сессии (аналогично Claim 1).
Идентификация Potentially Inaccurate Search Token как нового токена, не встречавшегося ранее в сессии.
Идентификация Related Tokens на основе предыдущих запросов сессии.
Сравнение неточного (нового) токена со связанными токенами.
Определение: входит ли неточный токен в число связанных токенов?
Если НЕТ (новый токен не соответствует контексту, установленному связанными терминами), система идентифицирует Replacement Token *из числа* Related Tokens (основываясь на исторических частотах замены).
Неточный токен в текущем запросе заменяется на Replacement Token.

Где и как применяется

Изобретение применяется на ранних этапах обработки запроса.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система (Contextual Query Processor) работает как модуль ревизии запроса. Она анализирует входящий запрос и историю сессии, чтобы определить, нуждается ли запрос в контекстуальном исправлении или уточнении, прежде чем он будет передан основным системам ранжирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных, необходимых для работы системы (офлайн-процессы). Анализируются исторические Query Logs для построения Token Clusters, определения Related Tokens, расчета Subject Weights и выявления частоты исторических замен токенов.

Входные данные:

Текущий поисковый запрос (Current Search Query).
История поисковой сессии (Previous Search Queries/Tokens).
База данных замен (Replacement Token Data).
Исторические логи запросов (Query Log).

Выходные данные:

Модифицированный поисковый запрос (Modified Search Query), если была произведена контекстуальная замена.
Исходный поисковый запрос, если замена не требуется или не найдена контекстуально релевантная замена.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на информационные и исследовательские запросы, где пользователи часто выполняют серию последовательных запросов для изучения темы (Search Journey). Также влияет на запросы, содержащие опечатки или многозначные термины (омонимы), где контекст сессии помогает выбрать правильное значение или исправление.
Конкретные типы контента: Влияет на все типы контента, так как изменяет сам запрос, по которому производится ранжирование.

Когда применяется

Алгоритм применяется при выполнении следующих условий:

Триггеры активации:
- Обнаружена опечатка в токене текущего запроса.
- Обнаружено слово, которое может быть неверно употреблено в контексте сессии (например, имеет низкий Subject Weight для тематики сессии).
- Пользователь ввел новый токен в запрос, уточняя предыдущий запрос в той же сессии (сценарий, описанный в Claims 1 и 7).
Условия применения: Система должна быть способна определить контекст сессии (найти достаточно Related Tokens) и найти подходящий Replacement Token, который соответствует этому контексту.

Пошаговый алгоритм

Патент описывает несколько вариантов реализации. Рассмотрим два основных процесса.

Процесс А: Контекстуальное исправление опечаток (на основе FIG. 5)

Получение запроса: Система получает текущий поисковый запрос в рамках сессии.
Идентификация неточности: Анализируется запрос на наличие потенциально неточных токенов (например, опечаток).
Генерация кандидатов: Для неточного токена идентифицируются возможные токены замены (Replacement Tokens) из базы данных замен.
Определение контекста: Идентифицируется группа связанных токенов (Related Tokens) из лога запросов на основе предыдущих запросов в этой сессии.
Валидация кандидатов: Система проверяет, присутствует ли какой-либо из Replacement Tokens в группе Related Tokens.
Модификация запроса: Если ДА, текущий запрос модифицируется путем замены неточного токена на контекстуально релевантный Replacement Token.
Обработка результатов: Система предоставляет результаты поиска по модифицированному (или исходному, если замена не произошла) запросу.

Процесс Б: Валидация и замена контекстуально неверных токенов (на основе FIG. 6 и Claims 1/7)

Получение запроса: Система получает текущий поисковый запрос.
Определение контекста: Идентифицируется группа Related Tokens на основе предыдущих запросов сессии.
Идентификация нового токена: В текущем запросе идентифицируется токен, который не присутствовал в предыдущих запросах сессии (Potentially Inaccurate Search Token).
Проверка контекста: Система определяет, существует ли этот новый токен в группе Related Tokens.
- Если ДА: Токен считается контекстуально верным. Система предоставляет результаты по исходному запросу.
- Если НЕТ: Токен считается контекстуально неверным (Misused Token). Переход к шагу 5.
Идентификация замены: Система ищет потенциальный Replacement Token. Этот токен должен быть членом группы Related Tokens и быть похожим на неточный токен (например, с использованием вектора расстояния или исторических данных о заменах).
Генерация модифицированного запроса: Создается новый запрос, включающий Replacement Token вместо исходного неточного токена.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о поведении пользователей и контексте сессии.

Поведенческие факторы: Критически важные данные. Используются исторические Query Logs для определения того, как пользователи ищут информацию, какие термины используются вместе (Token Clusters), и какие ошибки пользователи исправляют чаще всего (исторические частоты замен).
Пользовательские факторы: История запросов текущего пользователя в рамках активной Search Session. Эти данные используются для определения непосредственного контекста.

Какие метрики используются и как они считаются

Token Clustering (Кластеризация токенов): Используются методы кластеризации (например, k-means) или пороговые значения совместной встречаемости. Например, токен включается в кластер, если он встречается в более чем 50% запросов, содержащих другие токены этого кластера.
Distance Vector (Вектор расстояния): Упоминается как метод для определения схожести между потенциально неточным токеном и связанными токенами, чтобы выбрать наилучшую замену (например, "flour" ближе к "flower", чем к "rose").
Minimum Specified Rate (Минимальная заданная частота): Историческая частота, с которой один токен заменялся другим в логах запросов. Используется для валидации кандидатов на замену (упоминается в Claims).
Subject Weights (Веса тематик): Предварительно рассчитанные веса, ассоциирующие токены с тематиками. Суммирование этих весов для токенов сессии позволяет определить тематический контекст (например, Садоводство) и оценить релевантность нового токена этому контексту.

Приоритет контекста сессии над словарными исправлениями: Google не просто исправляет опечатки на наиболее частотный вариант. Система стремится понять намерение пользователя в рамках текущей сессии и выбирает исправление, которое соответствует этому намерению, даже если оно менее частотно в целом.
Запросы не обрабатываются изолированно: Патент подтверждает, что Google анализирует поисковую сессию (Search Journey) как единое целое. Предыдущие запросы напрямую влияют на интерпретацию текущего запроса.
Важность исторических данных и кластеризации: Система полагается на анализ огромных массивов исторических данных (Query Logs) для выявления Token Clusters. Понимание того, какие слова естественно сочетаются друг с другом в языке и поведении пользователей, является ключом к определению контекста.
Механизм борьбы с контекстуальными ошибками (Misused Tokens): Система активно идентифицирует слова, которые, хотя и написаны правильно, не вписываются в тематический контекст сессии (например, по Subject Weights или отсутствию в Related Tokens), и пытается заменить их на более подходящие.
Уточнение запроса как источник ошибок: Патент уделяет особое внимание ситуациям, когда пользователь уточняет запрос, вводя новые термины (Claims 1 и 7). Любой новый термин рассматривается как потенциально неточный и проверяется на соответствие контексту сессии.

Best practices (это мы делаем)

Построение тематического авторитета (Topical Authority): Создавайте контент, который полностью охватывает тему и включает связанные концепции и термины (Related Tokens). Это повышает вероятность того, что ваш контент будет релевантен для запросов внутри Token Cluster, даже если запрос пользователя был модифицирован системой.
Анализ пути пользователя (Search Journey): Понимайте, как пользователи исследуют вашу нишу. Какие запросы они задают сначала, и как они их уточняют? Оптимизируйте контент так, чтобы он отвечал на последовательные интенты в рамках одной сессии.
Использование естественного языка и синонимов: Включайте в текст естественные сочетания слов и синонимы, которые Google может идентифицировать как Related Tokens. Это помогает системе правильно интерпретировать контекст вашего контента и сопоставлять его с контекстом сессии пользователя.
Оптимизация под ясность и однозначность: Если ваша тематика включает термины, которые легко спутать (омонимы или близкие по написанию слова с разным значением), убедитесь, что контекст страницы четко поддерживает нужное значение.

Worst practices (это делать не надо)

Оптимизация под изолированные ключевые слова: Фокус на отдельных ключевых словах без учета их связи с более широкой темой и контекстом поисковой сессии становится менее эффективным. Система может изменить запрос пользователя, если посчитает его контекстуально неверным.
Игнорирование связанных сущностей и терминов: Создание контента, который не покрывает Related Tokens в рамках Token Cluster, снижает его видимость для пользователей, находящихся в процессе изучения темы.
Использование неестественных сочетаний слов (Keyword Stuffing): Попытки манипулировать релевантностью путем неестественного включения ключевых слов могут привести к тому, что система не сможет правильно соотнести контент с естественными Token Clusters.

Стратегическое значение

Этот патент подчеркивает стратегический сдвиг Google от анализа изолированных запросов к пониманию контекста поисковой сессии. Для SEO это означает необходимость перехода от традиционного Keyword Research к Journey Research и Topic Research. Долгосрочная стратегия должна фокусироваться на создании контента, который удовлетворяет пользователя на всех этапах его пути поиска информации, обеспечивая полное тематическое покрытие и используя естественные языковые паттерны.

Практические примеры

Сценарий 1: Контекстуальное исправление опечатки в ходе сессии

Предыдущий запрос пользователя: "yellow gardenia" (Желтая гардения).
Контекст сессии: Система определяет контекст как "Садоводство" или "Цветы". Related Tokens включают "plant", "leaves", "flower".
Текущий запрос пользователя: "long stemmed fluer" (длинностебельный [опечатка]).
Анализ: Система идентифицирует "fluer" как опечатку (Potentially Inaccurate Token). Кандидаты на замену: "flier", "flower", "flour", "fleur".
Контекстуальная ревизия: Система сравнивает кандидатов с Related Tokens. Кандидат "flower" присутствует в списке Related Tokens.
Результат: Система модифицирует запрос на "long stemmed flower" и показывает результаты по нему, так как это соответствует контексту сессии, начатой с поиска гардений.

Сценарий 2: Исправление контекстуально неверного слова (Misused Token)

Предыдущие запросы пользователя: "long stemmed bulbs", затем "long stemmed roses".
Контекст сессии: Садоводство. Subject Weights высоки для этой темы.
Текущий запрос пользователя: "long stemmed flour" (длинностебельная мука).
Анализ: Система видит, что "flour" – это новый токен в сессии. Она проверяет его соответствие контексту. "Flour" (мука) имеет низкий Subject Weight для садоводства и не входит в Related Tokens для "bulbs" и "roses".
Контекстуальная ревизия: Система ищет замену среди Related Tokens, которая похожа на "flour" (используя Distance Vector). Она находит "flower".
Результат: Система модифицирует запрос на "long stemmed flower", предполагая, что пользователь имел в виду цветок, а не муку, продолжая тему садоводства.

Чем описанный механизм отличается от стандартной проверки орфографии в поиске?

Стандартная проверка орфографии обычно предлагает наиболее частотный или словарно правильный вариант исправления, независимо от текущих действий пользователя. Описанный механизм (Contextual Query Revision) использует контекст текущей поисковой сессии. Он выбирает исправление, которое семантически соответствует предыдущим запросам пользователя, гарантируя, что исправление релевантно текущей задаче поиска.

Что такое "Поисковая сессия" (Search Session) в контексте этого патента?

Поисковая сессия определяется как последовательность запросов от одного пользователя. Она может быть ограничена периодом времени между запросами (например, сессия завершается после 5-10 минут бездействия), временем входа/выхода пользователя из системы или семантической связью между последовательными запросами. Это позволяет системе отслеживать эволюцию намерения пользователя.

Что такое "Кластеры токенов" (Token Clusters) и как они используются?

Token Clusters — это группы слов или фраз, которые статистически связаны между собой и часто встречаются вместе в исторических логах запросов. Например, "stemmed", "roses", "bulbs" и "flower" могут образовывать кластер. Система использует эти кластеры для определения Related Tokens. Если предыдущие запросы пользователя попадают в определенный кластер, система ожидает, что последующие запросы или исправления также будут находиться в рамках этого кластера.

Как этот патент влияет на подход к сбору семантического ядра?

Он требует смещения фокуса с отдельных ключевых слов на тематические кластеры и путь пользователя (Search Journey). Необходимо собирать не только целевые запросы, но и все связанные термины (Related Tokens), которые формируют Token Cluster. Также важно понимать последовательность запросов, которые пользователи задают при изучении темы, чтобы оптимизировать контент под всю сессию.

Может ли система изменить запрос, который написан орфографически правильно?

Да. Патент описывает сценарий обработки "Misused Tokens". Если пользователь вводит слово, которое написано правильно, но не соответствует тематическому контексту сессии (например, имеет низкие Subject Weights для темы или отсутствует в Related Tokens), система может посчитать его ошибочным и заменить на более подходящее по контексту слово.

Что такое "Веса тематик" (Subject Weights) и как они влияют на ревизию запроса?

Subject Weights — это метрики, указывающие на принадлежность слова к определенной теме (например, спорт, садоводство). Система суммирует эти веса для всех слов в сессии, чтобы определить основную тему. Если новый термин имеет низкий вес для этой темы, он может быть идентифицирован как контекстуально неверный и заменен на термин с более высоким весом для этой темы.

Как система определяет, какие слова являются "Связанными токенами" (Related Tokens)?

Related Tokens определяются путем анализа исторических логов запросов (Query Log). Система ищет токены, которые часто встречались в запросах вместе с токенами из предыдущих запросов пользователя. Для этого используются методы кластеризации (например, k-means) или пороги совместной встречаемости.

Насколько агрессивно система может изменять запрос пользователя?

Если система уверена, что найдена контекстуально релевантная замена для потенциально неточного термина, она может автоматически сгенерировать модифицированный запрос и показать результаты по нему. В патенте также упоминается возможность предложить пользователю ссылку на результаты по исходному запросу (например, "Искать вместо этого...").

Как SEO-специалисту оптимизировать сайт с учетом контекста сессии?

Необходимо фокусироваться на построении тематического авторитета (Topical Authority). Это означает создание кластеров контента, которые отвечают на все возможные вопросы пользователя в рамках темы и используют естественный язык, включая синонимы и связанные термины (Related Tokens). Важно обеспечить, чтобы контент удовлетворял последовательные интенты пользователя в ходе его поискового пути.

Влияет ли этот механизм на ранжирование по длиннохвостым (long-tail) запросам?

Да, влияет значительно. Длиннохвостые запросы часто являются частью более широкой поисковой сессии и подвержены опечаткам или неточным формулировкам. Система контекстуальной ревизии может уточнять эти запросы на лету, основываясь на предыдущих действиях пользователя, что изменяет набор документов, участвующих в ранжировании по этим запросам.

Как Google использует контекст запроса для исправления опечаток и понятийных ошибок, анализируя результаты поиска по оставшимся словам

Google использует механизм для исправления сложных, редких или понятийно ошибочных запросов. Если система идентифицирует потенциально неточный термин (опечатку или перепутанное название), она временно удаляет его и выполняет поиск по оставшимся словам. Затем анализируется контент найденных страниц (заголовки, анкоры, URL), чтобы определить правильный термин для замены, обеспечивая релевантную выдачу даже при ошибках пользователя.

US8868587B1
2014-10-21

Семантика и интент

Как Google использует историю запросов в текущей сессии для понимания контекста и переписывания неоднозначных запросов

Google анализирует предыдущие запросы пользователя в рамках текущей сессии, чтобы понять контекст нового запроса. Если новый запрос неоднозначен или содержит отсылки (например, местоимения типа «он», «это»), система пытается объединить его с сущностями из предыдущих запросов. Это позволяет переписать запрос более точно (например, заменить «он» на имя человека), чтобы предоставить результаты, соответствующие истинному намерению пользователя.

US9547690B2
2017-01-17

Семантика и интент

Как Google использует контекст топ-результатов для валидации синонимов и расширения запросов

Google использует механизм для предотвращения ошибок при расширении запросов синонимами или однокоренными словами. Система генерирует потенциальные альтернативные термины, но добавляет их к запросу только если они подтверждаются контекстом. Контекст определяется анализом терминов, найденных в топовых результатах поиска по исходному запросу. Это гарантирует, что расширение запроса остается семантически релевантным.

US8055669B1
2011-11-08

Семантика и интент

Как Google делает поиск «сессионным» (stateful), объединяя параметры из последовательных запросов пользователя

Google может определять, когда несколько последовательных запросов пользователя являются частью одного исследования («линии запроса»). Система объединяет параметры из этих запросов, создавая «комбинированный запрос». Это позволяет пользователю постепенно уточнять поиск (особенно голосом), не повторяя предыдущие условия, делая процесс более естественным и контекстуальным.

US11468052B2
2022-10-11

Семантика и интент

Как Google использует контекст пользователя и интерактивное уточнение для обучения моделей поиска

Google может инициировать поиск пассивно, основываясь на контексте действий пользователя (например, чтении статьи или телефонном звонке). Система позволяет пользователю уточнить этот поиск, выбрав один из использованных критериев (например, тапнув на сущность в тексте), чтобы повысить его значимость. Реакция пользователя на уточненные результаты используется для машинного обучения и улучшения взвешивания критериев в будущих поисковых запросах.

US11568003B2
2023-01-31

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках

Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.

US8417692B2
2013-04-09

Семантика и интент
Поведенческие сигналы

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента

Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.

US8412699B1
2013-04-02

Свежесть контента
Поведенческие сигналы
SERP

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей

Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.

US9213748B1
2015-12-15

SERP
Семантика и интент
Поведенческие сигналы

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах

Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.

US7953720B1
2011-05-31

Knowledge Graph
EEAT и качество
Семантика и интент

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования

Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.

US8688716B1
2014-04-01

SERP
Поведенческие сигналы

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа

Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.

US7305380B1
2007-12-04

Ссылки
SERP
Поведенческие сигналы

Как Google использует визуальные цитаты и обратную связь для генерации и уточнения ответов в мультимодальном поиске

Google генерирует ответы на мультимодальные запросы (изображение + текст), находя визуально похожие изображения в интернете и используя текст с их исходных страниц как основу для LLM. Система показывает эти изображения как «визуальные цитаты» для подтверждения ответа и позволяет пользователям исключать нерелевантные источники, чтобы мгновенно уточнить сгенерированный результат.

US20240378236A1
2024-11-14

Мультимедиа
EEAT и качество
Ссылки

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта

Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.

US9208233B1
2015-12-08

Ссылки
Семантика и интент
Индексация

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности

Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.

US7657520B2
2010-02-02

SERP
EEAT и качество
Поведенческие сигналы

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов

Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).

US9244977B2
2016-01-26

Персонализация
Семантика и интент
Поведенческие сигналы