
Google анализирует контекст веб-страницы или документа, который просматривает пользователь, чтобы определить основную тему (топик). Когда пользователь вводит запрос, система фильтрует результаты поиска, отдавая предпочтение тем документам, которые соответствуют этой контекстной теме, тем самым уточняя выдачу для неоднозначных запросов.
Патент решает проблему неоднозначности поисковых запросов. Когда стандартная выдача содержит результаты, относящиеся к разным темам (например, запрос "rock" может вернуть результаты о музыке и геологии), система пытается определить истинное намерение пользователя. Изобретение улучшает релевантность, используя текущий контекст пользователя (например, веб-страницу, которую он просматривает) для фильтрации результатов в соответствии с этим намерением.
Запатентована система для фильтрации или переранжирования результатов поиска на основе Context Information (контекстной информации), предоставленной пользователем. Система определяет доминирующую тему (Topic) этого контекста, используя предопределенную Hierarchy of Topics. Затем результаты поиска по запросу пользователя оцениваются на предмет их релевантности этой доминирующей теме, а не только самому запросу.
Механизм работает следующим образом:
Context Information (например, URL, фрагмент текста или целый документ).First Scores.First Score, которая считается наиболее релевантной контексту (при условии прохождения порогов уверенности).Second Scores.Second Scores выбираются и предоставляются пользователю, тем самым фильтруя выдачу по контекстуальной теме.Высокая. Понимание контекста пользователя и уточнение неоднозначных запросов являются ключевыми задачами современных поисковых систем. Хотя методы классификации могли эволюционировать с момента подачи патента (например, отход от явных иерархий вроде ODP к моделям на основе машинного обучения), базовая идея использования текущего контекста для фильтрации выдачи крайне актуальна.
Патент имеет значительное влияние на SEO (75/100). Он подчеркивает важность четкого тематического позиционирования контента. Чтобы ранжироваться в условиях контекстного поиска, страница должна быть строго релевантна конкретной теме (Topic), которую Google может идентифицировать. Это подтверждает необходимость построения тематического авторитета и использования терминологии, соответствующей конкретной тематической вертикали.
Context Information и конкретной темой (Topic) в иерархии. Используются для выбора доминирующей темы контекста.Topic). Используются для финальной фильтрации или переранжирования выдачи.Hierarchy of Topics.Claim 1 (Независимый пункт): Описывает основной процесс фильтрации поиска на основе контекста.
Context Information).First Scores, измеряющих релевантность контента к темам в Hierarchy of Topics.Topic), наиболее релевантная контексту (с наивысшим First Score).Second Scores, измеряющих релевантность результатов поиска к выбранной теме.Second Scores).Claim 5 (Зависимый): Вводит порог уверенности (Confidence Threshold) для активации механизма.
First Score установленный порог.Claim 6 (Зависимый): Вводит порог для разрешения неоднозначности (Ambiguity Threshold).
First Score следующую за ним оценку на величину, большую порогового значения (т.е. есть ли явный лидер среди тем).Claim 9 (Зависимый): Детализирует метод расчета First Scores с использованием иерархии.
Combined Score путем объединения оценки самой темы и оценок ее подтем.Combined Score.Изобретение применяется на финальных этапах обработки поискового запроса, модифицируя стандартную выдачу на основе контекста пользователя.
INDEXING – Индексирование и извлечение признаков
Система может предварительно (офлайн) классифицировать документы в индексе по темам из Hierarchy of Topics и рассчитывать для них Second Scores (релевантность документа теме). Это позволяет ускорить обработку запросов в реальном времени.
RANKING – Ранжирование
На этом этапе генерируется стандартный набор результатов поиска, релевантных только запросу пользователя.
RERANKING – Переранжирование (или METASEARCH – Смешивание)
Основной этап применения патента. Система активируется, если доступна Context Information.
First Scores для определения доминирующей темы контекста.Second Scores (релевантности выбранной теме).Входные данные:
Context Information (URL, документ, текст).Hierarchy of Topics и Weighting Factors.Выходные данные:
Hierarchy of Topics.Context Information вместе с запросом. Это может происходить, когда пользователь инициирует поиск со страницы, которую он активно просматривает.First Score должен превышать порог уверенности (Claim 5).First Score должен значительно превосходить следующую оценку (порог неоднозначности, Claim 6).Second Scores в Claim 7), система возвращает стандартную выдачу.Context Information от клиента.Context Information анализируется для извлечения контента (ключевых слов, фраз и т.д.). Если контекст – это URL, документ загружается или извлекается из кеша.Hierarchy of Topics.Combined Score, учитывающий оценки подтем и, возможно, Weighting Factors.First Score.Second Scores (например, Топ-L результатов или результаты с оценкой выше порога).Second Scores, стандартных оценках ранжирования или их комбинации.Патент фокусируется на использовании контентных и структурных данных для классификации.
Context Information. Также анализируется контент результатов поиска для определения их тематической релевантности.Hierarchy of Topics – предопределенная таксономия, используемая как эталон для классификации. Weighting Factors, присвоенные узлам этой иерархии.First Scores, но источником контента является результат поиска.First Scores. Проверяется абсолютное значение оценки (Confidence) и ее отрыв от ближайшего конкурента (Ambiguity), чтобы избежать фильтрации при слабом или неоднозначном контексте.Hierarchy of Topics и способности алгоритмов точно классифицировать контент (как контекст, так и результаты поиска) в рамках этой иерархии.First Scores), а затем оценивается релевантность результатов этой теме (Second Scores). Это смещает фокус с прямой релевантности запросу на релевантность теме.Combined Score (Claim 9) показывает, что система учитывает не только основную тему, но и ее подтемы. Контент, который глубоко и иерархически охватывает тему, будет иметь более высокие оценки релевантности.Hierarchy of Topics.Combined Score учитывает релевантность как основной теме, так и её подтемам. Хорошо структурированный контент помогает системе точнее определить его место в иерархии и повысить оценку.Second Scores.First Scores и Second Scores по конкретным темам, что затруднит его классификацию и ранжирование в контекстном поиске.Combined Score и точное определение тематической релевантности.Этот патент подтверждает стратегическую важность понимания того, как Google классифицирует контент по темам для целей контекстного поиска и уточнения интента. Для SEO это означает необходимость перехода от оптимизации под изолированный "запрос" к оптимизации под "тему" (Topic). Долгосрочная стратегия должна фокусироваться на том, чтобы сайт стал авторитетным источником для конкретного узла (или кластера узлов) в тематической иерархии Google.
Сценарий: Уточнение неоднозначного запроса "Ягуар"
First Scores. Оценка для темы "Автомобили" значительно выше, чем для темы "Животные" или "Биология". Пороги уверенности пройдены.Second Scores для этих результатов на предмет их релевантности теме "Автомобили". Статьи о животном получают низкие оценки.Что используется в качестве контекстной информации (Context Information)?
Патент описывает несколько вариантов источника контекстной информации. Это может быть URL или адрес веб-страницы, которую пользователь просматривает в данный момент, документ, загруженный пользователем, или даже фрагмент текста (snippet), выделенный пользователем на странице. Система анализирует контент из этого источника для определения доминирующей темы.
Как система определяет релевантность контента теме (First Scores и Second Scores)?
Основной метод, описанный в патенте (Claim 9), заключается в подсчете количества терминов в контенте, которые соответствуют терминам, ассоциированным с темой и ее подтемами в Hierarchy of Topics. Затем эти подсчеты агрегируются в комбинированную оценку (Combined Score), часто с использованием весовых коэффициентов (Weighting Factors) для разных уровней иерархии.
Что такое Hierarchy of Topics и откуда она берется?
Это предопределенная таксономия, классифицирующая знания по иерархическим категориям (например, Искусство -> Музыка -> Жанры). Патент явно упоминает, что эти категории могут быть получены из внешних авторитетных источников, таких как The Open Directory Project (DMOZ) или Yahoo! Directory. Для SEO это подчеркивает важность ориентации на общепринятые классификации знаний и сущностей.
Что произойдет, если система не сможет однозначно определить тему контекста?
Патент предусматривает механизмы защиты (Claims 5 и 6). Если наивысшая оценка релевантности (First Score) не превышает порог уверенности, или если несколько тем имеют очень близкие оценки (нет явного лидера), система не активирует фильтрацию. В таких случаях пользователю будет показана стандартная поисковая выдача по его запросу.
Как SEO-специалисту оптимизировать контент с учетом этого патента?
Ключевая стратегия – это обеспечение четкой тематической фокусировки и глубины. Необходимо использовать терминологию, которая однозначно ассоциируется с целевой темой и ее подтемами. Структурирование контента в соответствии с иерархией темы поможет системе рассчитать более высокий Combined Score, что повысит шансы на ранжирование в контекстном поиске.
Влияет ли этот механизм на ранжирование, если пользователь ищет из "чистого" окна браузера без контекста?
Нет. Согласно патенту, этот механизм активируется только тогда, когда вместе с запросом поступает Context Information. Если контекста нет, система использует стандартные алгоритмы ранжирования, основанные на релевантности запросу, а не контекстной теме.
Может ли система предварительно классифицировать мой сайт по темам?
Да, патент упоминает возможность офлайн-обработки. Система может заранее анализировать документы в индексе, классифицировать их по темам и рассчитывать Second Scores (релевантность документа теме). Это позволяет ускорить процесс фильтрации в реальном времени, так как системе останется только извлечь нужные оценки из индекса.
Как используются весовые коэффициенты (Weighting Factors)?
Weighting Factors присваиваются темам в иерархии и могут основываться на популярности темы или объеме контента по ней. Они используются для корректировки First Scores при расчете Combined Score, позволяя системе придавать больший вес более значимым темам или уровням иерархии при определении контекста.
Что важнее для финального ранжирования: релевантность запросу или релевантность теме?
Когда механизм активирован, релевантность теме (Second Scores) становится определяющим фактором для фильтрации и выбора результатов. Однако патент также упоминает, что финальный порядок может учитывать как Second Scores, так и стандартные оценки ранжирования (релевантность запросу), или их комбинацию.
Влияет ли этот патент на работу с низкочастотными (long-tail) запросами?
Влияние на низкочастотные запросы, вероятно, будет меньше, так как они обычно менее неоднозначны и не требуют контекстного уточнения. Патент в первую очередь направлен на решение проблемы широких или многозначных запросов, где высока вероятность неверной интерпретации интента пользователя без дополнительного контекста.

Персонализация
Поведенческие сигналы
SERP

Семантика и интент

Семантика и интент
SERP

Семантика и интент
Персонализация

Персонализация
Семантика и интент
Поведенческие сигналы

SERP
Поведенческие сигналы

Поведенческие сигналы
Ссылки
SERP

SERP
Ссылки
Структура сайта

Knowledge Graph
Семантика и интент
Ссылки

Ссылки
SERP
Техническое SEO

Ссылки
SERP
Семантика и интент

Семантика и интент
Local SEO
Персонализация

Семантика и интент
Поведенческие сигналы

Knowledge Graph
Семантика и интент
EEAT и качество

Ссылки
EEAT и качество
SERP
