
Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
Патент решает проблему неэффективности поиска, вызванную плохо сформулированными запросами пользователей — слишком общими, двусмысленными (ambiguous) или чрезмерно конкретными. Цель — автоматизировать процесс предложения релевантных уточнений (refinement suggestions), чтобы помочь пользователю быстрее найти нужную информацию, предлагая концептуально независимые и понятные варианты развития поиска.
Запатентована система для генерации предложений по уточнению запросов (например, блок "Related Searches"). Система собирает данные о последовательных запросах пользователей (исходный запрос source query и последующий уточняющий запрос refinement query), определяет семантическое значение этих уточнений и кластеризует их по концепциям. Затем для каждого кластера выбирается наиболее репрезентативный запрос, который предлагается пользователям.
Система работает в несколько этапов:
association counter) каждой пары.composite term vector. Это делается путем анализа терминов в топовых результатах поиска по этому запросу ИЛИ путем анализа других запросов, которые ведут на эти результаты.composite term vectors. Это объединяет семантически схожие запросы в один кластер.centroid (семантическому центру) кластера.compactness кластера), и их репрезентативные запросы показываются пользователю.Высокая. Генерация связанных запросов (Related Searches) является стандартной функцией Google Поиска. Методы, описанные в патенте (анализ сессий, кластеризация концепций на основе результатов поиска), лежат в основе понимания интента пользователя и навигации по теме. Хотя конкретные методы векторизации (например, TF-IDF) могли быть заменены нейросетевыми эмбеддингами, базовая архитектура остается актуальной. Участие Пола Хаара (Paul Haahr) подчеркивает фундаментальность этого подхода.
Патент имеет высокое стратегическое значение (8/10). Он раскрывает механизмы, с помощью которых Google определяет взаимосвязи между запросами и сегментирует интент пользователя на основе реального поведения. Понимание того, как формируются и кластеризуются уточнения, критически важно для построения Topical Authority и оптимизации контент-стратегии под целые сессии (User Journey), а не только отдельные запросы.
Refinement Query следовал за конкретным Source Query.TF-IDF).Refinement Query. Генерируется путем суммирования Term Vectors топовых документов, найденных по этому запросу (взвешенных по релевантности документа).Term Vectors. Используется для определения наиболее репрезентативного запроса в кластере.Centroid.Claim 1 (Независимый пункт): Описывает основной метод генерации предложений по уточнению запроса.
Claim 2 и 3 (Зависимые): Уточняют критерии идентификации уточнения. Идентификация основывается на том, получен ли второй запрос в течение предопределенного периода времени (например, 2 минуты) после первого.
Claim 8 (Зависимый): Детализирует процесс характеризации и кластеризации.
term vectors для документов.term vectors.Claim 14 (Зависимый от 12): Описывает альтернативный метод выбора представителя кластера (в отличие от метода максимальной частоты в Claim 1).
centroid для каждого кластера.term vector от centroid.Изобретение в основном функционирует на этапе понимания запросов, используя данные из индекса и логов поведения пользователей.
INDEXING – Индексирование и извлечение признаков
На этом этапе индексируются документы и рассчитываются веса терминов (например, IDF), которые необходимы для генерации Term Vectors в процессе характеризации.
QUNDERSTANDING – Понимание Запросов
Основное применение патента. Система выполняет сложный процесс анализа данных для понимания взаимосвязей между запросами.
Query Logs и данные сессий для выявления пар Source Query -> Refinement Query.Composite Term Vectors), кластеризации и выбора репрезентативных запросов выполняются преимущественно офлайн. Результаты сохраняются в базе данных уточнений.METASEARCH – Метапоиск и Смешивание
В реальном времени, когда пользователь вводит запрос, система обращается к заранее подготовленной базе данных уточнений. Отобранные предложения отображаются на странице результатов поиска (например, в блоке "Related Searches").
Входные данные:
Выходные данные:
predetermined time period) после первого (например, 2 минуты).Алгоритм состоит из нескольких ключевых этапов.
Этап 1: Сбор данных об уточнениях (Refinement Data Collection)
Source Query (Q1), а затем Refinement Query (Q2) от того же пользователя.Association Counter для этой пары увеличивается. Опционально учитываются язык и регион.Этап 2: Характеризация Уточнений (Characterization)
Term Vector. Патент предлагает два метода (FIG. 6 и FIG. 7): TF-IDF).Term Vectors нормализуются (например, L2 norm).Composite Term Vector для Q2 путем суммирования векторов документов. Векторы документов масштабируются в зависимости от их релевантности (relevancy score) или позиции в выдаче.Этап 3: Кластеризация (Clustering)
Composite Term Vectors всех уточнений для Q1.Этап 4: Выбор Репрезентативных Запросов (Selection)
Centroid (взвешенный центр векторов).Representative Refinement Query. Патент предлагает варианты: Association Counter внутри кластера (Claim 1).Association Counter) / (Расстояние от Centroid). Выбирается запрос с наивысшей оценкой (Claim 14).Этап 5: Ранжирование Кластеров (Ranking)
Compactness кластера (например, стандартное отклонение от центроида).Association Counters всех запросов в кластере.Association Counters) / Compactness. Это повышает ранг семантически четких кластеров.Query Logs) и данные сессий. Система анализирует последовательность запросов и время между ними для выявления переходов от Source Query к Refinement Query.Term Vectors (Метод характеризации А).Term Vectors (Метод характеризации Б).user profile) и страна/регион (country/region variables) могут использоваться для сегментации данных.TF-IDF. Формула веса: w(tf)⋅idf.Composite Term Vector.Centroid.Centroid.Composite Term Vectors). Если два разных запроса возвращают похожие документы, система считает их семантически близкими и объединяет в один кластер.Compactness), что гарантирует четкость предложений.Centroid) для выбора наилучшей формулировки для кластера. Это может привести к тому, что менее частотная, но более точная формулировка будет выбрана в качестве предложения.Refinement Queries). Это соответствует оптимизации под всю сессию.Composite Term Vectors запросов близки, и их можно таргетировать одной страницей.Term Vectors, соответствующие целевому кластеру.Refinement Data), которые могут указывать системе на нерелевантность вашего контента.Этот патент подчеркивает стратегическую важность перехода от оптимизации под ключевые слова к оптимизации под темы и интенты (Topic Clustering). Он демонстрирует, что Google обладает сложной системой для картирования пространства запросов, основанной как на поведении пользователей, так и на анализе контента через призму SERP. Долгосрочная SEO-стратегия должна фокусироваться на создании авторитетности в рамках целых тематических кластеров, выявленных Google.
Сценарий: Оптимизация сайта о велосипедах
Composite Term Vector сильно отличается (другие результаты поиска).Centroid своего кластера, покрывая все подтемы внутри него.Является ли этот патент описанием блока "Связанные запросы" (Related Searches)?
Да, этот патент описывает фундаментальную механику, которая используется для генерации блока "Связанные запросы". Он объясняет, как Google собирает данные о том, как пользователи уточняют поиск, кластеризует эти данные по смыслу и выбирает лучшие формулировки для показа. Это подтверждает, что Related Searches основаны на реальном поведении пользователей.
Как Google определяет, что второй запрос является уточнением первого?
Основной критерий, описанный в патенте, — это временной интервал. Если пользователь вводит второй запрос вскоре после первого (упоминается примерный лимит в 2 минуты), система считает это поисковой сессией и классифицирует второй запрос как Refinement Query. Эта связь фиксируется для последующего анализа.
Как Google понимает смысл запросов для их кластеризации?
Система использует метод семантической характеризации, создавая Composite Term Vector. Для этого она анализирует Топ-N результатов поиска по запросу. Смысл определяется либо через анализ контента этих результатов (Метод А), либо через анализ других запросов, которые ведут на эти результаты (Метод Б). Запросы с близкими векторами группируются вместе.
Что важнее для SEO: Метод А (анализ контента) или Метод Б (анализ ссылающихся запросов)?
Оба метода важны и подчеркивают разные аспекты SEO. Метод А подчеркивает важность качества контента и использования семантически релевантных терминов на странице. Метод Б подчеркивает важность того, чтобы страница отвечала на широкий пул связанных запросов (Topical Authority) и была признана релевантной для разных формулировок.
Всегда ли самое популярное уточнение выбирается для показа?
Не всегда. Хотя частота (Count) является важным фактором (Claim 1), патент также описывает выбор наиболее репрезентативного запроса (Claim 14). Для этого рассчитывается Centroid (семантический центр) кластера. Предпочтение может отдаваться запросу, который ближе к Centroid, так как он лучше отражает общую тему кластера.
Что такое "компактность" (Compactness) кластера и почему она важна?
Compactness — это мера смысловой плотности кластера. Если кластер плотный, это означает, что все запросы в нем очень близки по смыслу. Система может повышать рейтинг плотных кластеров при финальном ранжировании предложений, так как они представляют четко определенные концепции и более полезны для пользователей.
Как этот патент влияет на подбор семантического ядра?
Он подтверждает необходимость анализа реальных путей пользователя через изучение Related Searches. Семантическое ядро должно строиться как карта кластеров интентов, а не просто список ключевых слов. Необходимо выявлять репрезентативные запросы для каждого значимого кластера в вашей нише и обеспечивать их покрытие контентом.
Использует ли Google по-прежнему TF-IDF, как описано в патенте?
Патент был подан в 2004 году и упоминает TF-IDF как пример расчета весов. Современные системы Google (BERT, MUM) используют гораздо более сложные методы, такие как нейронные эмбеддинги, для генерации векторов. Однако общая логика процесса (характеризация -> векторизация -> кластеризация) остается актуальной.
Что делать, если я вижу два очень похожих ключевых слова? Создавать одну страницу или две?
Руководствуйтесь принципами этого патента: проверьте сходство SERP (Search Engine Results Page). Если результаты сильно пересекаются, это означает, что их Composite Term Vectors близки, и Google поместил их в один кластер. В этом случае лучше создать одну сильную страницу. Если результаты разные, требуются отдельные страницы.
Учитывает ли система язык и регион при генерации уточнений?
Да, патент описывает вариант реализации (Claim 4), в котором данные об уточнениях собираются и ассоциируются с учетом переменных профиля пользователя или интерфейса, таких как язык и страна/регион. Это позволяет генерировать более релевантные предложения для разных аудиторий.

Семантика и интент
Свежесть контента
SERP

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Мультимедиа
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

EEAT и качество
Свежесть контента
Семантика и интент

Персонализация
Семантика и интент
SERP

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
