
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
Патент решает задачу помощи пользователям в исследовании темы или уточнении их поискового намерения, когда исходный запрос слишком широк или не дает удовлетворительных результатов. Цель — предложить пользователю набор связанных запросов (query refinements), которые являются релевантными исходной теме, но при этом достаточно разнообразными (diverse), чтобы вести к новым наборам результатов, а не повторять уже увиденное.
Запатентована система генерации уточнений запроса (например, блок "Связанные запросы" или "Related Searches") на основе анализа данных пользовательских сессий. Система идентифицирует "родственные" запросы (sibling queries) — это запросы, которые часто следуют за одним и тем же "родительским" запросом (parent query). Ключевым элементом является механизм фильтрации кандидатов, который гарантирует разнообразие (diversity) результатов поиска, связанных с предложенными уточнениями.
Система работает в несколько этапов:
Session Data), чтобы определить последовательности запросов. Запрос, следующий за другим (часто сразу), определяется как "дочерний" (child query) по отношению к "родительскому" (parent query).sibling queries.Fan-in, Fan-out, сила связи) и ранжируются с использованием данных о предпочтениях пользователей (User Preference Data).intra-suggestion diversity). Предложение принимается, только если его топовые результаты существенно отличаются от результатов исходного запроса и уже выбранных предложений.Высокая. Понимание пути пользователя (user journey) и взаимосвязей между запросами является фундаментальной задачей для современных поисковых систем. Хотя методы анализа сессий могли эволюционировать (например, с использованием нейронных сетей и векторизации), базовые принципы идентификации связанных интентов и необходимость обеспечения разнообразия выдачи остаются крайне актуальными.
Патент имеет значительное влияние на SEO-стратегию (7/10). Он демонстрирует, что Google определяет взаимосвязь между запросами на основе реального поведения пользователей (последовательности запросов в сессии), а не только на основе семантической схожести контента. Это подчеркивает важность создания контент-стратегии, которая охватывает различные, но связанные субтопики (sibling intents), которые пользователи естественным образом исследуют последовательно.
query refinements).Fan-out может указывать на слишком общий родительский запрос, и такие запросы могут фильтроваться.Fan-in может указывать на слабость связи с конкретным родителем, и такие запросы могут фильтроваться.seen documents) по исходному запросу и другим принятым предложениям.click data), включающие click-through-rate (CTR), взвешенные клики (weighted clicks), показы и другие метрики, используемые для оценки качества результатов и ранжирования родственных запросов.IDF может указывать на слишком популярные концепции, которые не несут много информации для их дочерних запросов.Claim 1 (Независимый пункт): Описывает основной процесс идентификации родственных запросов с акцентом на фильтрацию родителей.
candidate sibling queries) для конкретного дочернего запроса. Условия идентификации: Fan-out, удовлетворяющий пороговому значению (т.е. не иметь слишком много детей).shared parent queries), размер которой удовлетворяет порогу общих запросов (common-query threshold).final sibling queries) из кандидатов и их ассоциация в качестве уточнений.Claim 3 (Зависимый от 1): Уточняет механизм выбора финальных запросов. Группа финальных родственных запросов выбирается на основе разнообразия (diversity) между документами, релевантными этим финальным запросам.
Claim 13 (Независимый пункт): Описывает процесс с акцентом на разнообразие и строгое определение дочернего запроса (без промежуточных запросов).
diversity) между документами, релевантными этим финальным запросам.Claim 19 (Зависимый от 13): Детализирует итеративный алгоритм выбора на основе разнообразия.
intra-sibling diversity score) пороговому значению. Оценка измеряет разнообразие между топовыми документами кандидата и группой увиденных документов (seen documents).seen documents.Изобретение в основном применяется на этапах понимания запросов и формирования финальной выдачи, используя данные о поведении пользователей.
QUNDERSTANDING – Понимание Запросов
Основная работа происходит на этом этапе в офлайн-режиме. Sibling Refinements Engine анализирует Session Data и User Preference Data для построения карты взаимосвязей между запросами (родитель-ребенок-родственник). Здесь генерируется база данных уточнений (Refinement Database).
INDEXING – Индексирование
Данные из индекса используются для расчета Inverse Document Frequency (IDF) для фильтрации родительских запросов, а также для определения топовых документов (top_docs), используемых при расчете разнообразия.
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
На этапе формирования SERP система обращается к базе данных уточнений, чтобы получить предварительно рассчитанные родственные запросы. Процесс фильтрации разнообразия (описанный в FIG. 8 и Claim 19) может применяться здесь (или быть предварительно рассчитанным) для выбора финального набора предложений, гарантируя, что они разнообразны по отношению друг к другу и к основному запросу.
Входные данные:
Session Data (последовательности запросов).User Preference Data (данные о кликах, CTR, показы).Выходные данные:
Child-Final Sibling Associations), сохраненные в базе данных уточнений.common-query threshold), и эти родители удовлетворяют требованиям качества (например, пороги Fan-out и IDF).intra-sibling diversity score выше порога) по сравнению с уже увиденными результатами.Процесс состоит из двух основных частей: идентификация кандидатов и фильтрация для обеспечения разнообразия.
Часть А: Идентификация кандидатов в родственные запросы (Офлайн)
Session Data, удаление подозрительного трафика (боты, спам), анонимизация.Fan-in (количество родителей) превышает порог.Fan-out (количество детей) превышает порог. Также могут удаляться родители с низким IDF или являющиеся суперстрокой (superstring) ребенка.common-query threshold).Strength of Relationship между родственными запросами на основе частоты их совместного появления после общих родителей. Фильтрация слабых связей.User Preference Data (например, CTR, взвешенные клики) или количества общих родителей.Часть Б: Фильтрация для обеспечения разнообразия (Sibling Filtering Engine)
Этот процесс выполняется для каждого дочернего запроса и его списка ранжированных кандидатов.
final_sibs). Инициализируется набор увиденных документов (seen_docs), который включает топовые документы исходного (дочернего) запроса.additional_sib) вычисляется intra-suggestion diversity. Это оценка того, насколько топовые результаты кандидата отличаются от документов в seen_docs.final_sibs.seen_docs. Это гарантирует, что следующий кандидат будет сравниваться и с ним тоже.desired_sibs) или пока не закончатся кандидаты.weighted clicks), CTR, показах (impressions). Используются для: (i) валидации связи родитель-ребенок (требование клика после ребенка); (ii) ранжирования кандидатов в родственные запросы; (iii) расчета оценки разнообразия (intra-sibling diversity score).IDF.Fan-in и Fan-out.User Preference Data (например, суммы оценок качества или tuple score) для документов, которые присутствуют в топе кандидата, но отсутствуют в наборе seen_docs.Session Data) для определения того, какие темы связаны между собой. Это поведенческое определение связи может отличаться от связей, установленных только на основе семантического анализа текста запросов или контента страниц.intra-suggestion diversity. Google активно избегает предложений ("Связанные запросы"), которые ведут к тем же результатам, что и исходный запрос или другие предложения в блоке. Цель — помочь пользователю исследовать новые направления.Fan-in и Fan-out позволяет системе игнорировать связи, основанные на слишком общих запросах (высокий Fan-out) или случайных переходах (высокий Fan-in), фокусируясь на значимых паттернах поведения.Strength of Relationship и ранжирует кандидатов, используя данные о кликах (User Preference Data), чтобы предложить наиболее полезные уточнения.sibling queries), которые пользователи естественным образом исследуют в рамках одной сессии. Это укрепляет релевантность сайта теме в целом.sibling queries система идентифицировала на основе поведения пользователей. Эти запросы должны быть интегрированы в вашу контент-стратегию.diversity), важно, чтобы разные родственные запросы вели на разные страницы вашего сайта (или на страницы с существенно разным контентом). Если несколько связанных запросов ведут к очень похожим результатам, Google не посчитает их достаточно разнообразными для показа в качестве уточнений.diverse).Session Data от подозрительного трафика (suspect traffic).Этот патент подтверждает стратегическую важность понимания не отдельных запросов, а всего процесса исследования темы пользователем. SEO-стратегия должна быть направлена на отображение контента на разнообразные пути (diverse paths), которые пользователи выбирают в рамках одной темы. Понимание того, какие запросы Google считает "родственными" (на основе поведения) и "разнообразными" (на основе результатов), критично для построения эффективной архитектуры сайта и достижения полного тематического охвата.
Сценарий: Оптимизация сайта о планетах (на основе примера из FIG. 1)
Session Data, что многие пользователи, искавшие [Solar System] (Parent Query), затем искали [Jupiter] (Child 1), а также [Mars] и [Venus] (Child 2, 3).sibling queries для [Jupiter], так как имеют общего родителя [Solar System].intra-suggestion diversity высока. [Mars] принимается как уточнение.Что такое "родственный запрос" (Sibling Query) согласно патенту?
Родственный запрос — это запрос, который имеет одного или нескольких общих "родительских" запросов с исходным запросом. Родительским считается запрос, который часто предшествует исходному и родственному запросам в рамках одной пользовательской сессии. Например, если пользователи часто ищут [Лучшие смартфоны], а затем [iPhone 15] или [Samsung S25], то [iPhone 15] и [Samsung S25] являются родственными запросами.
Как Google обеспечивает разнообразие в блоке "Связанные запросы"?
Google использует метрику intra-suggestion diversity. При выборе предложений система проверяет, насколько топовые результаты кандидата отличаются от результатов исходного запроса и уже выбранных предложений (seen_docs). Если результаты слишком похожи (разнообразие ниже порога), кандидат отклоняется. Это гарантирует, что каждое предложение ведет к новому набору информации.
Как этот патент влияет на мою стратегию ключевых слов?
Он подчеркивает необходимость перехода от изолированных ключевых слов к пониманию пути пользователя (user journey) и тематических кластеров. Необходимо анализировать, какие темы пользователи исследуют последовательно, и создавать контент для этих родственных, но различных интентов. Важно обеспечить, чтобы разные интенты вели на разные страницы вашего сайта, чтобы удовлетворить требованию разнообразия.
Что такое Fan-in и Fan-out и почему они важны?
Fan-out — это количество уникальных запросов, следующих за родительским запросом. Fan-in — это количество уникальных запросов, предшествующих дочернему запросу. Google фильтрует запросы с слишком высокими значениями этих метрик, чтобы исключить слишком общие (высокий Fan-out) или случайные (высокий Fan-in) связи и сфокусироваться на наиболее значимых паттернах поведения.
Основывается ли связь между запросами только на семантической близости текста?
Нет. Связь определяется в первую очередь на основе анализа поведения пользователей в Session Data. Два запроса считаются связанными, если пользователи часто вводят их последовательно. Хотя часто это коррелирует с семантической близостью, основой является именно поведенческий паттерн.
Использует ли Google данные о кликах (CTR) в этом алгоритме?
Да, User Preference Data (включая CTR, взвешенные клики) активно используются. Они могут применяться для валидации связи родитель-ребенок (требуя клика после дочернего запроса), для ранжирования кандидатов в родственные запросы и при расчете оценки разнообразия результатов.
Что такое "Сила связи" (Strength of Relationship) между запросами?
Это количественная мера того, насколько тесно связаны два родственных запроса. Она рассчитывается путем агрегации частот, с которыми оба запроса следовали за их общими родительскими запросами. Чем чаще они оба появляются после одних и тех же родителей, тем сильнее связь.
Может ли связь между родственными запросами быть односторонней?
Да, патент описывает такую возможность (FIG. 6 и соответствующее описание). Например, если Запрос А гораздо популярнее Запроса Б как уточнение для их общих родителей, то Запрос А может быть предложен как уточнение для Запроса Б, но Запрос Б не будет предложен для Запроса А, так как он менее полезен для пользователей, ищущих А.
Что произойдет, если я создам много страниц под близкие ключевые слова?
Если эти страницы имеют очень похожий контент и удовлетворяют одному и тому же интенту, Google не будет считать их разнообразными (diverse). В контексте этого патента, это не поможет занять больше мест в блоке "Связанные запросы", так как система отфильтрует предложения, ведущие к похожим результатам.
Как использовать информацию из этого патента для улучшения структуры сайта?
Необходимо спроектировать архитектуру сайта так, чтобы она отражала естественные пути исследования темы. Определите основные темы (потенциальные родительские запросы) и создайте кластеры контента для связанных субтопик (родственных запросов), убедившись, что каждый кластер отвечает на уникальный интент и предлагает разнообразную информацию.

Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Ссылки

Семантика и интент
Структура сайта
Ссылки

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Ссылки
Индексация
Техническое SEO

Свежесть контента
Ссылки
Техническое SEO

Мультиязычность
Поведенческие сигналы
Персонализация
