
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
Патент решает проблему сложности исследования пользователем связанных, но семантически разнообразных тем. Стандартный поиск требует ручного переформулирования запросов. Изобретение направлено на создание механизма "ориентированного на результат исследования документов" (result-oriented document exploration), аналогичного просмотру соседних книг на библиотечной полке. Цель — предложить пользователю связанные, но при этом разнообразные (diverse) пути исследования информации напрямую из поисковой выдачи.
Запатентована система генерации предлагаемых запросов (suggested queries), которые привязаны к конкретным документам в результатах поиска, а не ко всему запросу в целом. Ядром изобретения является модель "Документ-Запрос-Документ" (Document-to-Query-to-Document (D-Q-D) model). Эта модель, построенная на основе данных о поведении пользователей (user behavior data), позволяет идентифицировать запросы, которые связывают исходный документ с другими релевантными документами, отсутствующими в текущей выдаче.
Система функционирует в двух режимах:
user behavior data (например, клики и время просмотра (dwell time)), чтобы определить релевантность документов запросам. На основе этих данных строится D-Q-D model, которая структурирует связи: Документ А → Запрос X → Документ Б. Модель агрессивно фильтруется и сокращается (capping) для эффективности.D-Q-D model. Она ищет связанные Запросы X, которые удовлетворяют двум критериям разнообразия: 1) Запрос X содержит новые термины (Term Diversity); 2) Запрос X ведет к Документу Б, который отсутствует в текущих результатах (Result Diversity). Удовлетворяющий критериям Запрос X предлагается пользователю как подсказка, связанная с Документом А.Высокая. Механизмы, помогающие пользователям исследовать темы и находить разнообразный контент (например, блоки "Связанные запросы", "Люди также ищут"), являются неотъемлемой частью современного поиска. Опора на данные о поведении пользователей для оценки релевантности и построения связей между контентом остается центральной стратегией Google. Изобретатель Paul Haahr является ключевой фигурой в разработке алгоритмов ранжирования Google.
Патент имеет высокое значение (7.5/10) для SEO-стратегии. Он демонстрирует механизм, который напрямую влияет на путь пользователя (user journey) и обнаружение контента. Для попадания в D-Q-D model критически важна высокая релевантность документа для нескольких связанных запросов, подтвержденная поведением пользователей (например, long clicks). Это подчеркивает важность построения Topical Authority и оптимизации под удовлетворенность пользователя.
user behavior data, включающий информацию о том, как долго пользователь просматривает документ после клика (dwell time).Q-D Model. Связывает документы с релевантными для них запросами.D-Q-D Model (первая D). При обслуживании запроса это документ из текущей поисковой выдачи.long click) интерпретируется как признак релевантности. Короткое время (short click) — как признак отсутствия релевантности.user behavior data. Связывает запрос с набором релевантных документов и их оценками.user behavior data, используемая для оценки релевантности документа конкретному запросу (например, взвешенное среднее длинных кликов).Result Diversity.Term Diversity.D-Q-D Model.Claim 1 (Независимый пункт): Описывает основной метод предоставления предлагаемых запросов на основе разнообразия результатов.
document-to-query-to-document model.user behavior data) пороговый уровень diversity (разнообразия) по сравнению с первыми результатами поиска.Ядро изобретения — использование D-Q-D model для нахождения связанных запросов и обязательная проверка того, что эти запросы ведут к новым результатам (threshold level of diversity), причем релевантность определяется через user behavior data.
Claim 3 (Зависимый от 1): Уточняет, что связи в D-Q-D model (между первым документом, ПЗ и вторыми документами) основаны на данных, указывающих на поведение пользователей относительно этих документов как результатов поиска.
Claim 4 (Зависимый от 1): Описывает офлайн-процесс создания D-Q-D model.
query-to-document models (Q-D) для ПЗ, связывающих запросы с релевантными документами.D-Q-D model.Claim 12 (Зависимый от 1): Добавляет критерий разнообразия терминов.
term diversity (разнообразия терминов) для ПЗ по сравнению с первым запросом.term diversity.Изобретение затрагивает несколько этапов поиска, разделяясь на офлайн-процессы построения модели и онлайн-процессы обслуживания запросов.
CRAWLING / INDEXING (Сбор и обработка данных)
На этом этапе происходит сбор User Behavior Data (клики, dwell time) из журналов выбора результатов (Result Selection Logs). Эти данные обрабатываются для вычисления Quality of Result Statistics.
QUNDERSTANDING / INDEXING (Построение модели - Офлайн)
Это основной этап для офлайн-компонентов. D-Q-D Model Creation Engine использует обработанные данные о поведении пользователей для построения и обновления D-Q-D Model. Это включает фильтрацию запросов и документов, расчет оценок релевантности и структурирование связей (D-Q-D).
RANKING – Ранжирование
На этом этапе генерируется стандартный набор результатов для исходного запроса.
RERANKING / METASEARCH (Онлайн)
Основное применение патента в реальном времени. После того как этап RANKING сгенерировал список результатов, активируется Query Suggestion Engine.
D-Q-D Model для поиска кандидатов в предлагаемые запросы.Term Diversity, Result Diversity) и ранжирует оставшихся кандидатов по оценке (score).Входные данные (Онлайн):
D-Q-D Model.Выходные данные (Онлайн):
D-Q-D Model. Наиболее заметно влияние на информационные и исследовательские запросы, где пользователи стремятся изучить тему глубже.Indexing Document в D-Q-D Model; 2) Существуют связанные запросы и документы, удовлетворяющие критериям Term Diversity и Result Diversity.Процесс А: Онлайн обслуживание запроса (Online Serving)
Used Terms (UT) терминами входного запроса и Used Documents (UD) документами из результатов.Indexing Document) извлекаются соответствующие разделы Q-D из D-Q-D Model.score) для документа (например, функция от оценки индексирующего документа и оценки целевого документа).Candidate Queries (CQ) в формате <Запрос, Документ, Оценка>.Процесс Б: Офлайн построение D-Q-D Model (Offline Model Creation)
User Behavior Data. Документы оцениваются (Quality of Result Statistic) и фильтруются по порогу оценки. Запросы с недостаточным количеством документов также фильтруются. Документы сортируются по оценке.query term collisions) для обеспечения разнообразия внутри модели.D-Q-D Model.Ключевыми данными для этого патента являются поведенческие факторы.
D-Q-D Model. Используются данные о реакции пользователей на документы в результатах поиска. Конкретно упоминаются: Long Click vs Short Click).Term Diversity и для фильтрации коллизий терминов при построении модели.IR score), хотя фокус сделан на поведении пользователей.User Behavior Data. Пример расчета: взвешенное среднее количества длинных кликов (weighted average of the count of long clicks) для данного документа и запроса. Эта оценка используется для ранжирования документов внутри Q-D моделей.D-Q-D Model). Возможные функции: Used Terms (UT). Могут использоваться алгоритмы нечеткого сравнения (edit distance, синонимы, морфология).Used Documents (UD).D-Q-D Model строится на основе того, как пользователи взаимодействуют с результатами (User Behavior Data, Click Data). Релевантность в этой системе — это не текстовое совпадение, а подтвержденная пользователями полезность документа для запроса.Term Diversity (новые термины по сравнению с исходным запросом) и Result Diversity (вести к документам, отсутствующим в текущей выдаче).D-Q-D Model выполняются офлайн. Это позволяет системе быстро генерировать подсказки в реальном времени, используя предварительно рассчитанную модель.capping) для удаления шума, обеспечения качества и оптимизации размера модели, что затрудняет манипуляции.D-Q-D Model основана на User Behavior Data (особенно Long Clicks), критически важно создавать контент, который полностью отвечает интенту пользователя и удерживает его на странице. Это повышает Quality of Result Statistic, что необходимо для включения в модель и получения высоких оценок.D-Q-D Model. Если ваш сайт является авторитетным источником в нише, этот механизм может направлять к вам трафик из смежных тематик.Result Diversity), поэтому уникальный и полезный контент имеет больше шансов стать целью предлагаемого запроса.D-Q-D Model. Short Clicks сигнализируют о низкой релевантности.D-Q-D Model и не сможет эффективно участвовать в этом механизме перелинковки трафика.Result Diversity (проверка Used Documents).Патент подтверждает критическую важность данных о поведении пользователей в экосистеме Google. Он описывает конкретный механизм, где Google использует эти данные не просто для ранжирования, а для активного построения карты связей между документами через призму пользовательских запросов. Стратегически это означает, что SEO должно быть сосредоточено на реальной полезности контента и покрытии всего спектра интентов в рамках темы. Успех в этой системе измеряется не только позициями, но и тем, насколько центральным узлом в тематической карте (D-Q-D Model) является ваш документ.
Сценарий 1: Генерация подсказок для статьи о контроле версий
long clicks), также часто ищут "versioning", "source control" и "control system" и находят по ним другие полезные документы (Документы Б, В, Г).Term Diversity: Запросы "source control" и "versioning" содержат новые термины по сравнению с "version control".Result Diversity: Документы Б, В, Г отсутствуют в текущей выдаче по запросу "version control".Сценарий 2: Использование контента как тематического моста (SEO)
Long Clicks по обоим запросам.Что такое модель D-Q-D и как она строится?
Модель Document-to-Query-to-Document (D-Q-D) — это структура данных, которая связывает документы через запросы. Она строится офлайн на основе анализа поведения пользователей (User Behavior Data), в частности, кликов и времени просмотра (Dwell Time). Сначала система определяет, какие документы релевантны каким запросам (Q-D модель), затем инвертирует это (D-Q модель) и объединяет их. Если Документ А релевантен Запросу X, и Запрос X релевантен Документу Б, модель устанавливает связь D(A)→Q(X)→D(B).
Что означают критерии Term Diversity и Result Diversity?
Это два ключевых фильтра для обеспечения новизны предлагаемых запросов. Term Diversity требует, чтобы предлагаемый запрос содержал хотя бы один термин, которого нет в исходном запросе или других подсказках. Result Diversity требует, чтобы предлагаемый запрос вел к документам, которые отсутствуют в текущей поисковой выдаче. Цель — избежать предложения синонимичных запросов, ведущих к тем же самым результатам.
Как система определяет релевантность документа запросу в этой модели?
Релевантность определяется в первую очередь на основе User Behavior Data. Система вычисляет Quality of Result Statistic, которая часто основывается на концепции Long Clicks (длительное время взаимодействия с документом после клика). Чем выше удовлетворенность пользователей документом по данному запросу, тем выше его оценка релевантности в модели D-Q-D.
Могу ли я повлиять на то, какие запросы предлагаются для моей страницы?
Напрямую контролировать это нельзя, но можно повлиять косвенно. Чтобы увеличить шансы на генерацию подсказок, ваша страница должна быть высоко релевантной (иметь высокие показатели Long Clicks) для нескольких разнообразных, но тематически связанных запросов. Создание контента, который всесторонне раскрывает тему и отвечает на смежные интенты, способствует формированию нужных связей в D-Q-D модели.
Почему для одних документов в выдаче есть подсказки, а для других нет?
Это зависит от нескольких факторов. Во-первых, документ должен присутствовать в D-Q-D модели как индексирующий документ с достаточным количеством данных. Во-вторых, должны существовать связанные запросы и документы, которые удовлетворяют строгим критериям Term Diversity и Result Diversity. Если документ новый, узкоспециализированный или имеет низкие показатели удовлетворенности пользователей, подсказки могут не генерироваться.
Как этот патент связан с Topical Authority?
Он имеет прямую связь. Чтобы стать центральным узлом в D-Q-D модели, сайт или страница должны демонстрировать авторитетность по широкому спектру запросов в рамках темы. Система идентифицирует авторитетные источники через анализ поведения пользователей. Развитие Topical Authority естественным образом ведет к формированию множества сильных связей D-Q, что является основой для работы этого механизма.
Использует ли система стандартные IR-оценки (текстовую релевантность) в этом алгоритме?
Патент упоминает, что IR scores могут использоваться как альтернативный или дополнительный источник для определения релевантности при построении модели. Однако основной фокус сделан на User Behavior Data (клики и время просмотра) как на более надежный индикатор реальной полезности контента для пользователя.
Как система решает, какой из множества кандидатов выбрать в качестве подсказки?
Система рассчитывает оценку (Serving Score) для каждой пары <Кандидатский Запрос, Целевой Документ>. Эта оценка является функцией от оценок релевантности как исходного документа, так и целевого документа (взятых из D-Q-D модели). Кандидаты сортируются по этой оценке, и выбираются лучшие, которые также удовлетворяют критериям разнообразия.
Что происходит, если я создам много похожих страниц, чтобы занять больше места в выдаче?
Этот механизм активно борется с таким подходом через фильтр Result Diversity. Система поддерживает список Used Documents (UD). Если предлагаемый запрос ведет к документу, который уже есть в выдаче (даже если это другая страница вашего сайта), этот запрос будет отфильтрован. Система ищет новизну, а не дублирование.
Насколько агрессивно фильтруются данные при создании D-Q-D модели?
Фильтрация достаточно агрессивна. Удаляются нежелательные запросы (длинные, спамные), документы с низкими показателями удовлетворенности пользователей и запросы с недостаточным количеством релевантных документов. Также применяется сокращение (capping) количества связей и фильтрация по коллизиям терминов для обеспечения качества и оптимизации размера модели.

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
Персонализация

Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы

Индексация
Семантика и интент
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
SERP

Мультимедиа
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
EEAT и качество

Поведенческие сигналы
Семантика и интент
Мультимедиа
