
Google моделирует поведение пользователей как Марковскую цепь, создавая Матрицу Переходов между поисковыми сущностями (запросы, документы, время, сессии, домены). Эта матрица определяет силу связей на основе истории поиска и используется для прогнозирования трендов (QDF), распространения сигналов релевантности между связанными документами и идентификации спама путем анализа поведенческих паттернов.
Патент решает задачу моделирования и количественной оценки сложных взаимосвязей (как прямых, так и косвенных) между различными типами поисковых сущностей (search entities) – запросами, документами, доменами, сессиями, временем и рекламой. Цель – использовать агрегированные данные о поведении пользователей (search history data) для улучшения релевантности результатов, прогнозирования темпоральных трендов (свежести/QDF) и обнаружения неестественной активности (спама).
Запатентована система построения и использования Search Entity Transition Matrix (Матрицы переходов). Эта матрица представляет собой модель Марковской цепи (Markov chain model), где узлы – это сущности, а ребра – это вероятности перехода (transition probabilities) между ними, рассчитанные на основе истории поиска. Система использует эту матрицу для определения силы связей между любыми двумя сущностями.
Система функционирует в несколько этапов:
click data) и данные сессий.first order transition probabilities). Например, вероятность перехода Запрос-Документ основана на статистике качества результата (Quality of Result (QoR) statistic), которая вычисляется из кликовых данных (например, long clicks).higher order transition probabilities), например, связь Запрос-Запрос через Документ или Запрос-Запрос через Время.Критически высокая. Моделирование поведения пользователей и понимание взаимосвязей между сущностями (документами, запросами, временем) лежат в основе современного поиска. Описанные в патенте приложения, такие как прогнозирование QDF, использование косвенных сигналов для ранжирования "длинного хвоста" и анализ сессий для обнаружения спама, являются фундаментальными задачами для Google.
Патент имеет критическое значение (9/10). Он описывает инфраструктурный механизм, который влияет на множество аспектов SEO: как Google оценивает релевантность на основе поведения, как сигналы могут передаваться между связанными страницами (Topical Authority), как работает механизм прогнозирования QDF (свежести), и как система может идентифицировать спам на основе поведенческих паттернов. Это напрямую влияет на стратегию создания контента и оптимизацию пользовательского опыта.
queries), документы (documents), домены (domains), сессии (sessions), рекламные объявления (advertisements), время (time), анкоры (anchors).Click Data (например, взвешенная сумма long clicks).Хотя описание патента широко, ключевые независимые пункты формулы изобретения фокусируются на конкретных применениях: Темпоральное Ранжирование (QDF) и Обнаружение Спама.
Claim 1 (Независимый пункт): Описывает метод Темпорального Ранжирования (QDF) на основе связей Запрос-Время-Запрос.
time-based query-to-query transition probabilities.significant increase in popularity) в это время года в прошлом.scoring data) для документов, релевантных Q2, чтобы предпочесть более новые документы (newer documents).Система использует исторические данные для прогнозирования будущих трендов. Если два запроса часто достигали пика вместе, и один начинает расти сейчас, система активирует QDF для второго.
Claim 3 и 5 (Зависимые от 1): Уточняют механизм модификации оценки для QDF.
Для предпочтения новых документов система дисконтирует (понижает вес) исторических сигналов: anchor score (оценки на основе анкоров) (Claim 3) и historical quality of result score (оценки на основе прошлых кликов) (Claim 5).
Claim 7 (Независимый пункт): Описывает метод обнаружения спам-сессий через связи Сессия-Документ-Сессия.
spam score) для второй сессии (S2). Расчет использует вероятности перехода: (S1 → Документы) и (Документы → S2).Спам-сигнал распространяется по графу поведения пользователей. Сессии, пересекающиеся по просмотренным документам со спам-сессиями, могут быть также помечены.
Claim 12 (Независимый пункт): Описывает метод обнаружения спам-запросов через связи Сессия-Запрос.
spam score для запроса (Q1), используя вероятность перехода (S1 → Q1).Изобретение является инфраструктурным и затрагивает несколько ключевых этапов поиска.
INDEXING – Индексирование и извлечение признаков (Офлайн-процессы)
Основная работа по построению модели происходит здесь. Система анализирует Search History Data (логи) и структуру веба (анкоры, домены) в офлайн-режиме для расчета вероятностей перехода первого порядка и генерации Transition Matrix. Также здесь рассчитываются базовые метрики, такие как QoR statistics.
QUNDERSTANDING – Понимание Запросов
Матрица используется для выявления связей между запросами – как семантических (через общие документы), так и темпоральных (через общее время пиков популярности).
RANKING – Ранжирование
Рассчитанные взаимосвязи могут использоваться для улучшения оценки релевантности. Например, система может использовать сигналы (анкоры, текст) от связанных документов для оценки текущего документа (Signal Propagation), что особенно полезно для документов с недостатком данных.
RERANKING – Переранжирование
Несколько ключевых применений активируются на этом этапе:
significant increase in popularity) для запроса или темпорально связанного с ним запроса.Spam Session для распространения спам-оценки.Процесс А: Построение Матрицы Переходов (Офлайн)
Search History Data и структурных данных (анкоры, домены).Quality of Result (QoR) statistics на основе Click Data. Определение пиков популярности запросов во времени.QoR; для Q→T используются данные о пиках популярности.Transition Matrix.Clipping (удаление низких вероятностей), Row Normalization (нормализация строк) и возведение в степень.Процесс Б: Применение Temporal Boosting (QDF) (На основе Claim 1)
Transition Matrix для поиска Запроса 2 (Q2), который темпорально связан с Q1 (высокая вероятность Q1→T→Q2).anchor scores и historical quality of result scores при ранжировании документов для Q2.Search History Data (логи), Click Data (клики), типы кликов (long/short click), время просмотра (dwell time), данные о сессиях. Это основа для расчета большинства вероятностей перехода.Anchor scores также используются как сигнал, который может быть дисконтирован при QDF.Click Data (например, как взвешенная сумма кликов, где вес зависит от времени просмотра).peak = 1, если был всплеск популярности).Smoothing (сглаживание), Clipping (отсечение низких вероятностей), Row Normalization и возведение в степень для борьбы с шумом и управления кластеризацией.QoR statistics является ключевой метрикой для оценки этих связей.Temporal Boosting. Google может прогнозировать будущие тренды, обнаружив рост популярности одного запроса и найдя связанные с ним по времени другие запросы.anchor score и historical QoR score. Это критически важно для ранжирования в трендовых тематиках.QoR) от связанных с ними авторитетных документов через поведенческий граф.Spam Sessions и распространять этот спам-сигнал на связанные сессии и запросы, дисконтируя сигналы ранжирования из этих источников.long clicks) для повышения Quality of Result (QoR) statistic. Это напрямую усиливает связь Запрос→Документ в матрице и является фундаментом для всех поведенческих связей.Transition Matrix.Temporal Boosting, так как исторические сигналы (ссылки) будут дисконтированы в этот момент.QoR по всему кластеру помогают правильной классификации домена.Spam Sessions) для манипуляции QoR крайне рискованно. Патент описывает механизм распространения спам-сигнала от одной сессии к связанным сессиям и запросам с последующим дисконтированием данных.Temporal Boosting, неэффективны. Система намеренно дисконтирует anchor scores и исторические клики в пользу свежести.Этот патент подчеркивает стратегический переход от анализа отдельных страниц и изолированных факторов к анализу поведения пользователей и взаимосвязей между сущностями в глобальном масштабе. Данные о поведении являются связующим звеном, объединяющим контент, ссылки, время и авторитет. Долгосрочная SEO-стратегия должна фокусироваться на удовлетворении интента пользователя на протяжении всего его пути (Customer Journey), а не только на оптимизации отдельных лендингов.
Сценарий 1: Использование QDF (Temporal Boosting)
Temporal Boosting.Сценарий 2: Перенос сигналов (Signal Propagation)
Transition Probability между Doc A и Doc B.QoR) от Doc A к Doc B, взвешивая их по силе связи.Что такое Transition Matrix в контексте этого патента?
Это масштабная база данных, моделирующая поиск как Цепь Маркова. Она хранит вероятности перехода (Transition Probabilities) между любыми поисковыми сущностями (запросами, документами, сессиями, временем, доменами). Она позволяет Google количественно оценить силу связи между ними на основе анализа агрегированной истории поиска.
Что такое Quality of Result (QoR) statistic и почему это важно для SEO?
QoR — это ключевая метрика, оценивающая, насколько пользователи были удовлетворены документом в ответ на запрос. Она рассчитывается на основе click data, вероятно, учитывая long clicks и время просмотра. QoR является основой для расчета вероятностей перехода между запросами и документами. Для SEO это означает, что оптимизация под удовлетворенность интента пользователя критически важна для усиления связей сайта в поведенческом графе Google.
Как этот патент помогает Google прогнозировать тренды (QDF)?
Патент описывает механизм Temporal Boosting. Система выявляет запросы, которые исторически имели пики популярности в одно и то же время (темпорально связанные). Если один из таких запросов начинает расти сейчас, система прогнозирует рост связанного запроса и превентивно активирует для него режим свежести (QDF), дисконтируя исторические сигналы ранжирования.
Какие именно сигналы дисконтируются (теряют вес) во время активации QDF?
В Claims патента явно указаны два типа исторических сигналов: anchor scores (оценки на основе ссылок/анкоров) и historical quality of result scores (оценки на основе прошлых кликов). Это означает, что во время тренда авторитет, накопленный за счет ссылок и прошлого поведения, временно уступает место свежести контента.
Влияет ли эта модель на ранжирование страниц "длинного хвоста" (long-tail)?
Да, очень значительно, через механизм переноса сигналов (Signal Propagation). Для редких документов часто не хватает прямых данных. Патент описывает, как система может использовать сигналы (анкоры, текст, QoR) от связанных, более популярных документов для ранжирования редкого документа, если между ними установлена сильная поведенческая связь.
Как система использует Transition Matrix для борьбы со спамом?
Если сессия идентифицирована как спам (Spam Session), система использует матрицу для расчета вероятности перехода от этой сессии к другим сессиям или запросам. Если вероятность высока, связанные сущности также получают высокий Spam Score, а сигналы ранжирования, полученные из этих источников (например, клики), дисконтируются.
Что такое вероятности первого и высшего порядка?
Вероятности первого порядка – это прямые связи, извлеченные из логов (например, пользователь ввел Запрос А и кликнул на Документ Б). Вероятности высшего порядка – это косвенные связи, рассчитанные путем умножения матриц (например, связь между Запросом А и Запросом В, потому что оба ведут на Документ Б). Они нужны для выявления неявных тематических и контекстуальных связей.
Как оптимизировать сайт, чтобы усилить связи в Transition Matrix?
Необходимо фокусироваться на качестве сессий и построении Topical Authority. Создавайте тематические хабы контента, которые отвечают на последовательные запросы пользователя и удерживают его на сайте. Это способствует появлению сильных связей между вашими документами и релевантными запросами в логах Google, что усиливает соответствующие вероятности перехода.
Как классификация доменов связана с этой матрицей?
Система рассчитывает вероятности перехода от домена к запросам по цепочке: Домен → Документы → Запросы. Домен классифицируется на основе набора запросов, с которыми он имеет наиболее сильные связи, рассчитанные через поведение пользователей. Это подчеркивает важность четкой тематической структуры сайта.
Учитывает ли эта модель только данные логов?
В основном да, но не исключительно. Помимо данных истории поиска (поведенческие факторы), модель также использует структурные данные. Например, для расчета переходов между документами (D→D) могут использоваться прямые анкоры (ссылки), а для переходов Домен→Документ используется информация о принадлежности URL домену.

Семантика и интент
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
SERP
Антиспам

Антиспам
SERP
Техническое SEO

EEAT и качество
SERP
Knowledge Graph

SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Антиспам

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Local SEO

Ссылки
EEAT и качество
Свежесть контента

Персонализация
SERP
Ссылки

EEAT и качество
Свежесть контента
Семантика и интент

Поведенческие сигналы
Ссылки

Семантика и интент
Поведенческие сигналы
SERP
