SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует Матрицу Переходов (Markov Chains) для связи запросов, документов, времени и сессий, чтобы улучшить релевантность, прогнозировать QDF и бороться со спамом

SEARCH ENTITY TRANSITION MATRIX AND APPLICATIONS OF THE TRANSITION MATRIX (Матрица переходов между поисковыми сущностями и ее применение)
  • US8515975B1
  • Google LLC
  • 2009-12-07
  • 2013-08-20
  • Поведенческие сигналы
  • Антиспам
  • Свежесть контента
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google моделирует поведение пользователей как Марковскую цепь, создавая Матрицу Переходов между поисковыми сущностями (запросы, документы, время, сессии, домены). Эта матрица определяет силу связей на основе истории поиска и используется для прогнозирования трендов (QDF), распространения сигналов релевантности между связанными документами и идентификации спама путем анализа поведенческих паттернов.

Описание

Какую проблему решает

Патент решает задачу моделирования и количественной оценки сложных взаимосвязей (как прямых, так и косвенных) между различными типами поисковых сущностей (search entities) – запросами, документами, доменами, сессиями, временем и рекламой. Цель – использовать агрегированные данные о поведении пользователей (search history data) для улучшения релевантности результатов, прогнозирования темпоральных трендов (свежести/QDF) и обнаружения неестественной активности (спама).

Что запатентовано

Запатентована система построения и использования Search Entity Transition Matrix (Матрицы переходов). Эта матрица представляет собой модель Марковской цепи (Markov chain model), где узлы – это сущности, а ребра – это вероятности перехода (transition probabilities) между ними, рассчитанные на основе истории поиска. Система использует эту матрицу для определения силы связей между любыми двумя сущностями.

Как это работает

Система функционирует в несколько этапов:

  • Сбор данных: Агрегируются данные истории поиска, включая запросы, клики, время просмотра (click data) и данные сессий.
  • Расчет вероятностей первого порядка: Рассчитываются прямые вероятности перехода (first order transition probabilities). Например, вероятность перехода Запрос-Документ основана на статистике качества результата (Quality of Result (QoR) statistic), которая вычисляется из кликовых данных (например, long clicks).
  • Построение Матрицы Переходов: Все вероятности первого порядка объединяются в единую матрицу.
  • Расчет вероятностей высших порядков: Путем умножения матрицы система вычисляет косвенные связи (higher order transition probabilities), например, связь Запрос-Запрос через Документ или Запрос-Запрос через Время.
  • Применение: Вычисленные вероятности используются для различных задач: прогнозирование QDF (Temporal Boosting), распространение сигналов релевантности между документами, классификация доменов и обнаружение спама.

Актуальность для SEO

Критически высокая. Моделирование поведения пользователей и понимание взаимосвязей между сущностями (документами, запросами, временем) лежат в основе современного поиска. Описанные в патенте приложения, такие как прогнозирование QDF, использование косвенных сигналов для ранжирования "длинного хвоста" и анализ сессий для обнаружения спама, являются фундаментальными задачами для Google.

Важность для SEO

Патент имеет критическое значение (9/10). Он описывает инфраструктурный механизм, который влияет на множество аспектов SEO: как Google оценивает релевантность на основе поведения, как сигналы могут передаваться между связанными страницами (Topical Authority), как работает механизм прогнозирования QDF (свежести), и как система может идентифицировать спам на основе поведенческих паттернов. Это напрямую влияет на стратегию создания контента и оптимизацию пользовательского опыта.

Детальный разбор

Термины и определения

Search Entity (Поисковая сущность)
Элемент поискового опыта, являющийся узлом в графе. Примеры: запросы (queries), документы (documents), домены (domains), сессии (sessions), рекламные объявления (advertisements), время (time), анкоры (anchors).
Transition Probability (Вероятность перехода)
Оценка силы связи между двумя сущностями в модели цепи Маркова.
First Order Transition Probability (Вероятность перехода первого порядка)
Прямая вероятность перехода, рассчитанная непосредственно из исходных данных (например, логов поиска).
Higher Order Transition Probability (Вероятность перехода высшего порядка)
Косвенная вероятность перехода через промежуточные узлы (например, Q1→D→Q2). Вычисляется путем умножения матрицы переходов.
Search Entity Transition Matrix (Матрица переходов)
Матрица, хранящая вероятности переходов между всеми парами поисковых сущностей.
Quality of Result (QoR) Statistic (Статистика качества результата)
Метрика, оценивающая, насколько релевантным пользователи сочли документ в ответ на запрос. Рассчитывается на основе Click Data (например, взвешенная сумма long clicks).
Markov Chain Model (Модель цепи Маркова)
Математическая модель, используемая для описания системы, где сущности – это состояния, а вероятности перехода определяют модель.
Temporal Boosting (Темпоральное повышение/QDF)
Механизм модификации ранжирования для запросов, испытывающих или прогнозируемо испытающих рост популярности, с целью предпочтения более свежих документов.
Temporally Related Queries (Темпорально связанные запросы)
Запросы, которые имеют тенденцию демонстрировать всплеск популярности примерно в одно и то же время.
Spam Session (Спам-сессия)
Сессия, в которой запросы и клики могут не отражать подлинных предпочтений пользователя (например, накрутка).

Ключевые утверждения (Анализ Claims)

Хотя описание патента широко, ключевые независимые пункты формулы изобретения фокусируются на конкретных применениях: Темпоральное Ранжирование (QDF) и Обнаружение Спама.

Claim 1 (Независимый пункт): Описывает метод Темпорального Ранжирования (QDF) на основе связей Запрос-Время-Запрос.

  1. Система определяет, связан ли второй запрос (Q2) темпорально с первым запросом (Q1). Это делается на основе рассчитанных time-based query-to-query transition probabilities.
  2. Расчет включает вероятности: (Q1 → Время года) и (Время года → Q2).
  3. Вероятность (Q1 → Время года) оценивает силу связи и определяется так:
    1. Определяется, был ли у Q1 значительный всплеск популярности (significant increase in popularity) в это время года в прошлом.
    2. Если ДА, вероятность рассчитывается как функция от того, сколько раз у Q1 наблюдался этот всплеск.
  4. Система модифицирует данные оценки (scoring data) для документов, релевантных Q2, чтобы предпочесть более новые документы (newer documents).

Система использует исторические данные для прогнозирования будущих трендов. Если два запроса часто достигали пика вместе, и один начинает расти сейчас, система активирует QDF для второго.

Claim 3 и 5 (Зависимые от 1): Уточняют механизм модификации оценки для QDF.

Для предпочтения новых документов система дисконтирует (понижает вес) исторических сигналов: anchor score (оценки на основе анкоров) (Claim 3) и historical quality of result score (оценки на основе прошлых кликов) (Claim 5).

Claim 7 (Независимый пункт): Описывает метод обнаружения спам-сессий через связи Сессия-Документ-Сессия.

  1. Получаются данные, идентифицирующие первую сессию (S1) как спам.
  2. Вычисляется оценка спама (spam score) для второй сессии (S2). Расчет использует вероятности перехода: (S1 → Документы) и (Документы → S2).
  3. S2 идентифицируется как спам на основе полученной оценки.

Спам-сигнал распространяется по графу поведения пользователей. Сессии, пересекающиеся по просмотренным документам со спам-сессиями, могут быть также помечены.

Claim 12 (Независимый пункт): Описывает метод обнаружения спам-запросов через связи Сессия-Запрос.

  1. Получаются данные, идентифицирующие сессию (S1) как спам.
  2. Вычисляется spam score для запроса (Q1), используя вероятность перехода (S1 → Q1).
  3. Q1 идентифицируется как спам на основе полученной оценки.

Где и как применяется

Изобретение является инфраструктурным и затрагивает несколько ключевых этапов поиска.

INDEXING – Индексирование и извлечение признаков (Офлайн-процессы)
Основная работа по построению модели происходит здесь. Система анализирует Search History Data (логи) и структуру веба (анкоры, домены) в офлайн-режиме для расчета вероятностей перехода первого порядка и генерации Transition Matrix. Также здесь рассчитываются базовые метрики, такие как QoR statistics.

QUNDERSTANDING – Понимание Запросов
Матрица используется для выявления связей между запросами – как семантических (через общие документы), так и темпоральных (через общее время пиков популярности).

RANKING – Ранжирование
Рассчитанные взаимосвязи могут использоваться для улучшения оценки релевантности. Например, система может использовать сигналы (анкоры, текст) от связанных документов для оценки текущего документа (Signal Propagation), что особенно полезно для документов с недостатком данных.

RERANKING – Переранжирование
Несколько ключевых применений активируются на этом этапе:

  • Temporal Boosting (QDF): При обнаружении тренда система модифицирует веса факторов ранжирования, дисконтируя исторические сигналы и повышая свежие.
  • Spam Detection: Данные из сессий или запросов, помеченных как спам с помощью матрицы, дисконтируются при расчете финальных оценок.
  • Result Augmentation: Система может дополнять выдачу документами, которые имеют высокую вероятность перехода от топовых результатов.

На что влияет

  • Трендовые и новостные запросы (QDF): Механизм Temporal Boosting напрямую влияет на ранжирование свежего контента, делая исторические сигналы менее значимыми в моменты пиковой актуальности.
  • Запросы "длинного хвоста" и новые документы: Позволяет улучшить их ранжирование за счет использования сигналов от связанных, более популярных сущностей (Signal Propagation).
  • Тематические кластеры и домены: Позволяет оценивать связанные документы и классифицировать домены по темам на основе ассоциированных запросов (Domain Classification).

Когда применяется

  • Расчет матрицы: Происходит периодически в офлайн-режиме.
  • Применение в ранжировании: Происходит в реальном времени при обработке запроса.
  • Триггеры активации (QDF): Активируется при обнаружении значительного роста популярности (significant increase in popularity) для запроса или темпорально связанного с ним запроса.
  • Триггеры активации (Spam): Активируется при наличии исходного сигнала о Spam Session для распространения спам-оценки.

Пошаговый алгоритм

Процесс А: Построение Матрицы Переходов (Офлайн)

  1. Сбор и обработка данных: Агрегация Search History Data и структурных данных (анкоры, домены).
  2. Расчет базовых метрик: Вычисление Quality of Result (QoR) statistics на основе Click Data. Определение пиков популярности запросов во времени.
  3. Расчет вероятностей первого порядка: Применение специфических функций переноса для разных пар сущностей. Например, для Q→D используется QoR; для Q→T используются данные о пиках популярности.
  4. Построение матрицы: Формирование исходной Transition Matrix.
  5. Расчет вероятностей высших порядков: Итеративное перемножение матрицы для выявления косвенных связей (например, Q1→D→Q2 или Q1→T→Q2).
  6. Постобработка матрицы: Применение методов для снижения шума и управления кластеризацией: Clipping (удаление низких вероятностей), Row Normalization (нормализация строк) и возведение в степень.

Процесс Б: Применение Temporal Boosting (QDF) (На основе Claim 1)

  1. Мониторинг популярности: Отслеживание частоты запросов в реальном времени.
  2. Обнаружение тренда: Идентификация значительного роста популярности для Запроса 1 (Q1).
  3. Поиск связанных запросов: Использование предварительно рассчитанной Transition Matrix для поиска Запроса 2 (Q2), который темпорально связан с Q1 (высокая вероятность Q1→T→Q2).
  4. Модификация скоринга для Q2: Активация режима предпочтения свежести для Q2.
  5. Дисконтирование исторических сигналов: Понижение веса anchor scores и historical quality of result scores при ранжировании документов для Q2.
  6. Финальное ранжирование: Формирование выдачи по Q2 с учетом модифицированных оценок.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Ключевые): Search History Data (логи), Click Data (клики), типы кликов (long/short click), время просмотра (dwell time), данные о сессиях. Это основа для расчета большинства вероятностей перехода.
  • Временные факторы: Время отправки запросов, используемое для анализа пиков популярности и расчета Q→T и T→Q.
  • Ссылочные факторы: Анкоры между документами (используются для расчета D→D). Anchor scores также используются как сигнал, который может быть дисконтирован при QDF.
  • Структурные факторы: Связь Документ-Домен (используется для D→Domain и Domain→D).
  • Коммерческие факторы: Доход от рекламы (revenue), используемый для расчета Q→Ad и Ad→Q.

Какие метрики используются и как они считаются

  • Quality of Result (QoR) statistic: Оценка релевантности документа запросу. Рассчитывается из Click Data (например, как взвешенная сумма кликов, где вес зависит от времени просмотра).
  • Transition Probability (Вероятность перехода PtranP_{tran}Ptran​): Основная метрика системы. Рассчитывается с помощью специфических функций переноса. Общий принцип – нормализация.
  • Пример формулы P(D→Q) (Документ→Запрос): Ptran(D,Q)=qor(D,Q)∑Все запросыqor(D,Запрос)P_{tran}(D, Q) = \frac{qor(D, Q)}{\sum_{\text{Все запросы}} qor(D, \text{Запрос})}Ptran​(D,Q)=Все запросы∑​qor(D,Запрос)qor(D,Q)​
  • Пример формулы P(Q→T) (Запрос→Время) (Claim 7): Ptran(Q,T)=peak(Q,T)∑Все времяpeak(Q,Время)P_{tran}(Q, T) = \frac{peak(Q, T)}{\sum_{\text{Все время}} peak(Q, \text{Время})}Ptran​(Q,T)=Все время∑​peak(Q,Время)peak(Q,T)​ (где peak = 1, если был всплеск популярности).
  • Spam Score: Оценка вероятности спама, рассчитанная путем распространения спам-сигнала через матрицу переходов.
  • Методы обработки данных: Используются Smoothing (сглаживание), Clipping (отсечение низких вероятностей), Row Normalization и возведение в степень для борьбы с шумом и управления кластеризацией.

Выводы

  1. Поведение пользователя как основа связей: Патент демонстрирует фундаментальный подход к моделированию связей между всеми поисковыми сущностями, где основным источником данных являются логи поведения пользователей (клики, сессии, время). QoR statistics является ключевой метрикой для оценки этих связей.
  2. Выявление косвенных связей (Higher Order Probabilities): Ключевая особенность — использование цепей Маркова для выявления косвенных связей. Это позволяет понять, как связаны запросы или документы, которые напрямую не взаимодействовали, но связаны через промежуточные сущности (например, через общие документы или общее время пиковой популярности).
  3. Предиктивная актуальность (QDF): Патент детально описывает механизм Temporal Boosting. Google может прогнозировать будущие тренды, обнаружив рост популярности одного запроса и найдя связанные с ним по времени другие запросы.
  4. Агрессивное дисконтирование исторических сигналов для QDF: Для продвижения свежего контента система намеренно понижает вес исторических сигналов, таких как anchor score и historical QoR score. Это критически важно для ранжирования в трендовых тематиках.
  5. Перенос сигналов (Signal Propagation): Система может улучшать ранжирование документов с недостатком данных ("длинный хвост"), перенося сигналы (анкоры, текст, QoR) от связанных с ними авторитетных документов через поведенческий граф.
  6. Механизм борьбы с поведенческим спамом: Система может идентифицировать Spam Sessions и распространять этот спам-сигнал на связанные сессии и запросы, дисконтируя сигналы ранжирования из этих источников.

Практика

Best practices (это мы делаем)

  • Оптимизация под удовлетворенность пользователя (Intent Satisfaction): Необходимо максимизировать сигналы удовлетворенности (например, long clicks) для повышения Quality of Result (QoR) statistic. Это напрямую усиливает связь Запрос→Документ в матрице и является фундаментом для всех поведенческих связей.
  • Построение тематического авторитета через сессии: Создавайте кластеры контента, которые поддерживают длинные сессии и отвечают на последовательные запросы пользователя в рамках одной темы. Это усиливает косвенные связи между вашими документами (D→S→D) и связанными запросами (Q→S→Q) в Transition Matrix.
  • Прогнозирование и использование QDF: Мониторьте не только прямые, но и смежные или сезонно связанные запросы в нише. Быстрое создание свежего контента под прогнозируемые тренды позволит воспользоваться Temporal Boosting, так как исторические сигналы (ссылки) будут дисконтированы в этот момент.
  • Кластеризация контента для классификации домена: Система классифицирует домен на основе запросов, связанных с его документами (Domain→D→Q). Четкая тематическая структура и высокое QoR по всему кластеру помогают правильной классификации домена.

Worst practices (это делать не надо)

  • Накрутка поведенческих факторов: Создание искусственных сессий (Spam Sessions) для манипуляции QoR крайне рискованно. Патент описывает механизм распространения спам-сигнала от одной сессии к связанным сессиям и запросам с последующим дисконтированием данных.
  • Игнорирование свежести для трендовых запросов: Попытки ранжировать устаревший контент по запросам, для которых активирован Temporal Boosting, неэффективны. Система намеренно дисконтирует anchor scores и исторические клики в пользу свежести.
  • Создание изолированного контента (Piecemeal Content): Публикация статей, которые не связаны тематически и не поддерживают продолжение сессии пользователя, ослабляет связи в матрице, мешает классификации домена и не позволяет эффективно передавать сигналы ранжирования.

Стратегическое значение

Этот патент подчеркивает стратегический переход от анализа отдельных страниц и изолированных факторов к анализу поведения пользователей и взаимосвязей между сущностями в глобальном масштабе. Данные о поведении являются связующим звеном, объединяющим контент, ссылки, время и авторитет. Долгосрочная SEO-стратегия должна фокусироваться на удовлетворении интента пользователя на протяжении всего его пути (Customer Journey), а не только на оптимизации отдельных лендингов.

Практические примеры

Сценарий 1: Использование QDF (Temporal Boosting)

  1. Историческая связь: Google знает, что запросы [Оскар] и [День Святого Валентина] темпорально связаны (Q→T→Q), так как оба имеют пики в феврале.
  2. Триггер: В начале февраля запрос [День Святого Валентина] начинает расти в популярности.
  3. Действие системы: Google прогнозирует скорый рост запроса [Оскар] и активирует для него Temporal Boosting.
  4. Модификация ранжирования: Исторические сигналы (ссылки на статьи прошлых лет об Оскаре) дисконтируются.
  5. Результат для SEO: Новостные сайты, которые оперативно публикуют свежие новости о номинантах текущего года, получают преимущество над старыми авторитетными статьями, даже если у них меньше ссылок.

Сценарий 2: Перенос сигналов (Signal Propagation)

  1. Ситуация: Опубликована новая страница (Doc B) по НЧ запросу, у неё мало ссылок. Есть авторитетная страница (Doc A) на том же сайте.
  2. Связь в матрице: Анализ логов показывает, что пользователи часто взаимодействуют с Doc A и Doc B в рамках схожих поисковых задач (например, в одной сессии или по схожим запросам). Система устанавливает высокую Transition Probability между Doc A и Doc B.
  3. Действие системы: Система переносит сигналы ранжирования (например, анкорный текст, QoR) от Doc A к Doc B, взвешивая их по силе связи.
  4. Результат для SEO: Doc B получает более высокую позицию в выдаче, чем если бы он оценивался только по собственным сигналам.

Вопросы и ответы

Что такое Transition Matrix в контексте этого патента?

Это масштабная база данных, моделирующая поиск как Цепь Маркова. Она хранит вероятности перехода (Transition Probabilities) между любыми поисковыми сущностями (запросами, документами, сессиями, временем, доменами). Она позволяет Google количественно оценить силу связи между ними на основе анализа агрегированной истории поиска.

Что такое Quality of Result (QoR) statistic и почему это важно для SEO?

QoR — это ключевая метрика, оценивающая, насколько пользователи были удовлетворены документом в ответ на запрос. Она рассчитывается на основе click data, вероятно, учитывая long clicks и время просмотра. QoR является основой для расчета вероятностей перехода между запросами и документами. Для SEO это означает, что оптимизация под удовлетворенность интента пользователя критически важна для усиления связей сайта в поведенческом графе Google.

Как этот патент помогает Google прогнозировать тренды (QDF)?

Патент описывает механизм Temporal Boosting. Система выявляет запросы, которые исторически имели пики популярности в одно и то же время (темпорально связанные). Если один из таких запросов начинает расти сейчас, система прогнозирует рост связанного запроса и превентивно активирует для него режим свежести (QDF), дисконтируя исторические сигналы ранжирования.

Какие именно сигналы дисконтируются (теряют вес) во время активации QDF?

В Claims патента явно указаны два типа исторических сигналов: anchor scores (оценки на основе ссылок/анкоров) и historical quality of result scores (оценки на основе прошлых кликов). Это означает, что во время тренда авторитет, накопленный за счет ссылок и прошлого поведения, временно уступает место свежести контента.

Влияет ли эта модель на ранжирование страниц "длинного хвоста" (long-tail)?

Да, очень значительно, через механизм переноса сигналов (Signal Propagation). Для редких документов часто не хватает прямых данных. Патент описывает, как система может использовать сигналы (анкоры, текст, QoR) от связанных, более популярных документов для ранжирования редкого документа, если между ними установлена сильная поведенческая связь.

Как система использует Transition Matrix для борьбы со спамом?

Если сессия идентифицирована как спам (Spam Session), система использует матрицу для расчета вероятности перехода от этой сессии к другим сессиям или запросам. Если вероятность высока, связанные сущности также получают высокий Spam Score, а сигналы ранжирования, полученные из этих источников (например, клики), дисконтируются.

Что такое вероятности первого и высшего порядка?

Вероятности первого порядка – это прямые связи, извлеченные из логов (например, пользователь ввел Запрос А и кликнул на Документ Б). Вероятности высшего порядка – это косвенные связи, рассчитанные путем умножения матриц (например, связь между Запросом А и Запросом В, потому что оба ведут на Документ Б). Они нужны для выявления неявных тематических и контекстуальных связей.

Как оптимизировать сайт, чтобы усилить связи в Transition Matrix?

Необходимо фокусироваться на качестве сессий и построении Topical Authority. Создавайте тематические хабы контента, которые отвечают на последовательные запросы пользователя и удерживают его на сайте. Это способствует появлению сильных связей между вашими документами и релевантными запросами в логах Google, что усиливает соответствующие вероятности перехода.

Как классификация доменов связана с этой матрицей?

Система рассчитывает вероятности перехода от домена к запросам по цепочке: Домен → Документы → Запросы. Домен классифицируется на основе набора запросов, с которыми он имеет наиболее сильные связи, рассчитанные через поведение пользователей. Это подчеркивает важность четкой тематической структуры сайта.

Учитывает ли эта модель только данные логов?

В основном да, но не исключительно. Помимо данных истории поиска (поведенческие факторы), модель также использует структурные данные. Например, для расчета переходов между документами (D→D) могут использоваться прямые анкоры (ссылки), а для переходов Домен→Документ используется информация о принадлежности URL домену.

Похожие патенты

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
  • US8423538B1
  • 2013-04-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)
Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.
  • US9223868B2
  • 2015-12-29
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google намеренно задерживает или искажает изменения в ранжировании для выявления SEO-манипуляций
Google использует механизм для борьбы со спамом, который вносит временные задержки и неожиданные колебания в ранжирование документа после изменения его факторов. Вместо немедленного применения нового рейтинга система использует "Функцию перехода ранга". Это делается для того, чтобы запутать спамеров и проанализировать их реакцию на неожиданные изменения (например, падение позиций вместо ожидаемого роста), выявляя таким образом манипуляции.
  • US8244722B1
  • 2012-08-14
  • Антиспам

  • SERP

  • Техническое SEO

Популярные патенты

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования
Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.
  • US10878048B2
  • 2020-12-29
  • EEAT и качество

  • SERP

  • Knowledge Graph

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.
  • US8005716B1
  • 2011-08-23
  • Поведенческие сигналы

  • Семантика и интент

  • Антиспам

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса
Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов.
  • US10366422B2
  • 2019-07-30
  • Поведенческие сигналы

  • Local SEO

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
  • US8656266B2
  • 2014-02-18
  • Ссылки

  • EEAT и качество

  • Свежесть контента

Как Google персонализирует Sitelinks и сниппеты, используя интересы пользователя и тренды для прямого перехода на нужные страницы
Google использует механизм для динамического обогащения результатов поиска, особенно при навигационных запросах. Система анализирует сущности (продукты, категории) на целевом сайте и сравнивает их с известными интересами пользователя и текущими трендами. При совпадении Google отображает персонализированные прямые ссылки (например, динамические Sitelinks) на эти конкретные разделы или товары прямо в выдаче.
  • US20140188927A1
  • 2014-07-03
  • Персонализация

  • SERP

  • Ссылки

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников
Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.
  • US8745067B2
  • 2014-06-03
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore