Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google переранжирует выдачу в реальном времени, основываясь на краткосрочных интересах пользователя во время поисковой сессии

    RECENT INTEREST BASED RELEVANCE SCORING (Оценка релевантности на основе недавних интересов)
    • US9390143B2
    • Google LLC
    • 2016-07-12
    • 2009-10-02
    2009 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

    Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный тематический интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу. Если их предпочтения статистически отличаются от общих, Google корректирует ранжирование, адаптируя выдачу под текущий контекст поиска пользователя.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему повышения релевантности поисковой выдачи для запросов, которые могут иметь разный интент в зависимости от текущего контекста или задачи пользователя. Стандартные алгоритмы могут не учитывать сиюминутные потребности пользователя (short-term categorical interests), которые часто проявляются в ходе одной поисковой сессии. Изобретение позволяет динамически адаптировать ранжирование, опираясь на недавнюю активность пользователя.

    Что запатентовано

    Запатентована система персонализации ранжирования, которая использует недавнюю активность пользователя в рамках activity period (поисковой сессии) для определения его краткосрочных интересов. Система применяет коллаборативную фильтрацию: она сравнивает поведение (клики) пользователей с определенным интересом с поведением общей популяции пользователей по одному и тому же запросу. Если наблюдается статистически значимое различие, система корректирует оценки релевантности (Relevance Scoring) для текущего пользователя.

    Как это работает

    Механизм работает следующим образом:

    • Отслеживание активности: Фиксируются недавние запросы и клики пользователя в рамках текущей сессии (activity period).
    • Определение интереса: Interest Identifier анализирует эту активность и определяет краткосрочную категорию интереса пользователя.
    • Анализ поведения групп: Для текущего запроса система сравнивает две метрики для каждого результата:
      • Category Selection Value (или Category Click Fraction): Как часто результат выбирали другие пользователи с таким же краткосрочным интересом.
      • General Selection Value (или General Click Fraction): Как часто результат выбирали все пользователи.
    • Определение значимости: Если разница между этими показателями превышает установленный порог (threshold value), система рассчитывает Category Relevance.
    • Корректировка ранжирования: Rank Modifier Engine использует Category Relevance Score для корректировки стандартной оценки ранжирования (IR score), повышая или понижая результат в выдаче для текущего пользователя.

    Актуальность для SEO

    Высокая. Понимание контекста сессии и адаптация выдачи в реальном времени являются ключевыми направлениями развития поиска. Google активно использует контекст (включая недавние запросы) для уточнения намерений пользователя (Search Journeys). Этот патент описывает конкретный и актуальный механизм реализации такой адаптации.

    Важность для SEO

    Патент имеет высокое значение для SEO (8.5/10). Он описывает механизм, который напрямую влияет на то, какие результаты увидит пользователь в зависимости от его предыдущих действий. Это подчеркивает важность оптимизации не под изолированные запросы, а под целые сценарии (user journeys) и задачи. Ранжирование становится динамическим и контекстно-зависимым. Сайты, которые эффективно удовлетворяют потребности пользователей в рамках конкретной тематической сессии, получат преимущество.

    Детальный разбор

    Термины и определения

    Activity Period (Период активности / Сессия)
    Временной интервал, в течение которого отслеживается активность пользователя для определения краткосрочных интересов. Может определяться как последние N минут (например, 30 минут, 2 часа) или как последовательность действий без длительного перерыва.
    Category Selection Value / Category Click Fraction (Частота выбора в категории)
    Показатель, измеряющий частоту, с которой конкретный результат выбирается пользователями, имеющими определенную категорию интереса, при вводе определенного запроса. Аналог CTR внутри сегмента.
    Category Relevance (Категориальная релевантность)
    Мера разницы между Category Selection Value и General Selection Value.
    General Selection Value / General Click Fraction (Общая частота выбора)
    Показатель, измеряющий частоту, с которой конкретный результат выбирается всеми пользователями (общей популяцией) при вводе определенного запроса, независимо от их интересов.
    Interest Identifier (Идентификатор интересов)
    Компонент системы, отвечающий за анализ недавней активности пользователя и определение его краткосрочных категорий интересов.
    IR Score (Information Retrieval Score) (Оценка информационного поиска)
    Стандартная (базовая) оценка релевантности документа запросу, вычисляемая поисковой системой до применения персонализации.
    Rank Modifier Engine (Механизм модификации ранжирования)
    Компонент, который корректирует IR scores результатов на основе сигналов от Interest Identifier.
    Short-term category of interest (Краткосрочная категория интереса)
    Тема или задача, на которой сфокусирован пользователь в данный момент времени, определенная на основе его недавней активности.
    Weighted Selection Count (Взвешенный счетчик выборов)
    Счетчик кликов, который, согласно описанию патента, может быть взвешен на основе времени взаимодействия пользователя с ресурсом (Dwell Time).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод корректировки ранжирования.

    1. Система идентифицирует short-term category of interest для пользователя, отправившего запрос.
    2. Для результата поиска определяются два значения:
      • Category selection value (доля выборов этого результата пользователями с этим же интересом).
      • General selection value (доля выборов этого результата общей популяцией пользователей).
    3. Система определяет, удовлетворяет ли разница между этими двумя значениями пороговому значению (threshold value). Это ключевой шаг для обеспечения статистической значимости.
    4. Если порог достигнут, система корректирует ranking score этого результата.
    5. Результат ранжируется на основе скорректированной оценки.

    Ядро изобретения — это использование разницы в поведении (CTR) между сегментированной группой по интересам и общей массой пользователей как фактора для персонализированного переранжирования в реальном времени.

    Claim 3 (Зависимый от 1): Уточняет механизм корректировки.

    Ranking score является базовой оценкой информационного поиска (IR score). Корректировка включает комбинирование (combining) этой оценки с разницей между category selection value и general selection value. Это предполагает аддитивный или похожий метод интеграции.

    Claim 5 (Независимый пункт): Описывает альтернативный, потенциально более агрессивный вариант реализации.

    Процесс аналогичен Claim 1, но механизм корректировки уточнен: он включает умножение (multiplying) IR score на разницу между значениями выбора. Мультипликативный бустинг может приводить к значительным изменениям позиций в выдаче.

    Где и как применяется

    Изобретение применяется на финальных этапах обработки запроса, используя данные, собранные и обработанные офлайн.

    INDEXING / QUNDERSTANDING (Офлайн-процессы)
    Система заранее анализирует логи запросов и кликов (Result Selection Logs). На основе этих данных офлайн вычисляются и сохраняются General Selection Value и Category Selection Value для комбинаций [Запрос + Категория интереса]. Это позволяет быстро извлекать данные в реальном времени.

    QUNDERSTANDING – Понимание Запросов (Онлайн)
    Interest Identifier анализирует недавнюю активность пользователя (запросы до текущего) в реальном времени, чтобы определить его short-term category of interest.

    RANKING – Ранжирование (Онлайн)
    Ranking Engine генерирует первоначальный набор результатов со стандартными IR scores.

    RERANKING – Переранжирование (Онлайн)
    Основной этап применения патента. Rank Modifier Engine извлекает предопределенные значения. Если разница существенна (превышает threshold value), вычисляется Category Relevance Score. Стандартные IR scores модифицируются для получения adjusted scores, и происходит финальная сортировка выдачи.

    Входные данные:

    • Текущий запрос пользователя.
    • Недавняя история запросов и кликов пользователя (recent activity).
    • Базовые IR scores результатов.
    • Предопределенные данные о кликах (General Selection Value, Category Selection Value).

    Выходные данные:

    • Скорректированный набор результатов поиска (SERP) с adjusted scores.

    На что влияет

    • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы или запросы, которые могут появляться в разных тематических контекстах (например, запрос «ягуар» может относиться к животному или автомобилю).
    • Конкретные ниши или тематики: Влияет на ниши, где пользователи часто выполняют сложные задачи, требующие серии запросов (исследования продуктов, планирование путешествий, образование).

    Когда применяется

    Алгоритм применяется при выполнении нескольких условий:

    • Наличие данных о сессии: У пользователя должна быть недавняя активность (предшествующие запросы/клики).
    • Идентифицируемый интерес: Система способна определить четкую краткосрочную категорию интереса.
    • Наличие исторических данных: Достаточно данных о поведении других пользователей с таким же интересом по этому же запросу.
    • Триггер активации (Порог значимости): Разница между Category Selection Value и General Selection Value для результата должна превышать установленный порог (threshold value).

    Пошаговый алгоритм

    Патент описывает два взаимосвязанных процесса.

    Процесс А: Расчет показателей релевантности (Офлайн / Батч)

    1. Сбор и хранение активности: Система агрегирует данные о поисковых сессиях (запросы, клики, тайминги) множества пользователей в Result Selection Logs.
    2. Идентификация интересов в логах: Для каждой исторической сессии определяются категории интересов.
    3. Определение количества выборов (Selection Counts): Для каждой комбинации [Запрос + Категория интереса] подсчитывается количество кликов на каждый результат. Клики могут взвешиваться по времени просмотра документа (dwell time / time spent).
    4. Расчет Category Selection Value (CSV): Вычисляется частота выбора конкретного результата в этой категории.
    5. Расчет General Selection Value (GSV): Вычисляется общая частота выбора конкретного результата по запросу.
    6. Расчет Category Relevance: Вычисляется разница между CSV и GSV.
    7. Определение значимости и сохранение: Если разница превышает порог (статистически значима), вычисляется и сохраняется Category Relevance Score для использования в онлайн-процессе.

    Процесс Б: Обработка запроса в реальном времени (Онлайн)

    1. Получение запроса и активности: Система получает текущий запрос и данные о недавней активности пользователя.
    2. Идентификация интересов: Interest Identifier анализирует активность и определяет краткосрочные категории интересов пользователя.
    3. Идентификация ресурсов: Поисковая система идентифицирует ресурсы и их базовые IR scores.
    4. Сбор данных о релевантности: Система извлекает предопределенные Category Relevance Scores (из Процесса А) для комбинации [Текущий запрос + Идентифицированный интерес].
    5. Проверка значимости: Система проверяет, была ли достигнута пороговая разница в Процессе А.
      • Если НЕТ: Используется стандартное ранжирование.
      • Если ДА: Переход к шагу 6.
    6. Расчет скорректированных оценок: Rank Modifier Engine корректирует базовые IR scores с помощью Category Relevance Score (аддитивно или мультипликативно, как указано в Claims 3 и 5).
    7. Финальное ранжирование: Результаты сортируются по скорректированным оценкам и предоставляются пользователю.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании поведенческих данных для определения контекста и корректировки ранжирования.

    • Поведенческие факторы (User Behavior): Это ключевые данные.
      • Логи запросов (Queries): Последовательность запросов пользователя в рамках сессии.
      • Логи кликов (Result Selection Logs): Данные о том, какие результаты выбирают пользователи.
      • Время взаимодействия (Dwell Time): Время, проведенное пользователем на ресурсе после клика (время между выбором результата и последующим действием). Используется для взвешивания кликов (Weighted Selection Count).
    • Пользовательские факторы (Контекст): Упоминается возможность использования специфической информации о пользователе (search requester specific information), такой как демографические данные и местоположение, для уточнения категории интереса.
    • Системные данные: Базовые IR scores от основной поисковой системы.

    Какие метрики используются и как они считаются

    • Category Selection Value (CSV): Рассчитывается как (Взвешенное количество кликов на Результат X от пользователей с Интересом Y по Запросу Q) / (Общее взвешенное количество кликов на все результаты от пользователей с Интересом Y по Запросу Q).
    • General Selection Value (GSV): Рассчитывается как (Взвешенное количество кликов на Результат X от всех пользователей по Запросу Q) / (Общее взвешенное количество кликов на все результаты от всех пользователей по Запросу Q).
    • Category Relevance: Мера разницы между CSV и GSV (абсолютная или относительная).
    • Threshold Value (Порог): Минимальная разница между CSV и GSV, необходимая для активации корректировки. Порог может быть фиксированным, относительным или статистическим.
    • Adjusted Score: Итоговая оценка ранжирования. Может рассчитываться как сумма или произведение IR Score и Category Relevance Score (Claims 3 и 5).

    Выводы

    1. Контекст сессии критически важен для ранжирования: Google активно использует краткосрочную историю поиска (в пределах минут или часов) для определения текущей задачи пользователя (short-term interest) и динамической адаптации SERP. Ранжирование зависит от того, что пользователь искал непосредственно перед текущим запросом.
    2. Коллаборативная фильтрация по краткосрочным интересам: Механизм основан на предположении, что текущий пользователь предпочтет те же результаты, которые предпочитали другие пользователи, решавшие ранее ту же задачу (имевшие тот же интерес) и вводившие тот же запрос.
    3. Релевантность зависит от контекстной популярности (Сегментированный CTR): Если результат значительно более популярен среди пользователей с определенным интересом (высокий Category Selection Value) по сравнению с общей популярностью (General Selection Value), он получит бустинг.
    4. Защита от шума (Пороги): Корректировка применяется только тогда, когда разница в поведении пользователей статистически значима и превышает установленные пороги (threshold value).
    5. Влияние Dwell Time: Патент (в описании) явно предусматривает взвешивание кликов на основе времени взаимодействия с контентом (time spent). Это подтверждает важность не просто привлечения клика, но и удержания пользователя (удовлетворения интента).

    Практика

    Best practices (это мы делаем)

    • Оптимизация под сценарии (User Journeys), а не только под запросы: Проектируйте контент так, чтобы он поддерживал пользователя на разных этапах решения задачи. Понимайте последовательность запросов в вашей нише. Это поможет вашему контенту лучше ранжироваться в рамках тематических сессий.
    • Фокус на удовлетворении интента и Dwell Time: Создавайте контент, который удерживает пользователя. Поскольку клики могут взвешиваться по времени взаимодействия, длительное время на сайте после клика усиливает сигнал релевантности для данной категории интересов и повышает Weighted Selection Count.
    • Построение Topical Authority: Становитесь авторитетным источником в рамках конкретной категории. Это увеличивает вероятность того, что ваш сайт будет предпочтительным выбором для пользователей, глубоко погруженных в эту тему (высокий Category Selection Value).
    • Оптимизация сниппетов под контекстный интент: Для неоднозначных запросов убедитесь, что ваши сниппеты четко адресуют интент, который вы покрываете. Это поможет привлечь клики от пользователей с соответствующим краткосрочным интересом.

    Worst practices (это делать не надо)

    • Оптимизация под неоднозначные запросы без учета контекста: Попытка ранжироваться по общему запросу может быть неэффективной, если ваш контент не соответствует контексту сессии пользователя. Система может понизить ваш результат, отдав предпочтение более контекстуально релевантным страницам.
    • Использование кликбейта: Привлечение нерелевантных кликов, за которыми следует быстрый возврат на выдачу (короткий Dwell Time), негативно скажется на взвешенных показателях Selection Value и может привести к понижению в ранжировании для конкретных категорий интересов.
    • Изолированный анализ позиций: Оценка эффективности SEO только по позициям в «чистой» выдаче становится менее точной. Необходимо учитывать, что реальная выдача для активных пользователей часто персонализирована на основе их сессии.

    Стратегическое значение

    Этот патент подчеркивает переход Google от статического ранжирования к динамическому и контекстному. Стратегическое значение для SEO заключается в необходимости глубокого понимания пути пользователя и его задач. Успешными будут сайты, которые могут стать «хабом» для решения конкретной задачи, привлекая и удерживая пользователя в рамках тематической сессии. Это также подтверждает важность поведенческих факторов (сегментированные клики, Dwell Time) как прямых сигналов для корректировки ранжирования в реальном времени.

    Практические примеры

    Сценарий: Разрешение неоднозначности запроса (Кейс из патента)

    1. Действия пользователя: Пользователь ищет «harvard business», затем «kellogg». Система (Interest Identifier) определяет краткосрочный интерес: «Бизнес-школы».
    2. Следующий запрос: Пользователь вводит неоднозначный запрос «anderson».
    3. Анализ системы: Google сравнивает клики по запросу «anderson».
      • Общие пользователи (General Selection Value) кликают на разные результаты (актеры, города и т.д.).
      • Пользователи с интересом «Бизнес-школы» (Category Selection Value) значительно чаще кликают на сайт «UCLA Anderson School of Management».
    4. Результат: Разница превышает порог. Для текущего пользователя сайт UCLA Anderson School of Management будет значительно повышен в выдаче (возможно, мультипликативно, согласно Claim 5).
    5. Действия SEO: Если вы продвигаете ресурс с неоднозначным названием, необходимо убедиться, что он максимально удовлетворяет интент пользователей, приходящих из релевантного контекста, чтобы максимизировать Category Selection Value и Dwell Time в этом сегменте.

    Вопросы и ответы

    Является ли этот патент доказательством того, что CTR является фактором ранжирования?

    Да, но это не общий CTR. Патент описывает использование сегментированного CTR (Category Selection Value) в сравнении с общим (General Selection Value). Ранжирование корректируется на основе разницы между ними, и только если эта разница статистически значима. Это механизм контекстной персонализации, основанный на поведении групп со схожими краткосрочными интересами.

    Как система определяет краткосрочный интерес пользователя?

    Система анализирует активность пользователя в рамках текущей сессии (Activity Period) — его предыдущие запросы и выбранные результаты. Например, если пользователь искал и кликал на результаты о бизнес-школах, система классифицирует его текущий интерес как «Бизнес-школы». Также могут учитываться демографические данные и местоположение.

    Учитывает ли система только факт клика или также Dwell Time?

    Учитывает оба фактора. Описание патента явно указывает, что количество выборов (Selection Counts) может быть взвешено на основе времени, проведенного пользователем на ресурсе (Dwell Time или time spent). Клики с длительным взаимодействием имеют больший вес, чем клики с быстрым возвратом на выдачу.

    Как это влияет на ранжирование по неоднозначным запросам?

    Это оказывает значительное влияние. Для неоднозначных запросов (например, «Ягуар») предшествующая активность пользователя становится определяющим фактором. Если пользователь искал информацию о животных, система повысит результаты о животном, понизив результаты об автомобиле, даже если последние имеют более высокий общий CTR.

    Применяется ли этот механизм ко всем запросам?

    Нет. Он активируется только тогда, когда система может надежно идентифицировать краткосрочный интерес пользователя, и когда существует статистически значимая разница (превышающая threshold value) между поведением группы по интересам и общей популяцией. Если данные отсутствуют или разница незначительна, используется стандартное ранжирование.

    Как SEO-специалисту оптимизировать сайт под этот алгоритм?

    Ключевая стратегия — оптимизация под всю сессию пользователя (User Journey), а не только под отдельные запросы. Создавайте контентные хабы, которые поддерживают исследование темы. Обеспечивайте высокое качество контента для максимизации dwell time и убедитесь, что сниппеты привлекают клики именно целевого сегмента аудитории.

    Что произойдет, если мой сайт имеет высокий общий CTR, но низкий CTR среди определенного сегмента?

    В этом случае, когда пользователь из этого сегмента введет запрос, ваш сайт может быть пессимизирован в его персонализированной выдаче. Это произойдет, если ваш Category Selection Value значительно ниже General Selection Value. Это подчеркивает важность релевантности для конкретных интентов, а не только общей популярности.

    Насколько агрессивно могут быть повышены результаты?

    Патент описывает возможность как аддитивной (Claim 3), так и мультипликативной корректировки (Claim 5). Умножение базового IR score на фактор, основанный на разнице в CTR, может привести к агрессивному повышению результата в выдаче, если он сильно предпочитается группой по интересам.

    Отличается ли это от стандартной долгосрочной персонализации?

    Да, отличается. Этот патент фокусируется именно на Recent Interest, основанных на текущей сессии (например, последние 2 часа). Это не о том, что пользователь всегда предпочитает определенный бренд, а о том, что он делает прямо сейчас (например, планирует отпуск или исследует покупку).

    Как этот патент влияет на отслеживание позиций сайта?

    Он значительно усложняет отслеживание позиций. Поскольку выдача динамически адаптируется под контекст сессии пользователя, позиции в «чистой» выдаче могут сильно отличаться от того, что видит реальный пользователь. Это требует от SEO-специалистов больше фокусироваться на анализе трафика, поведенческих метрик и путей пользователя.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.