Как поисковые системы используют поведенческие факторы (клики, время просмотра, сохранение) для ранжирования результатов

Анализ патента, описывающего механизм сбора и использования данных об активности пользователей (UAD) для улучшения ранжирования. Система отслеживает клики, время просмотра (Dwell Time) и действия вроде печати или добавления в закладки. Этим взаимодействиям присваиваются положительные или отрицательные веса, которые влияют на будущие результаты поиска наряду с традиционными факторами (RSD).

Описание

Какую задачу решает

Патент решает проблему ограниченности ранних поисковых систем, которые полагались исключительно на данные, специфичные для документа (Record Specific Data — RSD), такие как частота ключевых слов. Такой подход не учитывал фактическую удовлетворенность пользователей результатами. Изобретение направлено на улучшение релевантности путем интеграции данных об активности пользователей (User Activity Data — UAD) в протокол ранжирования.

Что запатентовано

Запатентована система, которая систематически отслеживает, фиксирует и анализирует действия пользователей после отображения результатов поиска. Ядром изобретения является использование UAD (включая клики, время просмотра и терминальные действия, такие как печать или добавление в закладки) для присвоения числовых весов (положительных или отрицательных) связям ключевое слово-документ. Эти веса затем интегрируются в протокол ранжирования (Ranking Protocol) наряду с RSD.

Как это работает

Система работает как цикл обратной связи:

Ранжирование: Результаты сортируются с использованием протокола, который учитывает как RSD, так и накопленные UAD.
Мониторинг: Система отслеживает взаимодействие пользователя: какие документы выбраны, как долго они просматривались (время пребывания/Dwell Time) и выполнялись ли терминальные действия.
Присвоение весов: Быстрый возврат к выдаче (pogo-sticking) получает большой отрицательный вес. Длительный просмотр получает положительный вес. Игнорирование результата получает малый отрицательный вес. Добавление в закладки получает большой положительный вес.
Обновление: База данных UAD обновляется новыми весами и счетчиками (Count). Эти данные используются для уточнения ранжирования будущих запросов.

Актуальность для SEO

Крайне высокая. Хотя патент старый (приоритетная дата 2000 г.), описанные в нем концепции являются фундаментальными для современного поиска. Измерение времени пребывания (Dwell Time), анализ pogo-sticking и использование агрегированных поведенческих данных для оценки качества результатов являются центральными элементами современных алгоритмов ранжирования (например, систем на базе машинного обучения в Google).

Важность для SEO

Критическое влияние (9/10). Этот патент формализует важность поведенческих факторов в SEO. Он подтверждает, что удовлетворенность пользователя является измеримым фактором ранжирования. SEO-стратегии должны быть сосредоточены на полном удовлетворении интента пользователя и обеспечении положительного опыта взаимодействия с контентом, чтобы генерировать положительные сигналы UAD и избегать негативных.

Детальный разбор

Термины и определения

Count (Счетчик): Количество взаимодействий пользователя с записью по определенному ключевому слову.
Ranking Protocol (RP) (Протокол ранжирования): Формула для сортировки результатов поиска. В данном патенте RP определяется как комбинация RSD и UAD с использованием весовых коэффициентов.
RSD (Record Specific Data) (Данные, специфичные для документа): Традиционные факторы ранжирования, основанные на содержимом документа (например, частота ключевых слов, их расположение).
Temporal Activity Data (Временные данные активности): Данные о продолжительности просмотра выбранного документа (Dwell Time). Используются для различения коротких и длинных сессий.
Terminal Activity (Терминальная активность): Действия пользователя, указывающие на высокую ценность контента: печать, добавление в закладки (bookmarking), копирование/вставка, отправка по email.
Transaction (Транзакция): Отслеживаемая сессия взаимодействия пользователя с поиском. Используется для фиксации временных меток и расчета Temporal Activity Data.
UAD (User Activity Data) (Данные об активности пользователей): Поведенческие данные, собранные после выполнения поиска. Включают данные о выборе (клики), Temporal Activity Data и Terminal Activity. Агрегируются независимо от пользователя (user independent).
Weight (Вес): Числовое значение (положительное или отрицательное), присваиваемое связи ключевое слово-документ на основе UAD. Отражает предполагаемую полезность.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает архитектуру поисковой системы.

Система включает базу данных, содержащую записи, ключевые слова и UAD.
Определяется состав UAD: он включает данные о терминальной активности (user terminal activity data) и/или временные данные об активности с записью (record specific temporal activity data).
Критически важно: UAD не зависит от пользователя (user independent) и накапливается агрегированно по всем запросам.
Система использует протокол ранжирования, который включает RSD и UAD, причем каждый тип данных взвешивается с помощью отдельных весовых коэффициентов (weighting factors).

Claim 4 (Зависимый от 1): Уточняет состав UAD.

User terminal activity data включает: отправку по электронной почте, печать, добавление в закладки, копирование и т.д. Record specific temporal activity data включает продолжительность времени, которое пользователь тратит на просмотр записи.

Claim 16 (Независимый пункт): Описывает сам протокол ранжирования, реализованный на цифровом процессоре.

Протокол включает RSD и UAD, каждый из которых взвешен отдельными весовыми коэффициентами. Это защищает метод взвешивания, который учитывает оба типа данных (контентные и поведенческие).

Где и как применяется

Изобретение охватывает несколько этапов поисковой архитектуры, создавая замкнутый цикл обратной связи.

INDEXING – Индексирование и извлечение признаков
На этом этапе рассчитываются факторы RSD. Также инфраструктура базы данных (Database Module) подготавливается для хранения UAD (поля Weight и Count в индексе ключевых слов или базе данных документов).

RANKING – Ранжирование
Модуль ранжирования (Ranking Module) применяет Ranking Protocol при обработке запроса. Он вычисляет итоговый рейтинг по формуле, комбинирующей RSD и уже накопленные значения UAD.

RERANKING / Пост-обработка (Сбор UAD)
После отображения результатов модуль сбора активности (User Activity Capture Module) фиксирует взаимодействия (клики, время, терминальные действия). Модуль обновления базы данных (Database Update Module) обрабатывает эти транзакции и обновляет веса UAD. Это влияет на ранжирование будущих запросов.

Входные данные:

Запрос пользователя.
RSD и накопленные UAD для релевантных документов.
Данные о текущем взаимодействии пользователя с SERP (клики, временные метки транзакций, терминальные действия).

Выходные данные:

Ранжированный список результатов поиска.
Обновленные значения UAD (Weight и Count) в базе данных.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, где сигналы RSD неоднозначны или подвержены манипуляциям. В таких случаях агрегированное поведение пользователей (UAD) становится ключевым сигналом для определения релевантности и качества.
Все типы контента: Механизм универсален и применим ко всем типам контента.

Когда применяется

Алгоритм применяется непрерывно:

Ранжирование: При каждом новом запросе используется комбинация RSD и UAD.
Сбор UAD: При каждом взаимодействии пользователя с результатами поиска (клик, запрос следующей страницы, терминальные данные).

Пошаговый алгоритм

Этап 1: Обработка нового запроса

Получение и парсинг запроса.
Извлечение релевантных документов.
Ранжирование документов с использованием Ranking Protocol (комбинация RSD и накопленных UAD).
Открытие транзакции для пользователя, фиксация временной метки.
Отображение Топ-N результатов.

Этап 2: Обработка взаимодействия и обновление UAD

Система анализирует действия пользователя и присваивает веса (Weight Assignment Logic):

Просмотрено, но не выбрано (Низкий CTR): Если пользователь запросил следующую страницу или выбрал другой результат, документам, которые были показаны, но проигнорированы, присваивается малый отрицательный вес (Small negative weight).
Выбрано, короткая продолжительность (Pogo-sticking): Если пользователь выбрал документ, но вернулся к выдаче очень быстро (короткий Dwell Time), документу присваивается большой отрицательный вес (Large negative weight).
Выбрано, длительная продолжительность (Long Click — Удовлетворен): Если пользователь выбрал документ и не возвращался длительное время (или сессия завершилась), документу присваивается большой положительный вес (Large positive weight).
Выбрано, длительная продолжительность (Продолжение активности): Если пользователь выбрал документ, провел много времени, но затем продолжил активность (например, перешел по ссылкам), присваивается малый положительный вес (Small positive weight).
Терминальная активность: Если пользователь добавил документ в закладки, присваивается большой положительный вес. Если распечатал или скопировал — малый/дробный положительный вес.

Этап 3: Обновление базы данных

Рассчитанный вес добавляется к текущему Weight в индексе ключевых слов/документов, а счетчик (Count) увеличивается.

Какие данные и как использует

Данные на входе

Контентные факторы (RSD): В патенте упоминаются стандартные критерии RSD: частота слов (word frequency), расположение слов (word location), близость слов (word proximity).
Поведенческие факторы (UAD — Временные):
- Клики (Clicks): Факт выбора документа.
- Время пребывания (Dwell Time): Рассчитывается на основе временных меток транзакций.
- Pogo-sticking: Выявляется как быстрый возврат к результатам поиска.
Факторы вовлеченности (UAD — Терминальные):
- Добавление в закладки (Bookmarking).
- Печать (Printing).
- Отправка по электронной почте (E-mailing).
- Копирование/Вставка (Copying/Pasting).

Какие метрики используются и как они считаются

Метрики UAD:

Weight (Вес): Накопленное значение положительных и отрицательных оценок взаимодействия.
Count (Счетчик): Общее количество взаимодействий.

Примеры присвоения весов (из описания патента):

Выбрано: +1
Просмотрено и не выбрано: -1
Немедленный возврат (Pogo-sticking): -2
Длительный просмотр (Long Dwell Time): +2
Добавление в закладки: +3
Печать страницы: +0.2

Формулы ранжирования:

Патент предлагает несколько формул (Formulas 1-8) для расчета итогового фактора ранжирования (r), комбинируя RSD (Wi) и UAD (Wj).

Пример (Formula 8): r = α * (Σ Wi) + β * (Σ Wj)

Где α и β — весовые коэффициенты, определяющие баланс между RSD и UAD (α + β = 1.0). Это позволяет системе гибко настраивать важность контентной релевантности и поведенческих факторов.

Выводы

Поведенческие факторы (UAD) как прямой компонент ранжирования: Патент четко определяет UAD как неотъемлемую часть протокола ранжирования, используемую наряду с традиционными факторами RSD.
Dwell Time (Время пребывания) критично: Продолжительность просмотра документа (Temporal Activity Data) является ключевым сигналом. Система детально описывает логику присвоения весов на основе продолжительности сессии.
Наказание за Pogo-sticking: Быстрый возврат к результатам поиска (short duration или immediate return) идентифицируется как сильный негативный сигнал и ему присваивается значительный отрицательный вес.
Учет CTR на выдаче: Документы, которые были показаны, но не выбраны (displayed but not selected), получают малый отрицательный вес. Это подчеркивает важность привлекательности сниппета.
Поощрение высокой удовлетворенности: Действия, указывающие на ценность контента (Terminal Activity, такие как добавление в закладки), получают сильные положительные веса.
Агрегированные данные, а не персонализация: Система собирает UAD независимо от пользователя (user independent), используя коллективное поведение для улучшения общего ранжирования.
Динамическое обучение: Ранжирование постоянно эволюционирует на основе накапливаемых UAD, делая выдачу адаптивной к поведению пользователей.

Практика

Best practices (это мы делаем)

Фокус на удовлетворении интента пользователя: Ключевая стратегия. Необходимо гарантировать, что пользователь, перейдя на страницу, найдет то, что искал, и не вернется немедленно на выдачу. Это генерирует положительные веса UAD (Large positive weight).
Оптимизация вовлеченности и Dwell Time: Улучшайте читабельность, структуру контента, добавляйте медиа и внутренние ссылки для увеличения времени пребывания на странице (longer duration).
Оптимизация сниппетов (Title и Description) для релевантного CTR: Привлекательность сниппета критична, так как показанные, но не выбранные страницы получают отрицательный вес. Сниппет должен точно отражать содержание.
Создание контента, достойного сохранения: Высококачественный контент, который пользователи захотят добавить в закладки (Bookmarking) или распечатать, получает преимущество благодаря положительным весам за Terminal Activity.
Улучшение UX и скорости загрузки: Быстрая загрузка и удобный интерфейс критичны для удержания пользователя и предотвращения быстрых отказов, интерпретируемых как негативный сигнал.

Worst practices (это делать не надо)

Использование кликбейта: Заголовки, которые обманом заставляют кликнуть на некачественный контент, приведут к быстрому возврату на выдачу (pogo-sticking). Это генерирует сильные отрицательные веса UAD (Large negative weight).
Поверхностный контент и плохой UX: Страницы, которые не могут вовлечь пользователя или затрудняют получение информации, приводят к коротким сессиям и pogo-sticking.
Игнорирование намерения пользователя (Intent Mismatch): Создание контента, который формально соответствует ключевым словам (RSD), но не соответствует интенту пользователя, приведет к накоплению негативного UAD.

Стратегическое значение

Этот патент описывает фундаментальные принципы ранжирования, основанного на поведении. Он подтверждает стратегический сдвиг от статической релевантности (RSD) к динамической релевантности, измеряемой удовлетворенностью пользователей (UAD). Для долгосрочного успеха в SEO необходимо приоритизировать пользовательский опыт (UX) и качество контента, поскольку эти факторы напрямую конвертируются в измеримые сигналы ранжирования.

Практические примеры

Сценарий: Снижение Pogo-Sticking для информационного запроса

Ситуация: Статья ранжируется в ТОП-5, но аналитика показывает высокий показатель отказов и малое время на странице (признаки pogo-sticking).
Анализ на основе патента: Система фиксирует короткую продолжительность просмотра (short duration) и присваивает статье большой отрицательный вес UAD.
Действие: Анализируется причина ухода пользователей (например, ответ спрятан глубоко в тексте). Контент реструктурируется: основной ответ выносится в начало (принцип перевернутой пирамиды), улучшается форматирование и добавляется краткое содержание (Table of Contents).
Ожидаемый результат: Пользователи проводят больше времени за чтением (longer duration) и реже возвращаются на SERP. Это генерирует положительные веса UAD, что со временем улучшает или закрепляет позиции статьи.

Вопросы и ответы

Что такое UAD и RSD в контексте этого патента?

UAD (User Activity Data) — это поведенческие данные, собираемые после показа результатов поиска: клики, время просмотра (Dwell Time), сохранение страницы. RSD (Record Specific Data) — это традиционные факторы, основанные на самом документе, такие как ключевые слова. Патент описывает, как объединить эти два типа данных в едином протоколе ранжирования.

Как именно патент предлагает измерять Dwell Time (время пребывания)?

Патент предлагает механизм «Транзакций». Когда пользователь выполняет поиск или кликает на результат, создается транзакция с временной меткой. Время до следующего действия пользователя (например, возврата на выдачу или нового запроса) используется для расчета продолжительности просмотра (Temporal Activity Data).

Как система наказывает за Pogo-sticking (быстрый возврат на выдачу)?

Если система фиксирует, что пользователь просматривал документ в течение короткого времени (short duration) или немедленно вернулся (immediate return), она присваивает этому документу большой отрицательный вес. В примерах патента упоминается вес -2 для немедленного возврата.

Что произойдет, если мой сниппет часто показывают, но по нему не кликают (низкий CTR)?

Патент явно учитывает эту ситуацию. Если документ был отображен, но не выбран (displayed but not selected), ему присваивается малый отрицательный вес (например, -1 в описании). Это подчеркивает важность работы над CTR сниппетов на выдаче.

Какие действия пользователя считаются наиболее ценными для ранжирования?

Наиболее ценными считаются действия, указывающие на полное удовлетворение интента. Это длительный просмотр документа без последующей активности в поиске (большой положительный вес), а также «Терминальная активность» (Terminal Activity), особенно добавление в закладки (Bookmarking), которому в примере присвоен вес +3.

Учитывает ли система поведение конкретного пользователя (персонализация)?

Нет. В патенте (Claims 1, 7, 16) неоднократно подчеркивается, что сбор UAD является независимым от пользователя (user independent) и накапливается агрегированно по всем запросам. Это механизм улучшения общей релевантности, а не персонализации выдачи.

Как система определяет баланс между поведенческими факторами (UAD) и контентными (RSD)?

Патент предлагает конкретные формулы (Formulas 1-8), которые используют отдельные весовые коэффициенты (например, α для RSD и β для UAD). Это позволяет поисковой системе гибко настраивать, что важнее в данный момент или для данного типа запросов.

Как система узнает, что пользователь распечатал страницу или добавил ее в закладки?

Патент описывает клиентский модуль (User Activity Capture Module), который фиксирует эти терминальные действия на стороне пользователя. Затем эти данные передаются на сервер, например, с помощью механизма cookie (как описано в User Module «House Keeping»).

Является ли этот патент доказательством того, что Google использует Dwell Time?

Этот патент (US7565363B2) не принадлежит Google. Однако он описывает фундаментальные механизмы использования поведенческих данных, включая Dwell Time, которые стали стандартом индустрии поиска. Логика, изложенная в патенте, с высокой вероятностью используется в современных системах Google для оценки удовлетворенности пользователей.

Какой главный вывод для SEO-стратегии следует из этого патента?

Главный вывод — удовлетворенность пользователя является измеримым и критически важным фактором ранжирования. Недостаточно просто оптимизировать текст (RSD); необходимо гарантировать, что контент и UX решают задачу пользователя, удерживают его на странице и предотвращают быстрый возврат к поиску (Pogo-sticking).