Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте

Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.

Описание

Какую задачу решает

Патент решает задачу адаптации стандартного, обезличенного ранжирования под индивидуальные предпочтения конкретного пользователя. Цель — улучшить релевантность выдачи, предполагая, что ресурсы, с которыми пользователь положительно взаимодействовал в прошлом (например, часто кликал, долго изучал), будут более полезны для него и в будущем. Это улучшает пользовательский опыт, предоставляя более знакомый и предпочитаемый контент.

Что запатентовано

Запатентована система персонализированного ранжирования, которая изучает прошлую активность пользователя по выбору результатов поиска (past search result selection activity). Система отслеживает и анализирует детальные поведенческие метрики, такие как частота кликов на определенные документы или сайты, продолжительность этих кликов (duration of selection) и контекст сессии. Эти данные используются для корректировки (повышения или понижения) позиций результатов в будущих поисковых выдачах для этого конкретного пользователя.

Как это работает

Система функционирует путем непрерывного мониторинга и анализа взаимодействия пользователя с SERP:

Отслеживание (Tracking): Система фиксирует, какие результаты пользователь выбирает, в каком порядке, как часто и как давно это происходило.
Анализ взаимодействия (Dwell Time Analysis): Измеряется продолжительность выбора (duration of a search result selection) — как долго пользователь изучал документ после клика.
Оценка интереса (Interest Assessment): Анализируется частота и временной период выборов для определения устойчивого интереса (continuous interest) к сайту или документу.
Персонализированное ранжирование (Personalized Ranking/Re-ranking): При получении нового запроса система генерирует стандартный набор результатов, а затем корректирует их рейтинг, повышая (boosting) те ресурсы, которые пользователь предпочитал в прошлом, основываясь на собранных метриках. Также могут учитываться негативные сигналы (показы без кликов).

Актуальность для SEO

Высокая. Персонализация является фундаментальным компонентом современных поисковых систем. Описанные в патенте принципы — использование истории кликов, анализ продолжительности взаимодействия (Dwell Time) и частоты посещений — остаются крайне актуальными для понимания того, как Google адаптирует выдачу под конкретного пользователя, хотя конкретные алгоритмы, вероятно, эволюционировали в сторону более сложных ML-моделей.

Важность для SEO

Влияние на SEO значительно (7/10). Патент подчеркивает критическую важность поведенческих факторов и вовлеченности для обеспечения видимости сайта для возвращающихся пользователей. Если сайт не может удержать пользователя (низкий Dwell Time) или не получает кликов при показе, этот механизм может снизить его позиции в персонализированной выдаче. Успешное вовлечение пользователя фактически улучшает ранжирование сайта для этого пользователя в будущем.

Детальный разбор

Термины и определения

Continuous interest (Устойчивый интерес): Интерес пользователя к документу или сайту, подтвержденный серией выборов (кликов) в течение определенного периода времени. Учитывается для отличия от единичных случайных кликов.
Duration of a search result selection (Продолжительность выбора): Время, которое пользователь проводит на документе после выбора его из результатов поиска. Аналог метрики Dwell Time. Используется как индикатор качества взаимодействия.
Past search result selection activity (Прошлая активность по выбору результатов поиска): Исторические данные о взаимодействии пользователя с SERP. Включает клики, продолжительность кликов, частоту, давность, порядок выбора и показы без кликов.
Selection order (Порядок выбора): Последовательность, в которой пользователь выбирает результаты в рамках одной поисковой сессии.
Site (Сайт): Группа документов, объединенных общим управлением, доменным именем, хостингом или тематикой. Персонализация может применяться как на уровне документа, так и на уровне сайта.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает сложный метод персонализации ранжирования, основанный на сравнительном анализе взаимодействий.

Система предоставляет первый набор результатов поиска пользователю.
Отслеживается количество доступов (quantity of accesses) пользователя к первому документу с определенного веб-сайта.
Система получает второй (будущий) набор результатов поиска, который включает по крайней мере один результат, соответствующий второму документу с того же веб-сайта.
Рейтинг второго документа корректируется на основе выполнения нескольких условий:
- Количество доступов к первому документу удовлетворяет пороговому значению.
- Анализируется другое количество доступов (клики на другие результаты в первом наборе).
- Используется по крайней мере один из следующих сравнительных факторов:
  - Порядок (order), в котором происходили другие доступы относительно доступа к первому документу.
  - Сравнение времени, проведенного пользователем на первом документе, и времени, проведенного на документах, связанных с другими доступами (сравнительный Dwell Time).
Предоставляются скорректированные результаты.

Ключевая особенность Claim 1 — это не просто бустинг того, что пользователь кликал. Система анализирует контекст клика: что еще было кликнуто в той же сессии, в каком порядке, и насколько «длинным» был клик по сравнению с другими кликами в сессии. Бустинг применяется к будущим результатам с того же сайта, если взаимодействие было признано положительным в этом контексте и достаточно частым (порог).

Claim 2 (Зависимый): Уточняет механизм корректировки рейтинга.

Система идентифицирует, как часто результат поиска был включен в предыдущие наборы результатов, но не был выбран пользователем (показы без кликов). Корректировка рейтинга основывается на этой частоте невыбора.

Claim 5 (Зависимый): Уточняет фактор времени.

Отслеживается период времени, в течение которого происходит серия доступов (кликов). Корректировка рейтинга основывается на этом периоде (оценка устойчивого интереса).

Claim 8 (Зависимый): Уточняет фактор продолжительности.

Отслеживается продолжительность времени (duration of time) каждого доступа. Корректировка рейтинга основывается на этой продолжительности (Dwell Time).

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса для персонализации выдачи.

RANKING – Ранжирование
На этом этапе генерируется исходный набор результатов поиска с использованием стандартных алгоритмов ранжирования и rank scores. Это обеспечивает базовую релевантность.

RERANKING – Переранжирование
Основной этап применения патента. Система использует данные о пользователе для модификации результатов этапа RANKING.

Получение профиля пользователя: Извлекаются исторические данные (past search result selection activity) для данного пользователя.
Анализ кандидатов: Система определяет, присутствуют ли в текущем наборе результатов документы или сайты, с которыми пользователь взаимодействовал ранее.
Расчет корректировок: Для этих результатов рассчитывается персонализированный бустинг (или пессимизация) на основе метрик взаимодействия (частота, Dwell Time, давность, контекст сессии).
Применение корректировок: Исходные rank scores модифицируются, и происходит пересортировка списка.

Входные данные:

Идентификатор пользователя.
Текущий запрос пользователя.
Набор результатов поиска с исходными rank scores.
Исторические данные о взаимодействии пользователя с SERP (клики, время, продолжительность, URL/Site).

Выходные данные:

Персонализированный набор результатов поиска с пересчитанными rank scores.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на информационные и частично навигационные запросы, где у пользователя есть устоявшиеся предпочтения по источникам информации (например, новостные сайты, блоги, форумы). Меньше влияет на запросы, требующие свежей информации или связанные с новыми интентами.
Конкретные типы контента: Влияет на любые типы контента, где возможно измерение вовлеченности (статьи, листинги, видео).

Когда применяется

Идентификация пользователя: Алгоритм применяется, когда поисковая система может идентифицировать пользователя (например, через аккаунт Google или cookies) и связать его с историей поиска.
Наличие исторических данных: Применяется, когда у пользователя накоплен достаточный объем данных о прошлых взаимодействиях. Claim 1 явно указывает на необходимость удовлетворения порогового значения (threshold quantity of accesses) для активации.
Условия контекста: Активируется, если система определяет положительный паттерн взаимодействия, учитывая сравнительные метрики (например, Dwell Time выше среднего для сессии или устойчивый интерес во времени).

Пошаговый алгоритм

Процесс А: Обработка запроса и персонализация

Получение запроса: Система получает поисковый запрос от идентифицированного пользователя.
Генерация базовых результатов: Выполняется поиск по корпусу документов для получения исходного набора результатов, ранжированных по стандартным метрикам релевантности.
Получение истории пользователя: Извлекаются данные о прошлой активности пользователя (past search result selection activity).
Идентификация кандидатов для корректировки: В базовых результатах определяются документы/сайты, с которыми пользователь взаимодействовал ранее.
Оценка исторических взаимодействий: Для каждого кандидата анализируются исторические данные:
- Частота (Number of times selected).
- Продолжительность (Duration of selection / Dwell Time).
- Давность (Time elapsed).
- Устойчивость интереса (Period of time over which selections occur).
- Контекст сессий (порядок кликов, сравнительный Dwell Time, как описано в Claim 1).
- Негативные сигналы (Показы без кликов).
Расчет персонализированной оценки: На основе анализа вычисляется коэффициент повышения (boosting) или понижения для кандидатов.
Переранжирование: Базовые результаты переупорядочиваются с учетом персонализированных оценок.
Предоставление результатов: Персонализированная выдача предоставляется пользователю.

Процесс Б: Сбор и обновление данных пользователя

Предоставление результатов: Пользователю показывается SERP (результат Процесса А).
Отслеживание взаимодействия: Система мониторит действия пользователя: выбор результата (клик), порядок выбора, время выбора.
Измерение продолжительности: Фиксируется время, проведенное пользователем на выбранном документе до возврата к выдаче или завершения сессии.
Сохранение данных: Собранные метрики сохраняются и привязываются к профилю пользователя для будущего использования.

Какие данные и как использует

Данные на входе

Патент полностью сосредоточен на использовании поведенческих данных пользователя для персонализации.

Поведенческие факторы:
- Клики (Выбор результата).
- Duration of selection (Dwell Time): продолжительность доступа к документу после клика.
- Selection order: порядок кликов в рамках одной сессии.
- Общее количество кликов в сессии.
- Показы без кликов: частота, с которой результат показывался, но не был выбран.
- Временные метки кликов.
Пользовательские факторы:
- Идентификатор пользователя (необходим для связывания истории).
Контентные/Технические факторы:
- Идентификатор документа (URL).
- Идентификатор сайта/домена, к которому принадлежит документ.

Какие метрики используются и как они считаются

Система использует несколько ключевых метрик для оценки предпочтений пользователя:

Frequency (Частота): Количество раз, когда пользователь выбирал конкретный документ или любой документ с определенного сайта.
Dwell Time (Продолжительность выбора): Измеряется как время от клика на результат до возврата к SERP или завершения активности. В патенте используется термин Duration of selection.
Comparative Dwell Time: Сравнение продолжительности выбора одного результата с продолжительностью выбора других результатов в той же сессии (Claim 1).
Recency (Давность): Время, прошедшее с момента последнего выбора результата до текущего момента.
Continuous Interest (Устойчивый интерес): Оценивается по периоду времени, в течение которого происходит серия выборов. Более длительный период указывает на более устойчивый интерес.
Selection Context (Контекст выбора): Анализ порядка кликов и общего количества кликов в сессии.
Thresholds (Пороги): Минимальное количество доступов (threshold quantity of accesses), необходимое для активации механизма персонализации (Claim 1).

Выводы

Персонализация основана на детальных поведенческих сигналах: Google не просто учитывает факт клика для персонализации. Система анализирует сложный набор сигналов: продолжительность клика (Dwell Time), частоту, давность, устойчивость интереса во времени и контекст поисковой сессии.
Dwell Time критичен для оценки качества взаимодействия: Продолжительность выбора (Duration of selection) является ключевым фактором. Короткие клики могут не привести к бустингу. Более того, Claim 1 описывает использование сравнительного Dwell Time в рамках сессии для определения ценности клика.
Предпочтения могут применяться на уровне сайта: Патент явно указывает, что активность по выбору может отслеживаться для «специфического документа или любого документа, связанного со специфическим сайтом». Это означает, что положительное взаимодействие с одной страницей может привести к бустингу других страниц этого же сайта в будущих запросах пользователя.
Учитываются негативные поведенческие сигналы: Система отслеживает ситуации, когда результат был показан, но не выбран (Claim 2). Частое игнорирование результата пользователем может привести к его понижению в персонализированной выдаче.
Контекст сессии имеет значение: Анализируется порядок кликов и то, какие еще результаты были выбраны в рамках той же сессии. Это позволяет системе лучше понять интент и относительную ценность каждого взаимодействия.
Персонализация активируется при достаточном объеме данных: Механизм не срабатывает на основе единичных взаимодействий. Требуется достижение пороговых значений (threshold quantity of accesses) для подтверждения предпочтений пользователя.

Практика

Best practices (это мы делаем)

Максимизация Dwell Time (Long Clicks): Сосредоточьтесь на создании контента, который полностью удовлетворяет интент пользователя и удерживает его на странице. Это напрямую влияет на Duration of selection. Используйте качественный, глубокий контент, хорошую структуру и внутреннюю перелинковку для увеличения вовлеченности.
Стимулирование устойчивого интереса и лояльности к бренду: Работайте над тем, чтобы пользователи регулярно возвращались на ваш сайт за информацией. Патент подтверждает, что устойчивый интерес (continuous interest) к сайту приводит к его бустингу в персонализированной выдаче. Развивайте Topical Authority и бренд.
Оптимизация сниппетов для квалифицированного трафика (CTR): Обеспечьте привлекательность сниппетов, чтобы избежать накопления негативных сигналов (показы без кликов, Claim 2). Однако сниппеты должны точно отражать содержание страницы, чтобы избежать коротких кликов.
Анализ поведения возвращающихся пользователей: Сегментируйте трафик и анализируйте, как ведут себя пользователи, которые приходят на сайт повторно. Понимание их предпочтений поможет оптимизировать контентную стратегию для усиления положительных сигналов персонализации.

Worst practices (это делать не надо)

Использование кликбейта: Заголовки, которые привлекают клик, но не соответствуют содержанию страницы, приведут к высокому показателю отказов и низкому Dwell Time. Это сигнализирует о негативном взаимодействии и может привести к понижению в персонализированной выдаче.
Игнорирование UX и скорости загрузки: Плохой пользовательский опыт и медленная загрузка заставляют пользователей быстро покидать сайт (короткий клик), что негативно влияет на метрики вовлеченности, используемые для персонализации.
Создание поверхностного контента: Контент, который быстро просматривается и не предлагает дополнительной ценности, не сможет генерировать длительные сессии, необходимые для подтверждения положительного взаимодействия.

Стратегическое значение

Этот патент подтверждает стратегическую важность перехода от оптимизации под поисковые алгоритмы к оптимизации под удовлетворенность пользователя (Search Experience Optimization). Поведенческие факторы являются ключевыми для персонализации. В долгосрочной перспективе выигрывают сайты, которые способны выстраивать отношения с аудиторией, предоставлять стабильно высокое качество контента и обеспечивать отличный пользовательский опыт. Лояльность аудитории становится фактором ранжирования.

Практические примеры

Сценарий: Персонализация выдачи для любителя определенного новостного сайта

Исходное поведение (Сбор данных): Пользователь ищет информацию о политическом событии. В выдаче есть несколько новостных сайтов. Пользователь кликает на результат сайта «NewsSiteA.com», проводит там 5 минут (высокий Dwell Time), а затем кликает на «OtherSiteB.com» и проводит там 30 секунд (низкий Dwell Time). Система фиксирует это.
Повторное поведение: В течение следующих недель пользователь продолжает выбирать «NewsSiteA.com» при поиске новостей и демонстрирует высокий Dwell Time. Система определяет устойчивый интерес (continuous interest) и достижение порога частоты (threshold quantity of accesses).
Персонализация (Бустинг): Через месяц пользователь ищет информацию о другом событии по общему запросу «последние новости экономики».
Результат: Несмотря на то, что результат с сайта «EconomyFocus.com» может иметь более высокую общую релевантность, система повышает (boosting) результат с «NewsSiteA.com» в выдаче этого пользователя, так как он продемонстрировал явное предпочтение этому источнику.

Вопросы и ответы

Является ли Dwell Time фактором ранжирования согласно этому патенту?

Да, но в контексте персонализации. Патент явно описывает измерение продолжительности выбора (Duration of selection) как ключевой метрики для определения того, стоит ли повышать результат для конкретного пользователя в будущем. Если пользователь постоянно демонстрирует высокий Dwell Time на вашем сайте, ваш сайт будет ранжироваться выше в его персональной выдаче.

Влияет ли положительное взаимодействие с одной страницей на ранжирование других страниц сайта?

Да, влияет. Патент указывает, что отслеживается активность по выбору «специфического документа или любого документа, связанного со специфическим сайтом». Claim 1 также подтверждает, что доступ к первому документу сайта используется для корректировки рейтинга второго документа с того же сайта в будущем. Это подчеркивает важность качества всего сайта.

Что произойдет, если мой сайт часто показывают в выдаче, но пользователь его не выбирает?

Это негативный сигнал для персонализации. Claim 2 описывает механизм, при котором система отслеживает, как часто результат был показан, но не выбран. Если это происходит часто, система может скорректировать рейтинг вашего сайта вниз для этого конкретного пользователя, предполагая, что он ему не интересен.

Насколько важна частота кликов по сравнению с продолжительностью клика?

Важны оба фактора. Частота (quantity of accesses) необходима для достижения порога активации персонализации и демонстрации устойчивого интереса. Однако продолжительность (Duration of selection) используется для оценки качества этого интереса. Частые, но короткие клики могут быть менее ценными, чем менее частые, но длительные взаимодействия.

Что такое «устойчивый интерес» (Continuous interest) и как его добиться?

Устойчивый интерес определяется как серия кликов на ресурс в течение длительного периода времени. Это отличает стратегическую лояльность от случайного интереса. Чтобы добиться этого, необходимо постоянно публиковать высококачественный контент, соответствующий интенту аудитории, и работать над узнаваемостью бренда, чтобы пользователи целенаправленно искали ваш сайт в выдаче.

Учитывает ли система контекст поисковой сессии?

Да, это важный аспект, описанный в Claim 1. Система анализирует, что еще пользователь кликал в той же сессии, в каком порядке были сделаны клики, и сравнивает Dwell Time между разными результатами. Если пользователь кликнул на ваш сайт и остался на нем дольше, чем на сайтах конкурентов в той же сессии, это сильный положительный сигнал.

Применяется ли этот механизм, если пользователь не вошел в аккаунт Google?

Патент не уточняет метод идентификации пользователя, но для работы механизма необходим способ связать прошлую активность с текущим пользователем. Это может быть реализовано как через вход в аккаунт, так и через использование браузерных cookies или фингерпринтинга.

Как этот патент влияет на стратегию использования кликбейта?

Патент делает стратегию кликбейта крайне неэффективной. Кликбейт генерирует клики, но приводит к низкому Dwell Time (коротким кликам), так как контент не соответствует ожиданиям. Система интерпретирует это как негативное взаимодействие, что приведет к понижению сайта в персонализированной выдаче пользователя.

Стоит ли фокусироваться на привлечении новых пользователей или на удержании старых в контексте этого патента?

Оба аспекта важны, но этот патент подчеркивает ценность удержания старых пользователей. Механизм персонализации напрямую вознаграждает сайты, которые смогли завоевать лояльность аудитории. Удержание пользователя фактически превращает его в амбассадора вашего сайта внутри поисковой системы.

Влияет ли давность взаимодействия на персонализацию?

Да, патент упоминает отслеживание времени, которое прошло с момента выбора результата до текущего времени (давность). Более свежие предпочтения, вероятно, будут иметь больший вес при корректировке ранжирования, чем очень старые взаимодействия.