Как Яндекс обучает персонализированные модели ранжирования прямо на устройстве пользователя, используя данные о микроповедении (скроллинг, движение мыши)

Яндекс патентует метод клиентской персонализации. Система отслеживает детальные взаимодействия пользователя (скорость скроллинга, движения мыши, копирование текста) прямо на его устройстве. На основе этих данных локально обучается персональная модель ранжирования. Затем эта модель отправляется на сервер Яндекса, где она комбинируется с основной формулой ранжирования (например, путем переобучения) для создания высокоточной персонализированной выдачи.

Описание

Какую задачу решает

Патент решает две ключевые проблемы персонализации поиска. Во-первых, он устраняет ограничения серверного анализа, который не способен отслеживать детальные микровзаимодействия пользователя с контентом (например, точную скорость прокрутки, движения курсора, использование буфера обмена). Это позволяет использовать более гранулярные сигналы для оценки релевантности. Во-вторых, он повышает конфиденциальность: анализ поведения и обучение модели происходят локально на устройстве пользователя, а на сервер передается только агрегированная модель, а не сырые логи поведения.

Что запатентовано

Запатентован метод генерации User-Specific Ranking Model (пользовательской модели ранжирования) непосредственно на клиентском устройстве. Суть изобретения заключается в переносе процесса мониторинга пользовательских взаимодействий (User Interaction) и обучения модели машинного обучения (MLA) с сервера на устройство клиента. Это позволяет использовать в ранжировании сигналы, доступные только локально.

Как это работает

Система работает следующим образом: Сервер Яндекса определяет Resource-Specific Features (признаки ресурса) для отслеживания, включая те, что доступны только на клиенте, и отправляет их на устройство. Устройство локально отслеживает детальное поведение пользователя (скроллинг, движение мыши и т.д.) и на основе этого определяет Value Parameter (метку полезности ресурса). Используя признаки и метки как обучающий набор, устройство локально генерирует User-Specific Ranking Model. Эта модель передается на сервер, где она интегрируется с Generic Ranking Model (общей моделью ранжирования). Интеграция происходит путем переобучения (retraining) основной модели для создания Combined Ranking Model, или через двухэтапное переранжирование.

Актуальность для SEO

Высокая. Использование клиентских сигналов (client-side signals) для улучшения качества поиска при соблюдении требований конфиденциальности крайне актуально. Описанный подход соответствует современным трендам в машинном обучении, таким как федеративное обучение (Federated Learning) — обучение моделей на децентрализованных устройствах без обмена исходными данными.

Важность для SEO

Влияние на SEO критическое (9/10). Этот патент демонстрирует механизм, с помощью которого Яндекс может оценивать качество взаимодействия с контентом на гранулярном уровне (реальное чтение, изучение), выходя за рамки стандартных метрик (CTR, Dwell Time). Это смещает фокус SEO с оптимизации под клик на обеспечение глубокого вовлечения пользователя и высокого качества пользовательского опыта (UX) на странице, делая их прямыми сигналами для персонализированного ранжирования.

Детальный разбор

Термины и определения

Combined Ranking Model (Комбинированная модель ранжирования): Итоговая модель, созданная на сервере путем интеграции User-Specific Ranking Model и Generic Ranking Model. Используется для формирования персонализированной выдачи.
Generic Ranking Model (Общая модель ранжирования): Стандартная модель ранжирования поисковой системы, обученная на агрегированных данных всех пользователей.
MLA (Machine Learning Algorithm / Алгоритм машинного обучения): Алгоритм, используемый на устройстве пользователя для локального обучения User-Specific Ranking Model.
Personalized Ranking Module (Модуль персонализированного ранжирования): Компонент на устройстве пользователя (client-side), отвечающий за мониторинг взаимодействий и генерацию локальной модели.
Ranking Routine (Процедура ранжирования): Компонент на сервере поиска (server-side), отвечающий за выбор признаков и интеграцию моделей ранжирования.
Resource-Specific Feature (Признак веб-ресурса): Свойство веб-ресурса, используемое для обучения модели ранжирования (например, сложность текста, свежесть). Некоторые признаки могут быть отслежены только на клиенте.
User Interaction (Взаимодействие пользователя): Действия пользователя с веб-ресурсом, отслеживаемые локально (например, скорость скроллинга, движение мыши, копирование текста).
User-Specific Ranking Model (Пользовательская модель ранжирования): Модель ранжирования, сгенерированная локально на устройстве пользователя. Отражает его персональные предпочтения.
Value Parameter (Параметр ценности): Метка (label) полезности ресурса, определяемая на клиенте на основе User Interaction. Используется как целевая переменная для обучения локальной модели.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на разделении процесса обучения персонализированной модели между клиентским устройством и сервером.

Claim 1 (Независимый пункт): Описывает метод, выполняемый на электронном устройстве пользователя.

Получение от сервера индикации множества Resource-Specific Features.
Критически важно: Указано, что по крайней мере часть этих признаков может быть отслежена только на электронном устройстве (only trackable at the electronic device).
Отслеживание User Interaction с веб-ресурсом.
Определение Value Parameter для веб-ресурса на основе взаимодействия.
Генерация User-Specific Ranking Model с помощью MLA локально на устройстве.
Передача этой модели на сервер. Это действие заставляет сервер переобучить (retrain) Generic Ranking Model с использованием пользовательской модели для получения Combined Ranking Model.
Отправка запроса на сервер, что заставляет сервер ранжировать результаты с использованием этой Combined Ranking Model.

Claim 9 (Независимый пункт): Описывает метод, выполняемый на сервере поисковой системы.

Передача на устройство индикации Resource-Specific Features (включая те, что отслеживаются только локально).
Получение от устройства User-Specific Ranking Model (сгенерированной локально).
Комбинирование полученной модели с Generic Ranking Model путем переобучения (retraining) общей модели для создания Combined Ranking Model.
Получение запроса от пользователя.
Ранжирование результатов поиска с использованием Combined Ranking Model.

Где и как применяется

Изобретение затрагивает инфраструктуру сбора данных и процесс ранжирования, реализуя механизм федеративного обучения.

CRAWLING – Сбор данных (Data Acquisition — Client Side)
Сбор данных о поведении происходит децентрализованно. Personalized Ranking Module на устройстве пользователя отслеживает пост-клик поведение (User Interactions), включая сигналы, недоступные серверу (например, движение мыши, скорость скроллинга).

Обработка данных (Client Side)
Модуль на клиенте не только собирает данные, но и обрабатывает их: интерпретирует взаимодействия для определения Value Parameter и обучает User-Specific Ranking Model локально с помощью MLA.

RANKING – Ранжирование (Уровень L4 — Personalization)
Ranking Routine на сервере применяет модель, полученную от клиента. Патент описывает два варианта интеграции:

Комбинирование/Переобучение (Retraining): (Основной метод, описанный в Claims 1 и 9). Общая модель переобучается с использованием пользовательской для создания Combined Ranking Model. Эта модель используется для основного ранжирования запросов пользователя.
Повторное ранжирование (Re-ranking): (Альтернативный метод, упомянутый в Описании). Сервер сначала ранжирует результаты с помощью Generic Ranking Model, а затем переранжирует этот список с помощью User-Specific Ranking Model.

На что влияет

Поведенческие факторы: Вводит в ранжирование новый класс сигналов — детальные микровзаимодействия, отслеживаемые только на стороне клиента (сигналы вовлеченности, скорость чтения).
Все типы контента и запросов: Механизм универсален и направлен на изучение общих предпочтений пользователя в отношении характеристик веб-ресурсов (например, предпочтение определенной сложности текста, наличия видео или дизайна).

Когда применяется

Процесс разделен на две фазы:

Фаза Обучения (Локально): Происходит непрерывно на устройстве пользователя по мере его взаимодействия с веб-ресурсами.
Фаза Применения (Сервер): Активируется при отправке пользователем поискового запроса. Актуальная User-Specific Ranking Model передается на сервер (вместе с запросом или периодически) и используется для ранжирования выдачи.

Пошаговый алгоритм

Процесс генерации и применения пользовательской модели ранжирования.

Этап 1: Инициализация (Сервер)

Выбор признаков: Ranking Routine на сервере выбирает Resource-Specific Features для отслеживания, с приоритетом на те, которые лучше или возможно отслеживать только на клиенте.
Передача признаков: Сервер отправляет индикацию этих признаков на клиентское устройство.

Этап 2: Сбор данных и Обучение (Клиент)

Отслеживание взаимодействий: Personalized Ranking Module наблюдает за User Interaction (скорость прокрутки, движение мыши, копирование текста и т.д.).
Определение ценности: На основе взаимодействий модуль определяет Value Parameter (метку релевантности) для ресурса. (Например, медленная прокрутка и наведение мыши на текст = высокая релевантность).
Накопление выборки: Сбор достаточного количества данных (признаки + метки).
Генерация модели: Модуль использует MLA для создания User-Specific Ranking Model.

Этап 3: Интеграция и Ранжирование (Сервер)

Получение модели: Сервер получает User-Specific Ranking Model от клиента.
Интеграция модели: Сервер интегрирует полученную модель с Generic Ranking Model. Согласно Claims, это происходит путем переобучения (retraining) для создания Combined Ranking Model.
Ранжирование: При получении запроса сервер использует Combined Ranking Model для генерации персонализированной выдачи.

Какие данные и как использует

Данные на входе

Система использует два основных типа данных: признаки ресурса и данные о взаимодействии пользователя.

Поведенческие факторы (User Interactions): Это ключевые данные, отслеживаемые локально для определения Value Parameter.

Время, проведенное пользователем на ресурсе (Dwell Time).
Скорость прокрутки контента (Scrolling Speed).
Глубина переходов по гиперссылкам ресурса.
Взаимодействие с медиа-элементами (например, клики по видео).
Паттерны движения мыши (например, наведение курсора на текст, что указывает на чтение).
Копирование частей веб-ресурса в буфер обмена.
Скачивание веб-ресурса.
Взаимодействие со специфическими элементами (клик на e-mail, заполнение форм).

Факторы Ресурса (Resource-Specific Features): Используются как признаки для обучения модели.

Контентные факторы: Сложность текста, читаемость текста, свежесть контента, наличие изображений/видео.
UX/Дизайн факторы: Цветовая схема веб-ресурса.
Коммерческие факторы: Характер продавца, время доставки.
Факторы релевантности: Соответствие результата поисковому запросу.

Какие метрики используются и как они считаются

Value Parameter (Метка релевантности): Вычисляется на клиенте на основе эвристик, связанных с User Interactions. Патент приводит примеры эвристик:
- Больше время на сайте = выше релевантность.
- Медленнее скорость прокрутки = выше релевантность.
- Глубже переходы по ссылкам = выше релевантность.
- Дольше наведение мыши на текст = выше релевантность.
- Факт копирования/скачивания = выше релевантность.
Метка может быть бинарной или основанной на шкале, а также композитной.
Алгоритмы машинного обучения (MLA): Используются на клиенте для генерации User-Specific Ranking Model. Обучение происходит на наборе данных: Resource-Specific Features (признаки) и Value Parameter (целевая переменная).

Выводы

Федеративное обучение в поиске Яндекса: Патент описывает применение принципов федеративного обучения (Federated Learning) для персонализации. Обучение модели происходит локально на устройстве пользователя, а не централизованно на сервере.
Новый уровень поведенческих факторов (Client-Side Signals): Ключевое нововведение — использование признаков, которые невозможно отследить на сервере (движение мыши, паттерны скроллинга, копирование в буфер). Это позволяет оценить реальное потребление контента (чтение, изучение).
Оценка удовлетворенности на клиенте: Устройство пользователя не просто собирает данные, но и интерпретирует их, присваивая ресурсу метку полезности (Value Parameter) на основе локальных эвристик (например, медленный скролл = полезно).
Интеграция через переобучение: Персональная модель интегрируется с общей моделью. Основной защищенный патентом механизм (Claims 1 и 9) — это переобучение (retraining) основной модели, хотя также упоминается переранжирование (re-ranking).
Повышение конфиденциальности: Поскольку сырые данные о поведении не покидают устройство пользователя, а передается только обученная модель, система обеспечивает бóльшую конфиденциальность.

Практика

Best practices (это мы делаем)

Фокус на вовлеченности и UX (Engagement Optimization): Оптимизируйте страницы для длительного и внимательного изучения. Используйте ясную структуру, форматирование и мультимедиа, чтобы стимулировать пользователя медленно прокручивать страницу (медленный скроллинг) и взаимодействовать с элементами.
Стимулирование позитивных взаимодействий: Поощряйте действия, которые система интерпретирует как позитивные сигналы:
- Размещайте полезный контент, который пользователи захотят скопировать в буфер обмена (код, цитаты, рецепты, инструкции).
- Предлагайте полезные материалы для скачивания.
- Обеспечивайте удобство чтения (шрифт, контрастность), чтобы пользователь водил курсором по тексту или выделял его.
Оптимизация читаемости и сложности текста: Поскольку «сложность текста» и «читаемость» упомянуты как Resource-Specific Features, убедитесь, что контент соответствует уровню целевой аудитории.
Анализ поведения на странице: Активно используйте инструменты анализа поведения (например, Вебвизор в Яндекс Метрике), чтобы понять, как пользователи реально взаимодействуют с контентом — что прокручивают быстро, с чем взаимодействуют. Оптимизируйте страницу под эти клиентские сигналы.

Worst practices (это делать не надо)

Использование «простыней» текста без структуры: Длинный неструктурированный текст стимулирует быструю прокрутку, что может быть интерпретировано как негативный сигнал (низкий Value Parameter).
Вводящие в заблуждение заголовки (Кликбейт): Привлечение пользователя на страницу, которая не соответствует ожиданиям, приведет к быстрому уходу или хаотичному поведению, что негативно скажется на локальной модели ранжирования.
Агрессивный UX и всплывающие окна: Элементы, мешающие потреблению контента, могут вызывать раздражение и генерировать негативные поведенческие паттерны.
Запрет на копирование контента: Использование скриптов, запрещающих выделение и копирование текста, может лишить сайт позитивного сигнала (копирование в буфер обмена).

Стратегическое значение

Патент подтверждает стратегический фокус Яндекса на измерении реальной удовлетворенности пользователя за пределами простых кликов. Он вводит в экосистему поиска концепцию федеративного обучения для использования чувствительных данных. Для SEO это означает, что качество пользовательского опыта (UX) и глубина вовлечения становятся еще более критичными факторами ранжирования. Манипулировать такими гранулярными сигналами, как скорость прокрутки или движение мыши, практически невозможно, что требует ориентации на создание действительно полезного и удобного контента.

Практические примеры

Сценарий: Оптимизация страницы рецепта

Задача: Улучшить поведенческие сигналы для страницы с рецептом борща.
Применение патента: Мы знаем, что система может отслеживать скорость прокрутки, взаимодействие с элементами и копирование в буфер.
Действия:
- Разбиваем процесс приготовления на четкие шаги с фотографиями. Это стимулирует пользователя останавливаться на каждом шаге (медленный скроллинг).
- Размещаем список ингредиентов в виде блока с чекбоксами (взаимодействие с элементами).
- Добавляем кнопку «Скопировать ингредиенты в буфер» или «Скачать список покупок» (позитивные сигналы копирования/скачивания).
Ожидаемый результат: Улучшение User Interactions приводит к присвоению странице более высокого Value Parameter на устройствах пользователей. Это улучшает User-Specific Ranking Model и повышает позиции сайта в их персонализированной выдаче.

Вопросы и ответы

Что такое генерация модели ранжирования на стороне клиента?

Это процесс, при котором само устройство пользователя (например, через браузер или приложение) анализирует поведение пользователя и обучает персональную модель машинного обучения локально. Вместо отправки логов поведения на сервер Яндекса, устройство отправляет уже готовую, обученную модель. Это реализация концепции федеративного обучения (Federated Learning).

Какие новые поведенческие факторы позволяет учитывать этот патент?

Патент позволяет учитывать факторы, недоступные при серверном анализе. К ним относятся: скорость и паттерны прокрутки страницы (скроллинга), детальные паттерны движения мыши (например, наведение курсора на текст как индикатор чтения), факт копирования контента в буфер обмена, а также взаимодействие с интерактивными элементами интерфейса и формами.

Как система определяет, был ли контент полезен пользователю?

Система на устройстве пользователя использует эвристики для определения «Параметра ценности» (Value Parameter). Например, медленная прокрутка, длительное наведение мыши на текст, копирование фрагмента или скачивание файла интерпретируются как признаки высокой полезности и релевантности контента.

В чем разница между Generic Ranking Model и User-Specific Ranking Model?

Generic Ranking Model — это общая модель ранжирования Яндекса, обученная на агрегированных данных всех пользователей. User-Specific Ranking Model — это персональная модель, обученная локально на устройстве конкретного пользователя на основе его детальных взаимодействий. Они объединяются на сервере в Combined Ranking Model.

Как именно персональная модель влияет на финальную выдачу?

Патент описывает два способа. Основной (указанный в Claims 1 и 9) — это переобучение (retraining) общей модели с использованием персональной, что создает комбинированную модель. Альтернативный способ (указанный в Описании) — это повторное ранжирование (re-ranking) результатов, полученных общей моделью, с помощью персональной модели.

Как это влияет на конфиденциальность пользователей?

Влияние положительное. Поскольку детальные логи поведения (что делал на странице, куда двигал мышью) не покидают устройство пользователя, а передается только агрегированная и анонимизированная модель, уровень конфиденциальности повышается по сравнению с традиционным серверным отслеживанием.

Что это значит для SEO-стратегии по работе с контентом?

Это подчеркивает необходимость смещения фокуса с оптимизации под клик (CTR) на оптимизацию вовлеченности (Engagement). Контент должен быть не только релевантным, но и удобным для потребления, стимулируя позитивные сигналы, такие как внимательное чтение (медленный скролл) и взаимодействие с элементами страницы.

Можно ли манипулировать этими клиентскими поведенческими факторами?

Манипулировать такими гранулярными и естественными сигналами, как движение мыши или скорость прокрутки, крайне сложно и неэффективно в масштабе. Система рассчитана на анализ естественного поведения. Лучшая стратегия — это реальное улучшение качества контента и пользовательского опыта (UX).

Стоит ли запрещать копирование контента на сайте с помощью скриптов?

Согласно патенту, факт копирования контента в буфер обмена является позитивным сигналом полезности. Запрещая копирование, вы можете лишить свой сайт этого позитивного поведенческого сигнала. Рекомендуется разрешать копирование полезной информации (например, кодов, адресов, списков).

Как я могу увидеть эти клиентские сигналы для своего сайта?

Напрямую увидеть, как Яндекс интерпретирует эти сигналы в Value Parameter, невозможно. Однако можно использовать инструменты для анализа поведения пользователей, такие как тепловые карты, карты скроллинга и Вебвизор в Яндекс Метрике, чтобы понять паттерны взаимодействия и оптимизировать UX на их основе.