Как Яндекс раздельно моделирует разные типы поведенческих сигналов (клики vs время взаимодействия) для точной оценки релевантности

Яндекс патентует метод для рекомендательных систем (например, Дзен), который решает проблему смешивания разных поведенческих сигналов. Вместо использования одной модели для анализа всех взаимодействий (клики, время чтения, лайки), система применяет отдельные, независимые модели для каждого типа сигнала. Это позволяет точнее оценить как привлекательность контента (по кликам), так и его ценность (по времени взаимодействия), а затем объединить эти оценки для финального ранжирования.

Описание

Какую задачу решает

Патент решает задачу повышения точности и интерпретируемости в рекомендательных системах (упоминается Yandex.Zen). Основная проблема, которую адресует изобретение, — это неоптимальность использования единой модели для оценки всех типов взаимодействий пользователя (например, клики, время чтения, лайки). Разные сигналы несут разный смысл: клик может указывать на привлекательность заголовка, а время взаимодействия (interaction time) — на удовлетворенность контентом. Смешивание этих сигналов в одной модели приводит к предвзятым оценкам. Также патент решает проблему разреженности данных (data sparsity) — недостатка информации о взаимодействиях.

Что запатентовано

Запатентован метод оценки данных о взаимодействии пользователя и элемента (User-Item Interaction Data), использующий множественные модели. Суть изобретения заключается в раздельном и независимом моделировании различных типов взаимодействий. Для каждого типа данных (например, Тип 1: Клики; Тип 2: Время взаимодействия) используется своя специализированная модель (Estimation Model). Это позволяет системе предсказывать вероятность взаимодействия для пар, по которым нет статистики (non-occurred pairs), отдельно для каждого типа сигнала.

Как это работает

Система собирает исторические данные о взаимодействиях (occurred pairs) и разделяет их по типам. Для каждого типа применяется отдельная модель (например, SVD или нейросеть). Модель 1 обрабатывает только данные Типа 1 и предсказывает взаимодействия Типа 1. Модель 2 независимо обрабатывает данные Типа 2. В результате для каждой пары пользователь-контент система получает несколько независимых оценок (например, вероятность клика и ожидаемое время просмотра). На этапе ранжирования эти оценки комбинируются (например, взвешенной суммой) для определения финальной релевантности.

Актуальность для SEO

Высокая. Персонализация и рекомендательные системы являются ключевым направлением развития экосистемы Яндекс. Разделение поведенческих сигналов для более глубокого понимания интента и качества контента — это современный тренд в Information Retrieval и Machine Learning. Описанные методы (SVD, NN-based models, ALS) активно используются в индустрии.

Важность для SEO

Влияние на SEO значительно (7.5/10). Хотя патент напрямую относится к рекомендательным системам (например, Дзен), он раскрывает фундаментальный подход Яндекса к анализу поведенческих факторов. Он подтверждает, что разные метрики (CTR vs Dwell Time/Interaction Time) анализируются независимо и имеют разный вес. Этот принцип, вероятно, применяется и в веб-поиске, подчеркивая необходимость оптимизации как под первичное вовлечение (клик), так и под глубокое удовлетворение пользователя (длительное взаимодействие).

Детальный разбор

Термины и определения

ALS (Alternating Least Squares): Алгоритм матричной факторизации. В патенте применяется для генерации наборов признаков пользователя и элемента на основе матриц взаимодействий.
Digital Content Item (Элемент цифрового контента / Элемент): Единица контента, с которой взаимодействует пользователь. Указано, что это может быть цифровой документ, сетевой ресурс (сайт) или паблишер (издатель).
Estimation Model (Модель оценки): Алгоритм (например, SVD или NN-based), используемый для предсказания данных о взаимодействии. Патент предполагает использование как минимум двух таких моделей (First/Second Estimation Model) для разных типов взаимодействий.
Item Features (Признаки элемента): Численное представление (вектор) элемента контента. Система генерирует отдельные наборы признаков (First set, Second set) для каждого типа взаимодействия. Рассчитываются офлайн и сохраняются.
NN-based model (Модель на основе нейронных сетей): Тип модели оценки. Описывается как состоящая из двух частей: для генерации векторного представления элемента (embedded item vector) и векторного представления пользователя (embedded user vector).
Non-occurred user-item pair (Непроизошедшая пара пользователь-элемент): Пара, состоящая из пользователя и элемента контента, с которым этот пользователь еще не взаимодействовал.
Occurred user-item pair (Произошедшая пара пользователь-элемент): Пара, состоящая из пользователя и элемента контента, с которым этот пользователь уже взаимодействовал. Основа для обучения моделей.
SVD (Singular-Value Decomposition): Сингулярное разложение матрицы. Один из методов, упомянутый как возможная реализация модели оценки.
User Features (Признаки пользователя): Численное представление (вектор) пользователя, отражающее его предпочтения. Генерируются отдельные наборы для каждого типа взаимодействия. Рассчитываются онлайн и могут не сохраняться.
User-item interaction data (Данные о взаимодействии пользователя с элементом): Собранные данные о поведении. Патент подчеркивает разделение на типы (e.g., First type, Second type), такие как клики, лайки, дизлайки, длинные клики (long clicks), время взаимодействия (interaction time).
User-Specific Value (Пользовательское значение релевантности): Финальная оценка релевантности элемента для пользователя. Рассчитывается как взвешенная комбинация значений схожести (Similarity Values) от разных моделей.

Ключевые утверждения (Анализ Claims)

Патент защищает метод, в котором система рекомендаций обрабатывает разные типы поведенческих сигналов независимо друг от друга.

Claim 1 (Независимый пункт): Описывает основной метод оценки взаимодействий и генерации признаков.

Сервер извлекает данные о взаимодействиях для произошедших пар (occurred pairs).
Данные разделяются на Первый тип (в патенте указано: «длительность времени взаимодействия») и Второй тип (отличный от первого).
Применяется Первая модель оценки к данным Первого типа для предсказания взаимодействий Первого типа для непроизошедших пар (non-occurred pairs).
Применяется Вторая модель оценки к данным Второго типа для предсказания взаимодействий Второго типа.
Процесс включает генерацию отдельных наборов Item Features и User Features для каждого типа данных.
Критически важно: Item Features сохраняются, а User Features (сгенерированные на этом этапе) удаляются.

Ядро изобретения — это независимое моделирование разных поведенческих сигналов и разделение стабильных признаков контента от динамических признаков пользователей.

Claim 6 и 7 (Зависимые): Подчеркивают независимость процессов.

Применение Первой модели выполняется независимо от применения Второй модели и может происходить в разное время. Это обеспечивает гибкость системы и оптимизацию ресурсов.

Claim 9 (Зависимый): Описывает процесс применения этих оценок для ранжирования (онлайн-фаза).

Генерируются актуальные User Features для Первого и Второго типа (на основе текущей истории пользователя).
Определяется User-Specific Value релевантности для элемента контента.
Это значение определяется путем сравнения соответствующих User Features и Item Features для каждого типа.

Claim 10 (Зависимый): Детализирует механизм расчета финального значения.

Сравнение признаков приводит к получению Первого и Второго значений схожести (Similarity Values). Финальное User-Specific Value является взвешенной комбинацией этих значений схожести.

Где и как применяется

Изобретение относится к работе рекомендательных систем (таких как Яндекс.Дзен). Оно затрагивает несколько слоев в архитектуре такой системы и разделено на офлайн и онлайн фазы.

Офлайн-процессы (Аналог INDEXING & FEATURE EXTRACTION)

Оценка взаимодействий: Основная часть патента выполняется офлайн. Система анализирует логи взаимодействий и применяет Estimation Models (SVD или NN) для заполнения пробелов в данных. Это делается отдельно для каждого типа взаимодействия.
Генерация признаков элементов (Item Features): На основе полных матриц взаимодействий система генерирует стабильные признаки элементов (Item Features) с помощью алгоритмов факторизации (например, ALS). Для каждого элемента создается несколько наборов признаков (по одному для каждого типа взаимодействия). Они сохраняются в базе данных.

Онлайн-процессы (Аналог RANKING)

Когда пользователь запрашивает рекомендации:

Генерация признаков пользователя (User Features): Система анализирует текущие взаимодействия пользователя и быстро генерирует его актуальные признаки (User Features), также отдельно для каждого типа взаимодействия.
Расчет релевантности: Система сравнивает User Features с Item Features кандидатов для генерации значений схожести (Similarity Scores).
Финальное ранжирование: Значения схожести объединяются (взвешенная комбинация) для получения финального User-Specific Value. Это значение используется для ранжирования контента (Digital Content Pre-selection и Selection).

На что влияет

Типы контента: Влияет на любой контент в рекомендательных системах (статьи, видео, товары).
Оценка качества и борьба с кликбейтом: Влияет на то, как система интерпретирует качество контента. Контент, который получает только клики (высокий скор Типа 1), но низкое время взаимодействия (низкий скор Типа 2), может быть ранжирован ниже. Это позволяет эффективно бороться с кликбейтом.
Уровень элемента: Механизм может применяться на уровне отдельных документов, сайтов (network resource) или издателей (publisher).

Когда применяется

Офлайн-фаза: Выполняется периодически для обновления моделей и пересчета Item Features.
Онлайн-фаза: Активируется каждый раз, когда пользователь запрашивает или обновляет ленту рекомендаций.

Пошаговый алгоритм

Процесс работы системы разделен на две основные фазы.

Фаза 1: Офлайн-оценка взаимодействий и генерация признаков элементов

Сбор и разделение данных: Система собирает данные о взаимодействиях для произошедших пар и разделяет их на Тип 1 (например, Время взаимодействия) и Тип 2 (например, Клики).
Независимая оценка (Модель 1): Применение Первой модели оценки (например, SVD) к данным Типа 1 для предсказания значений Типа 1 для непроизошедших пар. Формируется полная матрица Типа 1.
Независимая оценка (Модель 2): Применение Второй модели оценки (например, NN-based) к данным Типа 2 для предсказания значений Типа 2. Формируется полная матрица Типа 2. (Шаги 2 и 3 выполняются независимо).
Генерация признаков элементов (Факторизация): Применение алгоритма факторизации (например, ALS) к Матрице 1 и Матрице 2.
Результат и Сохранение: Для каждого элемента генерируются и сохраняются Первый набор признаков элемента (на основе Типа 1) и Второй набор (на основе Типа 2). Признаки пользователей, сгенерированные на этом этапе, удаляются.

Фаза 2: Онлайн-ранжирование по запросу пользователя

Получение запроса и извлечение истории: Пользователь запрашивает рекомендации. Система извлекает его актуальные данные о взаимодействиях Типа 1 и Типа 2.
Генерация признаков пользователя: Система быстро генерирует актуальные Первый и Второй наборы признаков пользователя (User Features).
Расчет схожести (Similarity Score Generation):
- Сравнение Первого набора признаков пользователя с Первыми наборами признаков элементов-кандидатов -> Значение Схожести 1.
- Сравнение Второго набора признаков пользователя со Вторыми наборами признаков элементов-кандидатов -> Значение Схожести 2.
Комбинирование оценок: Расчет финального User-Specific Value путем взвешенной комбинации Значений Схожести 1 и 2 (например, $ \alpha \cdot Score1 + \beta \cdot Score2 $). Веса (α, β) могут быть глобальными или персонализированными.
Ранжирование и Выдача: Элементы ранжируются на основе User-Specific Value и предоставляются пользователю.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Это основные данные, используемые системой. Они разделяются на различные типы. В патенте перечислены примеры:
- Количество кликов (Number of clicks).
- Количество лайков/дизлайков (Number of likes/dislikes).
- Количество длинных кликов (Number of long clicks).
- Время взаимодействия (Amount of interaction time).
Контентные факторы (Косвенно): Если используются NN-based модели (Claim 15), они могут принимать на вход данные об элементе (item data) — текст, категории, мультимедиа — для генерации векторных представлений (embedded item vector).
Пользовательские факторы (Косвенно): Аналогично, NN-based модели могут принимать данные о пользователе (user data) — демографию, историю — для генерации векторных представлений (embedded user vector).

Какие метрики используются и как они считаются

Матрицы взаимодействий (User-item matrix): Разреженные матрицы, содержащие значения взаимодействий определенного типа. Создаются отдельные матрицы для каждого типа.
Признаки Элементов/Пользователей (Item/User Features): Векторы (эмбеддинги), полученные в результате матричной факторизации (SVD, ALS) или с помощью нейронных сетей. Генерируются отдельно для каждого типа взаимодействия.
Значения Схожести (Similarity Scores): Метрики близости между вектором пользователя и вектором элемента (например, векторное расстояние или косинусная близость). Рассчитывается отдельное значение для каждого типа взаимодействия.
User-Specific Value: Финальная метрика релевантности. Рассчитывается как взвешенная комбинация (weighted combination) различных Значений Схожести. Формула (как пример из FIG. 8): $ Value = \alpha \cdot Score_{Type1} + \beta \cdot Score_{Type2} $.
Алгоритмы Машинного Обучения: Упоминаются SVD, ALS и Neural Networks для оценки взаимодействий и генерации признаков.

Выводы

Яндекс обрабатывает разные поведенческие сигналы независимо: Ключевой вывод патента — Яндекс считает методологически важным не смешивать разные типы взаимодействий (клики, время чтения, лайки). Каждый тип сигнала обрабатывается отдельной, специализированной моделью.
Многомерная оценка качества контента: Система оценивает контент по нескольким измерениям одновременно. Одно измерение может отвечать за «привлекательность» (кликабельность), а другое — за «полезность» (глубину вовлечения).
Финальная релевантность — это взвешенная комбинация: Итоговый ранг определяется взвешенной суммой независимых оценок схожести по разным типам взаимодействий. Система может гибко настраивать важность (вес) каждого типа.
Разделение стабильных и динамических признаков: Патент четко разделяет стабильные признаки контента (Item Features), которые рассчитываются офлайн и хранятся, и динамические признаки пользователей (User Features), которые рассчитываются онлайн в момент запроса.
Борьба с кликбейтом: Раздельное моделирование является эффективным механизмом для идентификации контента, который привлекает внимание (высокая оценка по кликам), но не удовлетворяет пользователя (низкая оценка по времени взаимодействия).

Практика

Best practices (это мы делаем)

Хотя патент описывает работу рекомендательных систем, его принципы анализа поведения пользователей крайне важны для SEO-стратегии в целом, так как методология оценки ПФ часто едина для разных сервисов Яндекса.

Оптимизация под «Двойной Успех» (CTR и Dwell Time): Разрабатывайте контент, который одновременно привлекает внимание (оптимизация заголовков и сниппетов для высокого CTR) И глубоко вовлекает пользователя (высокое качество контента, удобство чтения для увеличения Interaction Time). Успех в обоих измерениях критичен, так как они оцениваются независимо и затем комбинируются.
Стратегия для Яндекс.Дзен: При создании контента для Дзена необходимо понимать, что система ищет баланс. Важно стимулировать пользователей не только кликать, но и дочитывать материалы, ставить лайки (если это выделено как отдельный тип взаимодействия).
Анализ поведенческих метрик в разрезе: При анализе эффективности SEO необходимо смотреть на поведенческие метрики раздельно (CTR, Время на сайте, Длинные клики). Улучшение одной метрики при деградации другой может не дать общего прироста.
Создание качественного контента для «длинного клика»: Фокусируйтесь на создании контента, который обеспечивает long clicks. Это прямо упоминается как один из типов данных, который может моделироваться отдельно и иметь высокий вес в финальной формуле.

Worst practices (это делать не надо)

Использование кликбейта для накрутки CTR: Стратегия, направленная исключительно на получение клика без последующего удовлетворения пользователя, будет неэффективна. Модель, отвечающая за время взаимодействия, даст низкую оценку, что понизит общий User-Specific Value.
Накрутка одного типа поведенческих факторов: Попытки манипулировать только одним сигналом (например, накрутка кликов). Из-за независимого моделирования, неестественный перекос в сторону одного сигнала при отсутствии других (например, клики без последующего времени на сайте) будет легко обнаружен и не принесет пользы.
Игнорирование юзабилити и скорости загрузки: Факторы, препятствующие взаимодействию с контентом (медленная загрузка, неудобная навигация), негативно скажутся на метриках вовлеченности и будут учтены соответствующей моделью.

Стратегическое значение

Патент подтверждает стратегический фокус Яндекса на глубоком анализе поведенческих факторов и качестве пользовательского опыта. Он демонстрирует, что Яндекс не ищет единую метрику поведения, а строит многомерную модель предпочтений. Для SEO это означает, что стратегии должны быть комплексными, направленными на удовлетворение пользователя на всех этапах взаимодействия с контентом — от привлечения внимания до решения задачи. Система, использующая несколько независимых моделей, также более устойчива к манипуляциям.

Практические примеры

Сценарий: Оптимизация статьи для попадания в рекомендации (например, Дзен)

Цель: Максимизировать User-Specific Value, который рассчитывается как $ \alpha \cdot Score_{Clicks} + \beta \cdot Score_{Time} $.
Действие для Score_{Clicks} (Тип 1): Создание привлекательного, релевантного, но не кликбейтного заголовка. Оптимизация изображения/сниппета для повышения CTR в ленте.
Действие для Score_{Time} (Тип 2): Обеспечение быстрой загрузки. Использование четкой структуры статьи. Предоставление уникальной ценности и подробного раскрытия темы, чтобы стимулировать пользователя провести больше времени за чтением.
Результат: Статья получает высокие оценки от обеих независимых моделей. При комбинировании оценок итоговый User-Specific Value оказывается выше, чем у конкурентов, которые оптимизировались только под клики или только под объем текста.

Вопросы и ответы

Относится ли этот патент к ранжированию в основном поиске Яндекса?

Патент напрямую описывает методы для «рекомендательного сервиса» (например, Яндекс.Дзен), а не основного веб-поиска. Однако, принципы анализа поведенческих факторов, заложенные в патенте (разделение кликов и времени взаимодействия, использование независимых моделей), с высокой вероятностью используются Яндексом глобально, в том числе и в основном поиске, для оценки качества контента и удовлетворенности пользователя.

Что важнее согласно этому патенту: CTR или время взаимодействия (Dwell Time)?

Патент не указывает, что важнее, но утверждает, что эти сигналы различны и обрабатываются независимо. Финальная оценка релевантности (User-Specific Value) является взвешенной комбинацией оценок по разным типам сигналов. Веса определяют важность каждого компонента, и они могут меняться. Поэтому критически важно оптимизировать оба показателя.

Как этот патент помогает бороться с кликбейтом?

Он предоставляет эффективный механизм для этого. Кликбейт генерирует много взаимодействий одного типа (клики), но мало другого (время взаимодействия). Поскольку эти типы обрабатываются разными моделями, кликбейт получит высокий балл от Модели 1 (клики), но низкий балл от Модели 2 (время). При финальном взвешивании низкий балл Модели 2 значительно снизит общую релевантность контента.

Что такое «Item Features» и «User Features» и почему одни рассчитываются офлайн, а другие онлайн?

Item Features — это векторное представление контента. Оно относительно стабильно и меняется медленно, поэтому рассчитывается заранее (офлайн) и сохраняется. User Features — это векторное представление текущих интересов пользователя. Оно очень динамично и может меняться после каждого клика, поэтому для максимальной точности оно рассчитывается в реальном времени (онлайн) в момент запроса.

Какие типы взаимодействий упоминаются в патенте?

В патенте явно перечислены следующие типы: количество кликов, количество лайков, количество дизлайков, количество длинных кликов (long clicks) и время взаимодействия (interaction time). Система может быть настроена на использование любых двух или более из этих типов, моделируя каждый из них независимо.

Что такое SVD, ALS и NN-based models, упомянутые в патенте?

Это различные алгоритмы машинного обучения для рекомендательных систем. SVD (Singular-Value Decomposition) и ALS (Alternating Least Squares) — это методы матричной факторизации, используемые для выявления скрытых признаков пользователей и контента. NN-based models — это модели на основе нейронных сетей. Патент предполагает гибкость в выборе этих алгоритмов для моделирования разных типов взаимодействий.

Может ли накрутка одного типа поведенческих факторов помочь в ранжировании?

Это маловероятно и неэффективно. Поскольку система использует взвешенную комбинацию оценок от независимых моделей, искусственное завышение одного показателя (например, кликов) при отсутствии других (например, времени взаимодействия) не даст значительного прироста в финальной релевантности и может выглядеть подозрительно.

Применяется ли этот метод к сайтам в целом или только к отдельным страницам?

Патент (Claim 2) явно указывает, что «Элемент цифрового контента» (Digital Content Item) может быть одним из: отдельным цифровым документом (страницей), сетевым ресурсом (сайтом) или паблишером (издателем). Это означает, что система может оценивать и рекомендовать как отдельные статьи, так и целые сайты или каналы авторов, используя описанный механизм.

Как определяются веса (α и β) в формуле финальной релевантности?

Конкретные методы определения весов не раскрываются детально, но патент упоминает, что они могут быть определены эмпирически, на основе статистического анализа логов пользователей. Также указано, что веса могут быть как общими для системы («user-non-specific»), так и индивидуальными для пользователя («user-specific»).

Как этот патент связан с метрикой Proxima?

Патент не упоминает Proxima. Однако, Proxima оценивает полезность контента и удовлетворенность пользователя. Описанный в патенте механизм раздельного анализа поведенческих сигналов (особенно времени взаимодействия и длинных кликов, которые связаны с удовлетворенностью) вполне может являться одним из компонентов или входных данных для расчета метрики Proxima как в рекомендациях, так и в основном поиске.