Как Яндекс раздельно анализирует разные типы поведенческих сигналов (клики, время, лайки) для точной оценки релевантности в рекомендательных системах

Яндекс патентует метод для рекомендательных систем (например, Дзен), который обрабатывает разные типы взаимодействий пользователя (например, клики и время просмотра) независимо друг от друга с помощью отдельных моделей (SVD, нейросети). Это позволяет избежать искажений от противоречивых сигналов (например, кликбейт) и точнее предсказать релевантность контента, комбинируя независимые оценки взвешенной суммой.

Описание

Какую задачу решает

Патент решает проблему снижения точности в рекомендательных системах, возникающую при совместном анализе разных типов поведенческих сигналов. Разные сигналы могут нести противоречивую информацию: например, большое количество кликов указывает на привлекательность, а малое время взаимодействия — на низкую удовлетворенность (например, в случае кликбейта). Обработка этих сигналов одной моделью приводит к систематическим ошибкам и менее точной интерпретации предпочтений. Также патент решает проблему разреженности данных (Data Sparsity) — ситуации, когда взаимодействий недостаточно для надежной оценки релевантности, и проблему вычислительной нагрузки в онлайн-режиме.

Что запатентовано

Запатентована система и метод оценки данных о взаимодействиях пользователь-элемент, ключевой особенностью которого является независимое моделирование различных типов поведенческих сигналов. Суть изобретения заключается в использовании отдельных моделей машинного обучения (например, SVD или Нейронные Сети) для каждого типа взаимодействия (одна модель для кликов, другая для времени просмотра). Это позволяет точнее предсказывать недостающие взаимодействия и генерировать отдельные наборы признаков (эмбеддинги) по каждому типу сигнала.

Как это работает

Система работает в двух режимах. В офлайн-режиме собираются данные о взаимодействиях разных видов (Тип 1, Тип 2). Для каждого типа независимо обучается своя модель, которая предсказывает недостающие взаимодействия (для не возникших пар). На основе полных данных (собранных и предсказанных) генерируются и сохраняются Признаки Элемента 1 и 2 (например, с помощью ALS). В онлайн-режиме, при запросе рекомендаций, система генерирует Признаки Пользователя 1 и 2 на основе его истории. Релевантность рассчитывается путем сравнения признаков пользователя и элемента для каждого типа отдельно, а затем эти оценки сходства комбинируются (взвешенной суммой) в итоговое Пользовательское значение релевантности. Для снижения нагрузки используется поэтапный отбор кандидатов.

Актуальность для SEO

Высокая. Описанный подход соответствует передовым методологиям в области рекомендательных систем. Использование матричной факторизации (SVD/ALS) и нейросетевых архитектур (включая подразумеваемые двухбашенные модели) для генерации эмбеддингов является стандартом индустрии. Независимое моделирование различных типов обратной связи крайне актуально для повышения качества персонализированных лент, таких как Яндекс.Дзен (упомянут в патенте).

Важность для SEO

Влияние на SEO умеренное (6/10). Патент напрямую описывает механизмы для рекомендательных систем, а не для основного веб-поиска Яндекса. Однако он дает критически важное понимание того, насколько глубоко Яндекс анализирует Поведенческие Факторы (ПФ). Патент демонстрирует технологическую способность изолировать и независимо оценивать сигналы привлекательности (клики) от сигналов удовлетворенности (время на сайте, длинные клики). Это подтверждает, что стратегии, направленные исключительно на генерацию кликов без удовлетворения интента пользователя, анализируются отдельно от подлинного вовлечения.

Детальный разбор

Термины и определения

ALS (Alternating Least Squares — Алгоритм чередующихся наименьших квадратов): Алгоритм матричной факторизации. Используется для разложения матрицы взаимодействий на матрицы признаков пользователей и элементов.
Возникшая пара (Occurred Pair) пользователь-элемент: Пара, состоящая из пользователя и элемента контента, с которым этот пользователь взаимодействовал. Для этих пар существуют собранные данные.
Модель оценивания (Evaluation Model): Алгоритм машинного обучения (SVD или NN), используемый для прогнозирования данных о взаимодействиях для не возникших пар.
Набор признаков (Feature Set / Вектор / Эмбеддинг): Численное представление пользователя (Признаки Пользователя) или элемента контента (Признаки Элемента), сформированное на основе данных о взаимодействиях определенного типа.
Не возникшая пара (Non-occurred Pair) пользователь-элемент: Пара, состоящая из пользователя и элемента контента, с которым этот пользователь ранее не взаимодействовал.
NN (Neural Network — Нейронная сеть): Один из видов моделей оценивания. В патенте описана архитектура, состоящая из двух частей (подразумевается двухбашенная модель): одна для формирования вектора элемента, другая для формирования вектора пользователя.
SVD (Singular-Value Decomposition — Сингулярное разложение): Метод матричной факторизации. Упоминается как один из видов моделей оценивания.
Пользовательское значение (User Value / Оценка релевантности): Финальная оценка, указывающая на релевантность элемента контента для пользователя. Рассчитывается как взвешенное сочетание оценок сходства по разным типам взаимодействий.
Элемент цифрового контента (Item): Единица контента в рекомендательной системе. Может быть цифровым документом, сетевым ресурсом (сайтом) или издателем.

Ключевые утверждения (Анализ Claims)

Патент защищает метод, при котором разные типы поведенческих сигналов обрабатываются независимо друг от друга для повышения общей точности прогнозирования.

Claim 1 (Независимый пункт): Описывает ядро изобретения — процесс раздельной оценки взаимодействий.

Сервер извлекает данные о взаимодействиях Первого вида и Второго вида (различных, например, клики и время просмотра) для Возникших пар.
Применяется Первая модель оценивания ТОЛЬКО к данным Первого вида, чтобы оценить (спрогнозировать) взаимодействия Первого вида для Не возникших пар.
Применяется Вторая модель оценивания ТОЛЬКО к данным Второго вида, чтобы оценить взаимодействия Второго вида для Не возникших пар.

Ключевой защищаемый аспект — это независимость применения моделей (подтверждается также в Claim 6). Это предотвращает ситуацию, когда данные одного вида (например, многочисленные клики на кликбейт) влияют на оценку данных другого вида (например, удовлетворенность контентом).

Claim 8 (Зависимый пункт): Описывает офлайн-процесс генерации признаков (эмбеддингов) элементов.

Формирование Первых наборов признаков элемента на основе всей совокупности данных Первого вида (собранных и оцененных).
Формирование Вторых наборов признаков элемента на основе всей совокупности данных Второго вида.

Для каждого элемента контента создаются два независимых векторных представления: одно отражает его свойства с точки зрения сигнала 1 (например, кликабельность), другое — с точки зрения сигнала 2 (например, способность удерживать внимание). Для этого используется факторизация (например, ALS).

Claim 9 (Зависимый пункт): Описывает процесс обработки запроса в реальном времени (онлайн).

При получении запроса сервер формирует Первый и Второй наборы признаков пользователя на основе его актуальной истории взаимодействий.
Определяется релевантность элемента путем сравнения соответствующих наборов признаков пользователя и элемента (Первый с Первым, Второй со Вторым).

Claim 10 (Зависимый пункт): Описывает комбинирование результатов.

На основе сравнений определяются Первое и Второе значения степени сходства. Финальное Пользовательское значение (оценка релевантности) представляет собой взвешенное сочетание этих двух значений сходства. Это позволяет настраивать баланс важности разных сигналов.

Claims 14-16 (Зависимые пункты): Описывают альтернативную реализацию моделей оценивания с помощью Нейронной сети (NN).

Модель NN состоит из двух частей (двухбашенная архитектура): первая часть формирует вложенный вектор элемента на основе данных элемента, вторая — вложенный вектор пользователя на основе данных пользователя. Модель обучается так, чтобы сходство между этими векторами предсказывало данные о взаимодействии определенного вида.

Где и как применяется

Этот патент не описывает архитектуру основного веб-поиска Яндекса. Он описывает внутреннюю архитектуру Рекомендательной Системы, такой как Яндекс Дзен (упомянут в). Процесс разделен на офлайн и онлайн фазы.

Офлайн-процессы и обработка данных

Основная часть вычислений происходит офлайн (Процедуры 320, 325):

Сбор данных: Отслеживание и сбор данных о взаимодействиях разных видов (клики, время, лайки).
Обучение моделей и Оценка: Обучение отдельных моделей (SVD/NN) для каждого типа данных и прогнозирование взаимодействий для не возникших пар.
Генерация признаков элементов: Использование алгоритмов факторизации (ALS) для генерации и сохранения наборов признаков (эмбеддингов) для элементов контента по каждому типу взаимодействия.

Онлайн Ранжирование / Рекомендация

Происходит в момент запроса пользователя (Процедуры 330, 340):

Генерация признаков пользователя: На лету генерируются наборы признаков пользователя на основе его актуальной истории.
Предварительный выбор (Процедура 330): Сравнение признаков пользователя с заранее рассчитанными признаками элементов и вычисление взвешенной суммы сходства (Пользовательского значения). Отбор топ-кандидатов. Этот этап использует «легкую формулу» для быстрого отбора.
Выбор цифрового контента (Процедура 340): Применение основной, вычислительно интенсивной модели ранжирования (например, GBDT) к предварительно отобранному небольшому подмножеству для определения финальных рекомендаций.

На что влияет

Типы контента: Влияет на любой контент, распространяемый через рекомендательные системы Яндекса: статьи, новости, видеоматериалы, продукты, аудиокниги.
Специфические запросы: Применяется к неявным запросам на рекомендацию контента (например, при открытии ленты Дзена), а не к явным поисковым запросам в веб-поиске.
Борьба с манипуляциями: Система позволяет эффективно бороться с кликбейтом, так как привлекательность (клики) и удовлетворенность (время просмотра) моделируются и взвешиваются раздельно.

Когда применяется

Триггеры активации (Онлайн): Запуск рекомендательного приложения, открытие новой вкладки браузера (если лента интегрирована), явный запрос на обновление ленты.
Временные рамки (Офлайн): Процессы оценки данных и генерации признаков элементов выполняются периодически в фоновом режиме для обновления моделей и учета новых данных.

Пошаговый алгоритм

Процесс работы системы можно разделить на офлайн и онлайн этапы.

Этап 1: Офлайн обработка данных и генерация признаков элементов

Сбор и разделение данных: Система собирает данные о взаимодействиях, разделяя их по типам (например, Тип 1: Клики; Тип 2: Время взаимодействия) для возникших пар.
Независимая оценка (Прогнозирование):
- Применение Модели 1 (например, SVD или NN) к данным Типа 1 для оценки взаимодействий Типа 1 для не возникших пар.
- Применение Модели 2 (например, SVD или NN) к данным Типа 2 для оценки взаимодействий Типа 2 для не возникших пар. (Выполняется независимо).
Формирование полных матриц: Создание Матрицы 1 (Тип 1) и Матрицы 2 (Тип 2), включающих как собранные, так и оцененные данные.
Факторизация и Генерация признаков элементов (ALS):
- Применение алгоритма ALS к Матрице 1 для формирования Первого набора признаков элементов (Векторы Элементов 1).
- Применение ALS к Матрице 2 для формирования Второго набора признаков элементов (Векторы Элементов 2).
Сохранение: Сохранение Векторов Элементов 1 и 2 в базе данных.

Этап 2: Онлайн обработка запроса и ранжирование

Получение запроса: Пользователь запрашивает рекомендации.
Генерация признаков пользователя: На основе актуальной истории взаимодействий система генерирует Вектор Пользователя 1 и Вектор Пользователя 2 (например, используя одну итерацию ALS).
Расчет сходства: Для кандидатов контента система вычисляет:
- Сходство 1: Сравнение Вектора Пользователя 1 с Вектором Элемента 1.
- Сходство 2: Сравнение Вектора Пользователя 2 с Вектором Элемента 2.
Расчет релевантности (User Value): Вычисление финальной оценки релевантности как взвешенной суммы:
$${UserValue} = \alpha \cdot {Сходство_1} + \beta \cdot {Сходство_2}$$
Ранжирование и Выбор: Отбор топ-кандидатов на основе User Value (предварительный выбор) и применение основной модели ранжирования (например, GBDT) для финального выбора.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Являются основными данными для системы. Патент явно упоминает следующие виды взаимодействий:
- Количество «кликов» (Clicks).
- Количество положительных отметок («лайков»).
- Количество отрицательных отметок («дизлайков»).
- Количество «длинных кликов» (Long Clicks).
- Продолжительность взаимодействия (Dwell time).
- Прокрутка документа (Scrolls).
- «Поделился» документом (Shares).
Контентные факторы (Для NN моделей): Если используются модели на основе нейронных сетей (NN), они могут принимать на вход данные элемента: присущие характеристики, статистическую информацию по тексту (частота слов), наличие мультимедийного контента, информацию классификации.
Пользовательские факторы (Для NN моделей): Если используются NN модели, они могут принимать на вход данные пользователя: статистическую информацию, данные пользовательского профиля (имя, возраст, пол).

Какие метрики используются и как они считаются

Модели для Оценки (Estimation):
- SVD (Сингулярное разложение) и NN (Нейронные сети) используются для прогнозирования недостающих взаимодействий. Для NN описана двухкомпонентная архитектура (аналог Two-Tower Model).
Алгоритм Генерации Признаков:
- ALS (Alternating Least Squares) используется для разложения матриц взаимодействий на Наборы признаков (эмбеддинги) пользователей и элементов.
Метрики Релевантности:
- Значение степени сходства (Similarity Score): Рассчитывается путем сравнения вектора пользователя и вектора элемента для конкретного типа взаимодействия (например, на основе векторного расстояния).
- Пользовательское значение (User Value / Релевантность): Финальная метрика. Рассчитывается как взвешенная сумма значений степени сходства по разным типам взаимодействий.
Весовые коэффициенты (α, β): Используются в формуле User Value для балансировки важности разных типов взаимодействий. Могут быть глобальными (определенными эмпирически) или персонализированными (зависящими от пользователя).
Ранжирующие Модели (MLA):
- Градиентный бустинг дерева решений (GBDT): Упоминается как для легкой модели предварительного выбора, так и для основной модели выбора,.

Выводы

Разделение поведенческих сигналов: Яндекс явно разделяет анализ различных типов поведенческих факторов (ПФ) в своих рекомендательных системах. Сигналы привлекательности (например, CTR) и сигналы удовлетворенности (например, время просмотра, лайки) обрабатываются независимыми ML-моделями.
Борьба с искажениями (Bias) и Кликбейтом: Независимая обработка предотвращает ситуацию, когда оптимизация под один показатель (например, высокий CTR за счет кликбейта) негативно влияет на точность прогнозирования другого показателя (удовлетворенность).
Множественные Эмбеддинги: Система генерирует различные наборы признаков (эмбеддинги) для пользователей и контента на основе каждого типа взаимодействия (например, «эмбеддинг кликов» и «эмбеддинг времени просмотра»).
Взвешенное комбинирование (Late Fusion): Финальная релевантность является взвешенной суммой оценок от независимых моделей. Это позволяет Яндексу настраивать баланс между разными целями, регулируя весовые коэффициенты.
Эффективность за счет поэтапного ранжирования: Патент описывает многоэтапный процесс ранжирования (предварительный отбор с легкой моделью, затем основная тяжелая модель), что критически важно для баланса между качеством и скоростью работы высоконагруженных систем.

Практика

ВАЖНО: Этот патент напрямую относится к рекомендательным системам Яндекса (например, Дзен). Его применение к основному веб-поиску Яндекса является косвенным, но дает глубокое понимание возможностей Яндекса в области анализа поведения пользователей.

Best practices (это мы делаем)

Оптимизация под множественные цели вовлечения (Особенно для Дзена): Необходимо оптимизироваться под две независимые цели: 1) Привлекательность (максимизация CTR через заголовки/превью) и 2) Удовлетворенность (максимизация времени просмотра, лайков через качество контента). Успех требует высоких оценок от обеих моделей.
Комплексная поведенческая оптимизация (Веб-поиск): Применяйте этот принцип к SEO в целом. Обеспечивайте как высокий CTR в SERP (оптимизация сниппетов), так и высокое качество взаимодействия на посадочной странице (длинные клики, время на сайте). Патент подтверждает, что Яндекс обладает технологиями для раздельной оценки этих факторов.
Фокус на качестве и удовлетворении интента: Создавайте контент, который действительно решает задачу пользователя и удерживает его внимание. Сигналы вовлеченности моделируются отдельно от кликов и вносят существенный вклад в финальную оценку релевантности.

Worst practices (это делать не надо)

Применение кликбейта: Использование вводящих в заблуждение заголовков для повышения CTR. Описанный механизм позволяет системе идентифицировать такой контент: Модель Кликов даст высокую оценку, но Модель Времени просмотра даст низкую. Низкая оценка удовлетворенности значительно снизит общую релевантность.
Накрутка одного типа ПФ: Попытка манипулировать только одним типом сигнала (например, накрутка кликов без имитации длительного пребывания на сайте) будет неэффективной, так как сигналы моделируются независимо, и расхождение между ними будет очевидно.
Игнорирование удовлетворенности пользователя: Фокусировка только на привлечении трафика (CTR) без работы над удержанием пользователя на сайте.

Стратегическое значение

Патент подтверждает высокий уровень сложности анализа поведенческих факторов в Яндексе. Он демонстрирует, что Яндекс не просто суммирует ПФ, а использует многоцелевую оптимизацию, где разные аспекты поведения моделируются независимо. Это подчеркивает стратегическую важность создания контента, который не только привлекает внимание, но и глубоко удовлетворяет интент пользователя. Удовлетворенность пользователя является отдельной, измеримой и моделируемой целью для алгоритмов Яндекса.

Практические примеры

Сценарий: Оптимизация статьи для рекомендательной системы (Яндекс.Дзен)

Задача: Максимизировать охват статьи о выборе ноутбука.
Действия (основанные на патенте):
- Оптимизация под Тип 1 (Клики): Создание привлекательного, но честного заголовка и выбор релевантного изображения для превью (оптимизация CTR).
- Оптимизация под Тип 2 (Время взаимодействия): Структурирование статьи, использование инфографики, обеспечение полноты раскрытия темы для удержания внимания (оптимизация Dwell Time).
- Оптимизация под Тип 3 (Лайки): Добавление призыва к действию в конце статьи с просьбой оценить материал.
Как работает система: Модель 1 анализирует кликабельность. Модель 2 анализирует время. Модель 3 анализирует лайки. Для статьи генерируются три отдельных набора признаков.
Результат: Финальная релевантность рассчитывается как взвешенная сумма ($V = \alpha \cdot Score_1 + \beta \cdot Score_2 + \gamma \cdot Score_3$). Статья получает высокий охват, так как она оптимизирована по всем ключевым поведенческим аспектам. Если бы использовался кликбейт, $Score_2$ и $Score_3$ были бы низкими, что снизило бы общую оценку V.

Вопросы и ответы

Применим ли этот патент к ранжированию в основном веб-поиске Яндекса?

Патент напрямую описывает архитектуру рекомендательных систем, таких как Яндекс Дзен (упомянут в тексте). Используемые методы (факторизация матриц, ALS, SVD) типичны для коллаборативной фильтрации в рекомендациях. Хотя базовые принципы анализа поведенческих факторов (ПФ) актуальны и для веб-поиска, конкретная реализация, описанная здесь, не относится к ранжированию сайтов в органической выдаче.

Какую главную проблему решает этот патент для Яндекса?

Основная проблема — это искажение (bias) при оценке релевантности, когда разные типы поведенческих сигналов анализируются совместно одной моделью. Например, клики (привлекательность) и время на сайте (удовлетворенность) могут конфликтовать (например, кликбейт). Патент решает эту проблему путем независимого анализа каждого типа сигнала, что повышает общую точность рекомендаций-[0015].

Как раздельный анализ кликов и времени взаимодействия помогает бороться с кликбейтом?

Кликбейт генерирует сильный сигнал Типа 1 (клики), но слабый сигнал Типа 2 (время взаимодействия, лайки). Поскольку система анализирует их раздельно и затем взвешивает, слабый сигнал Типа 2 снизит общую оценку релевантности. Если вес удовлетворенности (Тип 2) установлен выше веса кликабельности (Тип 1), кликбейт будет эффективно пессимизирован.

Какие типы поведенческих сигналов явно упомянуты в патенте?

В патенте явно перечислены: количество кликов, количество лайков, количество дизлайков, количество «длинных кликов» и продолжительность взаимодействия (Dwell time). Также упоминаются прокрутка документа (scrolls) и шеры (shares).

Что такое «Наборы признаков элемента/пользователя» (Эмбеддинги), упоминаемые в патенте?

Это латентные векторные представления. Они представляют собой сжатое численное описание характеристик контента или предпочтений пользователя. Ключевая особенность в том, что для каждого пользователя и элемента создается несколько векторов — по одному для каждого типа взаимодействия (например, вектор «кликабельности» и вектор «интересности»).

Как система объединяет оценки от разных поведенческих сигналов?

Система рассчитывает отдельные оценки сходства для каждого типа сигнала. Финальная оценка релевантности («Пользовательское значение») рассчитывается как взвешенная сумма этих оценок сходства. Это позволяет гибко настраивать важность разных сигналов.

Может ли Яндекс изменять важность (вес) кликов по сравнению со временем взаимодействия?

Да. Итоговая оценка релевантности является взвешенной комбинацией. Патент указывает, что эти весовые коэффициенты могут быть определены заранее и могут быть как общими для всех пользователей, так и индивидуальными (зависящими от пользователя)-[0241]. Это позволяет Яндексу гибко настраивать приоритеты.

Какие модели машинного обучения упоминаются в патенте?

Упоминаются два основных типа моделей для оценки взаимодействий: Сингулярное разложение (SVD) и Нейронные сети (NN). Для генерации признаков (эмбеддингов) используется алгоритм Чередующихся наименьших квадратов (ALS). Для финального ранжирования упоминается Градиентный бустинг дерева решений (GBDT).

Все ли вычисления происходят в реальном времени, когда я открываю ленту?

Нет. Система оптимизирована для скорости. Тяжелые вычисления, такие как обучение моделей и генерация Признаков Элементов (контента), выполняются офлайн. В реальном времени (онлайн) система быстро рассчитывает Признаки Пользователя на основе его недавних действий (например, с помощью одной итерации ALS) и сравнивает их с уже готовыми Признаками Элементов.

Как мне оптимизировать свой контент, исходя из этого патента?

Если вы оптимизируете контент для рекомендательных систем Яндекса (Дзен), необходима комплексная оптимизация. Создавайте привлекательные и честные заголовки (для кликов), обеспечивайте высокое качество контента (для времени взаимодействия и дочитываний) и стимулируйте обратную связь (для лайков). Фокус только на одной метрике (например, CTR) не принесет устойчивого результата.