Как Яндекс использует момент прекращения просмотра ленты для обучения ранжирования контента

Яндекс патентует метод генерации обучающих данных для систем ранжирования (например, лент рекомендаций). Система определяет последний элемент, с которым взаимодействовал пользователь перед закрытием или обновлением ленты. Элементам, получившим взаимодействие, присваивается «Оценка выигрыша». Элементам, показанным ниже последнего взаимодействия, присваивается «Оценка проигрыша», которая тем выше, чем ближе элемент находился к точке остановки пользователя. Это позволяет точнее обучать алгоритмы релевантности.

Описание

Какую задачу решает

Патент решает задачу повышения точности идентификации релевантного контента в интерфейсах типа «лента» (например, рекомендательные системы, такие как Яндекс.Дзен). Ключевая проблема — как интерпретировать поведение пользователя, который прекращает взаимодействие с лентой (закрывает или обновляет ее). Изобретение предлагает механизм, который трактует это действие как указание на то, что оставшиеся непросмотренные элементы содержимого не являются релевантными для пользователя, и использует эту информацию для более точного обучения алгоритмов ранжирования (MLA).

Что запатентовано

Запатентован способ генерации обучающих данных для системы ранжирования на основе анализа предыдущих пользовательских взаимодействий в ленте. Суть изобретения заключается в определении «Последнего просмотренного элемента» (Last Viewed Element) перед тем, как пользователь покинул интерфейс. На основе этого определяются «Оценки выигрыша» (Win Score) для элементов, с которыми было взаимодействие, и «Оценки проигрыша» (Loss Score) для элементов, ранжированных ниже точки остановки пользователя.

Как это работает

Система работает в две фазы: обучение и использование. Во время фазы обучения анализируются логи взаимодействий. Для каждой сессии идентифицируется последний элемент, с которым пользователь взаимодействовал. Элементы выше получают Оценку выигрыша (в зависимости от типа взаимодействия). Элементы, которые были показаны ниже последнего взаимодействия, получают Оценку проигрыша. Ключевой механизм: Оценка проигрыша тем выше, чем ближе элемент находился к последнему просмотренному. Если пользователь остановился на элементе X, то элемент X+1 получает высокую Оценку проигрыша, а элемент X+10 — более низкую. Эти оценки формируют метки для обучения MLA. Во время фазы использования обученный MLA прогнозирует Оценки релевантности для нового контента и ранжирует его в ленте.

Актуальность для SEO

Высокая. Методы обучения ранжированию на основе поведенческих сигналов (Learning to Rank) являются стандартом для современных поисковых и рекомендательных систем. Описанный механизм точной интерпретации негативных сигналов при прекращении сессии крайне актуален для платформ с бесконечной лентой контента.

Важность для SEO

Влияние на SEO значительно (7/10), но специфично для определенных платформ. Патент описывает механизм, критически важный для ранжирования в рекомендательных лентах (Яндекс.Дзен, Новости, возможно, блоки рекомендаций на главной странице). Он напрямую не относится к основному веб-поиску (SERP), но демонстрирует, как Яндекс использует поведенческие данные для обучения ML-моделей. Для SEO-специалистов, работающих с продвижением контента на этих платформах, понимание этого механизма критично: необходимо максимизировать вовлеченность и минимизировать вероятность того, что контент окажется в зоне «проигрыша».

Детальный разбор

Термины и определения

MLA (Machine Learning Algorithm / Алгоритм машинного обучения): Алгоритм (например, нейронная сеть, дерево решений), который обучается прогнозировать Оценку релевантности элемента содержимого на основе его атрибутов и исторических данных о взаимодействиях.
Интерфейс / Лента (Interface / Feed): Пользовательский интерфейс (например, мобильное приложение, веб-страница), отображающий прокручиваемый список ранжированных элементов содержимого. Пример – Яндекс.Дзен.
Последний просмотренный элемент содержимого (Last Viewed Element): Ключевое понятие патента. Это последний элемент в ранжированном списке, с которым взаимодействовал пользователь до того, как интерфейс был покинут (закрыт или обновлен). В некоторых вариантах определяется как элемент с самым низким рангом, с которым было взаимодействие.
Оценка выигрыша (Win Score): Оценка, присваиваемая элементу содержимого, с которым пользователь взаимодействовал (кликнул, прочитал, посмотрел). Величина оценки может зависеть от типа контента и характера взаимодействия (например, полное прочтение статьи ценится выше).
Оценка проигрыша (Loss Score): Оценка, присваиваемая элементу содержимого, который был отображен пользователю, но не получил взаимодействия, и при этом имел более низкий ранг (находился ниже), чем Последний просмотренный элемент. Величина оценки зависит от расстояния до Последнего просмотренного элемента.
Метка (Label): Итоговое значение, присваиваемое элементу содержимого на основании Оценки выигрыша и/или Оценки проигрыша. Используется в качестве целевой переменной (Ground Truth) при обучении MLA.
Оценка релевантности (Relevance Score): Прогнозируемая MLA оценка, указывающая вероятность того, что элемент содержимого будет интересен пользователю. Используется для финального ранжирования контента в ленте.

Ключевые утверждения (Анализ Claims)

Патент защищает метод обучения системы ранжирования, основанный на специфической интерпретации пользовательского поведения при завершении сессии в ленте.

Claim 1 (Независимый пункт): Описывает полный цикл работы системы (обучение и использование).

Фаза Обучения:

Получение исторических данных о взаимодействиях с ранжированным списком контента.
Для каждой сессии определение Последнего просмотренного элемента (последнее взаимодействие перед уходом из интерфейса).
Определение Оценки выигрыша для элементов, которые пользователь выбрал.
Определение Оценки проигрыша для элементов с более низким рангом, чем Последний просмотренный элемент.
Определение Метки на основе Оценок выигрыша/проигрыша.
Обучение системы ранжирования (MLA) прогнозировать релевантность, используя эти Метки.

Критически важная деталь в конце Claim 1 (и раскрытая в Claim 2): Определение Оценки проигрыша включает определение количества элементов между данным элементом и Последним просмотренным элементом, и расчет оценки на основании этого количества.

Фаза Использования:

Прием набора элементов контента.
Прогнозирование Оценки релевантности с помощью обученной системы.
Определение позиций ранжирования на основе этих оценок.

Claim 2 (Зависимый от 1): Детализирует расчет Оценки проигрыша.

Система рассчитывает Оценку проигрыша так, что она выше для элементов, которые находятся ближе к Последнему просмотренному элементу (т.е. количество элементов между ними меньше), и ниже для элементов, которые находятся дальше.

Это реализует механизм «штрафа за близость». Если пользователь перестал скроллить, это сильный негативный сигнал для следующего элемента и более слабый сигнал для элемента, находящегося значительно ниже. Это позволяет более точно определить, какой именно контент вызвал потерю интереса.

Claim 8 (Независимый пункт): Описывает способ, фокусируясь на триггере активации расчета Оценок проигрыша.

Подтверждается, что именно действие пользователя по прекращению сессии (выход/обновление) является триггером для генерации негативных обучающих сигналов (Оценок проигрыша) для непросмотренного контента.

Где и как применяется

Изобретение описывает механизм обучения ранжирующей модели, который применяется преимущественно в системах рекомендаций и лентах контента (например, Яндекс.Дзен, новостные ленты).

RANKING – Ранжирование (Обучение модели)
Основное применение патента — это не сам процесс ранжирования в реальном времени, а процесс генерации обучающих данных (Training Data Generation) для ML-модели ранжирования (например, CatBoost). Это офлайн-процесс.

Входные данные: Логи пользовательских взаимодействий (сессии), включающие список показанных элементов, их ранги, атрибуты элементов и действия пользователя (клики, время просмотра, закрытие/обновление ленты).
Процесс: Система анализирует логи, вычисляет Оценки выигрыша и Оценки проигрыша по описанной методике (с учетом Последнего просмотренного элемента) и формирует Метки.
Выходные данные: Обучающий набор данных (признаки элемента + Метка), который используется для обучения или дообучения MLA.

RANKING – Ранжирование (Использование модели)
Во время использования (в реальном времени) применяется уже обученная модель (MLA).

Входные данные: Набор элементов-кандидатов и их атрибуты.
Процесс: MLA прогнозирует Оценку релевантности для каждого элемента.
Выходные данные: Ранжированный список элементов для отображения в интерфейсе.

На что влияет

Типы интерфейсов: Наибольшее влияние оказывается на интерфейсы с прокручиваемым списком контента («ленты»), включая бесконечные ленты. Патент упоминает вертикальное расположение мозаичных элементов.
Конкретные типы контента: Влияет на все типы контента, отображаемые в таких лентах: статьи, видео, аудио, изображения, гиперссылки. При этом механизм расчета Оценки выигрыша может быть специфичен для каждого типа (например, для видео учитывается процент просмотра).

Когда применяется

Условия применения: Алгоритм генерации обучающих данных применяется при обработке исторических логов пользовательских сессий.
Триггеры активации (для расчета Оценки проигрыша): Ключевым триггером является событие прекращения пользователем просмотра интерфейса — его закрытие (например, нажатие кнопки «Выход») или обновление (например, нажатие кнопки «Обновить ленту»).
Частота применения: MLA может регулярно повторно обучаться с использованием новых данных для адаптации к изменению интересов пользователей.

Пошаговый алгоритм

Процесс А: Генерация обучающих данных и обучение MLA (Офлайн, на основе FIG. 5)

Сбор данных: Извлечение исторических наборов данных о пользовательских взаимодействиях с лентой.
Обработка сессии (Цикл): Для каждого набора данных:
1. Расчет Оценок выигрыша: Определение Оценки выигрыша для всех элементов, с которыми пользователь взаимодействовал. Используются формулы, специфичные для типа контента и взаимодействия.
2. Идентификация Пивота: Определение Последнего просмотренного элемента (последнее взаимодействие перед выходом/обновлением).
3. Идентификация Кандидатов на Проигрыш: Выбор элементов, имеющих более низкий ранг, чем Последний просмотренный элемент.
4. Фильтрация: Удаление из этого набора элементов, которые фактически не были отображены пользователю на экране.
5. Расчет Оценок проигрыша: Для оставшихся элементов расчет Оценки проигрыша. Оценка рассчитывается на основании расстояния (количества элементов) до Последнего просмотренного элемента: чем ближе, тем выше оценка.
6. Генерация Меток: Формирование финальных Меток для обучения на основании Оценок выигрыша и проигрыша.
Обучение Модели: Обучение MLA прогнозировать Оценку релевантности, используя атрибуты контента как признаки и сгенерированные Метки как целевые значения.

Процесс Б: Использование системы ранжирования (Онлайн, на основе FIG. 6)

Получение Кандидатов: Прием набора элементов содержимого для ранжирования.
Прогнозирование: Использование обученного MLA для прогнозирования Оценки релевантности для каждого элемента.
Ранжирование: Сортировка элементов на основании прогнозируемых оценок.
Отображение: Вывод интерфейса (ленты) с ранжированным контентом.
Сбор обратной связи: Запись взаимодействий и прием указания о закрытии/обновлении интерфейса. (Эти данные затем используются в Процессе А для дообучения).

Какие данные и как использует

Данные на входе

Система использует два основных типа данных для обучения: поведенческие факторы (логи сессий) и атрибуты контента (признаки для MLA).

Поведенческие факторы: Критически важны для расчета Оценок выигрыша/проигрыша. Используются записи о:
- Выбор (клик) элемента.
- Длительность выбора/взаимодействия (Dwell time) (например, время чтения статьи, время просмотра видео).
- Наведение курсора и его длительность.
- Специфические взаимодействия (воспроизведение аудио/видео, увеличение изображения).
- Событие завершения сессии (закрытие или обновление интерфейса).
- Данные о том, какие элементы были фактически отображены на экране.
Атрибуты контента (Признаки): Используются MLA для прогнозирования релевантности:
- Тип элемента (статья, видео, аудио и т.д.).
- Источник элемента (URL/ресурс).
- Возраст элемента (параметр новизны).
- Длина элемента (например, длина статьи или видео).
- Количество просмотров.
- Рейтинг пользователя (если доступен).
- Размер элемента, цветовое решение, присутствие объекта (компьютерное зрение).

Какие метрики используются и как они считаются

Оценка выигрыша (Win Score): Рассчитывается индивидуально для элементов, получивших взаимодействие. В патенте указано, что могут использоваться разные формулы для разных типов контента. Например, для видео оценка может зависеть от процента просмотра; для статьи — от времени чтения.
Оценка проигрыша (Loss Score): Рассчитывается для элементов ниже Последнего просмотренного. Расчет основан на расстоянии (количестве промежуточных элементов) до Последнего просмотренного элемента. Зависимость обратно пропорциональная: чем меньше расстояние, тем выше Оценка проигрыша.
Математически это можно выразить как: \(LossScore(Item) = f(Distance(Item, LastViewedItem))\), где \(f\) — убывающая функция.
Метка (Label): Агрегированная оценка, используемая для обучения. Может рассчитываться как комбинация Оценки выигрыша и Оценки проигрыша (например, сумма, разность, максимальное/минимальное значение).
Прогнозируемая Оценка Релевантности (Predicted Relevance Score): Выходные данные MLA. Значение, на основании которого происходит финальное ранжирование.

Выводы

Завершение сессии как негативный сигнал: Яндекс активно использует момент, когда пользователь закрывает или обновляет ленту, как явный сигнал о потере интереса к последующему контенту. Это позволяет генерировать ценные негативные обучающие примеры.
Штраф за близость к точке остановки: Ключевая инновация — дифференцированная Оценка проигрыша. Элементы, находящиеся непосредственно под последним взаимодействием, получают больший штраф, чем те, что находятся значительно ниже. Это повышает точность обучения модели.
Важность фактического отображения: Система учитывает, был ли элемент фактически показан на экране, прежде чем присваивать ему Оценку проигрыша. Это защищает от ложных негативных сигналов для контента, который пользователь просто не увидел.
Специфичность метрик для типов контента: Оценки выигрыша рассчитываются с учетом типа контента (видео, статья) и глубины взаимодействия (время чтения, процент просмотра), что подчеркивает важность качественного вовлечения, а не только клика.
Фокус на рекомендательные системы: Описанный механизм идеально подходит для сред типа Яндекс.Дзен и лент рекомендаций, где основной сценарий потребления — это последовательный просмотр предложенного контента.

Практика

Best practices (это мы делаем)

Рекомендации применимы в первую очередь к продвижению контента в лентах рекомендаций Яндекса (Дзен, Новости).

Максимизация глубины взаимодействия: Создавайте контент, который удерживает пользователя. Поскольку Оценка выигрыша зависит от глубины взаимодействия (время чтения, процент просмотра видео), необходимо стимулировать полное потребление контента. Это повышает Метку для вашего контента в обучающей выборке.
Оптимизация заголовков и сниппетов для вовлечения: В ленте критически важно не оказаться элементом, который пользователь проигнорировал перед закрытием ленты. Привлекательные, но релевантные заголовки и изображения снижают вероятность получения Оценки проигрыша.
Анализ атрибутов контента: Учитывайте, что MLA использует множество атрибутов (возраст, источник, тип, длина, визуальные характеристики) для прогнозирования релевантности. Тестируйте разные форматы и подачи материала, чтобы найти те, которые генерируют наилучшие поведенческие сигналы в вашей тематике.
Поощрение длительных сессий: Хотя это напрямую не контролируется SEO-специалистом, создание качественного контента, который побуждает пользователя продолжать просмотр ленты (и взаимодействовать с другими элементами после вашего), косвенно улучшает общую среду и качество данных, на которых обучается система.

Worst practices (это делать не надо)

Кликбейт, ведущий к быстрому отказу: Если пользователь кликнул на ваш контент, быстро разочаровался и сразу закрыл ленту, ваш контент станет Последним просмотренным элементом. Это приведет к низкой Оценке выигрыша (из-за малого времени взаимодействия) для вас и генерации Оценок проигрыша для следующего контента.
Скучный или нерелевантный контент: Контент, который пользователи часто игнорируют, рискует получить Оценку проигрыша, если пользователь закроет ленту после взаимодействия с контентом выше. Это снижает будущие прогнозы релевантности для подобного контента.
Игнорирование разнообразия форматов: Фокусировка только на одном типе контента, когда система использует специфические метрики для разных форматов (видео vs текст), может ограничивать потенциальный охват и качество получаемых Оценок выигрыша.

Стратегическое значение

Патент подтверждает стратегический фокус Яндекса на использовании сложных поведенческих сигналов для обучения ML-моделей ранжирования, особенно в рекомендательных системах. Он демонстрирует механизм, позволяющий системе автоматически генерировать высокоточные обучающие данные (Метки) из «сырых» логов поведения. Для SEO-стратегии это означает, что на платформах типа Дзен качество взаимодействия и способность удерживать внимание пользователя являются фундаментальными факторами, определяющими будущую видимость контента.

Практические примеры

Сценарий: Обучение модели на основе поведения в Яндекс.Дзен

Пользователь просматривает ленту Дзена.

Элемент 1 (Статья о кошках): Пользователь кликает и читает 2 минуты. Система присваивает высокую Оценку выигрыша (например, 0.9).
Элемент 2 (Видео о машинах): Пользователь кликает, смотрит 10 секунд и возвращается в ленту. Система присваивает низкую Оценку выигрыша (например, 0.2). Это Последний просмотренный элемент.
Действие пользователя: Пользователь видит следующие элементы, не кликает на них и нажимает «Обновить ленту».
Элемент 3 (Новость о политике): Находится сразу под Элементом 2. Система присваивает высокую Оценку проигрыша (например, 0.8), так как он был проигнорирован непосредственно перед обновлением.
Элемент 4 (Рецепт пирога): Находится ниже. Система присваивает среднюю Оценку проигрыша (например, 0.5).
Элемент 15 (Статья о рыбалке): Находится далеко внизу, но был показан на экране. Система присваивает низкую Оценку проигрыша (например, 0.1).

Результат: MLA обучается, что статьи о кошках релевантны, видео о машинах менее релевантны, а новости о политике (в данном контексте и с данными атрибутами) сильно нерелевантны.

Вопросы и ответы

Этот патент описывает ранжирование в основном поиске Яндекса (SERP)?

Нет, напрямую этот патент не описывает ранжирование в классическом веб-поиске. Он сфокусирован на интерфейсах типа «лента» (Feed), где контент предоставляется пользователю в виде прокручиваемого списка рекомендаций. В тексте упоминается Яндекс.Дзен как пример такой системы. Хотя общие принципы обучения на поведении пользователей универсальны, описанный механизм расчета «Оценки проигрыша» при закрытии ленты специфичен для рекомендательных систем.

В чем ключевое отличие «Оценки выигрыша» от «Оценки проигрыша»?

«Оценка выигрыша» (Win Score) — это позитивный сигнал, который присваивается, если пользователь взаимодействовал с контентом (кликнул, посмотрел). Ее величина зависит от качества взаимодействия. «Оценка проигрыша» (Loss Score) — это негативный сигнал (штраф), который присваивается контенту, который был показан, но проигнорирован, при условии, что он находился ниже последнего элемента, с которым пользователь взаимодействовал перед уходом из ленты.

Почему Оценка проигрыша выше для элементов, которые ближе к точке остановки пользователя?

Это ключевой механизм патента. Логика такова: если пользователь перестал скроллить и закрыл ленту, это является сильным свидетельством того, что следующий показанный элемент его не заинтересовал. Для элементов, находящихся значительно ниже, уверенность системы в их нерелевантности меньше, так как пользователь мог просто устать или отвлечься. Поэтому штраф (Оценка проигрыша) уменьшается по мере удаления от точки остановки.

Что такое «Последний просмотренный элемент»?

Это элемент, с которым пользователь взаимодействовал последним непосредственно перед тем, как закрыть или обновить интерфейс ленты. Он служит точкой отсчета (пивотом) для определения того, какие элементы получат Оценку проигрыша. Все, что было показано ниже него и проигнорировано, получает эту оценку.

Как система определяет, был ли элемент фактически показан пользователю?

Патент предусматривает этап фильтрации. Система анализирует логи, чтобы определить, какие элементы содержимого были фактически отображены на экране пользователя. Элементы, которые были в ленте, но до которых пользователь не доскроллил (т.е. они не отображались), исключаются из расчета Оценки проигрыша. Это важно для точности обучающих данных.

Влияет ли тип контента (видео или статья) на расчет оценок?

Да, влияет на расчет Оценки выигрыша. В патенте указано, что для разных типов контента могут использоваться разные формулы. Например, для видео может учитываться процент просмотра, а для статьи — время чтения. Это значит, что система оценивает не просто факт клика, а глубину вовлечения в контент.

Как этот патент влияет на стратегию продвижения в Яндекс.Дзен?

Он подчеркивает критическую важность удержания внимания. Необходимо не только получить клик, но и обеспечить глубокое взаимодействие с контентом (дочитывания, досмотры), чтобы получить высокую Оценку выигрыша. Также крайне важно избегать создания скучного или вводящего в заблуждение контента, который часто игнорируется и рискует получить Оценку проигрыша, что негативно скажется на будущих показах.

Является ли кликбейт выигрышной стратегией согласно этому патенту?

Нет, это скорее опасная стратегия. Кликбейт может привести к клику, но если за ним последует быстрое разочарование и закрытие ленты, система зафиксирует низкую Оценку выигрыша (из-за короткого взаимодействия). В долгосрочной перспективе это научит алгоритм (MLA) понижать подобный контент в ранжировании, так как его атрибуты будут ассоциироваться с низкими Метками.

Что такое Метка (Label) и как она используется?

Метка — это итоговое значение, рассчитанное на основе Оценок выигрыша и/или проигрыша для конкретного элемента в конкретной сессии. Она представляет собой «истинную» релевантность элемента, выведенную из поведения пользователя. Эти Метки используются как целевые значения (Ground Truth) для обучения алгоритма машинного обучения (MLA) прогнозировать релевантность контента.

Какие атрибуты контента использует система для ранжирования?

Система (MLA) использует множество атрибутов для прогнозирования релевантности. В патенте упоминаются тип контента, источник, возраст (новизна), длина, количество просмотров, рейтинг, а также визуальные характеристики, такие как размер, цвет и даже объекты, распознанные с помощью компьютерного зрения.