Как Яндекс моделирует эволюцию интересов пользователя для систем рекомендаций (например, Дзен)

Яндекс патентует метод для рекомендательных систем, который моделирует последовательность действий пользователя как траекторию в многомерном пространстве интересов. Система обучается предсказывать следующий шаг пользователя, анализируя направление и скорость этой траектории во времени. Контент, соответствующий прогнозируемому продолжению траектории, рекомендуется пользователю.

Описание

Какую задачу решает

Патент решает задачу повышения релевантности персонализированных рекомендаций контента путем прогнозирования будущих интересов пользователя. Вместо использования статических профилей интересов, изобретение предлагает моделировать динамическую эволюцию этих интересов во времени. Это позволяет рекомендательным системам (например, Дзен) адаптироваться к текущему контексту и направлению внимания пользователя.

Что запатентовано

Запатентован способ обучения модуля рекомендаций и сама система, основанная на моделировании последовательности действий пользователя как траектории в многомерном пространстве (латентном пространстве признаков). Суть изобретения заключается в методе обучения, который оптимизирует это пространство путем минимизации двух типов ошибок: Ошибки окрестности (точность направления) и Ошибки расстояния (согласованность скорости изменения интересов).

Как это работает

Система отображает каждое действие пользователя (например, просмотр статьи) в виде точки (Фактор активности) в многомерном пространстве. Последовательность действий формирует Пользовательскую траекторию. Во время обучения модель учится так располагать эти точки, чтобы будущее действие пользователя оказывалось максимально близко к прогнозируемому продолжению его текущей траектории, а скорость движения по ней была предсказуемой. При генерации рекомендаций система анализирует текущую траекторию и предлагает контент (Спрогнозированный фактор активности), который находится в Окрестности продолжения этой траектории.

Актуальность для SEO

Высокая. Моделирование временной динамики и эволюции интересов пользователей с использованием векторных представлений (эмбеддингов) является стандартом в современных рекомендательных системах (RecSys). Описанный подход к моделированию траекторий и оптимизации их предсказуемости является актуальным методом повышения качества персонализации в таких продуктах, как Дзен.

Важность для SEO

Влияние на традиционное SEO минимальное (2/10). Патент не описывает механизмы ранжирования веб-поиска по запросу пользователя. Он полностью сосредоточен на инфраструктуре систем персонализированных рекомендаций. Однако для оптимизации контента внутри этих платформ (Recommendation System Optimization) патент имеет высокое значение (8/10), так как раскрывает логику выбора следующей единицы контента на основе динамики поведения пользователя.

Детальный разбор

Термины и определения

Многомерное пространство (Multi-dimensional space): Латентное векторное пространство (пространство интересов), в которое отображаются действия пользователей и контент. Близость в этом пространстве отражает схожесть интересов.
Модуль обучения / Модуль обработки (Training module / Processing module): Компонент системы, реализующий алгоритм машинного обучения, который отвечает за отображение факторов активности в многомерное пространство и оптимизацию своих параметров на основе ошибок прогнозирования.
Окрестность траектории (Trajectory neighborhood): Область в многомерном пространстве вокруг пользовательской траектории. Система ожидает, что следующее действие пользователя попадет в эту область. Может иметь линейный или искривленный профиль (Claims 6, 7).
Ошибка окрестности (Neighborhood error): Метрика точности предсказания направления интересов. Определяется как кратчайшее расстояние от точки фактического следующего действия до окрестности прогнозируемой траектории (Claim 10).
Ошибка расстояния (Distance error): Метрика предсказуемости скорости изменения интересов. Рассчитывается как разница в скорости (соотношение расстояния и времени) на разных участках траектории (Claim 9).
Пользовательская активность (User activity): Зафиксированное действие пользователя (просмотр контента, клик, лайк и т.д.).
Пользовательская траектория (User trajectory): Вектор или кривая в многомерном пространстве, соединяющая последовательные факторы активности. Моделирует эволюцию интересов пользователя во времени.
Спрогнозированный фактор активности (Predicted activity factor): Точка в многомерном пространстве, соответствующая прогнозируемому следующему действию пользователя. Контент, связанный с этой точкой, рекомендуется.
Фактор активности (Activity factor): Векторное представление (эмбеддинг) конкретной пользовательской активности в многомерном пространстве.

Ключевые утверждения (Анализ Claims)

Патент описывает два основных процесса: обучение модели (Claims 1-11) и применение обученной модели для генерации рекомендаций (Claims 12-13).

Claim 1 (Независимый пункт — Обучение): Описывает механизм обучения на основе последовательности из трех действий.

Система берет три последовательные во времени пользовательские активности (Первая, Вторая, Третья).
Они отображаются в Многомерное пространство как Факторы активности (Точка 1, Точка 2, Точка 3).
На основе Точки 1 и Точки 2 определяется Первая пользовательская траектория и ее Окрестность. Это прогноз направления интереса.
Вычисляются две ошибки на основе фактического положения Точки 3:
- Первая ошибка расстояния: Оценивает, насколько согласована скорость движения между точками (с учетом времени).
- Первая ошибка окрестности: Оценивает, насколько Точка 3 отклонилась от прогнозируемой Траектории (1->2).
Эти ошибки сохраняются и используются для обучения модуля (Claim 3) путем корректировки параметров ML-алгоритма.

Цель обучения — так оптимизировать отображение активностей в пространство, чтобы минимизировать эти две ошибки, делая траектории максимально плавными и предсказуемыми.

Claims 9 и 10 (Детализация Ошибок): Уточняют расчет ошибок.

Claim 9 (Ошибка расстояния): Рассчитывается как разница между скоростями движения. Скорость определяется как соотношение пройденного расстояния к временному интервалу между активностями. Это позволяет моделировать динамику изменения интересов.
Claim 10 (Ошибка окрестности): Рассчитывается как кратчайшее расстояние от фактической следующей активности (Точка 3) до Окрестности прогнозируемой траектории.

Claim 12 (Независимый пункт — Применение): Описывает процесс генерации рекомендаций обученной моделью.

Система фиксирует текущие последовательные активности пользователя (Текущая 1, Текущая 2).
Обученный модуль отображает их в Многомерное пространство.
Определяется Текущая пользовательская траектория и ее Окрестность.
Система идентифицирует Спрогнозированные факторы активности, которые находятся в пределах этой Окрестности (т.е. на пути продолжения траектории).
Контент, связанный с этими факторами, рекомендуется пользователю.

Где и как применяется

Данный патент не вписывается в стандартную архитектуру веб-поиска Яндекс (CRAWLING, INDEXING, RANKING, BLENDING). Он относится исключительно к инфраструктуре Систем Рекомендаций (Recommender Systems).

Среда применения: Персонализированные сервисы Яндекса, работающие без явного запроса (например, Дзен, Яндекс Музыка, рекомендации на главной странице).

Взаимодействие компонентов:

На входе: Логи последовательных действий пользователя (User Activity Logs) с временными метками.
Обработка (Офлайн): Модуль обучения использует логи для построения многомерного пространства (обучения эмбеддингов), минимизируя Ошибки расстояния и Окрестности.
Обработка (Онлайн): Модуль обработки в реальном времени анализирует текущую активность, определяет местоположение и траекторию пользователя в обученном пространстве.
На выходе: Список рекомендованного контента, соответствующего прогнозируемому продолжению траектории.

На что влияет

Типы контента: Влияет на любой контент в рекомендательных лентах (статьи, видео, товары).
Динамика выдачи: Алгоритм способствует «серийному потреблению» контента, плавно переводя пользователя от одной темы к смежной, и адаптируется к скорости изменения интересов пользователя.
Специфические запросы: Не применимо, так как система работает в контексте рекомендаций, а не поиска по запросам.

Когда применяется

Триггеры активации: Алгоритм активируется для генерации рекомендаций при наличии у пользователя истории взаимодействий (минимум два последовательных действия для построения базовой траектории).
Частота применения: Обучение модели происходит периодически офлайн. Применение модели (генерация рекомендаций) происходит непрерывно в режиме онлайн.

Пошаговый алгоритм

Алгоритм состоит из двух фаз: Обучение и Применение.

Фаза 1: Обучение Модуля Обработки (Офлайн)

Сбор данных: Из логов извлекаются тройки последовательных активностей с временными метками.
Инициализация: Алгоритм машинного обучения инициализируется с начальными параметрами.
Итеративное обучение:
- Отображение: Тройка активностей отображается в многомерное пространство (Точка А, Точка Б, Точка В).
- Определение траектории: На основе Точек А и Б определяется Траектория и ее Окрестность.
- Расчет Ошибки расстояния: Вычисляется разница в скорости движения на участках А->Б и А->В (с учетом времени).
- Расчет Ошибки окрестности: Вычисляется кратчайшее расстояние от Точки В до Окрестности траектории А->Б.
- Корректировка параметров: Параметры Модуля обработки корректируются для уменьшения суммарной ошибки.
Завершение: Процесс повторяется до стабилизации ошибок модели.

Фаза 2: Генерация Рекомендаций (Онлайн)

Сбор текущих данных: Фиксируются последние действия пользователя (Текущая Активность 1, Текущая Активность 2).
Отображение: Обученный Модуль отображает эти активности в многомерное пространство.
Определение текущей траектории: Определяется Текущая пользовательская траектория и ее Окрестность.
Прогнозирование: Система экстраполирует траекторию для предсказания следующего шага.
Выбор контента: Идентифицируются единицы контента (Спрогнозированные факторы активности), чьи векторы находятся в пределах Окрестности прогнозируемой траектории.
Рекомендация: Выбранный контент предлагается пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на поведенческих данных и их временной динамике.

Поведенческие факторы: Последовательности (sequences) пользовательских активностей (просмотры, клики, лайки, время взаимодействия). Критически важна упорядоченность этих активностей во времени.
Временные факторы: Временные интервалы между последовательными активностями. Эти данные явно используются для расчета Ошибки расстояния (скорости изменения интересов), как описано в Claim 9.

Контентные, ссылочные, технические и другие традиционные SEO-факторы в данном патенте не упоминаются. Система работает с абстрактными «Факторами активности».

Какие метрики используются и как они считаются

Векторное представление (Эмбеддинг): Каждая активность представляется как Фактор активности — точка в многомерном пространстве.
Расстояние в многомерном пространстве: Метрика близости между двумя Факторами активности.
Ошибка расстояния (Distance Error): Оценивает равномерность движения (скорость). Согласно Claim 9, она вычисляется как разница между двумя соотношениями (скоростями):
$$( \text{Скорость 1} = \frac{\text{Расстояние}(1, 2)}{\text{Время}(1, 2)} )$$
$$( \text{Скорость 2} = \frac{\text{Расстояние}(1, 3)}{\text{Время}(1, 3)} )$$
$$( \text{Ошибка Расстояния} = | \text{Скорость 1} — \text{Скорость 2} | )$$
Ошибка окрестности (Neighborhood Error): Оценивает точность предсказания направления. Рассчитывается как минимальное расстояние от фактической следующей точки до прогнозируемой траектории (ее окрестности).

Выводы

Патент относится к системам рекомендаций, а не к веб-поиску: Описанные механизмы не влияют на ранжирование сайтов в органической поисковой выдаче. Они описывают логику работы персонализированных лент (например, Дзен).
Эволюция интересов как траектория: Яндекс моделирует поведение пользователя не как набор разрозненных действий, а как непрерывный процесс — траекторию в пространстве интересов. Система анализирует направление и скорость этого движения.
Важность плавности и предсказуемости: Модель оптимизируется для создания плавных (минимизация Ошибки расстояния) и предсказуемых (минимизация Ошибки окрестности) траекторий. Система предпочитает контент, который является логичным продолжением текущих интересов.
Временной контекст критичен: Время между взаимодействиями явно используется для моделирования скорости изменения интересов (Claim 9).
Фокус на серийном потреблении: Алгоритм структурно поощряет контент, который вовлекает пользователя в длительные сессии с плавным переходом между единицами контента.

Практика

ВАЖНО: Патент является инфраструктурным и описывает работу систем персональных рекомендаций (например, Дзен), а не классического веб-поиска. Прямых рекомендаций для SEO-оптимизации сайтов под органическую выдачу в нем нет. Приведенные ниже пункты применимы только для оптимизации контента внутри рекомендательных платформ Яндекса (Recommendation System Optimization).

Best practices (это мы делаем)

Создание серийного контента (Content Series): Разрабатывайте циклы статей/видео, которые логически продолжают друг друга. Это способствует формированию плавной и предсказуемой Пользовательской траектории, что предпочтительно для алгоритма.
Плавное развитие темы и перелинковка: Обеспечивайте логичные переходы между темами. Используйте внутреннюю перелинковку и блоки рекомендаций, чтобы направлять пользователя по предсказуемому тематическому пути.
Стимулирование длительного вовлечения: Фокусируйтесь на метриках глубины сессии и времени взаимодействия. Чем дольше пользователь следует по предсказуемой траектории, потребляя ваш контент, тем лучше система понимает его интересы и тем выше вероятность дальнейших рекомендаций.
Тематическая консистентность ресурса/канала: Поддерживайте четкую тематику. Это помогает системе легче классифицировать контент и строить траектории пользователей в рамках определенной области интересов.

Worst practices (это делать не надо)

Резкая смена тематики контента: Публикация контента на разные темы на одном ресурсе может привести к формированию хаотичных и непредсказуемых траекторий, что затрудняет работу алгоритма.
Кликбейт, ведущий к коротким кликам: Контент, который привлекает клик, но не удерживает внимание, прерывает траекторию или создает резкие скачки. Это может быть интерпретировано как ошибка прогнозирования и негативно скажется на будущих рекомендациях.
Тупиковые страницы: Страницы без возможностей для дальнейшего тематического взаимодействия прерывают последовательность активностей и не дают системе данных для построения траектории.

Стратегическое значение

Патент подтверждает стратегическую важность анализа временной динамики поведения пользователей для Яндекса. Для контент-стратегов это означает, что успех в рекомендательных системах зависит не только от качества отдельной единицы контента, но и от того, как этот контент встраивается в общую картину эволюции интересов пользователя. Долгосрочная стратегия должна быть направлена на сопровождение пользователя в его путешествии по теме, предлагая логичные следующие шаги.

Практические примеры

Сценарий: Оптимизация контентного проекта о кулинарии под рекомендательные системы

Ситуация: Пользователь читает статью «Основы приготовления пасты» (Активность 1).
Действие SEO/Владельца сайта: В блоке рекомендаций предлагается статья «Рецепт соуса Болоньезе». Пользователь кликает (Активность 2).
Анализ системы: Система строит Траекторию (1 -> 2). Так как обе статьи тематически близки и логично продолжают друг друга, траектория получается плавной (низкие ошибки расстояния и окрестности). Система экстраполирует ее.
Результат: Система с высокой вероятностью порекомендует следующий шаг в этой же тематике, например, «Как выбрать пармезан для пасты» (Активность 3), потенциально с этого же сайта, если он поддерживает эту траекторию интересов.

Контрпример: Неудачное вовлечение

Ситуация: Пользователь читает статью «Основы приготовления пасты» (Активность 1).
Действие SEO/Владельца сайта: В блоке рекомендаций предлагается статья «Срочные политические новости» (Кликбейт). Пользователь кликает (Активность 2).
Анализ системы: Система строит Траекторию (1 -> 2). Так как тематики кардинально разные, в многомерном пространстве это выглядит как резкий скачок (высокая Ошибка окрестности). Траектория становится непредсказуемой.
Результат: Системе сложнее предсказать следующий шаг пользователя. Вероятность рекомендации контента с исходного сайта снижается, так как он не помог сформировать четкую траекторию интересов.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в органическом поиске Яндекса?

Нет, напрямую не влияет. Этот патент описывает технологию для систем персонализированных рекомендаций (например, Дзен, Яндекс Музыка), а не для классического веб-поиска. Механизмы ранжирования сайтов в ответ на поисковый запрос основаны на других алгоритмах. Здесь речь идет о предсказании интересов пользователя без явного запроса.

Что такое «Пользовательская траектория» в контексте этого патента?

Пользовательская траектория — это модель эволюции интересов пользователя во времени. Каждое действие пользователя (например, просмотр статьи) отображается как точка в многомерном пространстве интересов. Последовательность этих точек формирует вектор или кривую — траекторию. Система анализирует направление и скорость движения пользователя по этой траектории, чтобы предсказать его следующий шаг.

В чем разница между «Ошибкой расстояния» и «Ошибкой окрестности»?

Ошибка окрестности измеряет точность предсказания направления интересов. Если система ошиблась с направлением следующего шага пользователя, эта ошибка будет высокой. Ошибка расстояния измеряет плавность или скорость изменения интересов (Расстояние/Время). Если пользователь двигался с одной скоростью, а затем совершил резкий скачок, эта ошибка будет высокой. Система стремится минимизировать обе.

Как я могу использовать эти знания для продвижения в Дзене или других рекомендательных системах?

Ключевая стратегия — способствовать формированию плавных и предсказуемых траекторий у ваших читателей. Создавайте серии материалов, которые логически продолжают друг друга. Обеспечивайте тематическую консистентность канала. Избегайте резких скачков между несвязанными темами. Чем последовательнее пользователь потребляет ваш контент, тем лучше алгоритм будет его рекомендовать.

Учитывает ли система скорость, с которой пользователь потребляет контент?

Да, учитывает. В патенте (Claim 9) явно описан механизм расчета Ошибки расстояния как разницы в скорости движения по траектории (соотношение расстояния ко времени между активностями). Это позволяет системе моделировать, насколько быстро меняются интересы пользователя, и адаптировать рекомендации под этот темп.

Что произойдет, если пользователь ведет себя хаотично?

Если пользователь потребляет совершенно разный контент в случайном порядке, его траектория будет ломаной и непредсказуемой. Ошибки прогнозирования будут высокими. Системе будет сложнее подобрать релевантную рекомендацию, и она может переключиться на более общие материалы или использовать другие механизмы рекомендаций, не основанные на траекториях.

Может ли траектория быть нелинейной?

Да. В патенте (Claims 7 и 20) упоминается, что пользовательская траектория может относиться к искривленному типу, а ее окрестность может обладать искривленным профилем. Это означает, что система способна моделировать сложные сценарии изменения интересов, которые не укладываются в простое линейное движение.

Как кликбейт влияет на работу этого алгоритма?

Кликбейт может негативно влиять на работу системы. Если он приводит к короткому клику (быстрый отказ), это сигнализирует об ошибке рекомендации. Если кликбейт уводит пользователя в совершенно другую тематику, это делает траекторию пользователя непредсказуемой (высокая Ошибка окрестности), что усложняет дальнейшее прогнозирование и может снизить вероятность показа контента от этого источника.

Используются ли данные разных пользователей для обучения?

Да. В патенте (Claims 11 и 24) упоминается возможность использования активностей, осуществленных различными пользователями, в процессе обучения. Модель учится на агрегированных данных миллионов пользователей, чтобы выявить общие закономерности эволюции интересов и построить общее многомерное пространство.

Используется ли этот механизм для пользователей, у которых мало истории (холодный старт)?

Патент фокусируется на ситуациях, когда история уже есть. Для построения текущей траектории требуется минимум 2 действия (Claim 12), а для обучения — минимум 3 (Claim 1). Для абсолютно новых пользователей (проблема холодного старта) этот механизм неприменим напрямую, и вероятно используются другие подходы.