Как Яндекс прогнозирует следующие действия пользователя для персонализации и рекомендации контента

Яндекс патентует метод машинного обучения для прогнозирования поведения пользователей. Система одновременно обучается создавать векторные представления (эмбеддинги) действий пользователя и предсказывать следующее действие на основе текущего. Это позволяет системе определять будущий контекст пользователя и проактивно рекомендовать релевантный контент в поиске или персонализированных лентах.

Описание

Какую задачу решает

Патент решает задачу определения контента, который будет наиболее релевантен пользователю в ближайшем будущем, путем прогнозирования его следующих действий или изменения контекста. Технически он направлен на повышение эффективности обучения предиктивных моделей. Изобретение устраняет неоптимальность раздельного обучения моделей представления данных (эмбеддингов) и моделей прогнозирования, предлагая метод их одновременной оптимизации.

Что запатентовано

Запатентована система и способ совместного итеративного обучения (Joint Training) двух взаимосвязанных алгоритмов машинного обучения: Модуля отображения (Mapping Module) и Модуля прогнозирования (Prediction Module). Модуль отображения учится создавать векторные представления (эмбеддинги) пользовательской активности, а Модуль прогнозирования учится предсказывать будущую активность в этом векторном пространстве. Суть изобретения в том, как эти модули обучаются одновременно, используя ошибки друг друга для корректировки.

Как это работает

Система анализирует последовательные пары действий пользователя (Факторы активности). Модуль отображения переводит эти действия в векторы в Непрерывном многомерном пространстве (эмбеддинги). Модуль прогнозирования пытается предсказать вектор следующего действия. Модуль контроля измеряет две ключевые ошибки: Ошибку отображения (насколько предсказуемо расположены векторы последовательных действий) и Ошибку прогнозирования (насколько точен был прогноз). Обе модели итеративно и одновременно корректируются для минимизации этих ошибок. В результате система учится строить такое векторное пространство, в котором траектория поведения пользователя становится предсказуемой.

Актуальность для SEO

Высокая. Прогнозирование поведения пользователей (Sequence Modeling), использование векторных представлений (User/Session Embeddings) и методы совместного обучения являются фундаментом современных рекомендательных систем (например, Дзен) и механизмов глубокой персонализации поиска.

Важность для SEO

Влияние на SEO значительное (7/10). Патент описывает инфраструктуру глубокой персонализации Яндекса. Он не дает прямых рекомендаций по оптимизации текста или ссылок, но критически важен для понимания того, как Яндекс моделирует путь пользователя (User Journey). Система стремится предсказать следующий шаг пользователя и предложить соответствующий контент. Это означает, что для успешного SEO необходимо фокусироваться не только на ответе на текущий запрос, но и на создании контентных путей, которые соответствуют ожидаемой траектории информационной сессии пользователя.

Детальный разбор

Термины и определения

Примечание: Предоставленный PDF файл содержит только Формулу изобретения (Claims). Определения основаны исключительно на этом тексте.

Модуль контроля (Control Module): Компонент, который оценивает работу Модуля отображения и Модуля прогнозирования путем вычисления Ошибки отображения и Ошибки прогнозирования и передает данные для их корректировки (обучения).
Модуль отображения (Mapping Module): Компонент (Первый алгоритм машинного обучения, Claim 2), реализующий Процедуру отображения. Преобразует Факторы активности в векторные представления (эмбеддинги) в Непрерывном многомерном пространстве.
Модуль прогнозирования (Prediction Module): Компонент (Второй алгоритм машинного обучения, Claim 2), реализующий Процедуру прогнозирования. Предсказывает местоположение будущего Фактора активности на основе текущего.
Непрерывное многомерное пространство (Continuous Multidimensional Space): Векторное пространство (Embedding Space), в которое отображаются Факторы активности. Близость точек в этом пространстве отражает функциональную или поведенческую схожесть активностей.
Ошибка отображения (Mapping Error): Метрика, определяемая путем сравнения расстояния между векторами двух последовательных Факторов активности с порогом расстояния (Claim 1). Высокая ошибка означает, что последовательные действия расположены непредсказуемо в векторном пространстве.
Ошибка прогнозирования (Prediction Error): Метрика, показывающая разницу между спрогнозированным местоположением следующего Фактора активности и его фактическим местоположением.
Пользовательский контекст (User Context): Ситуация или условия, в которых находится пользователь в определенный момент времени. Патент рассматривает последовательности контекстов (Первый и Второй, следующий за ним по времени).
Фактор активности (Activity Factor): Данные, представляющие активность пользователя, связанные с определенным Пользовательским контекстом. Конкретная природа данных (например, запрос, клик, просмотр URL) в патенте не раскрыта.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методе обучения системы для прогнозирования релевантного контента через моделирование последовательности действий пользователя.

Claim 1 (Независимый пункт): Описывает основной цикл работы и обучения системы.

Система получает два последовательных во времени Фактора активности (Первый и Второй), связанных с соответствующими Пользовательскими контекстами.
Модуль отображения использует Процедуру отображения для размещения этих факторов в Непрерывном многомерном пространстве (создает их эмбеддинги).
Модуль прогнозирования использует Процедуру прогнозирования, чтобы на основе местоположения Первого фактора предсказать местоположение Спрогнозированного фактора активности (т.е. пытается угадать, где будет Второй фактор).
Модуль контроля вычисляет Ошибку отображения: сравнивает расстояние между Первым и Вторым факторами с порогом. (Цель: последовательные действия должны быть расположены предсказуемо).
Модуль контроля вычисляет Ошибку прогнозирования: сравнивает местоположение Второго фактора (реальность) со Спрогнозированным фактором (прогноз).
Корректировка (Обучение): Данные, основанные на обеих ошибках, передаются обратно в Модуль отображения и Модуль прогнозирования для корректировки их процедур.

Claim 2, 17 и 33: Уточняют техническую реализацию и процесс обучения.

Процедуры отображения и прогнозирования являются алгоритмами машинного обучения (MLA 1 и MLA 2) (Claim 2).
Ключевая особенность: Модули обучаются итерационно, причем MLA 1 и MLA 2 обучаются ОДНОВРЕМЕННО на каждой итерации (Claim 17, 33). Это механизм совместного обучения (Joint Training/Co-training).

Claim 14: Описывает фазу применения (Inference) обученной (скорректированной) системы.

Система извлекает Текущий фактор активности (FC) пользователя.
С помощью скорректированной Процедуры отображения FC размещается в скорректированном многомерном пространстве (LC).
С помощью скорректированной Процедуры прогнозирования определяется местоположение Будущего спрогнозированного фактора активности (LFP).
На основе LFP определяется Релевантный контент для пользователя.

Где и как применяется

Изобретение описывает инфраструктурный механизм машинного обучения, применяемый для персонализации и прогнозирования намерений пользователя.

RANKING – Ранжирование (L4 — Personalization)
Основное применение в поиске — это слой персонализации. Прогноз Будущего спрогнозированного фактора активности используется как мощный сигнал для переранжирования результатов. Контент, соответствующий прогнозируемому будущему контексту пользователя, получает повышение в выдаче.

Рекомендательные системы (например, Дзен)
Описанный механизм является ядром рекомендательных систем. Он позволяет формировать ленту контента, прогнозируя, что пользователь захочет прочитать или посмотреть дальше, основываясь на его текущей активности.

QUERY PROCESSING – Понимание Запросов
Система может использовать этот механизм для прогнозирования следующего намерения (интента) пользователя, что может влиять на интерпретацию текущего запроса или генерацию предполагаемых следующих запросов (Саджесты).

Взаимодействие и данные: Система взаимодействует с хранилищами логов пользовательской активности. На вход принимаются последовательности Факторов активности. На выходе генерируется вектор, представляющий прогноз будущего состояния пользователя.

На что влияет

Специфические запросы: Наибольшее влияние на запросы в рамках длинных сессий (session-based search), где пользователь последовательно уточняет свою потребность. Система пытается предугадать следующий этап поиска.
Персонализация: Влияет на степень персонализации выдачи и рекомендаций на основе краткосрочной и долгосрочной истории поведения пользователя.
Типы контента: Влияет на все типы контента (статьи, товары, видео), которые могут быть рекомендованы пользователю в зависимости от прогнозируемого контекста.

Когда применяется

Алгоритм применяется в двух режимах:

Офлайн (Обучение): Система непрерывно обрабатывает логи активности пользователей для итеративного и одновременного обучения Модуля отображения и Модуля прогнозирования.
Онлайн (Применение/Inference): Активируется при каждом взаимодействии пользователя с сервисом (запрос, клик), требующем генерации релевантного контента. Система использует текущий контекст для генерации прогноза в реальном времени.

Пошаговый алгоритм

Процесс работы системы разделен на две основные фазы: Обучение (Training) и Применение (Inference).

Фаза А: Обучение (Итеративный совместный процесс)

Сбор данных: Из логов извлекаются последовательные пары Факторов активности (А и Б), где Б следует за А во времени.
Отображение (Векторизация): Модуль отображения (MLA 1) генерирует векторы V_A и V_B в многомерном пространстве.
Прогнозирование: Модуль прогнозирования (MLA 2) на основе V_A генерирует прогноз P_B (предполагаемое местоположение V_B).
Расчет Ошибок (Модуль контроля):
- Ошибка отображения: Вычисление расстояния между V_A и V_B и сравнение его с Порогом расстояния.
- Ошибка прогнозирования: Вычисление разницы между P_B (прогноз) и V_B (реальность).
Корректировка (Совместное обучение): На основе обеих ошибок генерируются данные для корректировки параметров MLA 1 и MLA 2. Обе модели обновляются одновременно для минимизации будущих ошибок. (Процесс повторяется итеративно).

Фаза Б: Применение (Генерация рекомендаций)

Получение текущего контекста: Система идентифицирует текущий Фактор активности пользователя (C).
Отображение: Используя обученный MLA 1, генерируется вектор V_C.
Прогнозирование будущего: Используя обученный MLA 2, на основе V_C генерируется прогноз будущего Фактора активности P_F.
Определение релевантного контента: Система ищет контент, который соответствует прогнозируемому вектору P_F (например, контент, чей вектор близок к P_F).
Выдача: Релевантный контент предоставляется пользователю (в поиске, ленте и т.д.).

Какие данные и как использует

Данные на входе

Патент описывает использование данных абстрактно, не специфицируя их точный состав. В тексте (Claims) упоминаются только Факторы активности и Пользовательские контексты.

Поведенческие факторы: Являются основой для Факторов активности. Логически подразумеваются история запросов, клики (CTR), посещенные URL, время на сайте (Dwell time), взаимодействия в рамках сессии.
Временные факторы: Хронологическая последовательность активностей критически важна для работы алгоритма (Второй контекст является следующим по времени за Первым).
Пользовательские и Географические факторы: Могут быть частью Пользовательского контекста (устройство, IP, локация), влияя на интерпретацию Факторов активности.

Контентные, ссылочные или технические факторы сайтов в данном патенте не упоминаются.

Какие метрики используются и как они считаются

Непрерывное многомерное пространство (Эмбеддинги): Векторные представления Факторов активности. Способ их генерации является обучаемым алгоритмом машинного обучения (MLA 1).
Расстояние в пространстве: Метрика для измерения близости между векторами (например, косинусное или евклидово расстояние). Используется для расчета обеих ошибок.
Порог расстояния (Distance Threshold): Значение, используемое для определения Ошибки отображения. Если расстояние между последовательными действиями превышает порог, это считается ошибкой.
Алгоритмы Машинного Обучения (MLA 1, MLA 2): Патент не специфицирует тип алгоритмов, но описывает процесс их совместного итеративного обучения (Joint Training).

Выводы

Прогнозирование поведения как основа релевантности: Яндекс рассматривает релевантность не только как ответ на текущий контекст, но и как соответствие прогнозируемому будущему состоянию пользователя. Система активно пытается предсказать, что пользователь будет делать дальше.
Совместное обучение Эмбеддингов и Прогнозов: Ключевая инновация — одновременное обучение модели, создающей векторные представления (MLA 1), и модели, делающей прогнозы на их основе (MLA 2). Это позволяет создать пространство эмбеддингов, оптимально подходящее именно для задачи прогнозирования.
Важность последовательности действий (User Journey): Алгоритм напрямую использует хронологическую последовательность действий. Система учится понимать типичные траектории пользователей в поиске или потреблении контента.
Два критерия качества моделирования: Успешная модель должна (1) располагать последовательные действия предсказуемо друг относительно друга (минимизация Ошибки отображения) и (2) точно предсказывать следующее действие (минимизация Ошибки прогнозирования).
Инфраструктура для глубокой персонализации: Этот механизм является фундаментом для работы персонализированного поиска (L4) и рекомендательных систем (Дзен), позволяя адаптироваться к изменениям в поведении пользователя в реальном времени.

Практика

Best practices (это мы делаем)

Оптимизация под User Journey (Путь пользователя): Проектируйте контент и структуру сайта так, чтобы они поддерживали пользователя на протяжении всей его информационной сессии. Понимайте, откуда пользователь пришел и куда он, вероятно, пойдет дальше.
Построение логичных семантических кластеров: Создавайте контент, который не только отвечает на текущий запрос, но и предлагает логическое продолжение. Если пользователь ищет «симптомы гриппа», следующим его шагом может быть «лечение гриппа». Наличие этого контента и удобных переходов к нему помогает сайту соответствовать прогнозируемой траектории.
Стимулирование сессионности и вовлеченности: Используйте продуманную внутреннюю перелинковку, блоки «Читать далее», «Похожие товары» или «Следующие шаги». Цель — удержать пользователя на сайте, проводя его по логичной цепочке контента. Это формирует четкие поведенческие паттерны, которые система может распознать и использовать для прогнозирования.
Анализ последовательности взаимодействий: Изучайте типичные пути пользователей по сайту с помощью систем аналитики. Определяйте, какие страницы часто посещаются последовательно, и оптимизируйте эти переходы.

Worst practices (это делать не надо)

Создание тупикового контента: Страницы, которые не предлагают пользователю никаких вариантов для дальнейшего взаимодействия (нет ссылок, нет связанных материалов). Это прерывает сессию и затрудняет прогнозирование дальнейших шагов.
Изолированная оптимизация под одиночные запросы: Фокусировка на получении трафика по отдельным запросам без учета общего контекста сессии пользователя и его дальнейших намерений.
Хаотичная перелинковка или структура сайта: Связывание несвязанных по смыслу или этапу пути пользователя страниц. Это создает шумные поведенческие данные и может привести к неверным прогнозам системы относительно намерений пользователя.
Использование кликбейта: Привлечение пользователей, которые быстро покидают сайт, вносит шум в данные об активности и прерывает последовательность, что может привести к некорректному моделированию и ухудшению качества прогнозов.

Стратегическое значение

Патент подтверждает стратегический переход Яндекса от модели «запрос-ответ» к модели непрерывного сопровождения пользователя и проактивного предложения контента. Это фундаментальный механизм для реализации глубокой персонализации. Для SEO это означает, что понимание долгосрочных интересов пользователя и его целей в рамках сессии становится критически важным. Стратегия должна быть направлена на построение авторитетных ресурсов, которые способны удовлетворять потребности пользователя на разных этапах его пути.

Практические примеры

Сценарий 1: Планирование отпуска (Travel/E-commerce)

Текущая активность (Фактор А): Пользователь ищет «лучшие пляжи Пхукета отзывы». Он на стадии исследования.
Действие системы (Прогнозирование): Система, обученная на миллионах похожих сессий, прогнозирует, что следующим шагом (Прогноз P_B) с высокой вероятностью будет поиск отелей или авиабилетов в этом регионе.
Применение в SEO:
- Тревел-блог: Статья про пляжи должна содержать логичные переходы (ссылки, виджеты) на статьи «Отели рядом с пляжем Карон» или «Как дешево добраться до Пхукета». Это соответствует прогнозируемому пути.
- Агрегатор туров: В персонализированной выдаче (L4) Яндекс может поднять выше те сайты, которые не только описывают пляжи, но и предлагают туры, так как они лучше соответствуют прогнозируемому следующему шагу.

Сценарий 2: E-commerce (продажа электроники)

Текущая активность (Фактор А): Пользователь просматривает карточку товара «Смартфон Samsung Galaxy S25».
Действие системы (Прогнозирование): Система прогнозирует следующий шаг (Прогноз P_B) как интерес к аксессуарам (чехлы, зарядки).
Применение в SEO: Оптимизация блока «Сопутствующие товары» путем размещения наиболее логичных следующих шагов. Это увеличивает вероятность перехода (Фактор Б) на вашем сайте. Система обучается, что эти товары тесно связаны (Ошибки отображения и прогнозирования снижаются). В будущем система с большей вероятностью порекомендует товары этого магазина в персонализированной выдаче или рекомендательных блоках.

Вопросы и ответы

Что такое «Непрерывное многомерное пространство» простыми словами?

Это пространство эмбеддингов (Embedding Space). Представьте себе карту, где каждое возможное действие пользователя представлено точкой (вектором). Семантически или функционально похожие действия (например, просмотр двух разных статей об одной и той же модели телефона) расположены близко друг к другу. Суть патента в том, чтобы научиться строить эту «карту» таким образом, чтобы последовательные действия пользователя образовывали предсказуемую траекторию.

В чем ключевая инновация этого патента: в прогнозировании или в методе обучения?

Ключевая инновация — в методе обучения. Патент описывает совместное обучение (Joint Training) двух моделей. Вместо того чтобы сначала создать эмбеддинги (отображение), а потом обучать модель прогнозирования, здесь система оптимизирует эмбеддинги специально под задачу прогнозирования. Обе модели корректируются одновременно, что позволяет достичь более высокой точности.

В чем разница между Ошибкой отображения и Ошибкой прогнозирования?

Ошибка отображения показывает, насколько «плохо» построено само векторное пространство. Если два последовательных действия пользователя (А и Б) оказались далеко друг от друга или расположены непредсказуемо на «карте», это высокая Ошибка отображения. Ошибка прогнозирования показывает, насколько неточен был прогноз следующего шага. Если система предсказала Б, а пользователь совершил В (и вектор В далек от Б), это высокая Ошибка прогнозирования.

Этот патент относится к основному поиску Яндекса или к Дзену?

Патент описывает общий механизм определения релевантного контента. Он имеет критическое значение для работы рекомендательных систем, таких как Дзен, где нужно постоянно прогнозировать следующий интерес. Однако эти же механизмы используются и в основном поиске на слое глубокой персонализации (L4 Ranking) для корректировки выдачи с учетом прогнозируемых намерений пользователя.

Как я могу оптимизировать свой сайт под этот алгоритм прогнозирования поведения?

Ключевая стратегия — это оптимизация под сессию и сопровождение пользователя (User Journey Optimization). Убедитесь, что ваш сайт предоставляет контент для всех этапов пути пользователя в вашей тематике. Используйте четкую структуру и продуманную внутреннюю перелинковку, чтобы вести пользователя от одного логического шага к другому. Чем более предсказуемым и полезным будет путь пользователя по вашему сайту, тем выше его оценит система.

Что конкретно может являться «Фактором активности»?

Патент не дает конкретных примеров, используя абстрактные термины. На практике это любое значимое действие пользователя, зафиксированное в логах: введенные поисковые запросы, клики по ссылкам, посещения определенных URL, время, проведенное на странице, лайки, покупки или добавление товара в корзину.

Насколько важна последовательность действий пользователя для этой системы?

Последовательность критически важна. Весь механизм патента построен на анализе пар последовательных факторов активности («первый» и «второй, следующий по времени»). Система учится предсказывать следующий шаг на основе текущего. Если последовательность хаотична, точность прогнозирования падает.

Как связаны Модуль отображения и современные модели типа YATI (BERT)?

Модуль отображения выполняет функцию энкодера — он преобразует входные данные (контекст, активность) в векторное представление (эмбеддинг). Современные трансформерные модели, такие как YATI или BERT, являются мощными энкодерами. Логично предположить, что на практике Яндекс использует именно такие продвинутые архитектуры в качестве основы для Модуля отображения, чтобы генерировать максимально качественные и информативные эмбеддинги.

Если я создам много страниц и свяжу их последовательно, поможет ли это?

Поможет, только если эта последовательность логична, полезна и соответствует реальным потребностям пользователей. Механическое создание цепочек контента не даст эффекта. Система обучается на реальном поведении пользователей, поэтому важно, чтобы пользователи действительно следовали предложенному вами пути и находили его полезным.

Может ли эта система использоваться для таргетинга рекламы (РСЯ)?

Безусловно. Прогнозирование будущего намерения пользователя имеет огромную ценность для рекламных систем. Если система предсказывает, что пользователь собирается совершить покупку или интересуется определенной услугой, ему можно показать соответствующую рекламу. Это повышает вероятность конверсии и эффективность рекламы.