Как Яндекс использует долгосрочную историю поиска и контекст текущей сессии для глубокой персонализации ранжирования

Яндекс применяет двухкомпонентную систему машинного обучения для персонализации выдачи. Первая модель агрегирует долгосрочную историю поиска пользователя в компактное векторное представление (профиль интересов). Вторая модель в реальном времени использует этот вектор вместе с данными текущей сессии (недавние запросы и действия) для предсказания вероятности взаимодействия с документом и переранжирования результатов.

Описание

Какую задачу решает

Патент решает задачу повышения релевантности поисковой выдачи за счет глубокой персонализации. Он направлен на улучшение качества поиска путем адаптации ранжирования с учетом как долгосрочных интересов пользователя, так и его непосредственных действий в рамках текущей поисковой сессии. Ключевая техническая проблема, которую решает изобретение — это вычислительная сложность учета всей долгосрочной истории пользователя в реальном времени. Система позволяет использовать эту информацию эффективно путем ее предварительной компрессии (векторизации).

Что запатентовано

Запатентован способ совместного обучения алгоритма машинного обучения, состоящего из двух моделей, для ранжирования результатов поиска. Суть изобретения в разделении обработки исторического контекста. Первая модель обучается создавать сжатое векторное представление долгосрочной истории пользователя. Вторая модель (ранжирующая) обучается предсказывать вероятность действия пользователя (например, клика или длительного взаимодействия), используя данные текущей сессии и векторное представление от Первой модели.

Как это работает

Система использует два набора исторических данных. Долгосрочная история (Первые данные предыстории) обрабатывается Первой моделью (часто офлайн) и сжимается в векторное представление (эмбеддинг профиля пользователя). Во время реального поиска Вторая модель принимает текущий запрос, данные текущей сессии и предварительно рассчитанный долгосрочный вектор. Она оценивает, насколько каждый документ-кандидат соответствует комбинации долгосрочных интересов и текущего интента, и ранжирует их по предсказанной вероятности действия пользователя.

Актуальность для SEO

Высокая. Патент подан в 2023 году и описывает современные (State-of-the-Art) подходы к персонализации с использованием передовых архитектур нейронных сетей (Трансформеры, упомянутые в Claims 8, 9). Эффективная интеграция долгосрочного профиля пользователя и контекста сессии является ключевым направлением развития современных поисковых систем.

Важность для SEO

Влияние на SEO критическое (9/10). Описанный механизм лежит в основе персонализации поисковой выдачи (уровень L4). Это означает, что универсальная релевантность уступает место персональной релевантности, и «объективной» выдачи практически не существует. Для SEO-специалистов это подчеркивает первостепенную важность построения долгосрочных отношений с аудиторией (влияние на долгосрочный вектор) и оптимизации под весь путь пользователя (Session-based SEO), а не под отдельные изолированные запросы.

Детальный разбор

Термины и определения

Алгоритм машинного обучения: Система, состоящая из Первой и Второй моделей машинного обучения, обученная для ранжирования цифровых документов.
Первая модель машинного обучения (Model 1): Модель (например, нейронная сеть на основе Трансформера), которая обучается на долгосрочной истории пользователя. Ее задача — сформировать Векторное представление первых данных предыстории.
Вторая модель машинного обучения (Model 2): Основная ранжирующая модель. Обучается предсказывать вероятность действия пользователя с документом, используя данные сессии и вектор от Model 1.
Первые данные предыстории (Долгосрочная история): Множество запросов, сформированные в ответ на них наборы документов и действия пользователя с этими документами за длительный прошлый период времени.
Вторые данные предыстории (Сессионная история): История поиска пользователя за прошлый обучающий пользовательский сеанс. Этот сеанс короче и осуществлялся позднее, чем Прошлый период времени.
Векторное представление первых данных предыстории (Эмбеддинг пользователя): Сжатое численное представление (эмбеддинг) долгосрочных интересов и поведения пользователя, генерируемое Model 1. Профиль пользователя.
Пользовательское действие: Взаимодействие пользователя с документом. Включает (Claim 3): выбор (клик), остановку на документе, добавление в избранное, контакт дольше порогового времени (Dwell Time), сохранение контента. Вероятность этого действия предсказывает Model 2.
Трансформер (Transformer): Архитектура нейронной сети (кодер-декодер), упомянутая в Claims 8 и 9 как возможная реализация для Первой и Второй моделей.

Ключевые утверждения (Анализ Claims)

Ядром изобретения является специфический двухэтапный метод обучения и применения моделей для персонализации ранжирования.

Claim 1 (Независимый пункт): Описывает процесс совместного обучения Первой и Второй моделей.

Получение двух наборов данных: Долгосрочной истории (Первые данные) и Сессионной истории (Вторые данные).
Обучение Первой модели (Model 1) на долгосрочных данных формированию их Векторного представления (эмбеддинга пользователя).
Формирование обучающих объектов для Второй модели (Model 2). Каждый объект включает сессионные данные (запрос, документы, действия) И векторное представление долгосрочной истории (полученное от Model 1).
Обучение Второй модели (Model 2) на этих объектах предсказывать вероятность действия пользователя с документом.

Система учится раздельно обрабатывать долгосрочный профиль и текущий контекст. Model 1 создает эмбеддинг пользователя. Model 2 учится ранжировать, используя этот эмбеддинг как дополнительный признак к данным текущей сессии. Ключевым моментом является совместное обучение, что позволяет Model 1 генерировать эмбеддинг, оптимальный для задачи Model 2.

Claim 4 (Зависимый пункт): Описывает применение системы на этапе использования (в реальном времени/Inference).

Получение текущего запроса и набора документов-кандидатов.
Получение данных предыстории текущей сессии (запросы и действия, предшествующие текущему запросу в этой же сессии).
Формирование цифрового объекта, включающего: текущий запрос, кандидатов, данные текущей сессии И Векторное представление долгосрочной истории (от Model 1).
Ввод этого объекта во Вторую модель (Model 2).
Определение значения вероятности действия пользователя для каждого кандидата.
Ранжирование документов согласно этим значениям вероятности.

Ранжирование в реальном времени осуществляется Model 2. Она оценивает релевантность документа не изолированно, а в контексте того, что пользователь искал минуту назад (сессия) и что он искал в течение длительного периода (долгосрочный вектор).

Claims 5-7 (Зависимые пункты): Описывают механизм поддержания актуальности долгосрочного профиля. Первые данные предыстории обновляются перед получением их векторного представления. Обновление происходит путем сдвига или расширения временного окна в сторону текущего момента и выполняется с заранее заданной частотой.

Профиль пользователя (эмбеддинг) не является статичным. Он периодически пересчитывается для учета изменений в интересах пользователя.

Claims 8-9 (Зависимые пункты): Уточняют архитектуру моделей. Каждая из Первой и Второй моделей может представлять собой нейронную сеть с архитектурой кодер-декодер, в частности, нейронную сеть на основе Трансформера (Transformer). Это позволяет моделям эффективно улавливать сложные зависимости и контекст в истории поиска.

Где и как применяется

Изобретение затрагивает офлайн-процессы обработки данных и финальный этап онлайн-ранжирования.

RANKING – Ранжирование (L4 Personalization)
Основное применение патента происходит на уровне L4, где осуществляется персонализация выдачи. Вторая модель (Model 2) интегрирована в конвейер ранжирования и отвечает за пересчет релевантности документов с учетом персонального контекста пользователя.

Входные данные: Набор документов-кандидатов (отобранных на L1-L3), текущий запрос, данные текущей сессии пользователя и его долгосрочный векторный профиль.
Выходные данные: Значение вероятности действия пользователя для каждого документа, используемое для финального переранжирования.

Офлайн-процессы (Feature Engineering и Управление Профилями Пользователей)
Значительная часть работы происходит офлайн:

Сбор и обработка логов пользовательского поведения.
Совместное обучение Model 1 и Model 2.
Регулярное применение Model 1 для генерации и обновления Векторных представлений (профилей пользователей) на основе обновляемой долгосрочной истории. Эти векторы сохраняются в специализированном хранилище.

На что влияет

Неоднозначные и широкие запросы: Наибольшее влияние оказывается на запросы, где долгосрочные интересы пользователя помогают разрешить интент (например, запрос «ягуар» для автолюбителя и зоолога).
Запросы в рамках сессии: Сильно влияет на запросы в рамках длительной поисковой сессии, где интент уточняется с каждым шагом (например, выбор товара, планирование поездки).
Конкретные ниши: Влияет на все ниши, но особенно заметно в E-commerce (персонализация предложений) и тематиках, связанных с хобби и профессиональной деятельностью, где история поиска формирует четкий профиль интересов.

Когда применяется

Алгоритм потенциально применяется при каждом поисковом запросе пользователя, для которого выполнены следующие условия:

Идентификация пользователя: Наличие идентификатора пользователя (логин, cookie и т.д.).
Наличие долгосрочной истории: Для пользователя рассчитано Векторное представление (Model 1).
Активная сессия: Механизм становится более точным при наличии истории внутри текущей сессии.

Пошаговый алгоритм

Процесс А: Офлайн-обработка и обновление профиля (Model 1)

Сбор данных: Агрегация долгосрочной истории поиска пользователя (запросы, результаты, действия) за определенный период.
Обновление данных: Периодическое обновление истории (сдвиг временного окна) с заданной частотой (Claims 5-7).
Векторизация (Model 1): Обработка обновленной истории Первой моделью (Трансформер) для генерации актуального Векторного представления (профиля пользователя).
Сохранение: Запись вектора в хранилище профилей пользователей.

Процесс Б: Ранжирование в реальном времени (Model 2)

Получение запроса: Система получает текущий запрос и набор документов-кандидатов (L1-L3).
Сбор контекста сессии: Идентификация предыдущих запросов и действий пользователя в рамках текущей сессии.
Извлечение профиля: Получение предварительно рассчитанного Векторного представления долгосрочной истории пользователя (из Процесса А).
Формирование входного объекта: Компоновка текущего запроса, кандидатов, контекста сессии и вектора долгосрочной истории в единый объект.
Вычисление (Model 2): Ввод объекта во Вторую модель (Трансформер). Модель предсказывает вероятность действия пользователя для каждого кандидата.
Ранжирование (L4): Сортировка документов на основе предсказанных вероятностей и формирование персонализированной выдачи.

Какие данные и как использует

Данные на входе

Патент полностью сосредоточен на использовании поведенческих данных и истории поиска.

Поведенческие факторы: Являются основой системы. Используются Пользовательские действия как в долгосрочной, так и в сессионной истории. Конкретно упомянуты (Claim 3):
- Выбор документа (клик).
- Остановка на документе.
- Добавление документа в список избранного.
- Контакт с документом дольше порогового времени (Dwell Time).
- Сохранение части контента документа.
История запросов и показов: Последовательность запросов и наборы документов, которые были показаны пользователю в прошлом.
Временные факторы: Система явно разделяет данные по времени: Прошлый период времени (долгосрочный) и Пользовательский сеанс (краткосрочный, недавний).
Пользовательские факторы: Идентифицированный пользователь, для которого ведется история.

Какие метрики используются и как они считаются

Векторное представление (Эмбеддинг пользователя): Генерируется Model 1. Это многомерный вектор, кодирующий долгосрочные интересы пользователя. Рассчитывается с помощью нейронной сети на основе исторических данных.
Значение вероятности действия пользователя: Основная метрика, используемая для ранжирования. Предсказывается Model 2 на основе комбинированного входа (сессия + долгосрочный вектор).
Алгоритмы машинного обучения: В патенте указано использование нейронных сетей с архитектурой кодер-декодер и, в частности, нейронных сетей на основе Трансформера (Claims 8, 9). Это позволяет использовать механизмы внимания (Attention) для анализа последовательностей запросов и действий.

Выводы

Двухуровневая архитектура персонализации: Яндекс использует сложную систему, разделяющую обработку долгосрочного (Model 1) и краткосрочного (Model 2) контекста. Это позволяет эффективно учитывать обширную историю без замедления поиска.
Компрессия долгосрочной истории: Долгосрочные интересы пользователя предварительно сжимаются в векторный профиль (эмбеддинг) офлайн. Этот вектор служит контекстом для интерпретации текущего запроса и сессии.
Ранжирование как предсказание поведения: Цель системы — предсказать, с какими документами пользователь будет позитивно взаимодействовать (кликнет, проведет время). Выдача ранжируется по этой вероятности, что подтверждает критическую важность поведенческих факторов.
Использование Трансформеров для анализа истории поиска: Применение архитектуры Трансформеров указывает на высокий уровень сложности и способности системы понимать эволюцию интента пользователя и сложные зависимости в его поведении.
Актуальность профиля: Система предусматривает механизм регулярного обновления долгосрочной истории и пересчета векторного профиля пользователя (Claims 5-7), адаптируясь к изменениям интересов.

Практика

Best practices (это мы делаем)

Построение Topical Authority и формирование лояльной аудитории (Ядра): Стратегически важно стимулировать пользователей регулярно возвращаться на ваш сайт по определенной тематике. Это формирует четкий долгосрочный профиль интересов пользователя (Векторное представление), связанный с вашим сайтом. Model 2 с большей вероятностью повысит ваш сайт в персонализированной выдаче для таких пользователей.
Оптимизация под весь путь пользователя (Session-based SEO): Анализируйте не отдельные запросы, а поисковые сессии. Убедитесь, что сайт не только отвечает на один запрос, но и помогает пользователю решить его задачу в рамках всей сессии. Model 2 явно учитывает контекст сессии. Хорошая перелинковка и контент, поддерживающий развитие интента, способствуют этому.
Максимизация позитивных поведенческих сигналов: Поскольку модели обучаются предсказывать действия пользователя, критически важно работать над качеством контента и UX. Патент явно упоминает «контакт с обучающим цифровым документом дольше порогового времени контакта» (Dwell Time) как позитивное действие (Claim 3). Необходимо создавать вовлекающий контент.
Стимулирование повторных визитов и брендового трафика: Работайте над узнаваемостью бренда и формированием привычки у пользователей обращаться к вашему ресурсу (email-маркетинг, подписки). Это укрепляет связь между вашим сайтом и интересами пользователя в долгосрочной модели.

Worst practices (это делать не надо)

Привлечение нецелевого трафика (Кликбейт): Трафик, который немедленно покидает сайт (короткие клики, низкий Dwell Time), обучает персонализированные модели ассоциировать ваш сайт с негативным опытом для конкретного пользователя. Это приведет к пессимизации вашего ресурса в его персональной выдаче.
Игнорирование возвращаемости пользователей (Retention): Ставка только на привлечение новых пользователей без работы над их удержанием делает сайт уязвимым. Без позитивной долгосрочной истории сайт теряет преимущество в ранжировании для возвращающихся пользователей.
Фокус на изолированных запросах: Оптимизация страницы под один запрос без учета контекста и пути пользователя становится менее эффективной. Система может предпочесть другой результат, если он лучше соответствует истории пользователя или контексту сессии.
Анализ позиций только в режиме «Инкогнито»: Поскольку выдача глубоко персонализирована, анализ позиций в чистом окружении дает неполную и искаженную картину. Важно анализировать реальный трафик и поведение пользователей, а не абстрактные позиции.

Стратегическое значение

Этот патент подтверждает стратегический приоритет Яндекса на глубокую персонализацию и переход от статической релевантности к динамическому предсказанию удовлетворенности пользователя. Для SEO это означает, что долгосрочная стратегия должна быть сосредоточена на пользователе, а не на запросе. Построение авторитетного ресурса, который генерирует лояльность и позитивные поведенческие сигналы, становится ключевым фактором успеха. Способность удовлетворить пользователя на протяжении всей его поисковой сессии важнее, чем текстовая оптимизация отдельной страницы.

Практические примеры

Сценарий 1: Влияние долгосрочных интересов на неоднозначный запрос

Пользователь А (Автолюбитель): Регулярно ищет обзоры машин, запчасти. Model 1 сформировала соответствующий долгосрочный вектор.
Пользователь Б (Зоолог): Регулярно ищет информацию о диких кошках. Model 1 сформировала другой вектор.
Текущий запрос (оба пользователя): «Ягуар».
Действие системы (Model 2): Для Пользователя А, Model 2 комбинирует запрос «Ягуар» с его авто-вектором. Для Пользователя Б — с его зоо-вектором.
Результат: Пользователь А увидит в топе сайты автосалонов. Пользователь Б увидит статьи о животном. Сайт автосалона получает преимущество для своей целевой аудитории.

Сценарий 2: Влияние контекста сессии (Уточнение интента)

Начало сессии (Запрос 1): Пользователь ищет «Лучшие рестораны Москвы». Кликает на несколько ссылок.
Продолжение сессии (Запрос 2): Пользователь ищет «Итальянская кухня».
Действие системы (Model 2): Model 2 получает Запрос 2, кандидатов, долгосрочный вектор И контекст сессии (Запрос 1 и действия по нему).
Результат: Система понимает, что пользователь ищет итальянские рестораны в Москве, а не рецепты. Model 2 повышает в ранжировании сайты ресторанов, соответствующие обоим запросам сессии, даже если в Запросе 2 не было слова «Москва» или «ресторан».

Вопросы и ответы

В чем разница между Первой (Model 1) и Второй (Model 2) моделями машинного обучения?

Model 1 работает преимущественно офлайн и отвечает за обработку долгосрочной истории поиска пользователя. Ее задача — сжать эту историю в компактное Векторное представление (эмбеддинг профиля пользователя). Model 2 работает в реальном времени во время поиска. Она использует Векторное представление от Model 1 и данные текущей поисковой сессии, чтобы предсказать вероятность взаимодействия с документом и ранжировать результаты.

Что такое «Пользовательское действие» в контексте этого патента и почему оно важно?

Пользовательское действие — это любое значимое взаимодействие с результатами поиска. Патент (Claim 3) перечисляет клик, остановку на документе, добавление в избранное, длительный контакт (Dwell Time) и сохранение контента. Это критически важно, так как Вторая модель обучается предсказывать вероятность именно этих действий. По сути, ранжирование строится на предсказании позитивного поведения пользователя, а не только CTR.

Как именно учитывается долгосрочная история в реальном времени, если она слишком большая?

Она не учитывается напрямую. В этом суть патента: долгосрочная история предварительно обрабатывается и сжимается в Векторное представление (эмбеддинг) с помощью Model 1. В реальном времени система ранжирования (Model 2) использует только этот сжатый вектор, что значительно ускоряет процесс и снижает вычислительную нагрузку.

Может ли SEO-специалист повлиять на Векторное представление пользователя (результат работы Model 1)?

Напрямую повлиять на вектор нельзя. Однако можно влиять косвенно. Если вы создаете качественный контент, который заставляет пользователей регулярно возвращаться на ваш сайт по определенной тематике, вы способствуете формированию у этих пользователей четкого профиля интересов, связанного с вашим ресурсом. Это повышает шансы на высокое ранжирование в их персонализированной выдаче.

Как этот патент влияет на анализ позиций сайта?

Он делает традиционный мониторинг позиций в «стерильных» условиях (например, в режиме инкогнито) гораздо менее информативным. Поскольку ранжирование глубоко персонализировано, выдача для реальных пользователей будет сильно отличаться от «чистой» выдачи. SEO-специалистам следует больше фокусироваться на анализе реального трафика, видимости в целевых сегментах и поведенческих метриках.

Какие архитектуры машинного обучения Яндекс использует для этой системы?

В патенте (Claims 8, 9) явно указано, что и Первая, и Вторая модели могут быть реализованы как нейронные сети с архитектурой кодер-декодер. В качестве предпочтительного варианта упоминаются нейронные сети на основе Трансформера, что соответствует современным практикам Яндекса (например, YATI) для анализа последовательностей и контекста.

Как часто обновляется профиль пользователя (Векторное представление)?

Патент указывает (Claims 5-7), что обновление происходит с «заранее заданной частотой» путем сдвига или расширения временного окна долгосрочной истории в направлении текущего момента времени. Это означает, что система стремится поддерживать актуальность долгосрочного профиля пользователя и адаптироваться к изменениям его интересов.

Что такое Session-based SEO и как оно связано с этим патентом?

Session-based SEO — это оптимизация под всю поисковую сессию пользователя, а не под отдельный запрос. Патент напрямую подтверждает важность этого подхода, так как Вторая модель активно использует контекст текущей сессии (предыдущие запросы и действия) для ранжирования текущего запроса. Необходимо создавать контент, который поддерживает развитие интента пользователя в рамках одной сессии.

Работает ли этот механизм для новых пользователей или в режиме инкогнито?

Для новых пользователей или в режиме инкогнито долгосрочная история отсутствует, поэтому Первая модель не сможет сгенерировать персонализированный вектор. Однако Вторая модель все еще может работать, используя только контекст текущей сессии, если пользователь успел сделать несколько запросов или действий. Но полный потенциал персонализации раскрывается только для пользователей с историей.

Что важнее для ранжирования: долгосрочная история или текущая сессия?

Оба компонента критически важны, и Вторая модель обучается находить оптимальный баланс между ними. Долгосрочная история (эмбеддинг) определяет общие интересы, а текущая сессия помогает понять сиюминутный интент. Вес каждого компонента зависит от контекста: для уточнения хобби важна история, для решения новой задачи — контекст сессии.