Как Яндекс объединяет разные типы пользовательских данных (поиск, местоположение, клики) в иерархический векторный профиль для оценки интересов

Яндекс патентует метод для построения комплексных профилей пользователей путем преобразования разнородных событий (запросы, посещенные места, просмотры страниц) в векторы в общем многомерном пространстве. Система использует иерархический подход с нейросетями (включая Сиамские сети) для агрегации данных на разных временных масштабах (от минут до месяцев), позволяя оценивать как краткосрочные намерения, так и долгосрочные интересы пользователя для глубокой персонализации контента.

Описание

Какую задачу решает

Патент решает фундаментальную проблему анализа поведения пользователей: сложность сравнения и совместного использования разнородных (мультимодальных) пользовательских событий. Традиционно данные о поисковых запросах, геолокации и истории браузера хранятся в разных форматах, что затрудняет построение целостного профиля пользователя (Para). Изобретение предлагает метод унификации этих данных в едином векторном пространстве, что повышает эффективность обработки огромного объема информации (Para) и позволяет точнее оценивать интересы пользователя.

Что запатентовано

Запатентован метод оценки интересов пользователя путем иерархического векторного отображения (vector mapping) пользовательских событий. Суть изобретения заключается в использовании каскада Модулей векторного отображения (например, нейронных сетей) для преобразования разнородных событий в векторы. События последовательно агрегируются и отображаются в пространства разных уровней, что позволяет моделировать поведение пользователя на разных временных масштабах (краткосрочные и долгосрочные интересы).

Как это работает

Система работает в несколько этапов. Сначала разнородные события (например, запрос и геолокация) преобразуются во входные векторы. Первый модуль отображает их в Первое многомерное пространство. Ключевая особенность: модуль обучен так, что расстояние между векторами в этом пространстве коррелирует с разницей в контексте (например, времени) между событиями (Para,). Для совмещения разных типов данных используются Связанные Сиамские Нейронные Сети (Para). Далее, эти векторы агрегируются (например, усредняются за час) и подаются на вход Второго модуля, который отображает их во Второе многомерное пространство, представляющее интересы на более длительном интервале. Анализ этих векторов используется для персонализации контента или рекламы.

Актуальность для SEO

Высокая. Построение векторных профилей пользователей (User Embeddings) и анализ мультимодальных данных с использованием глубокого обучения являются стандартом в современных поисковых и рекомендательных системах. Использование иерархических моделей и учет временной динамики крайне актуальны для глубокой персонализации в Яндексе.

Важность для SEO

Влияние на SEO значительно (7.5/10), но косвенное. Патент описывает не алгоритм ранжирования, а инфраструктуру для глубокого понимания поведения и интересов пользователя. Это механизм, лежащий в основе персонализации поиска (уровень L4). Понимание того, что Яндекс строит такие сложные, темпорально-чувствительные векторные профили, подчеркивает важность работы над долгосрочным вовлечением пользователей и ориентации на весь путь пользователя (User Journey), а не только на отдельные запросы.

Детальный разбор

Термины и определения

User Event (Пользовательское событие): Любое действие пользователя, зафиксированное системой: поисковый запрос, клик по ссылке, просмотр страницы, покупка, физическое местоположение (геолокация) (Para,,).
Vector-Mapping Module (VMM) (Модуль векторного отображения): Компонент системы (часто реализуемый как нейронная сеть), который преобразует входной вектор в выходной вектор в другом многомерном пространстве (Para). В патенте описана иерархия таких модулей (Первый, Второй, Третий).
Multidimensional Space (Многомерное пространство): Векторное пространство, в котором поведение пользователя представлено в виде векторов. Расстояние между векторами в этом пространстве отражает схожесть контекста или интересов.
Context (Контекст): Обстоятельства, связанные с событием. В патенте в качестве основного примера используется время события (timestamp) (Para). Разница в контексте (например, временной интервал) должна коррелировать с расстоянием между векторами (Para).
Coupled Siamese Neural Network (Связанная Сиамская нейронная сеть): Архитектура нейронной сети, используемая для обучения метрикам схожести для разнородных данных. Используется для конфигурации Первого VMM, чтобы события разных типов (например, запрос и геолокация), произошедшие в одном контексте, отображались близко друг к другу (Para,).
Cross-Modal Loss (Кросс-модальная функция потерь): Метрика, используемая при обучении Сиамских сетей. Она штрафует систему, если векторы, представляющие разные типы данных (модальности) из одного контекста, оказываются далеко друг от друга (Para).
Vector Aggregation (Агрегация векторов): Процесс объединения нескольких выходных векторов из одного пространства для создания одного входного вектора для следующего уровня. Может включать усреднение (Claim 39), конкатенацию или сбор статистики (Para).
Interest Identification Module (Модуль идентификации интересов): Компонент, который анализирует выходные векторы для определения интересов пользователя и выбора персонализированного сообщения (Para).

Ключевые утверждения (Анализ Claims)

Патент защищает иерархическую систему преобразования пользовательских событий в векторы для оценки интересов, с акцентом на обработку разнородных данных и учет контекста.

Claim 1 (Независимый пункт): Описывает базовый процесс работы системы (Фаза Применения).

Определение входных векторов для первого и второго пользовательских событий.
Отображение (Mapping) этих векторов в Первое многомерное пространство с помощью Первого VMM.
Определение третьего входного вектора на основе выходных векторов из Первого пространства (Агрегация).
Отображение третьего входного вектора во Второе многомерное пространство с помощью Второго VMM.
Определение сообщения (контента/рекламы) для пользователя на основе анализа выходных векторов.
Доставка сообщения пользователю.

Claim 2 и Claim 3 (Зависимые пункты): Определяют ключевой принцип конфигурации (Фаза Обучения).

Модули (Первый и Второй VMM) должны быть сконфигурированы так, чтобы расстояние между выходными векторами коррелировало с разницей в контексте соответствующих входных векторов (Claim 2). В Claim 3 уточняется, что эта разница может представлять собой временной интервал. Это означает, что события, близкие по времени, должны иметь близкие векторные представления.

Claim 9, 10 и 14 (Зависимые пункты): Описывают обработку мультимодальных (разнородных) данных.

Система обрабатывает события разных типов (Claim 9). Для этого Первый VMM использует отдельные нейронные сети для каждого типа события (Claim 10). Конфигурация этих сетей осуществляется путем их соединения в Связанную Сиамскую нейронную сеть и обучения с целью минимизации кросс-модальной функции потерь (Claim 14). Это обеспечивает совместное обучение моделей для разных типов данных.

Claim 5 и 8 (Зависимые пункты): Описывают иерархию и временные масштабы.

Процесс может быть расширен до Третьего пространства (Claim 5). Векторы в разных пространствах представляют поведение за разные периоды времени. Например, Второе пространство — короткий период (T1), Третье пространство — более длительный период (T2 > T1) (Claim 8).

Где и как применяется

Изобретение описывает инфраструктуру для обработки поведенческих данных и построения профилей пользователей (User Embeddings). Оно затрагивает несколько этапов поисковой архитектуры.

Офлайн-процессы (Обучение моделей)
Конфигурация (обучение) модулей VMM происходит офлайн (Фаза Конфигурации). Система анализирует исторические логи пользовательских событий для настройки весов нейронных сетей (включая Сиамские архитектуры), чтобы обеспечить корреляцию между расстоянием в векторных пространствах и временными интервалами.

CRAWLING & DATA ACQUISITION (Сбор данных)
Система непрерывно собирает данные о пользовательских событиях (User Events) из различных источников (поиск, карты, Метрика, голосовые помощники).

RANKING (Ранжирование) и BLENDER (Смешивание)
Применение обученных моделей происходит в реальном времени (Фаза Применения). Сгенерированные векторы интересов используются для определения «сообщения» пользователю (Para). Это включает:

Персонализация ранжирования (L4): Векторы интересов (краткосрочные и долгосрочные) используются как признаки в формуле ранжирования для адаптации выдачи под профиль пользователя.
Рекомендации и Реклама: Система напрямую используется для ранжирования контента в рекомендательных сервисах и для таргетинга рекламы, включая определение демографических групп (Para,).

На что влияет

Персонализированная выдача: Влияет на то, какие результаты увидит конкретный пользователь, основываясь на его комплексном поведении (поиск + локация + история).
Все типы запросов: Особенно сильно влияет на широкие или локальные запросы, где контекст пользователя помогает уточнить интент.
Поиск похожих пользователей (Look-alike): Позволяет находить пользователей со схожим поведением путем сравнения их векторов в многомерных пространствах (Claim 37).

Когда применяется

Система применяется постоянно, но с разной целью в зависимости от временного масштаба:

Краткосрочный анализ (Первое пространство): Активируется для учета недавних действий (минуты) и уточнения текущего интента в рамках сессии (Para).
Долгосрочный анализ (Второе/Третье пространство): Используется для определения общих интересов пользователя (часы, дни, месяцы) при выборе рекламы или формировании общей картины персонализации (Para).

Пошаговый алгоритм

Алгоритм состоит из двух основных фаз: Конфигурация (Обучение) и Применение.

Фаза А: Конфигурация (Обучение моделей — Офлайн)

Сбор данных: Накопление логов пользовательских событий разных типов с временными метками.
Подготовка входных векторов: Преобразование сырых данных событий в первичные входные векторы (например, с помощью хеширования) (Para-[90]).
Конфигурация Первого VMM (Мультимодальное обучение):
- Использование архитектуры Связанной Сиамской Нейронной Сети (Para).
- Обучение моделей так, чтобы расстояние между выходными векторами в Первом пространстве коррелировало с временным интервалом между событиями. Минимизация кросс-модальной функции потерь (Para-[95]).
Агрегация данных: Группировка векторов из Первого пространства по временным периодам (например, по часам) и их агрегация (усреднение) (Para-[101]).
Конфигурация Второго VMM: Обучение Второй нейронной сети отображать агрегированные векторы во Второе пространство, также сохраняя корреляцию между расстоянием и временными интервалами (на более крупном масштабе) (Para-[106]).

Фаза Б: Применение (Оценка интересов — Онлайн)

Получение событий: Фиксация новых пользовательских событий.
Первичный маппинг: Обработка событий сконфигурированным Первым VMM для получения векторов в Первом пространстве (краткосрочный интерес).
Агрегация: Обновление агрегированного вектора за текущий период времени.
Вторичный маппинг: Обработка агрегированного вектора сконфигурированным Вторым VMM для получения вектора во Втором пространстве (долгосрочный интерес).
Анализ интересов: Использование полученных векторов для идентификации интересов (Para) или поиска похожих пользователей (Para).
Формирование ответа: Определение и доставка «сообщения» пользователю (например, персонализация порядка результатов, выбор рекламы) (Para).

Какие данные и как использует

Данные на входе

Система использует разнообразные данные о поведении пользователей (мультимодальные данные).

Контентные и Поисковые факторы: Тексты поисковых запросов (Para), заголовки (Title) посещенных страниц (Para).
Технические факторы: URI (Uniform Resource Identifier) посещенных сетевых ресурсов (Para).
Поведенческие факторы: Использование сетевых ресурсов (просмотры, клики по ссылкам) (Para,). История поиска и браузинга (Para).
Географические факторы: Географические координаты пользователя (например, данные GPS со смартфона) (Para,).
Временные факторы: Временные метки (timestamps) событий. Время является ключевым элементом для определения «контекста» и обучения моделей (Para).
Коммерческие факторы: Покупки товаров или услуг через онлайн-сервисы (Para).

Какие метрики используются и как они считаются

Входные векторы событий: Могут генерироваться с помощью хеш-функций из сырых данных (Para,).
Расстояние в многомерном пространстве: Метрика схожести между векторными представлениями. Используется для обучения моделей (корреляция с временным интервалом) и для анализа. Предполагается использование стандартных метрик расстояния (например, Евклидово расстояние) (Para).
Кросс-модальная функция потерь (Cross-Modal Loss): Ключевая метрика для обучения Первого VMM. Минимизация этой метрики обеспечивает корректное совместное отображение разнородных данных в общее пространство (Para).
Методы машинного обучения: В патенте явно указано использование Нейронных сетей (Neural Networks) (Para) и специфическая архитектура Связанных Сиамских Нейронных Сетей (Coupled Siamese Neural Networks) для обучения (Para).
Агрегация данных: Используется усреднение векторов (Claim 39) или сбор статистики по типам событий (Para).

Выводы

Унификация поведенческих сигналов: Яндекс разработал сложную инфраструктуру для объединения всех доступных данных о пользователе (поиск, местоположение, клики, покупки) в единое математическое представление (User Embedding).
Мультимодальность и Сиамские Сети: Для обработки разнородных данных используются специализированные нейросетевые архитектуры (Сиамские сети). Это позволяет системе понять, что запрос об объекте и GPS-координаты этого объекта, полученные в одно время, являются частью одного контекста.
Время как ключевой элемент контекста: Система явно использует время как основу для определения связи между событиями. Близость во времени транслируется в близость векторов в многомерном пространстве.
Иерархия интересов (Краткосрочные vs Долгосрочные): Патент описывает иерархическую модель агрегации данных на разных уровнях (Первое, Второе, Третье пространства). Это позволяет Яндексу разделять текущий интент сессии и долгосрочные интересы пользователя.
Основа для гипер-персонализации: Полученные векторные профили являются фундаментом для персонализации выдачи, рекомендаций контента и таргетинга рекламы, в том числе через поиск похожих пользователей (look-alike).

Практика

Best practices (это мы делаем)

Хотя патент описывает внутреннюю инфраструктуру Яндекса для профилирования пользователей, он дает важные стратегические инсайты для SEO.

Оптимизация под сессию и путь пользователя (User Journey): Понимайте, что Яндекс оценивает поведение в контексте и во времени. Контент должен быть спроектирован так, чтобы поддерживать связную сессию и удовлетворять интент, который может развиваться. Анализируйте не отдельные запросы, а последовательность действий пользователя.
Создание контента, релевантного долгосрочным интересам: Поскольку система строит долгосрочные профили (Второе/Третье пространство), важно фокусироваться на построении авторитетности в тематике и формировании лояльной аудитории. Регулярное предоставление ценного контента способствует формированию сильного тематического профиля у вашей аудитории.
Учет мультимодального контекста (Локальный SEO): Для локального бизнеса критически важно обеспечить консистентность сигналов. Упоминания вашего бизнеса в поиске должны коррелировать с физическими посещениями (геолокацией). Система связывает поисковые запросы с физическими локациями, усиливая важность оптимизации в Картах.
Повышение вовлеченности и возвращаемости: Патент подчеркивает важность временных паттернов. Стратегии, направленные на удержание пользователя и стимулирование повторных визитов, помогают сформировать четкий поведенческий профиль, связанный с вашим ресурсом.

Worst practices (это делать не надо)

Фокус на изолированных ключевых словах: Игнорирование контекста и интересов пользователя. Система анализирует поведение комплексно, поэтому оптимизация страницы без учета того, как она вписывается в общий профиль интересов аудитории, менее эффективна.
Накрутка несвязанных поведенческих факторов: Попытки симулировать интерес путем генерации хаотичных, не связанных по времени или контексту событий, вероятно, будут отфильтрованы. Система ищет естественные корреляции между разными типами событий во времени.
Игнорирование влияния других каналов: Предположение, что поведение пользователя в Картах, Метрике или других сервисах не влияет на поисковую выдачу. Патент доказывает, что все данные унифицируются.

Стратегическое значение

Патент подтверждает стратегический фокус Яндекса на глубоком машинном обучении для понимания пользователей. Он демонстрирует, как Яндекс уходит от анализа отдельных сигналов к построению сложных, иерархических поведенческих моделей. Для SEO это означает, что релевантность становится все более субъективной и зависящей от профиля пользователя. Долгосрочная стратегия должна строиться на понимании целевой аудитории и обеспечении наилучшего пользовательского опыта для конкретных сегментов.

Практические примеры

Сценарий 1: Использование краткосрочного контекста (Персонализация сессии)

Действия пользователя: Пользователь ищет «Лучшие модели горных лыж 2025» (Событие 1), а через 5 минут ищет «Ски-пассы Красная Поляна цена» (Событие 2).
Работа системы: Первый VMM обрабатывает оба события. Так как временной интервал мал, векторы этих событий в Первом пространстве будут расположены близко (Claim 3).
Результат: Система идентифицирует связанный контекст (планирование поездки). При последующем запросе «Отели Сочи» система персонализирует выдачу, отдавая приоритет отелям, близким к горнолыжным трассам, понимая краткосрочный интент пользователя.

Сценарий 2: Кросс-модальный анализ (Локальный поиск)

Действия пользователя: Пользователь ищет «Как пройти в Лувр» (Событие 1, Тип: Запрос). Через 10 минут его смартфон фиксирует GPS-координаты у Лувра (Событие 2, Тип: Геолокация).
Работа системы: Благодаря обучению на Сиамских сетях, система связывает эти разнородные события, так как они произошли близко по времени. Их векторы располагаются рядом в Первом пространстве.
Результат: Когда пользователь затем ищет «кафе рядом», система использует этот совмещенный контекст. Ранжирование будет агрессивно повышать кафе, находящиеся рядом с Лувром, так как система точно понимает текущий контекст пользователя.

Сценарий 3: Построение долгосрочного профиля и Look-alike

Действия пользователя: Пользователь А в течение месяца регулярно ищет информацию о веганских рецептах и посещает эко-магазины (геолокация).
Работа системы: События агрегируются и отображаются во Второе/Третье пространство, формируя стабильный вектор долгосрочных интересов Пользователя А.
Анализ: Система обнаруживает Пользователя Б, чей вектор близок к вектору Пользователя А (Para).
Результат: Система предполагает, что Пользователю Б интересны веганские темы, и персонализирует для него контент или рекламу (Para). SEO-специалисту сайта веганских рецептов это дает дополнительный охват аудитории со схожими интересами.

Вопросы и ответы

Что такое «мультимодальные данные» в контексте этого патента?

Мультимодальные данные — это информация, имеющая разную природу (модальность). В патенте это относится к разным типам пользовательских событий: текстовые поисковые запросы, географические координаты (GPS), история посещения веб-страниц (URI, Title). Ключевая задача патента — научиться эффективно объединять и сравнивать эти разнородные данные в единой модели.

Как Яндекс объединяет данные разных типов, например, запрос и местоположение?

Для этого используется специальная архитектура — Связанная Сиамская Нейронная Сеть (Coupled Siamese Neural Network). Она состоит из нескольких сетей (по одной для каждого типа данных), которые обучаются совместно. Цель обучения — сделать так, чтобы события разных типов, произошедшие в одном контексте (например, в одно время), имели близкие векторные представления в общем многомерном пространстве.

В чем разница между Первым и Вторым многомерным пространством?

Разница заключается во временном масштабе агрегации данных. Первое пространство содержит векторы, представляющие отдельные события или очень короткие интервалы (краткосрочный контекст). Второе пространство содержит векторы, полученные путем агрегации (например, усреднения) векторов из Первого пространства за более длительный период (например, час или день). Это позволяет системе разделять сиюминутные намерения и долгосрочные интересы.

Какую роль играет время (Context) в этом патенте?

Время играет центральную роль при обучении моделей. Система настраивается так, чтобы расстояние между векторами событий коррелировало с временным интервалом между этими событиями. Если два события произошли близко по времени, их векторы должны быть расположены близко в многомерном пространстве. Время выступает как универсальный «клей», связывающий разнородные события в единый контекст.

Как этот патент влияет на персонализацию поисковой выдачи?

Патент описывает механизм создания детального векторного профиля пользователя (User Embedding), учитывающего его интересы на основе всех доступных данных. Алгоритмы ранжирования Яндекса (на уровне L4 Персонализация) используют этот профиль для адаптации результатов поиска под конкретного пользователя, повышая или понижая определенные документы или тематики.

Как SEO-специалист может использовать знание этого патента на практике?

Необходимо сместить фокус с анализа отдельных запросов на анализ сессий и долгосрочного поведения аудитории (Customer Journey). Важно понимать контекст, в котором пользователи взаимодействуют с сайтом. Стратегически выгодно строить ресурс, который формирует у аудитории четкий и стабильный профиль интересов в определенной тематике и стимулирует повторные визиты.

Что такое агрегация векторов и зачем она нужна?

Агрегация — это процесс объединения нескольких векторов в один (например, путем усреднения). Она необходима для перехода от одного временного масштаба к другому (например, от минут к часам) и для снижения размерности данных. Агрегация позволяет создать компактное представление поведения пользователя за определенный период.

Используются ли эти векторные профили для поиска похожих аудиторий (Look-alike)?

Да, патент явно упоминает это (Claim 37). Если вектор Пользователя А находится близко к вектору Пользователя Б в многомерном пространстве, система считает их похожими. Интересы одного пользователя могут быть использованы для подбора контента или рекламы другому (Claim 38). Это стандартный механизм Look-alike моделирования.

Влияет ли этот механизм на ранжирование, если персонализация отключена?

Прямого указания в патенте нет. Однако описанные механизмы могут использоваться не только для индивидуальной персонализации, но и для анализа поведения групп пользователей или сегментов (Para). Эти агрегированные данные могут влиять на общие алгоритмы ранжирования и оценку качества сайтов, даже если индивидуальная история поиска не учитывается.

Стоит ли пытаться манипулировать этими векторными профилями?

Манипулировать ими крайне сложно. Система построена на анализе сложных корреляций между разными типами данных (поиск, локация, браузинг) во времени с использованием сложных нейросетевых архитектур. Искусственное поведение (накрутки) вряд ли сможет воспроизвести естественные паттерны, заложенные в этих многомерных моделях, и скорее всего будет отфильтровано как аномалия.