Как Яндекс строит единый векторный профиль пользователя, объединяя поиск, геолокацию и веб-активность в иерархическую модель

Яндекс патентует метод оценки интересов пользователя путем перевода разнородных событий (поисковые запросы, посещенные сайты, геолокация) в единое векторное пространство. Система использует иерархию нейронных сетей для создания эмбеддингов, отражающих поведение на разных временных отрезках (от минут до месяцев). Близость векторов коррелирует с близостью событий во времени, что позволяет строить детальный профиль интересов для глубокой персонализации.

Описание

Какую задачу решает

Патент решает фундаментальную проблему анализа поведения пользователей: различные типы данных (например, история веб-просмотра в виде URI, поисковые запросы как текст и история перемещений как гео-координаты) хранятся в разных форматах и трудно поддаются совместному анализу-[05]. Изобретение предлагает механизм для унификации этих разнородных (мультимодальных) данных, позволяя системе строить целостный профиль пользователя для точной оценки его интересов и персонализации контента.

Что запатентовано

Запатентован способ оценки интересов пользователя путем многоуровневого перевода (векторизации) разнородных пользовательских событий в иерархию многомерных пространств. Суть изобретения — использование каскада Модулей векторного перевода (Vector Translation Modules), реализованных на нейронных сетях. Эти модули преобразуют события разных типов в единое векторное представление и агрегируют их на разных временных масштабах (краткосрочном и долгосрочном).

Как это работает

Система работает иерархически. На первом уровне события разных типов (например, запрос и геолокация) обрабатываются специализированными нейронными сетями, и переводятся в общее Первое многомерное пространство. Эти сети обучаются совместно (используя Сиамскую архитектуру), чтобы расстояние между векторами коррелировало с временным интервалом между событиями,. Затем эти векторы агрегируются (например, усредняются за час) и переводятся во Второе многомерное пространство, отражающее более долгосрочное поведение. Финальные векторы используются для идентификации интересов, поиска похожих пользователей и персонализации выдачи-[36].

Актуальность для SEO

Высокая. Создание унифицированных векторных представлений (эмбеддингов) пользователей является ядром современных систем персонализации (например, Яндекс Крипта). Методы кросс-модального анализа (объединение текста, локации, действий) и иерархического моделирования поведения остаются крайне актуальными для глубокого понимания пользователя.

Важность для SEO

Влияние на SEO значительно (7/10). Патент описывает не базовый алгоритм ранжирования, а инфраструктуру для построения профиля пользователя, которая критически важна для слоя персонализации (L4 Ranking). Он показывает, как Яндекс интегрирует данные о поиске, местоположении и истории просмотров в единый вектор. Это означает, что весь контекст пользователя (его история и локация) может существенно влиять на ранжирование результатов по его текущему запросу. SEO-стратегия должна учитывать весь путь пользователя и его интересы, а не только изолированные запросы.

Детальный разбор

Термины и определения

Контекст (Context): Факторы, связанные с пользовательским событием. В патенте в качестве основного примера контекста используется время события. Разница в контекстах часто измеряется как временной интервал.
Многомерное пространство (Multidimensional Space): Векторное пространство (Embedding Space), в которое переводятся события. Патент описывает иерархию пространств: Первое (для отдельных событий), Второе, Третье (для агрегации за все более долгие периоды).
Модуль векторного перевода (Vector Translation Module): Компонент системы (обычно нейронная сеть), который переводит входные векторы в выходные векторы в определенном многомерном пространстве. Обучается так, чтобы расстояние между выходными векторами коррелировало с разницей контекстов входных данных.
Пользовательское событие (User Event): Любое действие пользователя: поисковый запрос, использование сетевого ресурса (просмотр, клик, покупка), географическое положение-[31].
Сиамская нейронная сеть (Siamese Neural Network): Архитектура, используемая для совместного обучения нескольких сетей, обрабатывающих разные типы данных (мультимодальность). Позволяет генерировать сопоставимые векторы в едином пространстве.
Кроссмодальные потери (Cross-modal Loss): Функция потерь, используемая при обучении Сиамских сетей. Минимизация этих потерь гарантирует, что данные разных типов (например, текст и геолокация), но связанные одним контекстом, будут иметь схожие векторные представления.
Модуль векторной агрегации (Vector Aggregation Module): Компонент, который объединяет несколько векторов (например, за период времени) в один агрегированный вектор, используя усреднение, сложение или статистику.

Ключевые утверждения (Анализ Claims)

Патент защищает иерархическую систему для создания унифицированного векторного представления поведения пользователя из разнородных источников данных с учетом временного контекста.

Claim 1 (Независимый пункт): Описывает основную архитектуру и процесс обработки разнородных событий.

Определение входных векторов для События 1 (Тип А) и События 2 (Тип Б, отличный от А).
Преобразование в Выходные Векторы в Пространстве 1 с помощью Первого Модуля.
Критически важно: Модуль 1 содержит Нейронную Сеть А (для Типа А) и Нейронную Сеть Б (для Типа Б). Каждая сеть преобразует свой тип события в общее Пространство 1.
Определение Входного Вектора 3 путем агрегации выходных векторов из Пространства 1, произошедших за определенный период времени.
Преобразование Входного Вектора 3 в Выходной Вектор 3 в Пространстве 2 с помощью Второго Модуля (содержащего Нейронную Сеть В).
Определение сообщения для пользователя на основе анализа полученных выходных векторов.

Claims 2 и 3 (Зависимые пункты): Описывают процесс настройки (обучения) модулей.

Цель настройки — добиться того, чтобы расстояние между выходными векторами коррелировало с разницей между контекстами входных векторов (Claim 2). Разница в контексте определяется как временной интервал между событиями (Claim 3). Это означает, что события, близкие во времени, должны иметь близкие векторные представления, независимо от их типа.

Claims 11 и 12 (Зависимые пункты): Описывают метод настройки для обработки разнородных данных (кросс-модальность).

Настройка Первого Модуля (Сети А и Сети Б) (Claim 11) осуществляется путем их соединения в Сиамскую нейронную сеть и обучения с минимизацией кроссмодальных потерь (Claim 12). Это техническое решение для обеспечения сопоставимости векторов из разных источников в едином Пространстве 1.

Claims 5-8 (Зависимые пункты): Описывают возможность расширения иерархии.

Система может включать Третий Модуль и Третье Пространство (Claim 5). Иерархия отражает разные временные масштабы: Пространство 2 может представлять события за короткий период (например, час), а Пространство 3 — за более длительный (например, месяц) (Claim 8). Это позволяет моделировать как краткосрочные, так и долгосрочные интересы пользователя.

Где и как применяется

Изобретение относится к системам профилирования пользователей, которые используются для персонализации контента, рекламы и поисковой выдачи.

CRAWLING & ACQUISITION LAYER (Сбор данных)
Система собирает логи пользовательских событий из различных источников: поисковая система, данные умных помощников, GPS-ресиверы смартфонов, история просмотров веб-страниц.

INDEXING & FEATURE EXTRACTION (Индексирование и Профилирование)
Основное применение патента. Происходит обработка собранных логов для построения векторного профиля пользователя (User Embedding). Это включает офлайн-обучение нейронных сетей и постоянное обновление профилей.

Векторизация событий: Сырые данные преобразуются во входные векторы (например, через хеширование).
Иерархический перевод: Использование настроенных Модулей векторного перевода для последовательного перевода векторов в многомерные пространства (Уровень 1, Уровень 2 и т.д.).
Агрегация: Объединение векторов на основе временных окон.

RANKING (L4 — Personalization)
Сгенерированные векторные профили используются на этапе персонализации. Модуль идентификации интереса анализирует векторы для определения интересов. Также система может находить пользователей с похожими векторами (Look-alike modeling). Эти данные используются для переранжирования результатов поиска или выбора релевантного контента/рекламы.

На что влияет

Персонализация выдачи: Влияет на все типы запросов и контента, где возможна персонализация, адаптируя результаты под профиль интересов пользователя.
Кросс-модальное влияние: Позволяет событиям одного типа (например, физическое местоположение) влиять на интерпретацию событий другого типа (например, веб-активность или поиск), так как они объединены в одном векторном пространстве.
Локальный поиск: За счет интеграции геолокационных данных система может лучше понимать связь между запросами пользователя и физическими местами.

Когда применяется

Профилирование: Постоянно, по мере поступления новых данных о пользовательских событиях. Профили обновляются в реальном времени или периодически.
Применение профиля: В момент, когда системе необходимо предоставить пользователю персонализированное сообщение (выполнение поиска, запрос рекомендаций, показ рекламы).
Временные рамки: Система учитывает как краткосрочный контекст (поведение за последние минуты/часы), так и долгосрочные интересы (поведение за месяцы), используя иерархическую структуру.

Пошаговый алгоритм

Фаза А: Настройка/Обучение (Training Phase) (Офлайн)

Сбор Тренировочных Данных: Сбор массива исторических пользовательских событий разных типов с временными метками.
Обучение Уровня 1 (Кросс-модальное):
1. Создание специализированных Нейронных Сетей (НС) для каждого типа события (например, НС_текст, НС_гео).
2. Соединение их в Сиамскую нейронную сеть.
3. Обучение сетей таким образом, чтобы минимизировать кроссмодальные потери и чтобы расстояние между выходными векторами в Пространстве 1 коррелировало с временным интервалом между входными событиями.
Агрегация Тренировочных Данных: Агрегация векторов из Пространства 1 по временным окнам (например, по часам).
Обучение Уровня 2 (Иерархическое): Обучение Нейронной Сети Второго Модуля. Цель: расстояние между выходными векторами в Пространстве 2 должно коррелировать с временным интервалом между агрегированными временными окнами.

Фаза Б: Применение (In-use Phase) (Realtime/Online)

Сбор Событий: Получение новых событий от пользователя (например, Запрос и Геолокация).
Векторизация Входа: Преобразование сырых данных во Входные Векторы (например, хеширование).
Уровень 1 Перевод: Обработка Первым Модулем. Каждое событие обрабатывается соответствующей настроенной НС (НС_текст или НС_гео) для получения Выходных Векторов в Пространстве 1.
Агрегация: Модуль векторной агрегации объединяет новые векторы с предыдущими в рамках текущего временного окна (например, путем усреднения).
Уровень 2 Перевод: Обработка Вторым Модулем. Перевод Агрегированного Вектора в Выходной Вектор в Пространстве 2 (текущий профиль пользователя).
Анализ Профиля: Анализ полученных Выходных Векторов.
1. Использование Модуля идентификации интереса.
2. ИЛИ: Сравнение вектора с векторами других пользователей для поиска схожести.
Генерация Сообщения: Выбор или ранжирование контента (результатов поиска, рекламы) на основе анализа профиля.

Какие данные и как использует

Данные на входе

Система спроектирована для интеграции разнородных (мультимодальных) данных.

Контентные/Текстовые факторы: Тексты поисковых запросов (включая запросы к умному помощнику). Свойства веб-страниц, например, заголовки (Title).
Технические факторы: Единые идентификаторы ресурса (URI/URL) посещенных сетевых ресурсов.
Географические факторы: Географические координаты (широта и долгота), полученные с помощью GPS или других технологий позиционирования.
Поведенческие факторы: Использование сетевого ресурса (отображение, выбор гиперссылки). Покупка товаров или услуг через онлайн-сервис.
Временные факторы: Временные отметки (дата и время) событий. Время является критически важным элементом, используемым как контекст для обучения системы.

Какие метрики используются и как они считаются

Векторные Представления (Эмбеддинги): Основная структура данных. Входные векторы могут создаваться путем хеширования сырых данных. Выходные векторы генерируются нейронными сетями.
Метрика Расстояния: Расстояние между векторами в многомерных пространствах (например, Евклидово расстояние). Система обучается так, чтобы это расстояние коррелировало с временным интервалом между событиями.
Методы Агрегации: Для создания агрегированных векторов используются усреднение величин векторов и составление статистики о типах событий в рамках временного окна.
Алгоритмы Машинного Обучения:
- Нейронные сети: Используются как основа для Модулей векторного перевода.
- Сиамские нейронные сети (Siamese Neural Networks): Используются на этапе обучения для калибровки сетей, обрабатывающих разные типы данных, путем минимизации кроссмодальных потерь.

Выводы

Унифицированный профиль пользователя: Яндекс строит единый, кросс-модальный векторный профиль пользователя, интегрируя все доступные данные: поисковую активность, просмотр веб-страниц и физическое местоположение. Это фундамент для глубокой персонализации.
Время как ключевой контекст: Временная близость событий является фундаментальным сигналом для обучения системы. Система обучается так, чтобы векторы отражали темпоральную структуру поведения: события, близкие по времени, считаются связанными контекстуально.
Сложная архитектура для интеграции данных: Для объединения разнородных данных (текст и геолокация) используются специализированные нейронные сети, обучаемые совместно через Сиамскую архитектуру с минимизацией кроссмодальных потерь.
Иерархическое моделирование интересов: Поведение моделируется на нескольких уровнях абстракции — от отдельных событий до краткосрочных сессий и долгосрочных профилей. Это позволяет Яндексу различать сиюминутный интент и стабильные предпочтения пользователя.
Поиск похожих аудиторий (Look-alike): Технология позволяет находить пользователей со схожим поведением путем сравнения их векторов. Интересы одного пользователя могут быть перенесены на другого схожего пользователя.

Практика

Best practices (это мы делаем)

Оптимизация под сессии и путь пользователя (User Journey): Анализируйте и оптимизируйте не только отдельные запросы, но и последовательности действий. Поскольку система связывает события, близкие по времени, важно предоставлять контент, который удовлетворяет последовательные интенты в рамках одной сессии (например, после поиска информации пользователь ищет, где купить или как добраться).
Усиление связи «Онлайн-Офлайн» (для локального SEO): Так как система интегрирует геолокацию и поисковые запросы в единое пространство, критически важно укреплять ассоциации между вашим сайтом и физическими локациями. Стимулируйте онлайн-взаимодействие, связанное с офлайн-посещениями (поиск маршрута, отзывы после визита). Система увидит, что пользователи ищут вас и посещают ваши локации в рамках одного временного контекста.
Построение долгосрочных отношений и лояльности: Поскольку система строит иерархические профили, важно фокусироваться на формировании долгосрочных интересов пользователя к вашему ресурсу. Регулярное взаимодействие пользователя с вашим сайтом по одной теме укрепит его поведенческий вектор в этом направлении, улучшая персонализированное ранжирование.
Учет кросс-канального поведения: Помните, что действия пользователя в разных сервисах Яндекса (Карты, Дзен, Поиск) формируют единый профиль. Обеспечивайте консистентный опыт и присутствие бренда во всех релевантных каналах.

Worst practices (это делать не надо)

Игнорирование персонализации: Разработка SEO-стратегии в предположении, что выдача статична. Патент демонстрирует сложную инфраструктуру для глубокой адаптации результатов под историю и контекст пользователя.
Изолированная оптимизация под запрос: Оптимизация страницы под запрос без понимания того, какие другие действия (поиски, посещения сайтов или мест) обычно совершает пользователь в том же временном контексте.
Привлечение нецелевого трафика: Привлечение пользователей, чьи долгосрочные интересы не соответствуют тематике сайта. Это формирует «шумный» поведенческий профиль аудитории сайта и может ухудшить его видимость для целевых пользователей из-за механизмов Look-alike.

Стратегическое значение

Патент подтверждает стратегический приоритет Яндекса на глубокое понимание пользователя (вероятно, через технологию Crypta) как основу для всех сервисов. Он демонстрирует, что персонализация основана на сложных, иерархических векторных моделях, объединяющих весь доступный цифровой и физический след пользователя. Для SEO это означает, что стратегический успех все больше зависит от понимания поведения и интересов целевой аудитории в целом, а не только от технических аспектов оптимизации под ключевые слова. Битва идет за релевантность для конкретных сегментов аудитории.

Практические примеры

Сценарий 1: Связывание онлайн и офлайн поведения (Локальный SEO)

События: Пользователь ищет «лучший кофе рядом» (Тип 1: Поиск) в 10:00. В 10:15 его смартфон фиксирует геолокацию в кофейне «Бодрость» (Тип 2: Геолокация).
Действие системы: Первый модуль использует Сиамскую сеть. Благодаря временной близости (15 минут), векторы обоих событий оказываются близко в Пространстве 1.
Агрегация и Профилирование: Эти векторы агрегируются, укрепляя связь между интересом «кофе» и брендом «Бодрость» в профиле пользователя.
Результат: Система может улучшить ранжирование этой кофейни для этого пользователя в будущем, а также для других пользователей с похожими поведенческими векторами (Look-alike), ищущих кофе в этом районе.

Сценарий 2: Идентификация долгосрочных интересов (Контент-проект)

События: В течение месяца пользователь регулярно читает статьи про Python, ищет документацию по Django.
Действие системы: Каждое событие векторизуется (Уровень 1), затем агрегируется по дням (Уровень 2), затем агрегируется за месяц (Уровень 3).
Профилирование: Формируется вектор в Пространстве 3, который кодирует устойчивый долгосрочный интерес «Программирование на Python».
Результат: При последующих запросах, даже неоднозначных (например, «питон»), система с большей вероятностью покажет результаты о программировании, а не о змеях, благодаря персонализации на основе этого долгосрочного поведенческого вектора.

Вопросы и ответы

Что такое Модуль векторного перевода и почему их несколько?

Модуль векторного перевода — это компонент (обычно нейронная сеть), который преобразует данные о событии в вектор (эмбеддинг). Их несколько по двум причинам. Во-первых, для обработки разных типов данных (мультимодальность): внутри Первого модуля есть отдельные нейросети для запросов, геолокации и т.д. Во-вторых, для построения иерархии: Первый модуль обрабатывает отдельные события, Второй агрегирует их за короткий период (например, час), Третий — за более длительный (например, месяц).

В патенте сказано, что расстояние между векторами коррелирует со временем. Что это значит на практике?

Это ключевой принцип обучения системы (темпоральная корреляция). Если пользователь искал «ресторан», а через 5 минут оказался в ресторане, векторы этих двух событий будут расположены очень близко в многомерном пространстве. Система учится тому, что события, происходящие рядом во времени, связаны контекстуально. Это позволяет Яндексу точно моделировать сессии и понимать текущий интент пользователя.

Что такое Сиамская нейронная сеть и зачем Яндекс ее использует в этом патенте?

Сиамская сеть используется для решения сложной задачи объединения разнородных данных (мультимодальности). Нельзя напрямую сравнить текст запроса и GPS-координаты. Сиамская архитектура позволяет совместно обучить отдельные нейросети для каждого типа данных так, чтобы они генерировали сопоставимые векторы в едином пространстве, минимизируя «кроссмодальные потери». Это гарантирует корректную интеграцию данных из разных источников в один профиль.

Как эта система влияет на персонализацию поисковой выдачи?

Эта система является фундаментом персонализации (слой L4 ранжирования). Она генерирует векторные профили пользователей, которые затем используются как признаки в основной формуле ранжирования. В зависимости от того, какие интересы закодированы в векторе пользователя (как краткосрочные, так и долгосрочные), выдача по одному и тому же запросу будет разной для разных людей. Это снижает значение «общего ТОПа».

Может ли поведение пользователя вне поиска (например, геолокация или использование приложений) повлиять на ранжирование моего сайта?

Да, абсолютно. Ключевая особенность патента — это мультимодальный подход. Система специально разработана для интеграции данных о геолокации, посещении ресурсов и других событиях в единый профиль пользователя наравне с поисковыми запросами. Ваше физическое перемещение и активность в приложениях влияют на ваш поведенческий вектор и, как следствие, на поисковую выдачу.

Что значит «поиск похожих пользователей» (Look-alike) в контексте этого патента?

Система переводит поведение каждого пользователя в вектор. Если векторы двух разных пользователей близки в многомерном пространстве (особенно на долгосрочных уровнях иерархии), система считает их поведение и интересы схожими. Это позволяет Яндексу переносить знания: если Пользователь А предпочитает ваш сайт, то система может повысить ваш сайт в выдаче для Пользователя Б, который похож на Пользователя А.

Как этот патент связан с технологией Яндекс Крипта?

Хотя термин «Крипта» не упоминается, описанная технология с высокой вероятностью лежит в основе Крипты — системы Яндекса для поведенческого анализа. Патент описывает ключевые аспекты Крипты: сбор разнородных данных, построение профилей пользователей (эмбеддингов), определение интересов и сегментацию аудитории. Этот патент, вероятно, описывает один из ключевых механизмов ее работы.

Если я занимаюсь локальным SEO, как этот патент влияет на меня?

Для локального SEO этот патент критически важен. Геолокационные данные являются одним из основных типов событий, которые система интегрирует с поисковым поведением. Система активно связывает поисковые запросы с последующими физическими визитами. Это подчеркивает важность работы над связью онлайн-присутствия (сайт, Карты) и офлайн-активности (посещение точек).

Как SEO-специалист может повлиять на векторный профиль пользователя?

Путем создания контента и пользовательского опыта, который привлекает и удерживает целевую аудиторию. Если пользователи с определенными интересами регулярно и позитивно взаимодействуют с вашим сайтом, ваш ресурс становится значимой частью их поведенческого вектора. Важно обеспечивать качественный опыт во всех точках касания, чтобы формировать лояльность.

Что на практике означает агрегация векторов?

Агрегация — это процесс объединения нескольких векторов в один. Например, система берет все события пользователя за последний час (5 запросов, 1 геолокацию), представленные в виде векторов Уровня 1, и вычисляет их среднее значение. Полученный единый вектор представляет собой «сводку» активности пользователя за этот час и используется для перевода на следующий уровень иерархии (Уровень 2).