Яндекс использует алгоритмы машинного обучения (включая DSSM) для глубокой персонализации Яндекс Карт. Система анализирует действия пользователя во всей экосистеме Яндекса (Поиск, Такси, Еда, Музыка и т.д.) и создает вектор его интересов. Организации (POI) также векторизуются по их признакам. На карте приоритетно показываются те организации, чьи векторы наиболее близки к вектору интересов пользователя, при этом количество объектов ограничивается в зависимости от масштаба карты.
Описание
Какую задачу решает
Патент решает проблему информационной перегруженности электронных карт. Большое количество интересующих точек (POI, Point Of Interest) в густонаселенных районах затрудняет восприятие карты пользователем, замедляет ее отображение и усложняет поиск релевантной информации. Изобретение направлено на улучшение пользовательского опыта путем персонализации отображаемых POI и ограничения их количества в зависимости от масштаба карты, что также экономит вычислительные ресурсы клиентского устройства.
Что запатентовано
Запатентована система персонализированного ранжирования и выборочного отображения POI в картографических приложениях (например, Яндекс.Карты, Яндекс.Навигатор). Суть изобретения заключается в использовании данных о прежних действиях пользователя не только в картографическом сервисе, но и во множестве других связанных веб-сервисов (экосистеме Яндекса) для определения релевантности POI данному пользователю,.
Как это работает
Система использует алгоритм машинного обучения (MLA), в частности, упоминаются нейронные сети (NN) и глубокие структурированные семантические модели (DSSM). Алгоритм создает векторные представления (эмбеддинги) для POI на основе их признаков (категория, местоположение и т.д.) и вектор пользователя на основе его прежних действий во всех доступных сервисах. Релевантность определяется как расстояние между вектором пользователя и векторами POI в многомерном семантическом пространстве. POI ранжируются по этой релевантности. Для предотвращения перегрузки интерфейса система отображает только подмножество наиболее релевантных POI, количество которых зависит от текущего масштаба карты.
Актуальность для SEO
Высокая. Использование векторных представлений (включая DSSM и нейронные сети) для моделирования интересов пользователей является стандартом в современных рекомендательных системах. Активное использование данных из всей экосистемы сервисов для персонализации отдельных продуктов — ключевая стратегия крупных платформ, включая Яндекс.
Важность для SEO
Влияние на Local SEO значительно (8/10). Патент описывает механизм, который напрямую определяет видимость организации на Яндекс.Картах. Эта видимость становится экстремально персонализированной и динамической. Успех в Local SEO по этому патенту зависит от того, насколько точно оптимизированы признаки организации (формирующие Вектор POI) и насколько действия целевой аудитории в экосистеме Яндекса (формирующие Вектор пользователя) соответствуют этим признакам.
Детальный разбор
Термины и определения
- POI (Point Of Interest, Интересующая точка)
- Объект на карте, который может представлять интерес для пользователя (организации, рестораны, магазины и т.д.).
- MLA (Machine Learning Algorithm, Алгоритм машинного обучения)
- Алгоритм, используемый для формирования векторов пользователей и POI, а также для вычисления расстояния между ними. В патенте упоминаются NN и DSSM.
- DSSM (Deep Structured Semantic Model, Глубокая структурированная семантическая модель)
- Тип нейронной сети, используемый для моделирования семантического сходства. Используется для проецирования разнородных данных (признаки POI и действия пользователя) в общее семантическое пространство для их сравнения.
- NN (Neural Network, Нейронная сеть)
- Один из вариантов реализации MLA, упомянутый в патенте.
- Вектор точки POI (POI Vector)
- Численное представление POI в многомерном пространстве, сформированное MLA на основе признаков этой точки (категория, местоположение, название, описание и т.д.).
- Вектор пользователя (User Vector)
- Численное представление интересов и предпочтений пользователя в том же многомерном пространстве, сформированное MLA на основе его прежних действий во множестве веб-сервисов.
- Признаки (Features)
- Характеристики POI (например, категория, местоположение) или извлеченные предпочтения пользователя на основе его действий.
- Прежние действия пользователя (Past Actions)
- Данные о поведении пользователя в различных сервисах Яндекса (клики по POI, физические посещения, поисковые запросы, заказы такси/еды, прослушивание музыки и т.д.).
Ключевые утверждения (Анализ Claims)
Патент защищает метод персонализации отображения POI на основе кросс-сервисных данных пользователя с использованием векторного моделирования.
Claim 1 (Независимый пункт): Описывает основной способ работы системы.
- Получение запроса на отображение карты.
- Определение множества POI для данного местоположения.
- Идентификация множества веб-сервисов, связанных с пользователем.
- Извлечение данных о прежних действиях пользователя из этих веб-сервисов.
- Анти-клаттер механизм: Определение количества POI, которое допустимо отобразить при текущем или запрошенном масштабе карты.
- Ранжирование POI: Этот процесс детализирован внутри Claim 1 и включает:
- Векторизация POI: Формирование векторного представления каждой POI с помощью MLA на основе ее признаков (название, описание, категория, местоположение).
- Векторизация пользователя: Формирование вектора пользователя с помощью MLA на основе его прежних действий во множестве веб-сервисов.
- Определение релевантности: Ранжирование основано на расстояниях между вектором пользователя и векторными представлениями POI.
- Передача карты клиенту, содержащей только подмножество из ранжированного списка POI (соответствующее допустимому количеству для данного масштаба).
Claim 5 (Зависимый от п.1): Описывает альтернативный механизм ранжирования, основанный на коллаборативной фильтрации (Collaborative Filtering).
- Система получает множество ранее сформированных векторов других пользователей.
- Определяется расстояние между вектором текущего пользователя и векторами других пользователей.
- Выбирается по меньшей мере один вектор пользователя (похожий пользователь) с минимальным расстоянием до вектора текущего пользователя.
- Ранжирование: Основывается на расстояниях между вектором(ами) похожих пользователей и векторными представлениями POI. (Т.е. пользователю рекомендуется то, что релевантно похожим на него людям).
Claims 8 и 18: Уточняют, что в качестве MLA используется Глубокая структурированная семантическая модель (DSSM).
Где и как применяется
Изобретение не относится напрямую к классическому веб-поиску, а специфично для Картографических сервисов Яндекса (например, Яндекс.Карты, Яндекс.Навигатор). Оно затрагивает этапы RANKING (Ранжирование объектов POI) и Генерация Выдачи (в данном случае — генерация карты) внутри этих сервисов.
Взаимодействие компонентов:
- Картографический сервер: Центральный компонент. Принимает запрос, выполняет MLA (DSSM/NN) для расчета расстояний, ранжирует POI и формирует ответ.
- Сервер отслеживания: Собирает и хранит данные о действиях пользователей из всех сервисов (Поиск, Карты, Другие сервисы – Такси, Еда, Музыка и т.д.). Предоставляет эти данные для формирования вектора пользователя.
Входные данные: Запрос карты (местоположение, масштаб), Идентификатор пользователя.
Выходные данные: Карта с персонализированным подмножеством POI.
На что влияет
- Конкретные типы контента: Влияет исключительно на видимость локальных объектов (POI) – организаций, достопримечательностей, объектов инфраструктуры – в картографических приложениях.
- Специфические запросы: Влияет на отображение карты при любом запросе, включая имплицитные (просмотр карты без ввода текста поиска). Определяет, какие объекты видны по умолчанию.
- Конкретные ниши или тематики: Влияет на все локальные ниши. Влияние сильнее в конкурентных тематиках (еда, услуги, ритейл) и локациях с высокой плотностью POI.
Когда применяется
- Условия работы: Алгоритм применяется при каждом обращении пользователя к картографическому приложению для формирования вида карты.
- Триггеры активации: Запрос на отображение или изменение масштаба карты.
- Частота применения: В реальном времени при взаимодействии с картой. Предварительные расчеты векторов выполняются офлайн и периодически обновляются.
Пошаговый алгоритм
Процесс разделен на офлайн-подготовку и онлайн-обработку запроса.
Этап А: Офлайн-подготовка (Векторизация POI)
- Сбор признаков POI: Из картографической базы извлекаются признаки POI (местоположение, категория (многоуровневый классификатор), время работы, оценки, цены и т.д.).
- Формирование векторов POI: MLA (например, DSSM) обрабатывает признаки и формирует векторное представление для каждой POI в многомерном пространстве.
- Сохранение: Векторы POI сохраняются для быстрого доступа.
Этап Б: Подготовка данных пользователя (Векторизация пользователя) (Может выполняться офлайн или онлайн)
- Сбор данных о действиях: Из базы данных отслеживания извлекаются прежние действия пользователя во всех связанных сервисах (поиск, карты, такси, еда, музыка и т.д.).
- Извлечение признаков пользователя: Анализ действий для определения предпочтений (например, часто посещаемые категории POI, история покупок, медиа-предпочтения).
- Формирование вектора пользователя: MLA (DSSM) формирует вектор пользователя в том же многомерном пространстве, что и векторы POI.
Этап В: Онлайн-обработка запроса карты
- Получение запроса: Сервер получает запрос (местоположение, масштаб, ID пользователя).
- Идентификация кандидатов: Определение POI в запрашиваемой области и извлечение их векторов. Извлечение вектора пользователя.
- Расчет релевантности (Scoring): Вычисление расстояний (например, косинусное сходство или скалярное произведение) между вектором пользователя и векторами POI-кандидатов.
- (Опционально) Коллаборативная фильтрация: Поиск похожих пользователей (ближайшие векторы) и учет их предпочтений при ранжировании.
- Ранжирование: Сортировка POI на основе рассчитанных расстояний (наиболее близкие — выше).
- Определение квоты (Анти-клаттер): Определение максимального количества POI (N), допустимого для отображения при данном масштабе карты.
- Выбор подмножества и Передача: Выбор Топ-N ранжированных POI и передача карты с этими объектами пользователю.
Какие данные и как использует
Данные на входе
- Поведенческие факторы (Ключевые для Вектора Пользователя): Данные собираются из множества веб-сервисов. Упоминаются:
- Карты/Навигатор: Запрошенные местоположения, выбранные POI, посещенные POI, длительность посещения.
- Поиск: Отправленные запросы, выбранные результаты, время пребывания (Dwell time). История поиска, связанного с категориями POI.
- Другие сервисы: Электронная почта, заказ Такси, совместные поездки, Браузер (закладки). Доставка еды (заказы в ресторанах), магазины (покупки). Потоковое аудио/видео (используется для определения интересов, например, классическая музыка -> интерес к культурным центрам).
- Контентные/Структурные факторы (Ключевые для Вектора POI):
- Категория (Группа): Многоуровневый классификатор. Критически важный признак.
- Метаданные: Название, описание. Время работы, оценки пользователей, средняя цена.
- Географические факторы: Местоположение POI. Текущее местоположение пользователя, место проживания, место работы.
- Технические факторы: Масштаб карты (Zoom level) — используется для определения количества отображаемых POI.
Какие метрики используются и как они считаются
- Алгоритмы Машинного Обучения: Явно указаны Нейронная сеть (NN) и Глубокая структурированная семантическая модель (DSSM). Они обучаются проецировать векторы так, чтобы релевантные пары (Пользователь, POI) находились близко друг к другу в многомерном пространстве.
- Вектор точки POI и Вектор пользователя: Эмбеддинги, сгенерированные MLA на основе признаков и действий соответственно.
- Расчет Релевантности (Расстояние): Релевантность определяется как расстояние между вектором пользователя и вектором POI. Для расчета могут использоваться скалярное произведение или косинусное сходство.
- Весовые коэффициенты: Система может назначать разные веса признакам при вычислении расстояния. Например, может быть увеличен или уменьшен вес физического расстояния от POI до пользователя в зависимости от контекста.
Выводы
- Экстремальная кросс-сервисная персонализация Карт: Видимость организации на Яндекс.Картах определяется не только локальными факторами, но и всем цифровым следом пользователя в экосистеме Яндекса (Поиск, Такси, Еда, Музыка, Почта, Браузер и т.д.).
- DSSM как ядро моделирования интересов: Яндекс использует DSSM (или аналогичные нейросетевые модели) для создания общего векторного пространства, где сравниваются интересы пользователя и характеристики организаций. Релевантность = близость векторов.
- Динамическая видимость и Анти-клаттер: Видимость POI динамична и зависит от того, кто смотрит (персонализация) и при каком масштабе (механизм анти-клаттера, ограничивающий количество объектов на экране). Приоритет отдается наиболее релевантным объектам.
- Два режима персонализации: Патент описывает как прямую персонализацию (расстояние между Пользователем и POI), так и коллаборативную фильтрацию (рекомендации на основе предпочтений похожих пользователей – Claim 5).
- Критическая важность признаков POI: Категоризация (особенно многоуровневая), местоположение и описание являются фундаментом для формирования Вектора POI. Точность этих данных в Яндекс Бизнесе напрямую влияет на способность системы сопоставить организацию с интересами пользователя.
Практика
Best practices (это мы делаем)
Рекомендации касаются стратегии Local SEO и управления присутствием в экосистеме Яндекса.
- Максимально точная категоризация в Яндекс.Бизнес: Категория является одним из ключевых признаков для формирования Вектора POI. Необходимо выбирать наиболее релевантные и точные категории (используя все доступные уровни классификатора), чтобы обеспечить правильное семантическое сопоставление с интересами пользователей.
- Комплексное заполнение профиля Яндекс.Бизнес: Предоставляйте все возможные данные (название, описание, время работы, цены). Все эти признаки используются для формирования Вектора POI и влияют на его позиционирование в векторном пространстве.
- Стимулирование взаимодействий в экосистеме Яндекса: Так как Вектор пользователя строится на его действиях, критически важно генерировать целевые взаимодействия. Поощряйте пользователей строить маршруты до вашей организации (Яндекс.Навигатор/Карты), заказывать доставку (Яндекс.Еда), вызывать такси до вашего адреса. Эти действия напрямую обучают модель ассоциировать вашу POI с определенным профилем интересов.
- Анализ целевой аудитории через призму экосистемы: Понимайте, как ваша целевая аудитория ведет себя в других сервисах Яндекса. Если ваша аудитория интересуется определенной тематикой в Поиске или слушает определенную музыку (Яндекс.Музыка), это формирует их профиль, который система будет использовать для ранжирования ваших POI.
Worst practices (это делать не надо)
- Неверная или слишком широкая категоризация: Выбор неправильных категорий в Яндекс.Бизнес приведет к формированию нерелевантного Вектора POI. Система будет считать бизнес релевантным для нецелевой аудитории и скрывать его от потенциальных клиентов.
- Изолированный подход к Яндекс Картам: Рассмотрение оптимизации на Картах в отрыве от других сервисов Яндекса (особенно Поиска и Навигатора) игнорирует основной источник данных для алгоритма персонализации, описанного в патенте.
- Попытки манипуляции категориями: Добавление популярных, но нерелевантных категорий может быть неэффективным, так как модель обучается на реальном поведении пользователей. Если пользователи, интересующиеся категорией А, не взаимодействуют с вашей организацией (категория Б), сильная связь не будет установлена.
Стратегическое значение
Патент подтверждает стратегию Яндекса на максимальное использование преимуществ своей экосистемы для персонализации продуктов. Для Local SEO это означает переход от борьбы за статичные позиции в выдаче к управлению динамической видимостью для целевых сегментов аудитории. Долгосрочная стратегия должна включать активное управление присутствием и стимулирование вовлеченности во всех ключевых сервисах Яндекса. Понимание механизмов векторного моделирования интересов (DSSM) становится важным для разработки эффективных локальных стратегий.
Практические примеры
Сценарий 1: Использование кросс-сервисных данных для персонализации
- Действия пользователя: Пользователь часто слушает классическую музыку в Яндекс.Музыке, ищет информацию о документальных фильмах в Поиске Яндекса и ранее посещал музей (зафиксировано в Картах).
- Формирование Вектора Пользователя: MLA (DSSM) формирует вектор, который сильно коррелирует с признаками «Культура», «Музеи», «Театры».
- Действие системы: Когда пользователь открывает Яндекс.Карты в центре города, система рассчитывает расстояния от его вектора до векторов окружающих POI.
- Результат: Даже при отдаленном масштабе (когда видно мало объектов), система приоритетно покажет Музей или Концертный Зал, пессимизируя менее релевантные (для этого пользователя) бары или магазины одежды, благодаря близости векторов.
Сценарий 2: Коллаборативная фильтрация (Claim 5)
- Ситуация: Пользователь А и Пользователь Б имеют схожую историю посещений (например, оба часто ходят в кофейни и книжные магазины). Их Векторы пользователя близки в многомерном пространстве.
- Новое действие: Пользователь Б посетил новый барбершоп и взаимодействовал с его POI.
- Действие системы: При ранжировании POI для Пользователя А система идентифицирует Пользователя Б как «похожего».
- Результат: Новый барбершоп может быть показан Пользователю А на карте с повышенным приоритетом, даже если Пользователь А ранее не проявлял явного интереса к барбершопам, основываясь на предпочтениях схожего пользователя.
Вопросы и ответы
Что такое DSSM и почему Яндекс использует его в этом патенте?
DSSM (Deep Structured Semantic Model) — это архитектура нейронной сети, которая эффективна для сопоставления (matching) разнородных сущностей. Яндекс использует ее, чтобы перевести признаки организаций (категория, локация) и действия пользователей (поиск, музыка, такси) в единое векторное пространство. Это позволяет математически вычислить, насколько конкретная организация релевантна конкретному пользователю, даже если они описаны совершенно разными данными.
Влияет ли этот патент на ранжирование в основном веб-поиске Яндекса?
Нет, этот патент не описывает механизмы ранжирования веб-документов. Он специфичен для картографических сервисов (Яндекс.Карты, Яндекс.Навигатор) и описывает, как персонализируется и приоритизируется отображение организаций (POI) на самой карте. Его влияние ограничено Локальным SEO.
Какие сервисы Яндекса влияют на ранжирование в Картах?
Патент подразумевает использование данных из максимально широкого набора связанных веб-сервисов. Явно упомянуты или подразумеваются Поиск, Карты, Навигатор, Электронная почта, Такси, Браузер. Также приводятся примеры использования данных из сервисов доставки еды, интернет-магазинов, потокового аудио и видео (Яндекс.Еда, Маркет, Музыка, Кинопоиск). Фактически, любая активность внутри экосистемы Яндекса может влиять на Вектор Пользователя.
Насколько важна правильная категоризация в Яндекс.Бизнес в контексте этого патента?
Она фундаментальна. Категория является одним из главных признаков, на основе которых строится Вектор POI. Если категория указана неверно, вектор организации будет расположен в неправильной области семантического пространства и не будет соответствовать векторам пользователей, которые действительно заинтересованы в таких услугах.
В патенте описаны два механизма ранжирования (Claim 1 и Claim 5). В чем разница?
Claim 1 описывает прямую персонализацию: релевантность рассчитывается как расстояние между вектором текущего пользователя и вектором POI. Claim 5 описывает коллаборативную фильтрацию: система находит пользователей с похожими векторами (похожими интересами) и рекомендует POI, которые релевантны этим похожим пользователям. Это позволяет давать рекомендации, даже если у текущего пользователя мало истории.
Как работает механизм защиты от перегрузки карты (анти-клаттер)?
Система определяет максимальное допустимое количество POI для каждого уровня масштаба (zoom level). Цель — избежать визуального перенасыщения и ускорить рендеринг. Если для масштаба установлено ограничение в 10 POI, система покажет только 10 наиболее релевантных организаций, согласно персонализированному ранжированию.
Как SEO-специалист может повлиять на Вектор пользователя?
Напрямую повлиять на вектор конкретного пользователя нельзя, но можно повлиять на модель в целом, генерируя целевые взаимодействия. Необходимо стимулировать целевую аудиторию взаимодействовать с вашей организацией через сервисы Яндекса: строить маршруты, кликать на POI, совершать физические визиты, заказывать такси/еду. Это укрепляет связь между векторами вашей организации и векторами пользователей с определенным профилем интересов.
Что важнее для видимости на карте: физическое расстояние до пользователя или его предпочтения?
Оба фактора важны, но патент делает акцент на предпочтениях (семантическом расстоянии между векторами). При этом в патенте упоминается возможность динамического управления весом физического расстояния. В плотной городской застройке, где много альтернатив, предпочтения, вероятно, будут играть решающую роль в том, какие именно POI будут показаны пользователю первыми.
Моя организация релевантна запросу, но не видна на карте. Почему?
В контексте этого патента может быть две причины. Первая — персонализация: ваша организация может быть нерелевантна интересам конкретного пользователя, который смотрит карту. Вторая — механизм анти-клаттера: при текущем масштабе карты квота на количество объектов исчерпана другими организациями, которые система сочла более релевантными для этого пользователя.
Как этот патент меняет стратегию локального SEO для Яндекса?
Он смещает фокус со статического ранжирования на управление динамической видимостью. Стратегия должна быть экосистемной: необходимо не просто оптимизировать карточку в Яндекс.Бизнес, но и активно работать над присутствием и вовлечением пользователей во всех связанных сервисах Яндекса, чтобы обеспечить семантическое соответствие между Вектором POI и Векторами целевой аудитории.