Яндекс использует алгоритм для группировки близко расположенных и связанных точек интереса (POI) на картах. Система анализирует географическую близость, плотность объектов и текстовые описания для выявления связи. Затем она определяет иерархию — выделяет главный объект (например, торговый центр) и второстепенные (магазины внутри), создавая единую «Комплексную точку интереса» для улучшения визуализации и удобства пользователя.
Описание
Какую задачу решает
Патент решает проблему перегруженности интерфейса картографических сервисов большим количеством отдельных меток (Points of Interest, POI), что затрудняет восприятие информации пользователем. Изобретение улучшает визуализацию и организацию данных на карте путем группировки иерархически или тематически связанных объектов в единую сущность, тем самым уменьшая визуальный шум.
Что запатентовано
Запатентована система и метод генерации Комплексных точек интереса (Complex Point of Interest). Суть изобретения заключается в автоматическом определении связей и иерархии между несколькими географически близкими объектами (POI) и объединении их в один комплексный объект для отображения на карте. Это позволяет структурировать информацию, показывая пользователю сначала общий объект (например, Кремль или Торговый Центр), а затем его составные части (соборы или магазины).
Как это работает
Система анализирует пары POI и рассчитывает для них количественный индекс близости (Quantitative Index of Proximity). Этот индекс учитывает не только физическое расстояние, но и плотность объектов в данной местности, а также текстовую близость (взаимные упоминания в описаниях). Если индекс превышает заданный порог, активируется эвристический алгоритм для определения иерархии: какой объект является главным (Main POI), а какой — второстепенным (Secondary POI). Иерархия определяется на основе параметров значимости объекта (например, его популярности или Photo-rating) и иерархических маркеров в названии/описании. В результате создается Complex POI, который наследует данные главного объекта и агрегирует информацию о второстепенных.
Актуальность для SEO
Высокая. Агрегация, кластеризация и структурирование данных о локальных объектах являются критически важными функциями всех современных картографических сервисов (Яндекс.Карты). Методы определения иерархических связей между локальными сущностями и улучшения пользовательского опыта на картах остаются крайне актуальными.
Важность для SEO
Влияние на Local SEO и видимость в картографических сервисах значительно (7/10). Патент не описывает ранжирование в веб-поиске, но он напрямую влияет на то, как организация отображается на Яндекс.Картах. Описанный механизм может привести к тому, что отдельная организация (Secondary POI) будет «поглощена» меткой более крупного объекта, например, торгового или бизнес-центра (Main POI). Это требует от специалистов по Local SEO тщательной проработки данных в Яндекс.Бизнес с учетом логики этой иерархической группировки.
Детальный разбор
Термины и определения
- Complex Point of Interest (Комплексная точка интереса)
- Сгенерированный объект, который объединяет два или более связанных POI (Main POI и Secondary POI) для отображения на карте в виде единой сущности.
- Descriptive Parameter (Описательный параметр)
- Параметры POI, включающие название, описание объекта, фото, контактную информацию, ссылку на сайт. Используется для определения текстовой близости.
- Geographical Proximity Subparameter (Подпараметр географической близости)
- Метрика, зависящая от физического расстояния между объектами.
- Location Parameter (Параметр местоположения)
- Географические координаты или адрес объекта. Используется для расчета близости.
- Main Point of Interest (Главная точка интереса)
- Объект, который по результатам работы эвристического алгоритма признан главным (комплексным объектом) в паре или группе связанных POI. Например, Торговый Центр.
- Object Significance Parameter (Параметр значимости объекта)
- Метрика, указывающая на важность или популярность объекта. Используется для определения иерархии (Main vs Secondary). В патенте в качестве примера приводится Photo-rating.
- Objects Density Subparameter (Подпараметр плотности объектов)
- Метрика, зависящая от количества объектов на единицу площади в данной местности. Используется как корректирующий фактор: высокая плотность ужесточает требования к географической близости.
- Photo-rating (Фото-рейтинг)
- Способ определения значимости объекта (Object Significance), основанный на количестве фотографий этого объекта, найденных в открытых источниках (например, в интернете).
- Quantitative Index of Proximity (Количественный индекс близости)
- Численный показатель, рассчитываемый для пары POI и представляющий собой потенциальную возможность их ассоциации (связи). Учитывает Location Parameter и Descriptive Parameter.
- Secondary Point of Interest (Второстепенная точка интереса)
- Объект, который признан элементом главного объекта (Main POI). Например, магазин внутри ТЦ.
- Word Significance Markers (Маркеры значимости слов)
- Предопределенный набор иерархически упорядоченных терминов (например, Кремль > Ансамбль > Собор > Церковь). Используется эвристическим алгоритмом для определения иерархии объектов.
Ключевые утверждения (Анализ Claims)
Патент фокусируется на методе объединения отдельных POI в комплексные сущности на основе анализа их близости и иерархии.
Claim 1 (Независимый пункт): Описывает основной процесс генерации Complex POI.
- Получение карточек двух POI (первого и второго), каждая из которых содержит параметры местоположения (Location Parameter) и описательные параметры (Descriptive Parameter).
- Расчет Quantitative Index of Proximity между этими двумя POI на основе их параметров. Этот индекс отражает потенциальную возможность их ассоциации.
- Если индекс близости превышает пороговое значение, инициируется генерация Complex POI.
- Генерация включает следующие шаги:
- Применение эвристического алгоритма к двум POI для идентификации одного из них как Main POI, а другого как Secondary POI.
- Назначение сгенерированному Complex POI информации, по крайней мере частично, из карточки Main POI.
Claim 8 (Зависимый пункт): Уточняет работу эвристического алгоритма.
Определяется, что набор параметров POI также включает Object Significance Parameter (параметр значимости объекта). Эвристический алгоритм использует этот параметр для определения того, какой POI является главным, а какой — второстепенным.
Claim 9 (Зависимый пункт): Уточняет, что Object Significance Parameter может определяться с помощью Photo-rating.
Claim 10 (Зависимый пункт): Дополнительно уточняет работу эвристического алгоритма.
Система использует предопределенный набор Word Significance Markers (маркеров значимости слов). Эвристический алгоритм учитывает эти маркеры для определения иерархии (Main vs Secondary POI).
Claim 12 (Зависимый пункт): Уточняет расчет параметра местоположения.
Location Parameter определяется на основе двух подпараметров: Geographical Proximity (зависит от расстояния между объектами) и Objects Density (зависит от количества объектов на единицу площади).
Где и как применяется
Этот патент не относится напрямую к слоям ранжирования веб-поиска (RANKING). Он описывает механизмы, применяемые в инфраструктуре картографических сервисов Яндекса (Яндекс.Карты) и системах управления локальными данными.
Слой организации данных (Local Entity Management / INDEXING)
Система используется для структурирования базы данных POI, выявления связей и иерархий между локальными сущностями. Этот процесс, вероятно, происходит в офлайн-режиме или при обновлении базы геоданных.
- Сбор данных (CRAWLING): Сбор информации об объектах из публичных источников (сайты, Wikipedia), проприетарных баз и от владельцев (Яндекс.Бизнес).
- Обработка: Расчет параметров значимости (Photo-rating), анализ близости и применение эвристик для генерации Complex POI.
Слой визуализации (Map Visualization Layer)
Основное применение — на этапе генерации отображения карты для пользователя.
- Входные данные: Набор карточек POI из базы данных, соответствующих видимой области карты.
- Выходные данные: Сгенерированные Complex POI, которые заменяют исходные отдельные метки при отображении на карте для улучшения UX.
На что влияет
- Конкретные типы контента: Влияет на отображение всех типов локальных объектов (POI) — магазины, рестораны, достопримечательности, торговые и бизнес-центры.
- Специфические запросы: Наиболее заметно влияние на локальные и гео-запросы (например, «кафе рядом», «музеи в центре», «магазины в ТЦ»).
- Конкретные ниши: Критически важно для ритейла, сферы услуг, туризма и общепита, особенно в местах с высокой плотностью организаций (ТЦ, фудкорты, исторические центры).
Когда применяется
- Условия работы алгоритма: Алгоритм применяется при обработке базы данных POI.
- Триггеры активации: Наличие нескольких POI в заданной области.
- Пороговые значения: Ключевым условием для объединения является превышение Quantitative Index of Proximity установленного порога.
Пошаговый алгоритм
- Идентификация кандидатов: Система определяет набор POI в интересующей области.
- Получение данных: Из базы данных извлекаются карточки для каждого POI, содержащие Location Parameters, Descriptive Parameters и Object Significance Parameters.
- Расчет индекса близости: Для пар POI рассчитывается Quantitative Index of Proximity. Этот расчет включает:
- Оценку Geographical Proximity (расстояние).
- Корректировку с учетом Objects Density. В патенте указано: чем выше плотность объектов в области, тем более строгие требования применяются к географической близости (т.е. расстояние для связи должно быть меньше).
- Оценку текстовой близости (Textual Proximity) на основе Descriptive Parameters. Учитывается наличие упоминаний одного объекта в описании другого (например, в описании Собора упоминается Кремль).
- Фильтрация по порогу: Отбираются пары POI, чей Quantitative Index of Proximity превышает установленное пороговое значение.
- Определение иерархии (Эвристический алгоритм): К отфильтрованным парам применяется алгоритм для определения Main POI и Secondary POI. Алгоритм учитывает:
- Object Significance Parameter (например, Photo-rating). Более значимый/популярный объект вероятнее станет Main POI.
- Word Significance Markers. Анализ иерархических терминов в названиях (например, «ТЦ» главнее «Магазина»; «Кремль» главнее «Собора»).
- Генерация Complex POI: Создается новый объект Complex POI. Он наследует информацию из карточки Main POI и может быть дополнен информацией из карточек Secondary POI (например, списком входящих в него объектов).
- Визуализация: На карте пользователю отображается Complex POI вместо исходных отдельных меток.
Какие данные и как использует
Данные на входе
- Географические факторы: Географические координаты объекта (Location Parameter). Уличный адрес объекта.
- Контентные факторы (Текстовые): Название объекта, описание объекта (Descriptive Parameter). Контактная информация. Гиперссылка на сайт.
- Мультимедиа факторы: Фотографии объекта. Используются как для отображения в карточке, так и для расчета значимости.
- Данные о популярности (Косвенно): Object Significance Parameter. В патенте явно указано, что он может рассчитываться на основе внешних данных, например, по количеству фотографий объекта в интернете (Photo-rating).
Какие метрики используются и как они считаются
- Quantitative Index of Proximity: Агрегированная метрика, определяющая потенциальную связь между двумя POI. Рассчитывается на основе взвешенного учета расстояния, плотности и текстовой связи. Конкретная формула расчета в патенте не приводится.
- Geographical Proximity Subparameter: Метрика, основанная на физическом расстоянии между объектами.
- Objects Density Subparameter: Метрика, рассчитываемая как количество объектов определенной категории на единицу площади в данной местности. Используется как корректирующий коэффициент для географической близости.
- Textual Proximity (в составе Descriptive Parameter): Оценка наличия взаимных упоминаний одного объекта в текстовом описании другого.
- Object Significance Parameter (Photo-rating): Метрика значимости/популярности. Рассчитывается по количеству найденных в интернете фотографий объекта. Чем больше фото, тем выше рейтинг.
- Word Significance Markers: Используются предопределенные иерархические списки терминов для сравнения типов объектов (например, Кремль > Собор; ТЦ > Магазин). В патенте упоминается, что для генерации этих правил может использоваться машинное обучение (дедуктивное или индуктивное).
Выводы
- Группировка POI Яндексом — это не просто кластеризация по расстоянию. Система активно ищет семантические связи (через анализ описаний) и иерархические отношения между объектами.
- Иерархия (кто главный) определяется эвристически. Ключевые факторы для определения Main POI — это популярность объекта (Object Significance, например, Photo-rating) и его тип/название (Word Significance Markers). Более популярный или структурно более крупный объект «поглощает» меньшие или менее значимые.
- Плотность застройки влияет на чувствительность алгоритма. В центре города (высокая плотность) требования к близости для объединения объектов строже, чем на периферии (низкая плотность).
- Влияние на Local SEO. Видимость локального бизнеса на Картах напрямую зависит от того, будет ли он показан как отдельный POI или агрегирован внутри Complex POI (например, скрыт за общей меткой торгового центра).
- Важность работы с фотографиями. Патент явно выделяет Photo-rating как способ определения значимости объекта, что подтверждает важность наличия большого количества фотографий организации в сети для Local SEO.
Практика
Best practices (это мы делаем)
Рекомендации касаются оптимизации видимости в Яндекс.Картах и других гео-сервисах (Local SEO).
- Повышение значимости объекта (Object Significance): Активно работайте над увеличением популярности организации. Патент прямо указывает на Photo-rating (количество фотографий объекта в сети) как на фактор определения значимости. Необходимо стимулировать пользователей делать и публиковать фотографии, связанные с вашей локацией, а также самостоятельно загружать качественные фото в Яндекс.Бизнес и на другие площадки. Высокая значимость снижает риск быть «поглощенным» соседним объектом.
- Точное позиционирование и управление данными в Яндекс.Бизнес: Критически важно иметь точные координаты, адрес и детальное описание (Descriptive Parameter). Если вы находитесь внутри крупного комплекса (ТЦ, БЦ), максимально точно указывайте расположение (этаж, секция, номер офиса).
- Оптимизация описаний для установления связей:
- Для Main POI (например, ТЦ или исторического комплекса): Включайте в описание упоминания ключевых арендаторов или составных частей, чтобы усилить текстовую связь (Textual Proximity) и гарантировать их включение в Complex POI.
- Для Secondary POI (например, магазина в ТЦ): Указывайте в описании принадлежность к комплексу («Магазин X расположен в ТЦ Y»), чтобы система корректно ассоциировала вас с Main POI.
- Выбор названия и категории (Word Significance Markers): Используйте четкие и релевантные категории в Яндекс.Бизнес. Понимайте естественную иерархию объектов (ТЦ главнее Магазина), которую система может использовать для определения Main POI.
Worst practices (это делать не надо)
- Неточное позиционирование: Ошибки в координатах или неоднозначный адрес могут привести к некорректной ассоциации с соседними объектами или исключению из нужного Complex POI.
- Скудное или отсутствующее описание: Отсутствие детального описания не позволяет системе установить текстовую связь между объектами, что может повлиять на расчет Quantitative Index of Proximity.
- Игнорирование работы с фотографиями и популярностью: Низкий Object Significance (мало фото, низкая известность) значительно увеличивает риск того, что ваша метка будет скрыта за меткой более крупного или популярного соседнего объекта.
Стратегическое значение
Патент демонстрирует подход Яндекса к управлению локальными сущностями (Local Entity Management) и улучшению пользовательского опыта на Картах. Для Local SEO это подтверждает, что видимость организации зависит не только от расстояния до пользователя или релевантности запросу, но и от того, как Яндекс интерпретирует взаимосвязи, иерархию и значимость объектов на местности. Стратегия должна включать комплексную работу над известностью бренда и точностью данных в гео-сервисах.
Практические примеры
Сценарий 1: Оптимизация магазина в Торговом Центре (ТЦ)
- Контекст: ТЦ является вероятным Main POI, магазин — Secondary POI.
- Задача: Обеспечить корректное включение магазина в Complex POI «Торговый Центр» и его видимость в карточке ТЦ.
- Действия:
- В Яндекс.Бизнес указать точный адрес ТЦ и детализировать расположение: «Этаж 2, Секция 2B».
- В описании магазина указать: «Фирменный магазин расположен на 2 этаже ТЦ». Это усиливает Textual Proximity.
- Активно загружать фотографии интерьера и витрины магазина, стимулировать покупателей делиться фото (повышение Photo-rating).
- Ожидаемый результат: Система корректно ассоциирует магазин с ТЦ. При клике на метку ТЦ на карте, магазин будет виден в списке арендаторов (аналогично примеру с соборами в карточке Кремля из патента).
Сценарий 2: Сохранение отдельной метки для ресторана рядом с Бизнес-Центром (БЦ)
- Контекст: Ресторан находится в том же здании, что и БЦ, но имеет отдельный вход и не хочет ассоциироваться только с ним.
- Задача: Избежать «поглощения» меткой БЦ и сохранить отдельный POI на карте.
- Действия:
- Убедиться, что адрес и вход четко позиционированы и отделены от основного входа в БЦ (указать это в Яндекс.Бизнес).
- Избегать в описании формулировок, которые могут быть интерпретированы как иерархическая зависимость от БЦ.
- Максимально работать над повышением Object Significance (сбор большого количества фото, отзывов, повышение популярности), чтобы значимость ресторана была высока и система не посчитала его второстепенным объектом по отношению к БЦ.
- Ожидаемый результат: Несмотря на географическую близость, система либо не превысит порог Quantitative Index of Proximity (из-за отсутствия сильной текстовой связи), либо эвристический алгоритм не определит БЦ как доминирующий Main POI из-за высокой значимости ресторана. Ресторан сохраняет собственную метку на карте.
Вопросы и ответы
Что такое Complex POI и зачем Яндекс их создает?
Complex POI (Комплексная точка интереса) — это единая метка на карте, которая объединяет несколько связанных объектов. Яндекс создает их для решения проблемы перегруженности карты большим количеством меток в одной области. Это улучшает пользовательский опыт, позволяя сначала увидеть общий объект (например, Торговый Центр или исторический комплекс), а затем изучить его составные части (магазины или достопримечательности внутри).
По какому принципу Яндекс решает, какие объекты объединить в Complex POI?
Объекты объединяются, если их «Количественный индекс близости» (Quantitative Index of Proximity) превышает определенный порог. Этот индекс рассчитывается на основе трех факторов: 1) Географическое расстояние между объектами; 2) Плотность объектов в данной местности (чем плотнее, тем ближе должны быть объекты для связи); 3) Текстовая близость (упоминание одного объекта в описании другого).
Если объекты объединили, как система определяет, какой из них главный (Main POI)?
После того как связь установлена, активируется эвристический алгоритм для определения иерархии. Он определяет главный объект (Main POI) по двум основным критериям: 1) Параметр значимости объекта (Object Significance) — более популярный объект становится главным. 2) Маркеры значимости слов (Word Significance Markers) — система знает иерархию типов объектов (например, что «Торговый Центр» главнее «Магазина», а «Кремль» главнее «Собора»).
Что такое «Параметр значимости объекта» и как его повысить?
Это метрика популярности или важности объекта. В патенте в качестве конкретного примера реализации упоминается Photo-rating — рейтинг, основанный на количестве фотографий объекта, найденных в интернете. Для повышения этого параметра необходимо, чтобы в сети было как можно больше фотографий вашей организации, загруженных как вами, так и пользователями (UGC).
Мой магазин находится в ТЦ. Значит ли это, что у меня не будет своей метки на карте?
Вероятнее всего, на общих масштабах карты будет видна только метка ТЦ (Complex POI). Ваш магазин станет Secondary POI. Однако, согласно патенту, информация о второстепенных объектах агрегируется в карточке комплексного объекта. Это значит, что пользователь увидит ваш магазин в списке организаций при клике на метку ТЦ. Ваша задача — обеспечить точность данных, чтобы эта ассоциация работала корректно.
Как я могу избежать того, чтобы метку моей организации «поглотил» соседний крупный объект?
Чтобы сохранить отдельную метку, нужно минимизировать индекс близости или выиграть в иерархии. На практике это означает: 1) Максимально точное позиционирование, четкое указание отдельного входа и адреса. 2) Избегание текстовых связей, указывающих на подчинение. 3) Активное повышение значимости (Object Significance) вашей организации — работайте над популярностью, собирайте много фотографий и отзывов, чтобы ваша значимость была сопоставима с соседним объектом.
Как использовать текстовые описания для управления этими связями?
Система ищет взаимные упоминания объектов в описаниях (Textual Proximity). Если вы хотите связать свой объект с другим (например, указать, что вы находитесь внутри ТЦ), упомяните этот ТЦ в своем описании в Яндекс.Бизнес. Если же вы управляете ТЦ, перечисление ключевых арендаторов в описании ТЦ поможет системе корректно сформировать Complex POI.
Влияет ли плотность застройки в моем районе на работу этого алгоритма?
Да, напрямую. Патент описывает параметр «Плотность объектов» (Objects Density). В районах с высокой плотностью (например, в центре города) требования к географической близости для объединения объектов становятся строже. Это сделано для того, чтобы не объединять в одну метку просто близко стоящие, но не связанные между собой объекты.
Касается ли этот патент ранжирования в органическом поиске Яндекса?
Нет, этот патент не описывает алгоритмы ранжирования веб-страниц в основном поиске. Он касается исключительно организации данных и визуализации точек интереса (POI) в картографических сервисах Яндекса, таких как Яндекс.Карты.
Какие данные из Яндекс.Бизнес наиболее важны с точки зрения этого патента?
Наиболее важны: точные географические координаты и адрес (для расчета расстояния), название и рубрика организации (для определения иерархии по Word Markers), текстовое описание (для определения текстовой близости) и количество фотографий (влияет на определение значимости объекта/Photo-rating).