Яндекс использует систему для объединения связанных Точек Интереса (POI) в одну «Комплексную Точку Интереса» для снижения визуального шума. Система анализирует географическую близость, плотность объектов в регионе и текстовые связи (взаимные упоминания в описаниях). Затем используется эвристический алгоритм, учитывающий популярность объекта (Фоторейтинг) или иерархию терминов, чтобы определить главный объект (например, ТЦ) и второстепенные (например, магазины внутри).
Описание
Какую задачу решает
Патент решает задачу снижения информационной перегрузки и визуального шума при отображении большого количества Точек Интереса (Points of Interest, POI) на ограниченном пространстве, например, на карте или экране мобильного устройства. Цель — обеспечить более компактное отображение наиболее значимой информации, улучшая восприятие и ускоряя ориентирование пользователя в полученных данных. Это улучшает UX в картографических сервисах и локальном поиске.
Что запатентовано
Запатентована система и способ кластеризации связанных POI и создания Комплексной Точки Интереса (Complex POI). Суть изобретения заключается в расчете Количественного показателя близости между объектами на основе географических и описательных (текстовых) параметров. Если показатель превышает порог, система применяет Эвристический алгоритм для определения иерархии (Главный и Второстепенный объект) и формирует Комплексную точку.
Как это работает
Система сравнивает пары POI и рассчитывает Показатель близости. Этот расчет учитывает физическое расстояние, корректировку на плотность объектов в регионе (в центре города требования к близости строже) и текстовую близость (если объекты упоминают друг друга в описаниях). Если близость высока, активируется Эвристический алгоритм для определения иерархии. Алгоритм может использовать показатели значимости объектов (например, Фоторейтинг — количество фото объекта в сети) или предопределенные иерархии терминов (например, Кремль > Собор). В результате создается Комплексная Точка Интереса, наследующая данные от Главного объекта.
Актуальность для SEO
Высокая. Управление отображением сущностей, кластеризация объектов и выявление иерархических связей между ними являются ключевыми задачами современных поисковых систем, особенно в контексте Локального Поиска, Яндекс.Карт и Графов Знаний. Описанные методы анализа местоположения, контекста (плотности) и текстовых связей крайне актуальны.
Важность для SEO
Влияние на Local SEO значительно (7/10). Патент не описывает ранжирование веб-документов, но детально раскрывает, как Яндекс идентифицирует, связывает и приоритизирует физические объекты (POI). Понимание этих механизмов критически важно для видимости бизнеса в Яндекс.Картах и локальных блоках выдачи. Патент подчеркивает важность точности геоданных, описаний, раскрывающих связи между объектами, и сигналов популярности (Фоторейтинг).
Детальный разбор
Термины и определения
- Point of Interest (POI) (Точка интереса)
- Отметка на карте или запись в базе данных, обозначающая реальный объект. Ассоциирована с Карточкой точки интереса.
- Complex POI (Комплексная точка интереса)
- Точка интереса, созданная путем объединения Главной POI и одной или нескольких Второстепенных POI. Создается для более компактного отображения информации.
- Main POI (Главная точка интереса)
- Точка интереса в кластере, определенная Эвристическим алгоритмом как основная или иерархически высшая (например, Торговый Центр). Комплексная POI наследует данные преимущественно из ее карточки.
- Secondary POI (Второстепенная точка интереса)
- Точка интереса в кластере, определенная как входящая в состав Главного объекта (например, магазин в ТЦ).
- Quantitative Proximity Indicator (Количественный показатель близости)
- Числовой индикатор, указывающий на потенциальную взаимосвязь объектов. Рассчитывается на основе параметров местоположения и описательных параметров.
- Location Parameter (Параметр местоположения)
- Географические данные объекта. Включает подпараметры географической близости и плотности объектов.
- Geographic Proximity Subparameter (Подпараметр географической близости)
- Параметр, отражающий физическую дистанцию между объектами.
- Object Density Subparameter (Подпараметр плотности объектов)
- Корректирующий параметр. Отражает количество объектов на территории. Чем выше плотность, тем строже требования к географической близости для установления связи.
- Descriptive Parameter / Textual Proximity (Описательный параметр / Текстовая близость)
- Наименование, описание и другие текстовые данные объекта. Используется для расчета текстовой близости, основанной на взаимном упоминании объектов в описаниях друг друга.
- Significance Parameter (Параметр значимости объекта)
- Параметр, описывающий важность или популярность объекта. Используется для определения Главной POI.
- Photo Rating (Фоторейтинг)
- Реализация Параметра значимости. Основан на количестве фотографий объекта, найденных в Интернете. Большое количество фотографий свидетельствует об интересе пользователей.
- Heuristic Algorithm (Эвристический алгоритм)
- Алгоритм, применяемый к кластеру связанных POI для определения иерархии (Главная и Второстепенная POI). Может использовать Параметры значимости или предопределенные иерархические наборы терминов (Маркеры значимости слов).
Ключевые утверждения (Анализ Claims)
Патент описывает механизм консолидации отображения информации о связанных объектах для улучшения пользовательского опыта.
Claim 1 (Независимый пункт, Способ): Описывает основной процесс объединения двух POI.
- Получение карточек первой и второй POI (содержат параметры местоположения и описательные параметры).
- Расчет Количественного показателя близости на основе этих параметров.
- Если показатель превышает пороговое значение, инициируется создание Комплексной точки интереса.
- Применение Эвристического алгоритма для определения иерархии (Главная vs Второстепенная POI).
- Присвоение Комплексной точке интереса информации из карточки Главной точки интереса.
Ядро изобретения — автоматизированное определение связи и иерархии для консолидации отображения.
Claim 8, 9, 10 (Зависимые пункты): Детализируют работу Эвристического алгоритма для определения иерархии.
- Claim 8, 9: Алгоритм может использовать Параметр значимости объекта. Конкретная реализация этого параметра — Фоторейтинг. (Более популярный объект вероятнее будет Главным).
- Claim 10: Алгоритм может использовать предварительно запрограммированный набор маркеров значимости слов (иерархические термины, например, Кремль > Собор).
Claim 12 (Зависимый пункт): Детализирует расчет Параметра местоположения.
Параметр определяется с учетом подпараметра географической близости (дистанция) и подпараметра плотности объектов (количество объектов на единицу площади). Это подтверждает адаптивность системы к контексту местности.
Где и как применяется
Изобретение относится к инфраструктуре локального поиска и картографических сервисов Яндекса (Яндекс.Карты, Навигатор, локальные блоки в SERP), а не к стандартному ранжированию веб-документов.
CRAWLING & INDEXING (Сбор данных и Индексация POI)
Процессы происходят на этапе сбора и обработки данных о локальных объектах (офлайн):
- Сбор данных: Получение информации об объектах из открытых источников (Википедия, официальные сайты, соцсети, фотохостинги).
- Приоритизация источников: Оценка авторитетности источников данных (предпочтение отдается энциклопедиям или официальным сайтам).
- Извлечение признаков и Расчет метрик: Генерация Карточек POI и расчет статических параметров, таких как Параметр значимости (Фоторейтинг).
BLENDER – Метапоиск и Смешивание / Генерация SERP (Wizards)
Основное применение происходит на этапе формирования ответа пользователю (отображение карты или локального блока в SERP).
- Когда система получает запрос на отображение POI в определенной области, она извлекает кандидатов.
- Перед отображением запускается процесс кластеризации: рассчитываются Показатели близости и определяется иерархия.
- На этапе рендеринга система отображает Комплексные точки интереса вместо отдельных Второстепенных точек, снижая визуальный шум.
На что влияет
- Конкретные типы контента: Влияет на структурированные данные о физических локациях (POI) — бизнесы, достопримечательности, организации.
- Специфические запросы: Локальные запросы («рестораны рядом», «достопримечательности Москвы»), а также запросы, приводящие к показу карты или списка организаций.
- Конкретные ниши или тематики: Все ниши с физическими точками присутствия. Особенно актуально для объектов, расположенных в комплексных структурах (ТЦ, Бизнес-центры, музейные комплексы).
Когда применяется
- Условия работы: Алгоритм активируется при обработке запросов, результатом которых является список или карта с несколькими POI.
- Триггеры активации: Ключевым триггером является превышение Количественным показателем близости между двумя или более POI установленного порогового значения. Это происходит, когда объекты достаточно близки географически (с учетом плотности) и/или имеют текстовые связи.
Пошаговый алгоритм
Процесс работы системы включает офлайн и онлайн этапы.
Этап А: Подготовка данных (Офлайн/Асинхронно)
- Сбор данных: Получение информации о POI из доступных источников.
- Приоритизация источников: Определение наиболее авторитетного источника для каждого объекта.
- Создание Карточек POI: Извлечение параметров местоположения и описательных параметров.
- Расчет Значимости: Вычисление Параметра значимости (например, Фоторейтинга) путем анализа количества фотографий объекта в Интернете.
- Сохранение: Запись Карточек POI в базу данных.
Этап Б: Обработка запроса и Кластеризация (Онлайн)
- Получение запроса: Получение запроса пользователя на предоставление информации об объектах в определенной области.
- Извлечение кандидатов: Получение множества релевантных Карточек POI из базы данных.
- Расчет Показателя Близости: Для пар объектов рассчитывается Количественный показатель близости. Это включает:
- Географическая близость: Расчет дистанции между объектами.
- Коррекция плотностью: Применение Подпараметра плотности объектов. В зонах с высокой плотностью требования к близости строже.
- Текстовая близость: Анализ описательных параметров на наличие взаимных упоминаний.
- Идентификация Кластеров: Выявление пар/групп объектов, чей Показатель близости превышает пороговое значение.
- Определение Иерархии: Применение Эвристического алгоритма к кластерам для определения Главной и Второстепенных POI. Алгоритм использует:
- Параметры значимости (Фоторейтинг).
- И/или предопределенные иерархические наборы терминов (например, Кремль > Собор).
- Создание Комплексной POI: Формирование новой точки, которая наследует информацию преимущественно из карточки Главной POI, и может быть дополнена данными из Второстепенных POI.
- Генерация Выдачи: Отображение результатов пользователю, где кластер заменен Комплексной POI.
Какие данные и как использует
Данные на входе
- Географические факторы: Географические координаты, адрес объекта. Данные о количестве объектов на территории (для расчета Подпараметра плотности объектов).
- Контентные факторы (Текстовые): Наименование объекта, описание объекта. Эти данные анализируются для выявления текстовой близости (взаимных упоминаний) и для определения иерархии (маркеры значимости слов).
- Мультимедиа факторы: Количество фотографий объекта, найденных в интернете. Используется для расчета Фоторейтинга (Параметра значимости).
- Внешние данные: Информация из открытых источников (Википедия, официальные сайты, специализированные ресурсы). Система оценивает приоритетность этих источников.
- Структурные факторы: Категория объекта (рубрика). Может использоваться при расчете плотности объектов определенной категории и в эвристическом алгоритме.
Какие метрики используются и как они считаются
- Количественный показатель близости: Агрегированная метрика, рассчитываемая с учетом различных параметров (Местоположение и Описание), которым могут быть присвоены различные веса.
- Подпараметр географической близости: Метрика, зависящая от дистанции между объектами. Имеет пороговое значение.
- Подпараметр плотности объектов: Корректирующий коэффициент, зависящий от количества объектов на единицу площади. Обратно пропорционален строгости параметра географической близости (чем выше плотность, тем строже требования к дистанции).
- Параметр текстовой близости: Метрика, рассчитываемая с учетом наличия в тексте описания одного объекта указания на иной объект (кросс-референции).
- Параметр значимости (Фоторейтинг): Рассчитывается на основе количества фотографий объекта в Интернете. Рост рейтинга может быть выражен функцией от количества фотографий.
- Эвристический алгоритм (Определение иерархии): Использует методы машинного обучения (дедуктивное или индуктивное обучение). Включает анализ Параметров значимости и/или сравнение с базой знаний иерархически упорядоченных терминов (маркеров значимости слов).
Выводы
- Консолидация отображения POI: Яндекс активно кластеризует связанные Точки Интереса в Комплексные POI для улучшения UX и снижения визуального шума на картах и в локальной выдаче.
- Многофакторное определение связей: Связь между объектами определяется не только физическим расстоянием. Учитывается плотность объектов в регионе (адаптивность к контексту местности) и, что критически важно для SEO, текстовая близость (взаимные упоминания в описаниях).
- Определение Иерархии Сущностей: Система определяет, какой объект является главным, а какой входит в его состав. Это делается с помощью Эвристического алгоритма, использующего два основных подхода:
- Иерархия типов: Использование предопределенных знаний о типах сущностей (например, ТЦ иерархически выше Магазина).
- Параметр Значимости: Сравнение популярности/важности объектов.
- Фоторейтинг как сигнал значимости: Патент явно описывает Фоторейтинг — метрику значимости, основанную на количестве фотографий объекта в Интернете. Это прямой сигнал популярности, влияющий на иерархию и представление объекта.
- Приоритет источников данных: Яндекс при сборе информации о POI оценивает авторитетность источников, отдавая предпочтение энциклопедиям (Википедия) и официальным сайтам.
Практика
Best practices (это мы делаем)
Рекомендации касаются в первую очередь Local SEO и оптимизации сущностей (Entities) для Яндекс.Карт и Локального поиска.
- Уточнение связей в описаниях (Textual Proximity): Если ваш объект является частью более крупного комплекса (магазин в ТЦ, кафе в БЦ), явно укажите это в описании на официальном сайте и в Яндекс.Бизнесе. Это поможет системе корректно рассчитать текстовую близость и правильно ассоциировать объекты.
- Стимулирование генерации фотоконтента (Photo Rating): Активно работайте над увеличением количества фотографий вашего объекта в Интернете. Загружайте фото в Яндекс.Бизнес, поощряйте пользователей оставлять отзывы с фотографиями, размещайте фото на фотохостингах и в социальных сетях. Высокий Фоторейтинг повышает Параметр значимости, увеличивая шанс стать Главной POI или сохранить отдельную видимость.
- Оптимизация приоритетных источников (Entity Management): Так как Яндекс приоритизирует источники данных (Википедия, официальные сайты), убедитесь, что информация о вашем объекте на этих ресурсах максимально точна, полна и корректно описывает связи с другими объектами.
- Точность геолокационных данных: Обеспечьте абсолютную точность координат и адреса объекта для корректного расчета географической близости.
- Выбор правильной категории (Рубрикация): Используйте максимально точные категории в Яндекс.Бизнесе. Это помогает системе корректно рассчитывать плотность объектов данной категории и применять правильные иерархические правила в Эвристическом алгоритме.
Worst practices (это делать не надо)
- Изолированные описания: Создание описаний объекта без упоминания его контекста или расположения внутри более крупного комплекса (если применимо). Это затрудняет идентификацию текстовых связей.
- Игнорирование фото-присутствия (UGC): Минимальное количество фотографий объекта в сети приведет к низкому Фоторейтингу, из-за чего объект может быть признан Второстепенным по отношению к более популярным соседям.
- Неточные или неоднозначные адреса: Указание адреса, который не позволяет точно определить местоположение относительно соседних объектов или внутри комплекса.
Стратегическое значение
Патент подтверждает стремление Яндекса к глубокому пониманию реального мира: не только идентификации объектов, но и пониманию их взаимосвязей и иерархии. Для Local SEO это означает, что оптимизация не ограничивается заполнением карточки в Яндекс.Бизнесе. Стратегия должна включать управление присутствием сущности в авторитетных источниках (Entity Management) и работу над сигналами реальной популярности (Фоторейтинг). Видимость объекта напрямую зависит от его значимости и корректности его связей с другими объектами в Графе Знаний Яндекса.
Практические примеры
Сценарий 1: Оптимизация магазина в Торговом Центре (ТЦ)
- Задача: Убедиться, что магазин корректно ассоциируется с ТЦ.
- Действия:
- В описании магазина на сайте и в Яндекс.Бизнес добавить фразу: «Магазин расположен на 2 этаже ТЦ». Это усиливает Текстовую близость.
- Убедиться, что на сайте ТЦ (приоритетный источник для ТЦ) магазин указан в списке арендаторов.
- Результат: Система идентифицирует высокую близость. ТЦ определяется как Главная POI (из-за иерархии терминов ТЦ > Магазин). При просмотре карты отображается Комплексная POI «ТЦ», в карточке которой магазин указан как один из объектов внутри.
Сценарий 2: Повышение значимости объекта в плотной застройке
- Задача: Выделить новый ресторан на улице с высокой плотностью заведений (высокий Подпараметр плотности), чтобы он не был скрыт в общем кластере.
- Действия: В условиях высокой плотности основная задача — максимизировать Параметр значимости.
- Реализация: Массированная кампания по генерации фотоконтента в сети (профессиональные фотосессии, работа с фуд-блогерами, конкурсы фото в соцсетях и отзывах на Картах).
- Результат: Фоторейтинг ресторана растет. Высокий параметр значимости повышает вероятность того, что ресторан будет выбран как Главная POI (если кластеризация произойдет) или получит отдельную отметку, выделяясь среди соседей.
Вопросы и ответы
Что такое «Комплексная точка интереса» и зачем она нужна Яндексу?
Комплексная точка интереса (Complex POI) — это единая метка на карте или карточка в локальной выдаче, которая объединяет несколько связанных между собой реальных объектов (POI). Например, вместо отдельных меток для ТЦ и всех магазинов внутри него, система покажет одну метку «ТЦ». Это делается для улучшения UX: разгрузить интерфейс и предоставить пользователю информацию в более компактном виде.
По какому принципу Яндекс решает, какие объекты нужно объединить?
Яндекс рассчитывает «Количественный показатель близости». Он состоит из трех основных компонентов: 1. Географическая близость (физическое расстояние). 2. Плотность объектов в регионе (корректирующий коэффициент – чем выше плотность, тем строже требования к расстоянию). 3. Текстовая близость (упоминают ли объекты друг друга в своих описаниях на сайтах, в Википедии и т.д.).
Если объекты объединили, как Яндекс определяет, какой из них Главный?
Система применяет «Эвристический алгоритм» для определения иерархии. Он использует два основных фактора: 1. Параметр значимости объекта (популярность), который часто рассчитывается как «Фоторейтинг». 2. Маркеры значимости слов — предопределенная иерархия терминов (например, система знает, что «Кремль» иерархически выше, чем «Собор»).
Что такое «Фоторейтинг» и как его улучшить?
Фоторейтинг — это метрика значимости объекта, рассчитываемая на основе количества фотографий объекта, найденных Яндексом в Интернете (включая сайты, соцсети, фотохостинги, отзывы). Для его улучшения необходимо стимулировать генерацию фотоконтента: загружать качественные фото в Яндекс.Бизнес и мотивировать пользователей делать и публиковать фотографии вашего объекта (UGC).
Что такое «Подпараметр плотности объектов» и зачем он нужен?
Это корректирующий коэффициент, который делает систему адаптивной к местности. В районах с низкой плотностью (например, за городом) объекты, расположенные относительно далеко друг от друга, все еще могут считаться связанными. В районах с высокой плотностью (например, центр города) требования к близости становятся намного строже, чтобы избежать неправильной кластеризации независимых объектов, которые просто оказались рядом.
Насколько важны описания на моем сайте и в Википедии для этой системы?
Критически важны. Патент указывает, что система сканирует открытые приоритетные источники (включая Википедию и официальные сайты) и использует их для расчета «Текстовой близости». Если в описании вашего магазина указано, что он находится в конкретном ТЦ, это является сильным сигналом для их ассоциирования. Управление данными во внешних авторитетных источниках (Entity Management) является ключевым элементом работы с этим алгоритмом.
Мой магазин находится в ТЦ. Означает ли это, что у меня не будет своей метки на карте?
Есть высокая вероятность, что при стандартном масштабе карты система предпочтет показать одну Комплексную точку для ТЦ, а ваш магазин будет указан внутри ее карточки. Ваша отдельная метка может появиться при большем увеличении масштаба или при прямом поиске вашего бренда. Это компромисс между полнотой информации и читаемостью карты.
Можно ли предотвратить объединение моего объекта с другими?
Теоретически да, если снизить «Количественный показатель близости» ниже порога. Для этого нужно минимизировать «Текстовую близость» — убрать взаимные упоминания в контролируемых вами источниках. Однако, если географическая близость очень высокая и объекты действительно связаны, предотвратить объединение будет сложно, так как данные из неконтролируемых источников (например, Википедии) все равно будут использованы.
Влияет ли этот патент на ранжирование в основном веб-поиске?
Напрямую нет. Патент сфокусирован на представлении информации о POI в локальном поиске и на картах. Однако косвенное влияние есть: механизмы, описанные в патенте (определение иерархии сущностей, анализ текстовых связей, оценка значимости), являются частью глобальной стратегии Яндекса по пониманию сущностей (Entity Understanding), что важно и для веб-поиска.
Какие действия предпринять, если система некорректно определила Главную точку интереса?
Если ваш объект должен быть главным, но система выбрала другой, необходимо работать над усилением его «Параметра значимости». Во-первых, проверьте и исправьте описания в авторитетных источниках, используя более высокие иерархические термины, если это уместно. Во-вторых, активно работайте над увеличением «Фоторейтинга» вашего объекта, стимулируя публикацию фотографий в сети.