Яндекс использует метод для рекомендации «Областей интереса» (AOI) на картах, основанный на анализе плотности геотегов пользовательских фотографий. Система автоматически определяет границы популярных зон и подбирает их размер в соответствии с временем, которое пользователь готов потратить на прогулку, и способом передвижения.
Описание
Какую задачу решает
Патент решает задачу автоматического обнаружения и рекомендации привлекательных географических зон для исследования (Areas-of-Interest, AOI), особенно в местах, для которых существует мало путеводителей. Он направлен на предоставление объективных рекомендаций, основанных на коллективном поведении пользователей (плотности фотографий). Ключевая техническая проблема, которую решает изобретение, — это необходимость ручной настройки параметров в существующих методах кластеризации (таких как DBSCAN), что приводит к формированию зон сильно различающегося размера, не адаптированных под время пользователя.
Что запатентовано
Запатентована система и метод «беспараметрического» (parameter-free) обнаружения AOI. Суть изобретения заключается в многомасштабном анализе плотности геотегов фотографий и автоматическом выборе оптимального масштаба (размера зон) на основе ограничений пользователя (user defined search constraint), таких как доступное время на прогулку и способ передвижения. Это позволяет рекомендовать зоны, которые можно комфортно исследовать за заданное время.
Как это работает
Система использует геокоординаты фотографий как индикатор привлекательности места. Для определения AOI применяется метод оценки плотности ядра (Kernel Density Estimation, KDE). Ключевой механизм заключается в расчете множества представлений региона (Region Representations), используя разные параметры сглаживания плотности. Каждое представление содержит потенциальные AOI разного размера. Затем система определяет, какой средний размер зоны соответствует времени пользователя (например, за 10 минут пешком можно покрыть 0.1 кв. км), и выбирает то представление (Optimal Region Representation), которое лучше всего соответствует этому размеру. Границы AOI определяются с помощью Watershed Segmentation.
Актуальность для SEO
Средняя/Высокая. Принципы использования UGC (пользовательского контента, в данном случае фотографий) и анализа геоданных для локального поиска остаются крайне актуальными для картографических сервисов (например, Яндекс Карты). Описанные методы (KDE, Watershed Segmentation) являются классическими и эффективными инструментами анализа пространственных данных.
Важность для SEO
Влияние на SEO среднее (6/10). Этот патент имеет критическое значение для Local SEO и видимости бизнеса на Яндекс Картах, но оказывает минимальное влияние на стандартное ранжирование веб-документов. Он раскрывает механизм, с помощью которого Яндекс оценивает привлекательность и определяет границы физических районов на основе активности пользователей. Для локального бизнеса это подчеркивает важность стимулирования UGC (фотографий с геометками) для повышения популярности своей локации.
Детальный разбор
Термины и определения
- Area-of-Interest (AOI) (Область интереса)
- Географическая зона (кластер), обладающая высокой привлекательностью для пользователей. В отличие от POI (Point of Interest), это не точка, а область (например, парк, квартал).
- Density Parameter (Параметр плотности)
- Метрика популярности конкретной AOI, основанная на количестве фотографий, сделанных внутри ее границ. Используется для ранжирования AOI.
- Geo-objects (Гео-объекты)
- Сущности реального мира (здания, памятники, парки), представленные на картах. Фотографии ассоциируются с этими объектами.
- Integral Density (Интегральная плотность)
- Более робастная метрика для ранжирования AOI, которая учитывает не только плотность фотографий внутри зоны, но и плотность в соседних зонах.
- Kernel Density Estimation (KDE) (Оценка плотности ядра)
- Статистический метод для оценки плотности распределения данных. В патенте используется для сглаживания дискретных точек (фотографий) в непрерывную поверхность плотности.
- Optimal Region Representation (Оптимальное представление региона)
- Тот набор AOI (из множества рассчитанных), который лучше всего соответствует ограничениям пользователя (например, по среднему размеру зон).
- Photograph Density Calculation Parameter (‘h’) (Параметр расчета плотности фотографий)
- Параметр сглаживания (bandwidth, обозначаемый как ‘h’ в формуле KDE). Изменение этого параметра влияет на размер и количество обнаруживаемых AOI. Высокое значение ‘h’ дает более гладкое представление с меньшим количеством крупных зон.
- Region Representation (Представление региона)
- Результат сегментации карты на потенциальные AOI при использовании определенного Photograph Density Calculation Parameter.
- User Defined Search Constraint (Пользовательское ограничение поиска)
- Входные данные от пользователя, определяющие параметры рекомендации. В первую очередь, это доступное время (T), а также способ передвижения (пешком, велосипед, авто), текущее время суток или сезон.
- Watershed Segmentation (Сегментация по методу водораздела)
- Алгоритм сегментации, используемый для разделения карты на кластеры (AOI) на основе рассчитанной поверхности плотности (KDE), путем идентификации локальных максимумов.
Ключевые утверждения (Анализ Claims)
Патент фокусируется на методе, который позволяет адаптировать размер рекомендуемых зон под запрос пользователя без необходимости ручной настройки параметров системы.
Claim 1 (Независимый пункт): Описывает основной процесс работы системы.
- Получение запроса пользователя, включающего геолокацию устройства и ограничение поиска (user defined search constraint).
- Получение данных о фотографиях (с геометками), связанных с Geo-objects, вблизи локации пользователя.
- Вычисление множества представлений региона (plurality of region representations). Это ключевой шаг. Каждое представление ассоциировано с уникальным параметром расчета плотности (unique photograph density calculation parameter ‘h’).
- Процесс вычисления включает (пункты i-iv в Claim 1):
- Создание гистограммы (histogram representation) геокоординат фотографий.
- Расчет множества оценок плотности (plurality of density estimations) на основе гистограммы и уникальных параметров ‘h’.
- Разделение (Partitioning/Сегментация) каждой оценки плотности для формирования представлений региона.
- Определение потенциальных AOI в каждом представлении.
- Определение оптимального представления региона (optimal region representation) на основе пользовательского ограничения.
- Отображение рекомендованной AOI.
Система не знает заранее, какой размер кластеров (AOI) нужен пользователю. Вместо того чтобы пытаться настроить один параметр кластеризации, она генерирует множество вариантов кластеризации с разными параметрами сглаживания (h) и затем выбирает тот вариант, который лучше всего подходит под ограничение пользователя (например, время T).
Claim 5 (Зависимый от 4): Уточняет, как определяется оптимальное представление.
Определение оптимального представления включает расчет среднего размера поверхности (average surface size) потенциальных AOI для каждого представления региона.
Если пользователь указал, что у него есть 30 минут на прогулку, система сначала переводит это время в ожидаемую площадь покрытия (S_opt). Затем она сравнивает S_opt со средним размером AOI в каждом из сгенерированных представлений и выбирает то, где разница минимальна.
Claim 4 (Зависимый от 3): Уточняет процесс ранжирования.
Если оптимальное представление содержит несколько AOI, они ранжируются на основе значений параметра плотности (density parameter), который основан на количестве фотографий внутри AOI.
Где и как применяется
Изобретение применяется в рамках инфраструктуры локального поиска и картографических сервисов (например, Яндекс Карты), а не основного веб-поиска.
CRAWLING – Сканирование и Сбор данных
Система собирает данные о фотографиях с геометками из публичных источников (например, фотохостинги, социальные сети, Yandex.Photos) и напрямую с устройств пользователей.
INDEXING – Индексирование (Гео-индекс)
Собранные геоданные (координаты, время, связь с Geo-objects) индексируются для быстрого доступа. На этом этапе могут происходить офлайн-расчеты, такие как предварительный расчет FFT для разных параметров сглаживания (упомянуто в патенте).
QUERY PROCESSING и RANKING (Локальный поиск/Карты)
Применение происходит в момент запроса пользователя на карте или при запросе с локальным исследовательским интентом.
- Входные данные: Геолокация пользователя, User Defined Search Constraint (время T, способ передвижения, сезон/время суток).
- Процесс: Система извлекает геоданные фотографий вокруг пользователя, выполняет многомасштабный анализ плотности (используя KDE и Watershed Segmentation) и выбирает оптимальный масштаб.
- Выходные данные: Набор полигонов на карте, представляющих рекомендованные AOI, отранжированных по популярности (на основе Density Parameter или Integral Density).
На что влияет
- Локальный поиск и Карты: Напрямую влияет на то, как пользователи взаимодействуют с картами при поиске мест для посещения и как оценивается популярность Geo-objects.
- Типы запросов: Наиболее релевантно для запросов с исследовательским интентом («что посмотреть рядом», «где погулять 30 минут»).
- Ниши: Туризм, отдых, HoReCa, локальный бизнес, зависящий от физического трафика.
Когда применяется
- Триггеры активации: Запрос пользователя на рекомендацию зоны для исследования в картографическом приложении или сервисе.
- Условия: Наличие достаточного количества геотегов фотографий в запрашиваемой местности для статистического анализа плотности.
- Дополнительные условия: Система может применять фильтрацию по сезону или времени суток, если пользователь активировал соответствующий режим (Claim 6).
Пошаговый алгоритм
- Сбор данных (Офлайн): Непрерывный сбор и индексация геотегов фотографий из различных источников.
- Получение запроса (Онлайн): Система получает геолокацию пользователя и ограничения (User Defined Search Constraint): время T, способ передвижения (скорость V), сезонность.
- Фильтрация данных: Выборка фотографий вблизи пользователя. Фильтрация по сезону или времени суток, если указано пользователем.
- Расчет целевого размера зоны: Определение оптимального среднего размера поверхности (Optimal Average Surface Size, S_opt) на основе времени T и скорости V (например, пешком V≈5 км/ч).
- Многомасштабный анализ плотности:
- Гистограмма: Наложение сетки (KxK grid) на карту и подсчет количества фотографий в каждой ячейке (Histogram Representation G).
- Оценка плотности (KDE): Расчет множества оценок плотности D(h) для разных значений параметра сглаживания h (Photograph Density Calculation Parameter). Используется Гауссова функция ядра. Расчет оптимизирован через Быстрое Преобразование Фурье (FFT) и теорему о свертке:
$$D(h) = ifft(fft(G) * fft(g(h)))$$
- Сегментация: Применение Watershed Segmentation к каждой оценке плотности D(h) для выделения кластеров (потенциальных AOI). Результат — множество Region Representations.
- Выбор оптимального представления: Для каждого Region Representation рассчитывается средний размер AOI. Выбирается то представление, где средний размер AOI наиболее близок к целевому размеру S_opt. Это и есть Optimal Region Representation.
- Ранжирование AOI: Найденные в оптимальном представлении AOI ранжируются по популярности. Для этого используется Density Parameter (количество фото) или Integral Density.
- Отображение: Вывод отранжированных AOI на карте пользователя.
Какие данные и как использует
Данные на входе
- Географические факторы: Геолокационные координаты (широта/долгота) фотографий. Текущая геолокация пользователя (electronic device geo-location).
- Временные факторы: Временные метки фотографий (используются для фильтрации по сезону или времени суток).
- Пользовательские факторы (Контекст): User Defined Search Constraint (время T). Дополнительные индикаторы: способ передвижения, текущий сезон, текущее время суток.
- Данные о сущностях: Связь фотографий с Geo-objects.
Какие метрики используются и как они считаются
- Histogram Representation (G): Дискретное представление распределения фотографий по ячейкам сетки.
- Photograph Density Calculation Parameter (h): Параметр сглаживания (bandwidth) для KDE. Система перебирает множество значений h.
- Kernel Density Estimation (D(h)): Оценка плотности распределения фотографий. Рассчитывается по формуле с использованием Гауссова ядра (Уравнение 1):
$$D_{i,j}(h)=\frac{1}{N}\sum_{p=1}^{N}\sum_{q=1}^{N}\frac{G_{p,l}}{2\pi h}exp(-\frac{(i-p)^{2}+(j-q)^{2}}{2h^{2}})$$
Для ускорения вычислений используется FFT (Уравнение 2), как описано в алгоритме выше.
- Optimal Average Surface Size (S_opt): Целевой размер зоны, рассчитываемый на основе времени пользователя (T) и скорости передвижения (V).
- Density Parameter / Integral Density: Метрики для ранжирования найденных AOI, основанные на количестве фотографий в зоне и ее окрестностях.
- Алгоритмы кластеризации: Watershed Segmentation применяется для определения границ AOI на основе рассчитанной поверхности плотности D(h).
Выводы
- Плотность фотографий как мера привлекательности: Яндекс использует активность пользователей (количество сделанных фотографий с геометками) как основной сигнал для определения туристической привлекательности физической локации (Geo-objects).
- Фокус на AOI вместо POI: Система нацелена на рекомендацию зон для исследования (Areas of Interest), а не отдельных точек (Points of Interest), что лучше соответствует задаче планирования прогулок.
- Автоматическая адаптация размера зон («Беспараметрический» подход): Ключевой механизм патента — автоматический подбор оптимального масштаба анализа (размера AOI), чтобы он соответствовал времени, которое пользователь готов потратить. Это достигается за счет генерации множества вариантов кластеризации (перебор параметра ‘h’) и выбора наилучшего.
- Важность контекста (Время, Транспорт, Сезон): Система учитывает скорость передвижения пользователя и может фильтровать данные по сезону или времени суток, чтобы повысить релевантность рекомендаций.
- Робастное ранжирование: Ранжирование AOI основано на плотности фотографий, с возможностью использования Integral Density, которая учитывает популярность соседних зон.
Практика
Best practices (это мы делаем)
Хотя патент описывает внутренний механизм картографических сервисов, он имеет прямые последствия для Local SEO и управления репутацией локального бизнеса.
- Стимулирование User Generated Content (UGC): Активно мотивируйте посетителей делать фотографии вашего бизнеса и прилегающей территории и загружать их на Яндекс Карты, в отзывы и на публичные фотохостинги (упомянуты Yandex.Photos, Instagram, Flickr) с точными геометками. Высокая плотность фотографий является прямым сигналом привлекательности зоны (AOI).
- Повышение физической привлекательности локации: Инвестируйте в благоустройство территории, освещение, создание «инстаграмных» зон (фотозон). Чем привлекательнее место визуально, тем больше фотографий делают пользователи, и тем выше вероятность, что система идентифицирует эту зону как AOI.
- Работа с Яндекс Бизнес и Картами: Обеспечьте максимальную заполненность профиля организации и его точное позиционирование. Хотя патент не анализирует содержание фото, наличие актуального профиля на Картах увеличивает взаимодействие пользователей с вашей локацией.
- Учет сезонности: Патент упоминает возможность фильтрации по сезонам и времени суток. Убедитесь, что ваша локация генерирует фотографии круглый год и в разное время дня, или проводите сезонные активности для повышения привлекательности в определенные периоды.
Worst practices (это делать не надо)
- Игнорирование визуальной составляющей в Local SEO: Полагаться только на текстовые описания и отзывы недостаточно. Визуальная активность пользователей напрямую влияет на определение популярных зон.
- Манипуляции с геоданными: Попытки накрутки путем загрузки большого количества фотографий с поддельными геометками или спамных фотографий. Хотя данный патент не описывает механизмы антифрода, такие действия нарушают правила сервисов Яндекса и могут привести к пессимизации.
- Запрет на фотосъемку: Создание препятствий для фотографирования в локации снижает ее видимость для алгоритмов, основанных на плотности фотографий.
Стратегическое значение
Патент подтверждает стратегический приоритет Яндекса на использование поведенческих данных и UGC для понимания физического мира в локальном поиске. Для Local SEO это означает, что популярность и визуальная привлекательность локации являются измеримыми факторами, влияющими на ее видимость в рекомендательных системах и на картах. Долгосрочная стратегия должна включать работу по управлению пользовательским опытом в офлайне для генерации позитивных онлайн-сигналов (фотографий).
Практические примеры
Сценарий: Повышение привлекательности района для нового ресторана
- Задача: Открывается новый ресторан в районе с невысокой туристической активностью. Нужно повысить вероятность того, что эта зона будет рекомендована как AOI.
- Действия:
- Создание яркой входной группы и фотозоны внутри ресторана.
- Проведение конкурса среди посетителей на лучшее фото с геометкой ресторана, загруженное на Яндекс Карты или в публичные соцсети.
- Организация локального мероприятия (например, уличного фестиваля) рядом с рестораном для привлечения людей и генерации большого количества фотографий в короткий срок.
- Ожидаемый результат: Увеличение плотности геотегов фотографий в этой локации. Система Яндекса идентифицирует новый кластер плотности (с помощью KDE и Watershed Segmentation) и начинает рассматривать эту зону как потенциальную AOI для рекомендаций пользователям, ищущим, где провести время поблизости.
Вопросы и ответы
Влияет ли этот патент на ранжирование в органическом веб-поиске Яндекса?
Напрямую нет. Патент описывает метод обнаружения и рекомендации Областей Интереса (AOI) в контексте локального поиска и картографических сервисов (например, Яндекс Карты). Он не затрагивает факторы ранжирования веб-документов. Однако он имеет критическое значение для Local SEO и видимости бизнеса на картах.
Какие источники фотографий использует Яндекс согласно патенту?
В патенте упоминаются различные источники. Это могут быть публичные источники (Public Sources), такие как сервисы обмена фотографиями (Flickr, Instagram, Yandex.Photos) и социальные сети, где пользователи делятся фотографиями с геометками. Также данные могут поступать напрямую с электронных устройств пользователей.
Как система понимает, сколько времени займет прогулка по рекомендованной зоне?
Система адаптирует размер рекомендуемой зоны (AOI) под время, указанное пользователем. Она переводит доступное время (T) и способ передвижения (пешком, велосипед, авто) в ожидаемую площадь покрытия (Optimal Average Surface Size). Затем она выбирает тот масштаб анализа плотности (из множества сгенерированных), при котором средний размер AOI лучше всего соответствует этой площади.
Чем отличается «Area of Interest» (AOI) от «Point of Interest» (POI)?
POI (Точка интереса) — это конкретное место или объект (например, памятник, ресторан). AOI (Область интереса) — это географическая зона, которая содержит несколько привлекательных мест или сама по себе является привлекательной для исследования (например, исторический квартал, парк). Патент фокусируется именно на обнаружении AOI.
Как локальный бизнес может повлиять на то, чтобы его включили в рекомендованную AOI?
Основной сигнал, который использует система, — это плотность геотегов фотографий. Чтобы повысить вероятность включения в AOI, бизнесу необходимо стимулировать пользователей делать и публиковать фотографии своего заведения и прилегающей территории. Создание фотозон, проведение конкурсов и улучшение визуальной привлекательности локации напрямую влияют на этот показатель.
Анализирует ли система содержание фотографий (что на них изображено)?
Согласно тексту патента, нет. Система использует исключительно метаданные: геолокационные координаты и временные метки фотографий. Содержание изображений (объекты, лица и т.д.) в описанном методе не анализируется. Привлекательность определяется только плотностью съемки.
Что означает «беспараметрический» (Parameter-Free) метод в контексте этого патента?
Это означает, что система не требует ручной настройки параметров кластеризации (например, радиуса поиска) для разных городов или условий. Вместо этого система автоматически перебирает множество параметров сглаживания (Photograph Density Calculation Parameter ‘h’) и выбирает оптимальный на основе запроса пользователя. Это делает систему масштабируемой и адаптивной.
Как система ранжирует AOI, если найдено несколько подходящих зон?
Если найдено несколько AOI, соответствующих временным ограничениям пользователя, они ранжируются по популярности. Для этого используется «Параметр плотности» (Density Parameter), основанный на количестве фотографий внутри зоны. Также упоминается более робастная метрика «Интегральная плотность» (Integral Density), учитывающая плотность в соседних зонах.
Учитывает ли система сезонность или время суток при рекомендации?
Да, патент предусматривает такую возможность. Если пользователь указывает текущий сезон или время суток в качестве ограничения, система может отфильтровать исходные данные и использовать только те фотографии, которые были сделаны в аналогичный период. Это позволяет давать более релевантные рекомендации (например, места, популярные для вечерних прогулок).
Что такое Kernel Density Estimation (KDE) и Watershed Segmentation?
KDE (Оценка плотности ядра) — это статистический метод, который позволяет преобразовать набор дискретных точек (фотографий) в непрерывную гладкую поверхность плотности. Watershed Segmentation (Сегментация по методу водораздела) — это алгоритм, который применяется к этой поверхности плотности для определения точных границ областей скопления (AOI), находя локальные пики плотности и разделяя их.