Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс определяет популярность мест (POI) по количеству пользовательских фотографий в интернете для ранжирования на Картах

    SYSTEM AND METHOD OF RANKING POINTS OF INTEREST USING PHOTOGRAPH RATING (Система и метод ранжирования точек интереса с использованием фоторейтинга)
    • WO2016156936A1
    • Yandex LLC
    • 2016-10-06
    • 2015-07-16
    2016 Local SEO Патенты Яндекс Ранжирование Яндекс Карты

    Яндекс патентует метод ранжирования физических локаций (POI) на основе их популярности, измеряемой количеством фотографий объекта в сети. Система использует двухэтапный процесс: сначала идентифицирует фото по метаданным (геотеги, описания), а затем применяет компьютерное зрение (например, SURF) для поиска визуально похожих изображений без метаданных. Общее количество найденных фото формирует рейтинг важности объекта.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу автоматической и объективной оценки популярности физических объектов (Points of Interest, POI), таких как достопримечательности или бизнесы. Это необходимо для улучшения ранжирования в локальном поиске и картографических сервисах. Ключевая техническая проблема, которую решает изобретение — это идентификация и учет фотографий объекта, у которых отсутствуют или неточны метаданные (геотеги, описания), для формирования более полного рейтинга популярности.

    Что запатентовано

    Запатентована система ранжирования POI на основе «Photograph Rating» (Фоторейтинга). Суть изобретения — двухэтапный процесс ассоциации фотографий с объектом для расчета «Importance Coefficient» (Коэффициента важности). Система комбинирует анализ метаданных с технологиями компьютерного зрения (сравнение дескрипторов изображений) для максимизации полноты данных о популярности объекта.

    Как это работает

    Система работает в два этапа. На первом этапе определяются «эталонные» (First Photographs) фотографии. Для этого рассчитывается «Proximity Coefficient» (Коэффициент близости), учитывающий географическую близость геотега фото к координатам POI и текстовое совпадение описаний. Если коэффициент высок, фото связывается с объектом. На втором этапе система ищет дополнительные фотографии (Second Photographs) без четких метаданных. Они сравниваются с эталонными с использованием дескрипторов изображения (упоминаются SURF). При высоком визуальном сходстве они также ассоциируются с объектом. Итоговый Importance Coefficient рассчитывается на основе общего числа найденных фото. Также предусмотрен механизм дисконтирования (Reduction Coefficient) для фотографий от одного автора.

    Актуальность для SEO

    Высокая. Оценка популярности локальных сущностей с помощью анализа пользовательского контента (UGC) и применение компьютерного зрения для идентификации объектов являются ключевыми направлениями развития современных картографических сервисов и систем локального поиска (Яндекс Карты).

    Важность для SEO

    Влияние на SEO значительно (7.5/10), но строго в контексте Local SEO и продвижения на картах. Патент не влияет на ранжирование веб-документов, но описывает конкретный механизм, как визуальный контент в интернете напрямую влияет на расчет важности (Importance Coefficient) и, следовательно, на видимость физического объекта в локальной выдаче. Это критически важно для офлайн-бизнесов и достопримечательностей.

    Детальный разбор

    Термины и определения

    Description Parameter (Параметр описания)
    Текстовые данные, связанные с POI (название, описание) или с фотографией (имя файла, подпись к фото, alt-текст, окружающий текст на веб-странице).
    First Photograph (Первая фотография / Эталонная фотография)
    Фотография, надежно идентифицированная как относящаяся к POI на основе анализа метаданных (Этап 1). Служит эталоном для визуального сравнения.
    Image Descriptors / SURF (Дескрипторы изображения)
    Численные представления визуальных характеристик изображения. В патенте упоминается метод SURF (Speeded Up Robust Features), устойчивый к изменениям масштаба, ракурса и освещения.
    Importance Coefficient (Коэффициент важности)
    Итоговая метрика популярности POI, рассчитанная на основе общего количества ассоциированных с ним фотографий. Используется для ранжирования.
    Location Parameter (Параметр местоположения)
    Географические данные. Для POI это координаты или адрес. Для фотографии это геотег (координаты места съемки).
    Photographer Identifier (Идентификатор фотографа)
    Данные, позволяющие определить автора фотографии (например, из EXIF или профиля на сайте). Используется для предотвращения накруток.
    Point of Interest (POI, Точка интереса)
    Физический объект (достопримечательность, бизнес), имеющий координаты и представленный на карте.
    Proximity Coefficient (Коэффициент близости)
    Метрика, показывающая вероятность того, что фотография изображает данный POI. Рассчитывается на основе сравнения Location и Description параметров фотографии и POI.
    Reduction Coefficient (Понижающий коэффициент)
    Коэффициент, применяемый при расчете Importance Coefficient для снижения веса фотографий, если один автор загрузил их слишком много. Служит для борьбы со спамом и предвзятостью.
    Second Photograph (Вторая фотография)
    Фотография, у которой нет подтвержденной связи с POI по метаданным, но которая ассоциирована с POI благодаря визуальному сходству с First Photograph (Этап 2).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод ранжирования POI, состоящий из двух этапов определения популярности и финального ранжирования.

    Этап 1: Определение популярности (Идентификация эталонов).

    1. Система получает параметры POI (локация, описание).
    2. Получение First Photograph с ее параметрами.
    3. Расчет Proximity Coefficient путем сравнения параметров фото и POI (географическая близость + текстовое сходство).
    4. Если коэффициент превышает порог, фотография ассоциируется с POI и становится эталоном.

    Это формирование надежного набора данных (seed set), основанного на верифицируемых метаданных.

    Этап 2: Определение популярности (Визуальное расширение).

    1. Получение Second Photograph, у которой нет подтвержденной связи с POI (т.е. Proximity Coefficient низкий, метаданные отсутствуют или не совпадают).
    2. Определение индикатора визуального сходства между Second и First Photograph с использованием Image Descriptors (например, SURF).
    3. Если сходство превышает порог, Second Photograph также ассоциируется с POI.

    Это ядро изобретения, позволяющее использовать компьютерное зрение для значительного увеличения полноты данных о фотографиях объекта.

    Этап 3: Ранжирование.

    1. Расчет Importance Coefficient для POI на основе общего количества ассоциированных фотографий (First + Second).
    2. Сравнение коэффициентов разных POI. POI с более высоким коэффициентом получает более высокий рейтинг.

    Claim 11 (Зависимый пункт): Уточняет расчет Importance Coefficient для борьбы с накрутками и предвзятостью.

    Если у фотографий есть Photographer Identifier, и количество фотографий от одного автора превышает заданное значение, при расчете Importance Coefficient применяется Reduction Coefficient. Вес большого количества фотографий от одного человека снижается для обеспечения объективности рейтинга.

    Где и как применяется

    Изобретение применяется в инфраструктуре локального поиска и картографических сервисов (например, Яндекс.Карты).

    CRAWLING – Сканирование и Сбор данных
    Система сканирует публичные источники в интернете (веб-сайты, соцсети, фотохостинги, сайты отзывов) для сбора фотографий и их метаданных (геотеги, текст, данные об авторе).

    INDEXING – Индексирование и извлечение признаков
    Основная часть алгоритма выполняется на этом этапе в режиме офлайн-обработки:

    • Извлечение метаданных и вычисление визуальных дескрипторов (SURF) для фотографий.
    • Выполнение двухэтапного процесса ассоциации фотографий с POI.
    • Расчет Importance Coefficient для каждого POI и сохранение его в индексе как статического фактора популярности.

    RANKING – Ранжирование (Локальный поиск/Карты)
    При обработке локального запроса пользователя или при отрисовке карты, система использует предварительно рассчитанный Importance Coefficient как один из ключевых факторов ранжирования POI. Также он может использоваться для фильтрации: при высокой плотности объектов на карте приоритет отдается POI с высоким коэффициентом.

    На что влияет

    • Конкретные типы контента: Влияет исключительно на ранжирование Точек Интереса (POI) — физических объектов (рестораны, магазины, памятники). Не влияет на ранжирование веб-документов в основном поиске.
    • Специфические запросы: Влияет на локальные запросы (коммерческие, навигационные, информационные, связанные с поиском мест).
    • Конкретные ниши: Имеет высокое значение для тематик с высокой визуальной составляющей и активным UGC: туризм, HoReCa (отели, рестораны, кафе), ритейл, развлечения.

    Когда применяется

    • Вычисление рейтинга: Происходит в офлайн-режиме по мере обновления базы фотографий и данных о POI.
    • Применение рейтинга: В реальном времени при обработке локальных запросов пользователей.
    • Условия активации: Этап 2 (визуальное сравнение) активируется только при наличии эталонного набора (First Photographs), найденного на Этапе 1.

    Пошаговый алгоритм

    Процесс А: Ассоциация фотографий и расчет популярности POI (Офлайн)

    1. Подготовка данных: Сбор данных о POI (координаты, название) и фотографий из интернета (изображение, геотеги, подписи, идентификаторы авторов). Расчет визуальных дескрипторов (SURF) для фото.
    2. Этап 1: Идентификация эталонов (Seed Identification).
      1. Расчет Proximity Coefficient между фотографией и POI.
      2. Проверка географического расстояния. В описании патента упоминается, что если расстояние превышает максимум (например, 450 метров), коэффициент может быть обнулен.
      3. Анализ текстового сходства описаний.
      4. Если коэффициент превышает порог, фотография помечается как «First Photograph» и ассоциируется с POI.
    3. Этап 2: Визуальное расширение (Visual Association).
      1. Фотографии, не ассоциированные на Этапе 1 («Second Photographs»), сравниваются с эталонным набором (First Photographs).
      2. Сравнение происходит с использованием визуальных дескрипторов (SURF) для определения индикатора сходства.
      3. Если сходство превышает порог, фотография также ассоциируется с POI.
    4. Расчет Коэффициента Важности (Importance Coefficient).
      1. Агрегация: Подсчет общего количества ассоциированных фотографий.
      2. Корректировка (Анти-фрод): Анализ Идентификаторов фотографов. Если количество фото от одного автора превышает порог, применяется Reduction Coefficient. В описании патента приводится пример: первые 10 фото с весом 1, следующие 10 с весом 0.75 и т.д.
      3. Финализация: Расчет и сохранение Importance Coefficient для POI.

    Процесс Б: Ранжирование (Онлайн)

    1. При получении локального запроса система использует Importance Coefficient как фактор ранжирования. POI с более высокими коэффициентами получают приоритет.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы (Текстовые):
      • Для POI: Название, описание.
      • Для фотографий: Подписи, имена файлов, alt-тексты, окружающий текст на странице. Используются на Этапе 1.
    • Мультимедиа факторы (Визуальные):
      • Изображения фотографий, используемые для расчета дескрипторов SURF. Используются на Этапе 2.
    • Географические факторы:
      • Для POI: Координаты, адрес.
      • Для фотографий: Геотеги (EXIF GPS data). Используются на Этапе 1.
    • Пользовательские факторы:
      • Идентификатор фотографа (Photographer Identifier). Используется для применения Reduction Coefficient.

    Какие метрики используются и как они считаются

    • Proximity Coefficient: Агрегированная метрика. В патенте указано, что она прямо пропорциональна качеству и количеству текстовых совпадений и обратно пропорциональна географическому расстоянию между фото и POI.
    • Индикатор визуального сходства: Рассчитывается путем сравнения SURF дескрипторов двух изображений. Это метод компьютерного зрения, устойчивый к изменениям масштаба и ракурса.
    • Importance Coefficient: Финальная метрика популярности. Рассчитывается как взвешенная сумма всех ассоциированных фотографий после применения Reduction Coefficient для нормализации вклада отдельных авторов.

    Выводы

    1. Количество фотографий = Популярность POI: Яндекс использует количество публичных фотографий объекта в интернете как прямой сигнал его популярности (Importance Coefficient) для ранжирования в локальном поиске и на картах.
    2. Гибридная идентификация (Метаданные + CV): Ключевым является двухэтапный процесс. Надежная идентификация по метаданным (Этап 1) формирует эталонный набор, который затем используется технологиями компьютерного зрения (Этап 2) для поиска фотографий без метаданных.
    3. Критичность Этапа 1: Чтобы система начала распознавать объект визуально, необходимо наличие хотя бы нескольких фотографий с четкими метаданными (геотег и/или описание), которые сформируют эталонный набор.
    4. Защита от накруток (Анти-фрод): Система активно борется с манипуляциями. Массовая загрузка фотографий одним пользователем пессимизируется с помощью Reduction Coefficient. Важно разнообразие авторов.
    5. UGC как фактор Local SEO: Патент подтверждает, что пользовательский визуальный контент (фотографии), размещенный на любых публичных ресурсах, напрямую влияет на видимость локальных сущностей в Яндексе.

    Практика

    Best practices (это мы делаем)

    Рекомендации касаются исключительно Local SEO и продвижения физических локаций.

    • Стимулирование разнообразного UGC: Активно мотивируйте реальных посетителей делать фотографии вашего объекта (интерьер, экстерьер, продукция) и публиковать их в интернете (соцсети, сайты отзывов, блоги). Фокусируйтесь на разнообразии авторов, чтобы избежать применения Reduction Coefficient.
    • Оптимизация метаданных (для Этапа 1): Поощряйте пользователей использовать геолокацию и упоминать название вашего заведения в подписях. Это увеличит количество эталонных фотографий (First Photographs) и улучшит точность всего процесса.
    • Оптимизация собственных фото: При публикации официальных фото на сайте или в соцсетях добавляйте геотеги (EXIF GPS) и четкие текстовые описания (включая Alt-текст). Это поможет им стать эталонами.
    • Создание «фотогеничных» зон: Оформляйте интерьер или фасад так, чтобы у посетителей возникало желание фотографироваться. Уникальные визуальные элементы помогут системе компьютерного зрения (Этап 2) лучше идентифицировать объект на разных фото.

    Worst practices (это делать не надо)

    • Накрутка фотографий одним пользователем: Массовая загрузка фотографий с одного аккаунта неэффективна. Система определит это по Photographer Identifier и применит Reduction Coefficient (Claim 11).
    • Использование стоковых фото: Загрузка нерелевантных или стоковых изображений не принесет пользы, так как они не будут визуально похожи на реальные фотографии объекта, сделанные пользователями.
    • Игнорирование визуального присутствия: Отсутствие работы над увеличением количества реальных фотографий бизнеса в интернете снижает Importance Coefficient и ухудшает локальное ранжирование.

    Стратегическое значение

    Патент демонстрирует стратегию Яндекса по интеграции технологий компьютерного зрения и анализа больших данных UGC для оценки качества и популярности физических объектов. Для Local SEO это означает, что сигналы из реального мира (активность пользователей, выраженная в фотографиях) становятся критически важным фактором ранжирования. Стратегия должна фокусироваться на стимулировании естественной генерации визуального контента клиентами.

    Практические примеры

    Сценарий 1: Повышение рейтинга ресторана через UGC

    1. Задача: Повысить видимость ресторана в Яндекс Картах.
    2. Действия (Этап 1): Проведение конкурса в соцсетях: публикация фото из ресторана с геометкой и хэштегом (названием).
    3. Результат Этапа 1: Яндекс индексирует эти фото. Они получают высокий Proximity Coefficient и становятся эталонами (First Photographs).
    4. Действия (Этап 2): Другие гости делают фото интерьера, но публикуют их без меток с подписью «Отличный вечер».
    5. Результат Этапа 2: Яндекс сравнивает эти фото с эталонами (Этап 1). Алгоритм SURF определяет визуальное сходство. Эти фото (Second Photographs) также ассоциируются с рестораном.
    6. Итог: Importance Coefficient растет, улучшая ранжирование ресторана.

    Сценарий 2: Демонстрация работы Reduction Coefficient

    1. Задача: Владелец пытается накрутить рейтинг.
    2. Действия: Владелец загружает 100 фотографий своего магазина с одного аккаунта на сайт отзывов.
    3. Работа алгоритма: Яндекс ассоциирует фото с магазином, но идентифицирует, что все они имеют одинаковый Photographer Identifier. Применяется Reduction Coefficient (например, после 10-го фото вес снижается).
    4. Итог: Вклад этих 100 фотографий в Importance Coefficient оказывается значительно меньше, чем если бы это были 100 фото от разных клиентов.

    Вопросы и ответы

    Этот патент влияет на ранжирование моего сайта в основном поиске Яндекса?

    Нет, прямого влияния нет. Патент описывает механизм ранжирования физических объектов (Points of Interest, POI), а не веб-страниц. Он применяется для определения популярности мест на Яндекс.Картах и в локальной поисковой выдаче, но не влияет на ранжирование веб-сайтов в основном поиске.

    Что такое Importance Coefficient и как он рассчитывается?

    Importance Coefficient (Коэффициент важности) — это рейтинг популярности физического объекта. Он рассчитывается на основе общего количества фотографий этого объекта, найденных Яндексом в интернете. Учитываются как фото с метаданными, так и фото, идентифицированные визуально. При этом система снижает вес фотографий, если их слишком много загружено одним пользователем.

    Как система понимает, что на фото именно мое заведение, если нет геотега?

    Это происходит на втором этапе анализа. Если система уже нашла эталонные фотографии вашего заведения (с геотегом или четким описанием), она использует компьютерное зрение (например, алгоритм SURF), чтобы сравнить фотографию без тегов с эталонными. Если визуальное сходство велико (узнаваем интерьер или фасад), фото связывается с вашим заведением.

    Могу ли я накрутить этот рейтинг, если попрошу сотрудников загрузить много фото?

    Это будет неэффективно. В патенте предусмотрена защита от таких манипуляций (Claim 11). Система анализирует идентификатор фотографа. Если она обнаружит, что слишком много фотографий загружено одним пользователем, она применит понижающий коэффициент (Reduction Coefficient), и вклад этих фотографий в рейтинг будет снижен.

    Что такое SURF дескрипторы?

    SURF (Speeded Up Robust Features) — это алгоритм компьютерного зрения, который находит ключевые визуальные особенности на изображении. Он позволяет сравнивать изображения независимо от масштаба, ориентации и освещения. Яндекс использует его, чтобы понять, что на двух разных фотографиях изображен один и тот же объект.

    Что важнее для системы на первом этапе: точный геотег или правильное описание фото?

    Оба компонента важны для расчета Коэффициента близости (Proximity Coefficient). Система учитывает как географическую близость (в описании патента упоминается пример порога 450м), так и совпадение значимых слов в тексте. Комбинация этих факторов позволяет надежно идентифицировать эталонную фотографию.

    Как мне использовать этот патент для улучшения позиций в Local SEO?

    Ключевая стратегия — стимулировать естественную генерацию визуального UGC от разных авторов. Проводите акции за фотоотзывы в соцсетях и на картах, создавайте фотогеничные зоны в заведении. Цель — максимизировать количество реальных фотографий вашего бизнеса в интернете, опубликованных разными людьми.

    Из каких источников Яндекс берет фотографии для этого анализа?

    В патенте упоминаются публичные источники данных (Public Data Sources). Это включает любые доступные для сканирования ресурсы в интернете: веб-сайты, социальные сети, фотохостинги, сайты отзывов, блоги, а также фотографии, загруженные пользователями напрямую в сервисы Яндекса.

    Влияет ли качество или содержание фотографий на этот рейтинг?

    Согласно патенту, учитывается факт идентификации объекта и количество фотографий, а не их эстетическое качество или содержание (например, позитивное оно или негативное). Система использует фотографии для оценки интереса к объекту (популярности), а не качества услуг. Однако четкие фото лучше распознаются алгоритмами CV.

    Стоит ли добавлять GPS-данные в EXIF фотографий на сайте компании?

    Да, для Local SEO это полезная практика. Наличие корректных геотегов и релевантной информации в метаданных фотографий на вашем сайте может помочь Яндексу идентифицировать их как «First Photographs» (эталоны) на первом этапе анализа, что улучшит общую точность распознавания вашего объекта.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.