Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует гео-кластеризацию и визуальный анализ изображений для распознавания и определения популярности достопримечательностей

    AUTOMATIC DISCOVERY OF POPULAR LANDMARKS (Автоматическое обнаружение популярных достопримечательностей)
    • US10289643B2
    • Google LLC
    • 2019-05-14
    • 2008-05-12
    2008 Knowledge Graph Local SEO Мультимедиа Патенты Google

    Google использует двухэтапный процесс для автоматического создания базы данных достопримечательностей из больших коллекций изображений. Сначала изображения группируются по географической близости (гео-кластеризация), а затем внутри этих групп они кластеризуются по визуальному сходству (визуальная кластеризация). Это позволяет системе идентифицировать конкретные объекты, оценивать их популярность по количеству фотографий и уникальных авторов, улучшать понимание запросов и автоматически аннотировать новые изображения.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему организации и анализа больших неструктурированных коллекций цифровых изображений (например, доступных в Интернете) для автоматического извлечения информации о популярных объектах и достопримечательностях (landmarks). Он устраняет необходимость ручной разметки и классификации, предлагая автоматизированный метод для идентификации, аннотирования и определения популярности объектов на основе анализа геотегов и визуального содержания изображений.

    Что запатентовано

    Запатентована система и метод для автоматического создания и обновления базы данных изображений достопримечательностей (Landmark database). Основной механизм включает двухэтапную кластеризацию: geo-clustering (группировка изображений по географической близости) и последующую visual-clustering (группировка по визуальному сходству объектов на изображениях). Также запатентованы методы использования этой базы для улучшения поисковых запросов пользователей и автоматического аннотирования новых изображений.

    Как это работает

    Система обрабатывает корпус гео-тегов изображений (Geo-tagged image corpus). Ключевые этапы работы:

    • Гео-кластеризация: Изображения группируются в geo-clusters на основе их географических координат и заданного радиуса. Кластеры могут валидироваться по популярности (например, по минимальному числу уникальных пользователей, загрузивших фото).
    • Визуальная кластеризация: Внутри каждого гео-кластера изображения анализируются на предмет визуального сходства. Используются методы распознавания объектов и сравнения векторов признаков. Строится граф соответствия регионов (match-region graph), на основе которого формируются visual clusters, объединяющие изображения одного и того же объекта.
    • Оценка популярности: Модуль популярности (Popularity module) рассчитывает popularity score для кластеров, например, на основе количества изображений и уникальных авторов.
    • Применение: База данных используется для дополнения запросов пользователя (например, запрос «Париж» дополняется тегом «Эйфелева башня») и для автоматического тегирования новых загружаемых изображений.

    Актуальность для SEO

    Высокая. Распознавание объектов на изображениях, использование гео-данных и понимание сущностей (включая достопримечательности и локации) являются критически важными компонентами современного поиска, особенно в Image Search, Google Maps и Local Search. Методы, описанные в патенте, лежат в основе того, как Google идентифицирует и каталогизирует физический мир через пользовательский контент.

    Важность для SEO

    Патент имеет высокое значение (85/100) для SEO, особенно для оптимизации изображений, локального поиска и работы с сущностями. Он раскрывает механизмы, с помощью которых Google использует визуальные данные и геотеги для идентификации объектов и оценки их популярности. Понимание этих процессов критически важно для стратегий, направленных на улучшение видимости контента, связанного с конкретными локациями или физическими объектами (товарами, местами).

    Детальный разбор

    Термины и определения

    Geo-tagged image corpus (Корпус гео-тегов изображений)
    Большая коллекция цифровых изображений, каждое из которых имеет ассоциированные географические метаданные (геотеги).
    Landmark database (База данных достопримечательностей)
    Хранилище, содержащее идентифицированные достопримечательности, связанные с ними визуальные кластеры, изображения, шаблоны признаков, метаданные (геокоординаты, время, информация о пользователе) и текстовые метки.
    Geo-clustering (Гео-кластеризация)
    Процесс группировки гео-тегов изображений на основе их географической близости (например, в пределах определенного радиуса) для создания geo-clusters.
    Visual-clustering (Визуальная кластеризация)
    Процесс группировки изображений внутри гео-кластера на основе визуального сходства для создания visual clusters. Цель – объединить изображения одного и того же объекта.
    Geo-cluster (Гео-кластер)
    Группа изображений, сделанных в географической близости друг от друга.
    Visual cluster (Визуальный кластер)
    Группа изображений, которые система идентифицировала как содержащие один и тот же объект или достопримечательность.
    Popularity module (Модуль популярности)
    Компонент системы, который вычисляет popularity score для визуальных кластеров.
    Popularity score (Оценка популярности)
    Метрика, определяющая популярность достопримечательности. Может основываться на общем количестве изображений в кластере и/или количестве уникальных пользователей (авторов), предоставивших изображения.
    Match-region graph (Граф соответствия регионов)
    Структура данных, используемая при визуальной кластеризации. Узлы представляют изображения (или регионы изображений), а связи указывают на визуальное соответствие между ними.
    Trigger words (Триггерные слова)
    Слова в запросе пользователя (например, названия городов), которые инициируют поиск связанных тегов в базе данных достопримечательностей для дополнения запроса.
    Supplemented user query (Дополненный запрос пользователя)
    Исходный запрос пользователя, расширенный тегами, извлеченными из базы данных достопримечательностей.

    Ключевые утверждения (Анализ Claims)

    Данный патент (US10289643B2) является патентом-продолжением (continuation patent). Его Claims сосредоточены не столько на первичном создании базы данных (описанном в основной части патента), сколько на использовании этой базы для улучшения запросов и механизмах пользовательского интерфейса для кураторства данных.

    Claim 1 (Независимый пункт): Описывает метод, сочетающий дополнение запроса и ручное кураторство кластеров.

    1. Система получает запрос пользователя.
    2. Идентифицирует в нем trigger words.
    3. Выбирает соответствующие теги из landmark database.
    4. Дополняет запрос этими тегами, создавая supplemented user query, описывающий достопримечательность.
    5. На основе дополненного запроса идентифицирует набор visual clusters, связанных с этой достопримечательностью.
    6. Отображает пользовательский интерфейс (UI), включающий эти визуальные кластеры.
    7. Получает ввод от пользователя, указывающий, что первый и второй визуальные кластеры должны быть объединены.
    8. В ответ на ввод обновляет landmark database, объединяя эти два кластера.

    Claim 8 (Независимый пункт): Описывает систему, реализующую логику, аналогичную Claim 1 (дополнение запроса и последующее объединение кластеров через UI).

    Claim 15 (Независимый пункт): Описывает компьютерно-читаемый носитель с инструкциями для реализации логики, аналогичной Claim 1.

    Где и как применяется

    Изобретение затрагивает несколько этапов поисковой архитектуры, от сбора данных до понимания запросов.

    CRAWLING – Сканирование и Сбор данных
    Система требует доступа к большому корпусу цифровых изображений (Geo-tagged image corpus). Это подразумевает сканирование и сбор изображений и связанных с ними метаданных (в частности, геотегов и идентификаторов пользователей) из интернета или других источников.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит основная обработка данных для построения Landmark database:

    • Извлечение признаков: Извлечение гео-координат, временных меток, данных пользователя (EXIF).
    • Визуальный анализ: Распознавание объектов, генерация векторов визуальных признаков (feature vectors) для сравнения изображений.
    • Кластеризация (Офлайн): Выполнение Geo-clustering и Visual-clustering для идентификации достопримечательностей и построения базы данных.
    • Расчет популярности: Вычисление Popularity score для идентифицированных сущностей.

    QUNDERSTANDING – Понимание Запросов
    Одно из ключевых применений, описанных в Claims. Система использует Landmark database в реальном времени для интерпретации и улучшения запросов:

    • Идентификация trigger words (например, локаций).
    • Дополнение запроса (Query Supplementation) конкретными тегами достопримечательностей для уточнения интента.

    RANKING / METASEARCH (Image Search)
    Хотя патент явно не фокусируется на ранжировании, созданная база данных и улучшенное понимание запросов напрямую влияют на релевантность и качество результатов в поиске по картинкам. Идентификация популярных достопримечательностей может использоваться как сигнал ранжирования.

    Входные данные:

    • Корпус гео-тегов изображений (изображения, геолокация, метаданные, ID пользователя).
    • Запросы пользователей (для функции дополнения запросов).
    • Новые изображения (для функции автоматического тегирования).

    Выходные данные:

    • Landmark database (визуальные кластеры, оценки популярности, теги).
    • Supplemented user queries.
    • Автоматически сгенерированные теги для новых изображений.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на цифровые изображения с гео-метаданными.
    • Специфические запросы: Влияет на запросы, связанные с локациями (названия городов, регионов) и конкретными достопримечательностями. Система улучшает обработку как широких (e.g., «фотографии Парижа»), так и конкретных запросов.
    • Конкретные ниши или тематики: Наибольшее влияние в тематиках путешествий, туризма, недвижимости, локального бизнеса (если концепция «landmark» трактуется шире).

    Когда применяется

    Процесс создания базы данных (Офлайн):

    • Применяется периодически для обработки новых изображений и обновления Landmark database (инкрементальное обновление).
    • Триггеры активации (Geo-clustering): Наличие достаточного количества изображений в определенном географическом радиусе.
    • Пороговые значения (Валидация): Гео-кластер обрабатывается дальше, если он соответствует критериям популярности (например, превышен порог по количеству уникальных авторов).

    Процесс использования базы данных (Онлайн):

    • Дополнение запроса: Активируется, когда в запросе пользователя обнаружены trigger words, для которых есть соответствия в Landmark database.
    • Автоматическое тегирование: Активируется при загрузке нового изображения, если оно визуально соответствует одному из кластеров в базе.

    Пошаговый алгоритм

    Патент описывает несколько взаимосвязанных процессов.

    Процесс А: Создание базы данных достопримечательностей

    1. Сбор данных: Получение доступа к корпусу гео-тегов изображений.
    2. Гео-кластеризация:
      1. Создание гео-кластеров: Для каждого изображения вычисляется расстояние до существующих кластеров. Если расстояние в пределах заданного радиуса, изображение добавляется в кластер. Если нет – создается новый кластер.
      2. Валидация гео-кластеров: Кластеры проверяются на соответствие критериям (например, минимальное число уникальных пользователей). Нерелевантные кластеры отфильтровываются.
    3. Визуальная кластеризация (для каждого валидного гео-кластера):
      1. Индексация и извлечение признаков: Создание индекса изображений в кластере, извлечение визуальных признаков и генерация векторов признаков.
      2. Сравнение изображений: Попарное сравнение всех изображений в гео-кластере с использованием векторов признаков для идентификации совпадений.
      3. Построение графа: Создание match-region graph, где узлы – это изображения, а связи – это совпадения.
      4. Кластеризация графа: Идентификация связанных поддеревьев в графе (после удаления слабых связей). Эти поддеревья формируют visual clusters.
    4. Расчет популярности: Вычисление popularity score для каждого визуального кластера (например, по числу уникальных авторов).
    5. Сохранение данных: Сохранение визуальных кластеров, репрезентативных изображений, тегов и оценок популярности в Landmark database.

    Процесс Б: Дополнение поискового запроса (Онлайн)

    1. Получение запроса: Система получает запрос от пользователя.
    2. Идентификация триггеров: Парсинг запроса для поиска предопределенных trigger words (например, названий локаций).
    3. Поиск в базе данных: Поиск в Landmark database для идентификации тегов (названий достопримечательностей), связанных с триггерными словами.
    4. Дополнение запроса: Генерация supplemented user query путем добавления найденных тегов к исходному запросу.

    Процесс В: Автоматическое тегирование изображений (Онлайн)

    1. Получение изображения: Система получает новое изображение.
    2. Сравнение: Новое изображение сравнивается (визуально) с изображениями или шаблонами в Landmark database.
    3. Выбор тегов: Если найдено совпадение с визуальным кластером, система выбирает теги, ассоциированные с этим кластером.
    4. Тегирование: Присвоение выбранных тегов новому изображению.

    Какие данные и как использует

    Данные на входе

    Система использует несколько ключевых типов данных для идентификации достопримечательностей:

    • Географические факторы (Критически важно): Гео-теги изображений (координаты). Используются для первичной Geo-clustering.
    • Мультимедиа факторы (Критически важно): Визуальное содержание изображений. Используется для Visual-clustering. Система анализирует пиксели для распознавания объектов и генерации векторов признаков.
    • Пользовательские факторы: Идентификаторы пользователей (авторов изображений). Используются для валидации гео-кластеров и расчета Popularity score (определение уникальных авторов).
    • Контентные факторы (Вспомогательно): Существующие текстовые метки (теги), присвоенные изображениям. Могут использоваться для генерации меток для всего кластера и как критерий при кластеризации (согласованность меток).
    • Временные факторы: Время создания изображения (метаданные). Может использоваться при анализе и хранении данных.

    Какие метрики используются и как они считаются

    • Географическое расстояние: Используется для определения принадлежности изображения к гео-кластеру. Сравнивается с предопределенным параметром радиуса.
    • Визуальное сходство (Feature Vector Comparison): Метрика для определения совпадения между двумя изображениями. Основана на сравнении векторов признаков, извлеченных из изображений. Используются конфигурируемые числовые пороги для классификации пары как совпадающей.
    • Сила связи (Link Strength) в графе: Метрика, определяющая надежность связи между узлами в match-region graph. Слабые связи (например, с числом совпадающих признаков ниже порога) удаляются при формировании визуальных кластеров.
    • Количество уникальных пользователей: Метрика для валидации гео-кластеров (фильтрация непопулярных мест) и для расчета популярности.
    • Popularity Score: Агрегированная метрика популярности визуального кластера. Рассчитывается на основе одного или нескольких параметров: общее количество изображений, количество уникальных авторов, количество изображений в пределах определенного радиуса от центра кластера.

    Выводы

    1. Автоматизированное распознавание сущностей физического мира: Патент описывает масштабируемую систему для идентификации реальных объектов (достопримечательностей) без ручного вмешательства. Google активно использует комбинацию гео-сигналов и визуального анализа для понимания содержания изображений и их контекста.
    2. Двухэтапная кластеризация для повышения эффективности: Использование Geo-clustering в качестве первого шага значительно сокращает вычислительную сложность, позволяя проводить дорогостоящий визуальный анализ только на географически связанных наборах данных.
    3. Популярность как ключевая метрика: Система не просто идентифицирует объекты, но и определяет их популярность (Popularity Score). Критерий количества уникальных фотографов используется для фильтрации шума (например, частных фотографий) и фокусировки на общественно значимых объектах. Это может быть важным сигналом для ранжирования.
    4. Визуальное сходство для определения идентичности: Visual-clustering позволяет системе понять, как выглядит объект с разных ракурсов, при разном освещении и расстоянии. Это формирует визуальное представление сущности.
    5. Улучшение понимания запросов через дополнение: Идентифицированные достопримечательности используются для расширения и уточнения запросов пользователей (Query Supplementation). Если пользователь ищет локацию, Google может неявно добавить в запрос популярные объекты из этой локации.
    6. Автоматическая аннотация контента: Система способна автоматически присваивать семантические теги новым изображениям, если они визуально соответствуют известным достопримечательностям.

    Практика

    Best practices (это мы делаем)

    • Оптимизация изображений с гео-контекстом: Для сайтов о путешествиях, локального бизнеса, недвижимости критически важно использовать качественные изображения с корректными гео-метаданными (EXIF GPS). Это увеличивает вероятность попадания изображений в Geo-tagged image corpus и их корректной кластеризации.
    • Стимулирование пользовательского контента (UGC) с гео-тегами: Для локального бизнеса: мотивируйте клиентов делать фотографии вашего заведения и публиковать их (например, в Google Maps). Большое количество фотографий от уникальных пользователей может привести к расчету высокого Popularity Score для вашего объекта.
    • Использование консистентных визуальных элементов: Убедитесь, что ключевые объекты (продукты, логотипы, здания) представлены четко и узнаваемо на различных изображениях. Это помогает алгоритмам Visual-clustering корректно группировать изображения, относящиеся к вашей сущности.
    • Насыщение контента релевантными тегами и подписями: Хотя система может работать автоматически, наличие точных и согласованных текстовых описаний (alt-тексты, подписи) у изображений помогает в процессе валидации кластеров и генерации тегов для сущности.
    • Оптимизация под расширенные запросы: При оптимизации страницы под локационный запрос (например, «рестораны в центре Франкфурта») учитывайте, что Google может дополнить запрос популярными объектами рядом. Упоминание этих объектов на странице может повысить релевантность.

    Worst practices (это делать не надо)

    • Манипуляции с гео-тегами: Присвоение изображениям ложных гео-координат (например, популярных туристических мест) для повышения видимости. Система использует визуальную кластеризацию, и если изображение визуально не соответствует объектам в данной локации, оно будет отфильтровано или может привести к санкциям.
    • Удаление метаданных из изображений: Чрезмерное сжатие изображений, которое удаляет важные EXIF-данные (включая геолокацию и данные о камере), снижает ценность этих изображений для системы распознавания.
    • Использование стоковых или неуникальных изображений для локальных объектов: Использование типовых изображений не помогает системе построить уникальное визуальное представление вашего объекта и не способствует росту Popularity Score.

    Стратегическое значение

    Патент подтверждает стратегический фокус Google на глубоком понимании сущностей физического мира через анализ пользовательского контента. Для SEO это означает, что оптимизация смещается от простого текстового анализа к обеспечению комплексных сигналов о сущности, включая ее внешний вид (визуальные данные) и географическое положение. Популярность, измеряемая через вовлеченность пользователей (UGC-фотографии), становится измеримым сигналом авторитетности объекта. Стратегии должны быть направлены на построение сильного и узнаваемого визуального присутствия в интернете.

    Практические примеры

    Сценарий: Оптимизация карточки отеля в туристическом городе

    1. Задача: Улучшить видимость отеля в Image Search и Local Search по запросам, связанным с городом и ближайшими достопримечательностями.
    2. Действия на основе патента:
      1. Гео-тегирование: Убедиться, что все профессиональные фотографии отеля (фасад, интерьеры, виды из окон) имеют точные GPS-координаты в EXIF-данных.
      2. Визуальная консистентность: Сделать четкие фотографии фасада с разных ракурсов, чтобы система могла сформировать устойчивый visual cluster для здания отеля.
      3. Стимулирование UGC: Запустить кампанию, поощряющую гостей делиться фотографиями отеля в Google Maps и социальных сетях с геолокацией. Цель – увеличить количество уникальных авторов и повысить Popularity Score.
      4. Контекстуализация: Добавить на сайт отеля раздел о ближайших достопримечательностях с уникальными фотографиями, также снабженными гео-тегами. Это свяжет отель с уже известными geo-clusters.
    3. Ожидаемый результат: Google более точно идентифицирует здание отеля как значимый объект (landmark). Высокий Popularity Score улучшает ранжирование в локальной выдаче. Изображения отеля чаще появляются при запросах, которые были дополнены (supplemented) тегами ближайших достопримечательностей.

    Вопросы и ответы

    Как система определяет популярность достопримечательности?

    Система рассчитывает Popularity Score. В патенте упоминается несколько возможных факторов для расчета: общее количество изображений объекта, количество уникальных пользователей (авторов), которые предоставили эти изображения, а также плотность изображений вблизи центра кластера. Использование числа уникальных авторов помогает отфильтровать непопулярные места и сосредоточиться на общественно значимых объектах.

    Что такое Geo-clustering и зачем он нужен перед Visual-clustering?

    Geo-clustering – это группировка изображений по географической близости на основе их геотегов. Этот этап необходим для повышения эффективности. Визуальный анализ изображений – это вычислительно дорогая операция. Гео-кластеризация позволяет значительно сузить набор данных, чтобы система сравнивала между собой только те изображения, которые были сделаны рядом, а не все изображения в мире.

    Как система понимает, что на двух разных фотографиях изображен один и тот же объект?

    Это происходит на этапе Visual-clustering. Система извлекает из каждого изображения векторы визуальных признаков (feature vectors) и сравнивает их. Если сходство превышает определенный порог, изображения считаются совпадающими. Затем строится граф совпадений (match-region graph), и группы сильно связанных изображений формируют визуальный кластер, соответствующий одному объекту.

    Использует ли Google данные из EXIF, такие как GPS-координаты?

    Да, абсолютно. Этот патент напрямую указывает на использование корпуса гео-тегов изображений (Geo-tagged image corpus) в качестве основного источника данных. GPS-координаты из метаданных изображения являются критически важными для этапа Geo-clustering.

    Что означает «дополнение запроса» (Query Supplementation) в контексте этого патента?

    Это механизм улучшения понимания запроса. Система идентифицирует в запросе триггерные слова (trigger words), например, название города («Париж»). Затем она ищет в своей базе данных популярные достопримечательности, связанные с этим словом (например, «Эйфелева башня», «Лувр»), и добавляет эти теги к исходному запросу. Это позволяет предоставить пользователю более релевантные и полные результаты.

    Может ли эта технология применяться не только к достопримечательностям, но и к бизнесу (магазинам, ресторанам)?

    Хотя в патенте используется термин «landmark» (достопримечательность), описанные механизмы гео- и визуальной кластеризации универсальны. Логично предположить, что Google использует аналогичные подходы для идентификации, каталогизации и оценки популярности любых физических объектов, включая здания, где расположен бизнес. Это делает патент очень релевантным для локального SEO.

    Как наличие большого количества пользовательских фотографий (UGC) влияет на мой объект?

    Большое количество фотографий от уникальных пользователей напрямую влияет на Popularity Score вашего объекта. Высокая оценка популярности помогает системе идентифицировать ваш объект как значимый и может положительно влиять на его ранжирование и видимость в поиске (особенно локальном и поиске по картинкам).

    Что делать, если система неправильно сгруппировала изображения?

    Патент предусматривает наличие пользовательского интерфейса (UI) для ручного кураторства данных. Он позволяет операторам просматривать visual clusters, редактировать их (удалять или добавлять изображения), объединять или разделять кластеры, а также корректировать текстовые метки. Это указывает на то, что система использует комбинацию автоматических алгоритмов и ручной модерации (или краудсорсинга) для обеспечения качества данных.

    Как эта система помогает автоматически тегировать изображения?

    Когда загружается новое изображение, система сравнивает его визуальные характеристики с уже известными кластерами в Landmark database. Если найдено сильное визуальное совпадение с кластером (например, кластером Эйфелевой башни), система автоматически присваивает новому изображению теги, связанные с этим кластером.

    Стоит ли удалять EXIF-данные при оптимизации скорости загрузки изображений?

    С точки зрения SEO, основанного на этом патенте, это плохая практика, особенно если изображения имеют локальный контекст. Удаление EXIF-данных лишает Google ценной информации (геолокация, время, данные камеры), которая используется для понимания контекста изображения и идентификации объектов. Лучше использовать эффективные форматы сжатия (например, WebP), сохраняя важные метаданные.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.