Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует компьютерное зрение для проверки соответствия геолокационных тегов содержанию изображения

    VERIFYING LABELS FOR IMAGES USING IMAGE RECOGNITION (Проверка меток для изображений с использованием распознавания образов)
    • US9495614B1
    • Google LLC
    • 2016-11-15
    • 2015-02-27
    2015 Мультимедиа Патенты Google

    Google проверяет автоматически сгенерированные теги изображений, основанные на местоположении (GPS). Система использует распознавание изображений (Computer Vision), чтобы определить, что на самом деле изображено на фотографии, и сравнивает это с тегами, основанными на местоположении. Это гарантирует, что изображения, связанные с определенным местом, действительно показывают это место, повышая точность поиска по картинкам.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неточности автоматического тегирования изображений, основанного исключительно на геолокационных данных (например, GPS-координатах). Проблема возникает, когда данные о местоположении неточны, неоднозначны (несколько объектов по одним координатам) или когда камера направлена в сторону от объекта, связанного с этими координатами. Это приводит к тому, что изображения помечаются метками (descriptor labels), которые не соответствуют фактическому визуальному содержанию, ухудшая качество поиска.

    Что запатентовано

    Запатентована система верификации меток изображений, которая использует технологии компьютерного зрения (Image Recognition) для подтверждения точности геолокационных тегов. Система сравнивает descriptor labels (метки, полученные на основе местоположения) с recognized labels (метки, полученные путем распознавания объектов на изображении). Метки, прошедшие проверку, становятся verified labels.

    Как это работает

    Система получает изображение и его геолокационную информацию. На основе этой информации из базы данных извлекаются потенциальные descriptor labels (например, названия бизнесов поблизости). Затем система анализирует пиксели изображения с помощью алгоритмов распознавания объектов и текста, генерируя recognized labels. Эти два набора меток сравниваются. Если метка, основанная на местоположении, соответствует распознанному объекту с достаточной степенью уверенности (confidence score) и важности (importance score), она верифицируется. Несовпадающие метки могут быть отброшены.

    Актуальность для SEO

    Высокая. Точное понимание содержания изображений и их связи с физическими местами критически важно для Google Maps, Google Photos и Google Lens. С развитием компьютерного зрения этот патент описывает фундаментальный процесс обеспечения качества и очистки данных, который активно используется для улучшения результатов локального поиска и поиска по изображениям.

    Важность для SEO

    Патент имеет существенное значение (7/10) для Image SEO и Local SEO. Он демонстрирует, что простого геотаггинга (добавления GPS-координат) недостаточно. Визуальное содержание изображения должно подтверждать его геолокационный контекст. Для SEO-специалистов это подчеркивает необходимость использования четких, высококачественных изображений, которые явно демонстрируют объект или местоположение, по которому они должны ранжироваться.

    Детальный разбор

    Термины и определения

    Confidence Score (Оценка уверенности)
    Метрика, указывающая, насколько система уверена в точности распознавания конкретного признака изображения. Используется для определения надежности Recognized Labels.
    Descriptor Labels (Описательные метки)
    Метки или теги, автоматически связанные с изображением на основе его Location Information. Извлекаются из базы данных, хранящей информацию о географических объектах в данном местоположении.
    Importance Score (Оценка важности)
    Метрика, определяющая значимость распознанного признака в контексте всего изображения. Может основываться на размере признака относительно площади изображения или типе признака (например, объект на переднем плане важнее фона).
    Location Information (Информация о местоположении)
    Географические данные, связанные с изображением, обычно указывающие место, где было сделано фото (например, GPS-координаты в метаданных).
    Recognized Image Features (Распознанные признаки изображения)
    Объекты, текст, характеристики или географические особенности, которые система компьютерного зрения идентифицировала на самом изображении.
    Recognized Labels (Распознанные метки)
    Текстовые описания, связанные с Recognized Image Features. Генерируются в процессе распознавания изображения.
    Verified Labels (Верифицированные метки)
    Descriptor Labels, которые были подтверждены как точно описывающие содержание изображения путем сопоставления с Recognized Label.
    Verification Levels (Уровни верификации)
    Различные степени подтверждения точности метки (например, высокая уверенность, средняя уверенность, неточно), основанные на Confidence Score и степени совпадения меток.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод верификации.

    1. Система получает изображение с географической Location Information.
    2. Система получает descriptor labels, связанные с этой локацией.
    3. Система определяет recognized image features с помощью методов распознавания объектов и ассоциирует с ними confidence scores.
    4. Система сравнивает распознанные признаки с descriptor labels.
    5. Система определяет verified labels на основе этого сравнения И учитывая confidence scores.

    Ключевым моментом является то, что верификация зависит не только от совпадения меток, но и от уверенности системы в том, что объект был распознан корректно.

    Claim 8 (Зависимый от 1): Вводит понятие Importance Score.

    Система определяет оценку важности для распознанного признака, основываясь на его размере относительно площади изображения и/или типе признака. Определение verified labels также основывается на этой оценке важности. Это означает, что малозначительные или фоновые объекты могут быть распознаны, но не будут использоваться для верификации меток, если их Importance Score низкий.

    Claim 10 (Зависимый от 1): Описывает механизм оптимизации для снижения нагрузки.

    Система может изучить descriptor labels ДО анализа содержания изображения, чтобы определить наличие возможных расхождений (possible discrepancies). Например, если для одной локации получено несколько меток. Процесс распознавания изображений запускается ТОЛЬКО в том случае, если обнаружены возможные расхождения. Это позволяет экономить вычислительные ресурсы.

    Claim 12 (Зависимый от 7): Описывает обработку несовпадающих меток.

    Система проверяет несовпадающие Descriptor Labels на соответствие предопределенным характеристикам, позволяющим сохранить их ассоциацию с изображением. Например, если метка описывает географический объект более высокого уровня (город, штат), который включает в себя распознанные объекты.

    Где и как применяется

    Изобретение применяется на этапе обработки и обогащения данных после их сбора.

    INDEXING – Индексирование и извлечение признаков

    Это основной этап применения патента. Когда изображение (например, загруженное в Google Maps, Photos или проиндексированное с веб-сайта) обрабатывается системой индексирования:

    1. Извлечение метаданных: Система извлекает Location Information (GPS).
    2. Обогащение данными о локации: Система запрашивает базу данных локаций для получения Descriptor Labels.
    3. Анализ изображения (Computer Vision): Система применяет модели распознавания изображений для извлечения Recognized Image Features и Recognized Labels, а также рассчитывает Confidence Scores и Importance Scores.
    4. Верификация и очистка данных: Система выполняет сравнение и определяет Verified Labels. Неподтвержденные метки удаляются.
    5. Индексирование: Изображение сохраняется в индексе (например, Image Search Index) с ассоциированными Verified Labels.

    RANKING – Ранжирование

    Результаты работы этого алгоритма (Verified Labels) используются на этапе поиска. Точные метки позволяют системе более релевантно сопоставлять запросы пользователей с изображениями в индексе.

    Входные данные:

    • Цифровое изображение (пиксельные данные).
    • Location Information (GPS-координаты, метаданные).
    • База данных географических объектов и связанных с ними Descriptor Labels.
    • Модели распознавания изображений.

    Выходные данные:

    • Набор Verified Labels, ассоциированных с изображением.
    • Verification Levels для каждой метки.
    • Потенциально, сигналы о недостоверности исходных данных (unreliability indication), отправляемые обратно в базу данных локаций (Claim 16).

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на изображения, связанные с географическими объектами: фотографии бизнесов (Local SEO), достопримечательностей, ландшафтов, улиц.
    • Конкретные ниши или тематики: Наибольшее влияние в сферах путешествий, недвижимости, ритейла и любых локальных услуг, где визуальное подтверждение местоположения критично.
    • Форматы поиска: Влияет на точность результатов в Image Search, Google Maps и Google Photos.

    Когда применяется

    • Временные рамки: Применяется во время индексации или обработки изображения после его загрузки или обнаружения.
    • Триггеры активации:
      1. Наличие Location Information в метаданных изображения.
      2. (Опционально, согласно Claim 10) Активация полного анализа происходит только тогда, когда система обнаруживает possible discrepancies — например, если по данным GPS-координатам находится несколько разных объектов (торговый центр, несколько ресторанов), и неясно, что именно изображено на фото.

    Пошаговый алгоритм

    Процесс верификации меток изображения:

    1. Получение данных: Система получает изображение и связанную с ним информацию о местоположении (GPS).
    2. Получение меток локации: Система запрашивает базу данных для получения Descriptor Labels, связанных с этими координатами.
    3. Проверка на расхождения (Опционально): Система анализирует полученные Descriptor Labels. Если метка одна и однозначная, процесс может остановиться (метка принимается). Если меток несколько или они неоднозначны (possible discrepancies), процесс продолжается.
    4. Распознавание изображений: Система анализирует содержание изображения для идентификации объектов, текста и сцен. Генерируются Recognized Image Features и соответствующие Recognized Labels.
    5. Расчет оценок: Для каждого распознанного признака рассчитывается Confidence Score (насколько точно распознано) и Importance Score (насколько это важно для изображения, например, по размеру).
    6. Сравнение меток: Система сравнивает Descriptor Labels с Recognized Labels для поиска совпадений (учитывая синонимы).
    7. Определение верифицированных меток: Метки, имеющие совпадение, оцениваются с учетом Confidence Score и Importance Score. Если оценки удовлетворяют пороговым значениям, Descriptor Label становится Verified Label. Ей присваивается соответствующий Verification Level.
    8. Обработка несовпадающих меток: Descriptor Labels, которые не нашли подтверждения в визуальном контенте, обычно отбрасываются. Исключение составляют метки, соответствующие специальным критериям (например, название города/штата).
    9. Ассоциация и хранение: Verified Labels ассоциируются с изображением и сохраняются в индексе.

    Какие данные и как использует

    Данные на входе

    • Мультимедиа факторы: Пиксельные данные изображения. Они используются алгоритмами компьютерного зрения для распознавания объектов, текста (OCR), логотипов и общих характеристик сцены.
    • Географические факторы: Location Information (GPS-координаты). Это ключевой элемент, который используется для извлечения исходного набора Descriptor Labels из географической базы данных.
    • Временные факторы: Время создания изображения (timestamp) может использоваться для помощи в распознавании признаков (например, определение времени суток или подтверждение направления теней).

    Какие метрики используются и как они считаются

    • Confidence Score (Оценка уверенности): Рассчитывается моделью распознавания изображений. Указывает на вероятность того, что распознанный объект идентифицирован корректно. (Claim 1).
    • Importance Score (Оценка важности): Рассчитывается на основе анализа композиции изображения. Факторы включают размер объекта относительно общей площади кадра и тип объекта. (Claim 8).
    • Similarity Score (Оценка схожести): Рассчитывается при сравнении текста Descriptor Label и Recognized Label. Учитывает точные совпадения, синонимы или семантическую близость.
    • Verification Level (Уровень верификации): Агрегированная метрика, определяющая итоговую степень доверия к метке. Является функцией от Confidence Score, Importance Score и Similarity Score. (Claim 11).

    Выводы

    1. Компьютерное зрение как арбитр метаданных: Google полагается на визуальное содержание (Computer Vision) для подтверждения или опровержения данных, полученных из других источников (в данном случае, GPS). Если метаданные противоречат визуальному контенту, приоритет отдается визуальным данным.
    2. Важность контекста и композиции (Importance Score): Не все распознанные объекты одинаково полезны. Система учитывает композицию изображения (размер объекта, его расположение), чтобы определить главный предмет съемки. Фоновые или незначительные элементы могут игнорироваться при верификации (Claim 8).
    3. Многоуровневая уверенность: Верификация не является бинарной. Система использует гранулированные оценки (Confidence Scores и Verification Levels), что позволяет более гибко использовать метки в поиске, учитывая степень их достоверности.
    4. Оптимизация ресурсов: Система спроектирована так, чтобы избегать дорогостоящего анализа изображений, если исходные геолокационные данные однозначны (Claim 10). Анализ запускается в первую очередь при наличии неоднозначности.
    5. Очистка данных для улучшения поиска: Основная цель — повышение точности данных, связывающих изображения с сущностями (Entities). Это напрямую влияет на качество и релевантность результатов в поиске по изображениям и локальном поиске.

    Практика

    Best practices (это мы делаем)

    • Обеспечение визуальной ясности для Local SEO: При оптимизации Google Business Profile или локальных лендингов используйте изображения, которые четко и однозначно демонстрируют ваш бизнес (фасад, вывеску, интерьер). Это гарантирует, что система распознавания сможет легко подтвердить Descriptor Labels, связанные с вашим местоположением.
    • Фокус на главном объекте (Importance Score): Убедитесь, что объект, по которому вы хотите ранжироваться, является главным предметом изображения и занимает значительную часть кадра. Это повысит Importance Score и вероятность успешной верификации метки.
    • Использование текста на изображениях (OCR): Наличие читаемого названия бизнеса (например, на вывеске) или логотипа на фотографии помогает системе генерировать точные Recognized Labels, что гарантирует верификацию названия компании.
    • Геотегинг изображений: Продолжайте добавлять корректные геолокационные метаданные (GPS) к изображениям. Это предоставляет системе исходные Descriptor Labels для верификации.

    Worst practices (это делать не надо)

    • Манипуляции с геотегами (Location Spoofing): Добавление GPS-координат к изображениям, которые визуально не соответствуют этому местоположению (например, тегирование стоковых фото координатами вашего бизнеса). Описанная система обнаружит несоответствие и отбросит эти метки.
    • Использование неоднозначных или низкокачественных изображений: Публикация фотографий, где главный объект плохо различим или размыт. Это приведет к низким Confidence Scores при распознавании и провалу верификации.
    • Игнорирование композиции: Использование фотографий, где ключевой объект находится далеко на заднем плане или занимает малую часть кадра. Importance Score будет низким, и метка может быть проигнорирована.

    Стратегическое значение

    Этот патент подтверждает, что Google активно использует компьютерное зрение для перекрестной проверки и валидации других источников данных. Для SEO это означает переход от манипулирования метаданными к необходимости обеспечения фактической, визуально подтверждаемой релевантности. Стратегия в Image SEO должна фокусироваться на создании аутентичного и четкого визуального контента, который помогает алгоритмам машинного обучения корректно классифицировать и верифицировать объекты.

    Практические примеры

    Сценарий: Оптимизация изображений для ресторана в торговом центре

    Проблема: Торговый центр имеет одни и те же GPS-координаты для нескольких бизнесов. Фотографии могут быть ошибочно помечены.

    Применение патента:

    1. Действие SEO-специалиста: Загрузить в Google Business Profile высококачественную фотографию, которая крупным планом показывает вход в ресторан с четко читаемой вывеской. Фото имеет корректные GPS-теги.
    2. Обработка Google:
      • Система получает GPS и извлекает Descriptor Labels: [«Название ТЦ», «Название Ресторана», «Название Соседнего Магазина»].
      • Система видит множественные метки (possible discrepancy) и запускает распознавание (Claim 10).
      • Система распознает вывеску (OCR) и генерирует Recognized Label: [«Название Ресторана»] с высоким Confidence Score и Importance Score.
    3. Результат: Система сравнивает метки. «Название Ресторана» верифицируется. Метки соседних магазинов отбрасываются для этого изображения. Изображение успешно ассоциируется с рестораном.

    Вопросы и ответы

    Означает ли этот патент, что добавление GPS-координат (геотегинг) бесполезно?

    Нет, геотегинг по-прежнему важен. Он предоставляет системе исходную информацию о местоположении (Location Information), которая используется для извлечения потенциальных Descriptor Labels. Однако патент показывает, что одного геотега недостаточно: визуальное содержание изображения должно подтвердить, что объект, связанный с этими координатами, действительно присутствует на фото.

    Как Importance Score влияет на SEO изображений?

    Importance Score означает, что главный объект изображения имеет наибольшее значение для тегирования (Claim 8). Если вы хотите ранжироваться по запросу о вашем бизнесе или продукте, он должен быть основным и четко видимым объектом на фото. Объекты с низким баллом (например, на заднем плане) могут быть проигнорированы, снижая видимость этого изображения по соответствующим запросам.

    Применяется ли этот алгоритм ко всем изображениям, которые индексирует Google?

    Алгоритм применяется к изображениям, у которых есть связанная информация о местоположении. Однако, согласно Claim 10, Google может оптимизировать процесс и запускать ресурсоемкое распознавание изображений только в том случае, если исходные геолокационные данные неоднозначны (например, по одному адресу находится много объектов) или имеют низкое доверие.

    Что произойдет, если система распознавания изображений Google ошибется?

    Система использует Confidence Scores для управления риском ошибок. Если объект распознан с низкой уверенностью, то связанные с ним Recognized Labels будут иметь меньший вес. В результате, итоговый Verification Level для соответствующей метки будет низким или неопределенным, что снижает риск использования неверной метки в ранжировании.

    Как этот патент влияет на использование стоковых фотографий для Local SEO?

    Использование стоковых фотографий для представления локального бизнеса становится менее эффективным. Даже если вы добавите GPS-координаты вашего бизнеса к стоковому фото, система распознавания не найдет визуальных признаков вашего фактического местоположения (вывески, фасада). В результате Descriptor Labels вашего бизнеса не будут верифицированы для этого изображения.

    Что такое Descriptor Labels и чем они отличаются от Recognized Labels?

    Descriptor Labels — это теги, полученные на основе местоположения (GPS) изображения из базы данных (например, «Ресторан Ромашка» по адресу Ленина 1). Recognized Labels — это теги, полученные путем визуального анализа самого изображения (например, «здание», «вывеска с текстом Ромашка»). Система сверяет эти два типа меток для подтверждения точности.

    Может ли система добавить теги, которых не было в исходных данных о местоположении?

    Да. Патент упоминает, что Recognized Labels (метки, распознанные на изображении), которые не совпали ни с одной из Descriptor Labels, также могут быть ассоциированы с изображением как верифицированные метки, если они соответствуют определенным условиям (например, высокий Confidence Score). Например, если на фото распознан «велосипед», этот тег может быть добавлен.

    Влияет ли качество фотографии на процесс верификации?

    Да, напрямую. Размытые, темные или некачественные изображения затрудняют распознавание объектов и текста. Это приводит к низким Confidence Scores, что, в свою очередь, может помешать успешной верификации меток, даже если объект действительно изображен на фото.

    Как система обрабатывает ситуации, когда на фото изображено несколько объектов?

    Система распознает несколько объектов и сравнивает их метки с доступными Descriptor Labels. Для каждого объекта рассчитывается Importance Score. Объекты с более высоким баллом (более крупные, центральные) будут иметь приоритет при верификации и ассоциации меток с изображением.

    Что происходит с метками, которые описывают недемонстрируемые признаки, например, название города?

    Патент предусматривает обработку таких меток (Claim 12). Система может проверять несовпадающие Descriptor Labels на наличие определенных характеристик. Метки, описывающие признаки более высокого уровня (город, страна, парк), которые обычно не видны на фото, могут быть одобрены и ассоциированы с изображением, если на фото распознан объект более низкого уровня в этой локации.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.