Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует OCR и геолокацию для выбора главной фотографии локального бизнеса

    SELECTING REPRESENTATIVE IMAGES FOR ESTABLISHMENTS (Выбор репрезентативных изображений для заведений)
    • US8811656B2
    • Google LLC
    • 2014-08-19
    • 2011-05-11
    2011 EEAT и качество Local SEO Мультимедиа Патенты Google

    Система Google для автоматического выбора лучшего (репрезентативного) изображения для локального бизнеса. Анализируя коллекции гео-тегированных фото (например, Street View или пользовательские), система распознает текст на изображениях (OCR) и сопоставляет его с данными ближайших компаний. На основе точности совпадения, уникальности текста и расстояния выбирается главное фото для показа в Google Maps и Поиске.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу автоматической идентификации заведений (Establishments), таких как магазины или здания, на большом количестве гео-тегированных изображений. Основная цель — эффективно и без ручного вмешательства выбрать наилучшее, репрезентативное изображение (Representative Image) для конкретного заведения из доступной коллекции фотографий. Это улучшает качество визуальных данных в локальном поиске и на картах.

    Что запатентовано

    Запатентована система для выбора репрезентативного изображения для заведения. Система использует геотеги для определения ближайших заведений-кандидатов. Затем она применяет Оптическое распознавание символов (OCR) для чтения текста на изображениях (например, вывесок) и сопоставляет его с фразами (n-grams), извлеченными из данных этих заведений. Путем оценки этих связей система выбирает изображение с наивысшим баллом как репрезентативное.

    Как это работает

    Механизм сочетает компьютерное зрение и геопространственный анализ:

    • Сбор данных: Получение коллекции гео-тегированных изображений.
    • Обработка изображений: Обнаружение текстовых областей и применение OCR для извлечения текстовых строк (Pool of Texts) с оценками уверенности.
    • Гео-фильтрация: Определение известных заведений в радиусе от места съемки, указанного в геотеге.
    • Извлечение фраз: Генерация n-grams из данных (название, адрес, телефон) этих заведений (Pool of Phrases).
    • Приблизительное сопоставление (Approximate Matching): Сравнение распознанного текста с фразами, допуская ошибки OCR.
    • Скоринг: Оценка пар Изображение-Заведение (Image-Establishment Pairs) на основе веса совпадений. Вес зависит от уникальности текста, уверенности OCR и расстояния.
    • Выбор: Изображение с наивысшей оценкой выбирается как Representative Image.

    Актуальность для SEO

    Высокая. Автоматический выбор основного изображения для Google Business Profile (GBP) и Google Maps является критически важной задачей. Технологии, сочетающие OCR, компьютерное зрение и геолокационные данные для верификации и представления локального бизнеса, лежат в основе современных систем локального поиска и постоянно развиваются.

    Важность для SEO

    Влияние на SEO значительно (75/100), особенно для Local SEO. Патент раскрывает механизм, как Google визуально идентифицирует бизнес и выбирает его главное изображение. Это напрямую влияет на CTR в локальной выдаче и на картах. Понимание механизма подчеркивает стратегическую важность четких физических вывесок и строгой согласованности NAP (Name, Address, Phone) между реальным миром и онлайн-профилем.

    Детальный разбор

    Термины и определения

    Approximate matching (Приблизительное сопоставление)
    Метод сравнения текстовых строк, допускающий ошибки или различия (используя Edit-distance). Применяется для сопоставления неточного вывода OCR с данными заведения.
    Edit-distance (Редакционное расстояние)
    Метрика различия между двумя строками (например, расстояние Левенштейна). Используется для количественной оценки приблизительного совпадения.
    Establishment (Заведение)
    Физический объект или место ведения бизнеса (магазин, здание, фабрика).
    Geo-tagged image (Гео-тегированное изображение)
    Изображение с метаданными, указывающими географическое местоположение (Image location), например, широту и долготу места съемки.
    Image-Establishment Pair (Пара Изображение-Заведение)
    Ассоциация между изображением и заведением, созданная на основе найденных текстовых совпадений.
    N-gram (N-грамма, Фраза)
    Последовательность из N элементов (слов или символов), извлеченная из данных заведения (например, из названия).
    OCR (Optical Character Recognition)
    Оптическое распознавание символов. Процесс преобразования текста на изображении в машиночитаемые текстовые строки (OCR’ed text strings).
    Pool of phrases (Пул фраз)
    Коллекция N-grams, извлеченных из данных всех ближайших заведений.
    Pool of texts (Пул текстов)
    Коллекция текстовых строк, распознанных с помощью OCR на одном или нескольких изображениях.
    Prevalence (Распространенность)
    Метрика частотности фразы в языке или в конкретной географической области. Используется для снижения веса общих слов.
    Representative Image (Репрезентативное изображение)
    Изображение, выбранное системой из коллекции как наилучшее визуальное представление конкретного заведения.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод выбора репрезентативного изображения.

    1. Распознавание текстовых строк во множестве гео-тегированных изображений.
    2. Идентификация заведений, связанных с географическими местоположениями этих изображений.
    3. Для конкретного заведения:
      1. Извлечение фраз из информации, связанной с этим заведением.
      2. Сравнение распознанных текстовых строк с извлеченными фразами для поиска совпадений.
      3. Выбор репрезентативного изображения для заведения на основе этих совпадений.

    Claim 2 (Зависимый от 1): Уточняет, что выбор основан на скоринге (оценке) пар Изображение-Заведение.

    Claim 3 (Зависимый от 2): Детализирует факторы скоринга и указывает, что совпадения являются приблизительными (approximate match). Оценка пары базируется на одном или нескольких из следующих факторов:

    • (i) Информационное поле (Information field): Источник фразы (например, название важнее категории).
    • (ii) Уверенность (Confidence): Точность распознанной текстовой строки (OCR Confidence).
    • (iii) Распространенность в языке (Prevalence): Насколько уникальна фраза в языке.
    • (iv) Распространенность в географической области (Prevalence): Насколько уникальна фраза в данной локации.
    • (v) Расстояние (Distance): Расстояние между местоположением изображения и местоположением заведения.

    Claim 5 (Зависимый от 1): Определяет источники информации о заведении: название, категория, номер телефона и/или адрес.

    Claim 7 и 8 (Зависимые от 1): Уточняют метод идентификации кандидатов: поиск заведений в пределах радиуса от местоположения изображения, причем радиус может зависеть от точности геотега.

    Где и как применяется

    Изобретение применяется преимущественно на этапе индексирования для обогащения данных о локальных сущностях.

    CRAWLING – Сканирование и Сбор данных
    Система собирает исходные данные — коллекции гео-тегированных изображений. Источники включают пользовательский контент (UGC) и собственные данные Google (например, Street View, упомянутый как camera car).

    INDEXING – Индексирование и извлечение признаков
    Это основной этап применения патента. Происходит ресурсоемкая обработка:

    1. Извлечение признаков (Визуальных): Применение OCR для извлечения текста из изображений.
    2. Извлечение признаков (Сущностных): Доступ к базе данных заведений (например, Локальный индекс/Knowledge Graph) и генерация n-grams.
    3. Ассоциация и Скоринг: Сопоставление текста с фразами с использованием геолокации как фильтра. Расчет оценок для Image-Establishment Pairs.
    4. Выбор и Обогащение: Выбор Representative Image и сохранение этой связи, обогащая данные о сущности.

    METASEARCH / RANKING – Метапоиск и Ранжирование
    Результаты работы алгоритма (выбранные изображения) используются на этих этапах для отображения в результатах поиска (Local Pack, Google Maps, Панель Знаний), когда пользователь ищет заведение.

    Входные данные:

    • Коллекция изображений с геотегами (координаты, точность).
    • База данных заведений (NAP, категория, координаты).

    Выходные данные:

    • Выбранное Representative Image для каждого идентифицированного заведения.
    • Аннотации к изображениям, указывающие на идентифицированные заведения.

    На что влияет

    • Конкретные типы контента: Изображения и профили локальных бизнесов (Google Business Profile).
    • Специфические запросы: Локальные и навигационные запросы, где визуальное представление объекта критично для пользователя.
    • Конкретные ниши или тематики: Все ниши с физическими точками присутствия (ритейл, услуги, рестораны, недвижимость и т.д.).

    Когда применяется

    • Условия работы: Применяется при наличии изображений с геотегами и базы данных заведений в этом регионе. Требует наличия распознаваемого текста на изображениях.
    • Частота применения: Вероятно, это пакетный процесс (batch process), который выполняется при обновлении больших массивов данных (например, обновление Street View или обработка новых пользовательских фото). Патент также описывает сценарий обработки отдельных изображений (individual image scenario).

    Пошаговый алгоритм

    Процесс выбора репрезентативного изображения из коллекции.

    1. Получение данных: Система получает коллекцию гео-тегированных изображений.
    2. Обработка Изображений (Поток 1):
      1. Детектирование текста: Анализ изображений для обнаружения текстовых регионов. Используется «чрезмерно включающий» (overly inclusive) подход для максимизации охвата.
      2. Распознавание текста (OCR): Применение нескольких OCR движков для генерации текста с оценками уверенности (confidence scores). Формирование Pool of texts.
    3. Обработка Заведений (Поток 2):
      1. Идентификация ближайших заведений: Поиск заведений в базе данных в пределах радиуса от геотега изображения.
      2. Генерация фраз: Извлечение n-grams из данных (имя, категория, телефон) этих заведений. Формирование Pool of phrases.
    4. Сопоставление: Сравнение Pool of texts и Pool of phrases с использованием Approximate Matching (учитывая edit-distance).
    5. Создание пар: Формирование Image-Establishment Pairs на основе совпадений.
    6. Скоринг пар: Расчет оценки для каждой пары. Оценка агрегирует веса совпадений. Вес зависит от уверенности OCR, источника фразы, распространенности (Prevalence) фразы и расстояния до объекта.
    7. Выбор: Для каждого заведения выбирается изображение с наивысшей оценкой как Representative Image.

    Какие данные и как использует

    Данные на входе

    • Мультимедиа факторы: Пиксельные данные изображений, анализируемые для обнаружения и распознавания текста.
    • Географические факторы: Критически важные данные. Геотеги изображений (координаты, точность, ориентация) и координаты заведений из базы данных. Используются для фильтрации и расчета расстояния.
    • Контентные факторы (Извлеченные): Текстовые строки, полученные с помощью OCR из изображений.
    • Структурированные данные (База данных): Название, Категория, Номер телефона, Адрес заведений. Используются для генерации n-grams.

    Какие метрики используются и как они считаются

    • Confidence Score (Оценка уверенности OCR): Метрика, предоставляемая движком OCR, измеряющая предполагаемую точность распознавания.
    • Edit-distance (Редакционное расстояние): Измеряет степень различия между распознанным текстом и фразой. Меньшее расстояние увеличивает вес совпадения.
    • Prevalence (Распространенность): Оценка уникальности фразы в языке и/или регионе. Совпадения с общими фразами (например, «Магазин») получают пониженный вес.
    • Source Field Weight (Вес источника фразы): Приоритет, отдаваемый источнику. Фразы из Названия получают больший вес, чем из Категории.
    • Distance (Расстояние): Расстояние между местоположением изображения и заведения. Меньшее расстояние может увеличивать итоговую оценку.
    • Image-Establishment Pair Score: Итоговая оценка, рассчитываемая путем комбинации весов всех совпадений между изображением и заведением, используя эвристики или методы машинного обучения.

    Выводы

    1. Критическая роль OCR в локальном поиске: Google активно использует OCR для понимания изображений и верификации данных о физическом мире. Текст на вывесках является ключевым сигналом для идентификации локальных сущностей.
    2. Геолокация как обязательный фильтр: Система строго ограничивает анализ заведениями, находящимися в непосредственной близости от места съемки. Точность геотега и местоположения бизнеса критически важна.
    3. Приоритет уникальности (Prevalence): Система оценки предпочитает уникальные названия общим терминам. Это подчеркивает важность брендинга в Local SEO.
    4. Многофакторный скоринг ассоциаций: Выбор изображения основан на комплексной оценке, включающей уверенность OCR, источник данных (название важнее категории) и расстояние.
    5. Устойчивость к ошибкам (Robustness): Система спроектирована для работы с неидеальными данными, используя избыточное распознавание и Approximate Matching для компенсации ошибок OCR, плохого освещения или ракурса.
    6. Слияние физического и цифрового мира: Патент подтверждает, что физическое представление бизнеса (вывески) напрямую влияет на его цифровое представление (выбор главного фото в GBP).

    Практика

    Best practices (это мы делаем)

    Рекомендации касаются Local SEO и оптимизации Google Business Profile (GBP).

    • Оптимизация физических вывесок для OCR: Убедитесь, что вывеска бизнеса использует четкие, контрастные шрифты, хорошо освещена и видна с улицы. Это повышает Confidence Score OCR и вероятность правильной визуальной идентификации.
    • Строгая консистентность NAP: Название и адрес на физической вывеске должны точно соответствовать данным в GBP. Расхождения могут привести к низкому скорингу или неправильной ассоциации изображений.
    • Загрузка качественных фотографий фасада в GBP: Загружайте высококачественные, четкие фотографии фасада, на которых хорошо видна вывеска. Это увеличивает шансы, что ваше фото будет выбрано как Representative Image.
    • Точность геолокации: Убедитесь, что пин на карте в GBP установлен максимально точно. При загрузке фото используйте точные геотеги (EXIF), если возможно. Фактор Distance используется в скоринге.
    • Уникальность названия: Используйте уникальное брендовое название. Это снижает Prevalence и увеличивает вес совпадения при скоринге по сравнению с общими названиями (например, «Продукты 24»).

    Worst practices (это делать не надо)

    • Использование сложных или нечитаемых шрифтов: Декоративные или низкоконтрастные шрифты на вывесках могут привести к ошибкам OCR и снижению способности системы идентифицировать бизнес.
    • Расхождение между вывеской и онлайн-названием: Если название в GBP отличается от того, что написано на физической вывеске, система не сможет установить надежную связь.
    • Отсутствие текстовой вывески: Использование только графического логотипа без текста не позволяет использовать описанный механизм OCR для идентификации.
    • Использование общих (Generic) названий: Названия, состоящие только из общих слов, получат низкий вес из-за высокой Prevalence, усложняя системе выбор правильного изображения.

    Стратегическое значение

    Патент подтверждает стратегию Google по верификации данных о физическом мире с помощью анализа изображений. Для Local SEO это означает, что оптимизация выходит за рамки цифровых данных и включает физическое представление бизнеса. Обеспечение машиночитаемости вашего бренда в реальном мире (через вывески) напрямую влияет на то, как Google воспринимает и отображает ваш бизнес в цифровых продуктах.

    Практические примеры

    Сценарий: Выбор главного фото для GBP

    1. Ситуация: Для Аптеки «Фармалюкс» доступно 20 фото пользователей и 5 фото от владельца. В качестве главного фото Google показывает фото интерьера.
    2. Анализ по патенту: Вероятно, на фото интерьера OCR распознал слово «Аптека» (высокая Prevalence, низкий вес). На фото фасада название «Фармалюкс» распознано с низкой уверенностью из-за бликов или шрифта.
    3. Действия SEO-специалиста:
      1. Проверить консистентность названия «Фармалюкс» в GBP.
      2. Сделать и загрузить высококачественное фото фасада днем, где вывеска «Фармалюкс» видна четко и без бликов.
    4. Ожидаемый результат: Система обработает новое фото. OCR распознает уникальное название «Фармалюкс» с высоким Confidence Score. Эта пара Изображение-Заведение получит наивысший балл (высокая уверенность, низкая Prevalence), и новое фото будет выбрано как Representative Image.

    Вопросы и ответы

    Как этот патент влияет на выбор основного изображения в Google Business Profile (GBP)?

    Патент напрямую описывает механизм для этого выбора. Google ищет изображение, которое наиболее достоверно идентифицирует бизнес. Это достигается путем поиска фотографий, на которых текст (вывеска) четко распознается с помощью OCR и совпадает с данными компании (NAP). Изображение с наивысшей оценкой по совокупности факторов (уверенность OCR, уникальность названия, близость) становится основным.

    Что важнее для системы: совпадение названия или категории бизнеса?

    Название бизнеса значительно важнее. Патент указывает (Claim 3), что учитывается информационное поле (information field), из которого извлечена фраза. Кроме того, названия обычно более уникальны (имеют низкую Prevalence), чем категории (например, «Ресторан»), что также увеличивает вес совпадения по названию.

    Как система справляется с ошибками распознавания текста (OCR)?

    Система устойчива к ошибкам благодаря двум механизмам. Во-первых, используется Approximate Matching, допускающее различия между распознанным текстом и данными заведения (измеряется через Edit-distance). Во-вторых, учитывается оценка уверенности OCR (Confidence Score); совпадения с низкой уверенностью получают меньший вес.

    Что такое «Prevalence» (распространенность) и почему это важно для SEO?

    Prevalence — это мера того, насколько часто фраза встречается в языке или регионе. Если название вашего бизнеса уникально (низкая Prevalence), совпадение по этому названию получит высокий вес. Если название общее (например, «Аптека»), вес будет низким. Это подчеркивает важность уникального брендинга для надежной идентификации бизнеса системой.

    Учитывает ли система только фотографии, загруженные владельцем?

    Нет, система анализирует всю коллекцию доступных гео-тегированных изображений. Сюда входят фотографии пользователей, изображения из Street View (упомянутые в патенте как данные от camera car) и фотографии, загруженные владельцем. Выбирается лучшее изображение независимо от источника.

    Как SEO-специалист может использовать этот патент на практике?

    Ключевые действия — это обеспечение максимальной согласованности NAP между GBP и физическими вывесками, а также консультации бизнеса по дизайну вывесок (четкие, контрастные шрифты для лучшей читаемости OCR). Также необходимо загружать качественные фотографии фасада с четко видимым названием.

    Влияет ли расстояние от места съемки до входа в заведение на выбор фото?

    Да, расстояние (Distance) является одним из ключевых факторов скоринга (Claim 3). При прочих равных, система предпочтет изображение, сделанное ближе к фактическому местоположению заведения, указанному в базе данных.

    Что произойдет, если у бизнеса нет вывески или используется только логотип без текста?

    Описанный в патенте механизм полагается на OCR. Если текста нет, этот конкретный алгоритм не сработает. В этом случае Google будет полагаться на другие сигналы. Хотя в описании патента упоминается возможность дополнительного использования распознавания графических компонентов (логотипов), ядром данного изобретения является текст.

    Нужно ли добавлять геотеги к фотографиям, загружаемым в GBP?

    Да, это полезно. Геотеги являются основным механизмом для фильтрации кандидатов и расчета фактора Distance. Наличие точного геотега помогает системе быстрее и точнее связать вашу фотографию с физическим местоположением вашего бизнеса.

    Влияет ли этот патент на ранжирование в локальном поиске?

    Напрямую он не описывает алгоритмы ранжирования. Однако он определяет, как выбирается Representative Image. Качественное главное фото значительно повышает CTR профиля бизнеса в локальной выдаче и на картах, что является косвенным фактором ранжирования и улучшает поведенческие метрики.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.