
Google извлекает текст непосредственно из изображений (например, названия улиц, вывески бизнесов в Street View), используя передовые методы OCR и улучшения качества (Superresolution). Этот текст ассоциируется с точными географическими координатами (GPS). Это позволяет Google индексировать информацию из реального мира и использовать её для ответа на локальные поисковые запросы и повышения релевантности поиска по картинкам.
Патент решает проблему индексации информации из реального мира, которая видна только на изображениях, но не представлена в текстовом формате (например, названия магазинов на вывесках, часы работы, адреса на зданиях). Он также решает техническую задачу точного распознавания текста (OCR) в естественных сценах (например, на городских улицах), где качество изображения часто низкое, присутствуют искажения, тени и препятствия.
Запатентована система для извлечения текста из изображений, его индексации и использования в поиске. Ключевым элементом изобретения является ассоциация извлеченного текста с точными данными о географическом местоположении (Geographic Location Data), где было сделано изображение. Система включает методы для обнаружения текста, повышения его читаемости (например, с помощью Superresolution) и последующего распознавания символов (OCR) для использования в локальном поиске и поиске по картинкам.
Система работает в несколько этапов:
3D Range Data).Classifier) для идентификации областей в изображении, которые могут содержать текст (Candidate Text Regions).Superresolution, которая объединяет несколько кадров одной и той же сцены для создания единого изображения текста с более высоким разрешением.Критически высокая. Описанная технология является фундаментальной для работы Google Street View и Google Maps. Способность Google понимать физический мир путем «чтения» вывесок, знаков и адресов напрямую влияет на качество и полноту данных в Локальном Поиске. Хотя методы OCR и обработки изображений с момента подачи патента усовершенствовались, заложенные здесь принципы остаются основой систем визуального позиционирования и локальной индексации Google.
Патент имеет критическое значение (9/10) для Локального SEO и Поиска по Картинкам. Для Локального SEO это означает, что физическая видимость бизнеса (вывески, адрес) напрямую конвертируется в цифровые сигналы индексации и ранжирования. Для Поиска по Картинкам это подтверждает, что текст, присутствующий внутри изображения, является ключевым фактором релевантности, выходящим за рамки alt-text и окружающего контента.
Claim 1 (Независимый пункт): Определяет основную цель изобретения — использование текста из изображений в контексте геолокации.
Ядро изобретения — это не просто OCR, а индексация результатов OCR в привязке к точной геолокации для использования в поиске.
Claim 2 (Зависимый от 1): Детализирует технический процесс извлечения текста.
Candidate Text Region.OCR на улучшенном изображении.Этот пункт описывает стандартный пайплайн для OCR в естественных сценах, включая критически важный этап улучшения качества перед распознаванием.
Claim 6 (Зависимый от 1): Уточняет применение в картографических сервисах.
Подтверждает интеграцию этой технологии с сервисами типа Google Maps.
Claims 7, 8, 9 (Зависимые от 1): Описывают монетизацию технологии.
Извлеченный текст может служить триггером для показа релевантной рекламы.
Изобретение затрагивает несколько ключевых этапов поисковой архитектуры, связывая сбор данных с индексацией и ранжированием.
CRAWLING – Сканирование и Сбор данных
На этом этапе происходит физический сбор данных. Система собирает изображения (например, с помощью автомобилей Street View), одновременно фиксируя точные Geographic Location Data (GPS) и, возможно, 3D Range Data (LIDAR).
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Полученные изображения обрабатываются: текст обнаруживается, улучшается (Superresolution) и распознается (OCR). Результат — извлеченный текст — сохраняется в индексе в строгой привязке к изображению и его географическим координатам.
RANKING / METASEARCH – Ранжирование / Метапоиск
Когда пользователь вводит запрос (особенно локальный или в поиске по картинкам), система обращается к индексу, созданному на предыдущем этапе. Если ключевые слова запроса совпадают с текстом, извлеченным из изображения, это изображение или связанная с ним локация могут быть показаны в результатах поиска (например, в Google Maps или Image Search).
Входные данные:
Geographic Location Data (GPS координаты).3D Range Data (LIDAR, опционально).Выходные данные:
Процесс А: Сбор и обработка изображений (Офлайн)
Superresolution требуется несколько кадров одной и той же сцены с небольшим смещением.Candidate Text Regions.3D Range Data для удаления нетекстовых областей. Например, система может требовать, чтобы текст находился на плоской поверхности (планарность) и на определенном расстоянии от камеры.Процесс Б: Обработка поискового запроса (Онлайн)
3D Range Data (данные LIDAR или стерео-сенсоров). Используются для понимания геометрии сцены и расстояния до объектов.Патент не детализирует конкретные формулы, но описывает используемые методы и метрики:
3D Range Data, определяющая, лежит ли кандидатная текстовая область на плоской поверхности.Superresolution (объединение нескольких кадров) и 3D Range Data (для фильтрации шума), чтобы справиться с низким качеством текста в естественных сценах.Этот патент подчеркивает стратегию Google по индексации физического мира для улучшения локального поиска. Для SEO-специалистов это означает, что оптимизация больше не ограничивается только веб-сайтом и ссылками; она распространяется на то, как бизнес представлен в реальном мире и как эта информация фиксируется системами Google. Это подтверждает важность визуальных данных как источника достоверной информации о локальных сущностях и укрепляет связь между онлайн и офлайн присутствием бренда.
Сценарий 1: Верификация локального бизнеса (Local SEO)
Сценарий 2: Поиск по картинкам (Image SEO)
alt-text соответствует запросу, но и где технология OCR смогла распознать текст «Air Max 270» на самом кроссовке или на коробке, изображенной на фото.Как этот патент влияет на Локальное SEO (Local SEO)?
Влияние фундаментальное. Патент описывает, как Google конвертирует физические вывески и знаки в индексируемые цифровые данные, привязанные к геолокации. Это означает, что Google использует изображения (например, из Street View) для обнаружения новых бизнесов, верификации существующих (название, адрес, телефон – NAP) и даже для извлечения атрибутов (например, часы работы). Четкая и читаемая вывеска становится прямым фактором индексации в локальном поиске.
Что такое Superresolution и почему это важно?
Superresolution — это технология, которая позволяет Google объединять несколько изображений низкого качества (например, кадры видео, снятые с движущегося автомобиля) в одно изображение высокого разрешения. Это критически важно, потому что текст на уличных знаках часто бывает размытым, маленьким или искаженным. Superresolution значительно повышает точность OCR, позволяя распознавать текст, который иначе был бы нечитаем.
Означает ли это, что Google читает весь текст на изображениях, которые мы загружаем на сайт?
Да, патент подтверждает, что Google разработал и использует технологию для извлечения текста из изображений для целей индексации и поиска. Если на вашем сайте есть изображения товаров, инфографика или фотографии офиса, Google может извлечь из них текст и использовать его для определения релевантности страницы или самого изображения. Поэтому важно оптимизировать читаемость текста внутри изображений.
Как используются данные 3D Range Data (LIDAR)?
Данные о расстоянии (3D Range Data) используются для улучшения точности обнаружения текста. Поскольку текст обычно находится на плоских поверхностях (стены, знаки), система может отфильтровать ложные срабатывания на неровных объектах (например, листве деревьев). Также эти данные помогают определить расстояние до текста, что позволяет сфокусироваться на объектах определенного типа (например, отличать вывеску на здании от дорожного знака на переднем плане).
Стоит ли теперь размещать ключевые слова внутри изображений на сайте?
Размещать ключевые слова следует только в том случае, если это естественно и полезно для пользователя (например, название продукта на его фотографии, заголовок на инфографике). Система может распознать этот текст и использовать его как сигнал релевантности. Однако попытки искусственного наполнения изображений ключевыми словами (keyword stuffing) могут быть расценены как спам и привести к негативным последствиям.
Как Google обеспечивает точность распознавания названий бизнесов?
Помимо улучшения качества изображения (Superresolution), патент упоминает возможность использования внешних баз данных для помощи в OCR (Database Assisted OCR). Например, если система знает, какие бизнесы зарегистрированы в определенном районе (из справочников или GBP), она может сверять результаты распознавания с этими данными, что значительно повышает точность идентификации названий.
Влияет ли этот патент на ранжирование рекламы?
Да, напрямую. В патенте (Claims 7-9) указано, что система может показывать рекламу вместе с найденным изображением или локацией. Причем реклама может быть таргетирована как на основе исходного запроса пользователя, так и на основе текста, который был извлечен непосредственно из показанного изображения. Это открывает возможности для гиперлокального рекламного таргетинга.
Если моя вывеска плохо видна со стороны дороги, повлияет ли это на мое Локальное SEO?
Да, с высокой вероятностью. Если системы Google (Street View) не смогут четко зафиксировать и распознать текст на вашей вывеске из-за препятствий, плохого освещения или низкого качества самой вывески, вы потеряете важный сигнал подтверждения вашего местоположения и названия. Это может снизить уверенность Google в ваших данных и негативно повлиять на локальное ранжирование.
Применяется ли эта технология только к уличным сценам?
Хотя уличные сцены (Street View) являются основным примером, патент описывает применение технологии шире. Упоминается возможность индексации товаров внутри магазинов или экспонатов в музеях путем фотографирования и распознавания текста на этикетках и упаковках. Технология применима к любому набору изображений, где текст необходимо извлечь и проиндексировать.
Насколько важен этот патент, учитывая его возраст (подача в 2006 году)?
Несмотря на возраст, патент остается критически важным, так как он заложил фундамент для современных систем визуальной индексации Google. Технологии обработки изображений и OCR с тех пор значительно продвинулись (например, с использованием глубокого обучения), но базовый принцип — извлечение текста из изображений и его привязка к геолокации для использования в поиске — остается неизменным и центральным для продуктов Google Maps и Local Search.

Мультимедиа
Индексация
Семантика и интент

Индексация
Мультимедиа
Семантика и интент

Мультимедиа
Индексация
EEAT и качество

Мультиязычность
Local SEO
EEAT и качество

Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Ссылки

SERP
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Knowledge Graph
SERP
Семантика и интент

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
Индексация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Индексация
Ссылки
Техническое SEO
