
Google разработал систему, позволяющую использовать изображения с мобильных устройств в качестве поисковых запросов. Система распознает объекты на изображении (продукты, здания, текст, лица), преобразует их в символьное описание (текстовый запрос) и использует его для поиска релевантной информации в стандартной поисковой системе.
Патент решает фундаментальную задачу поиска информации об объектах реального мира без необходимости формулировать текстовый запрос. Он устраняет разрыв между визуальным восприятием пользователя и традиционными поисковыми системами, которые принимают на вход только символьные данные (текст). Это позволяет мгновенно получать информацию о продуктах, зданиях, текстах или лицах, просто сфотографировав их.
Запатентована комплексная система и метод для реализации визуального поиска. Суть изобретения заключается в инфраструктуре, которая принимает изображение с удаленного устройства (например, мобильного телефона), обрабатывает его с помощью программы распознавания объектов (object recognition program) для идентификации содержимого и генерирует символьное описание (symbolic indexing или symbolic identifier). Это символьное описание затем используется в качестве запроса к стандартной поисковой системе.
Система работает по следующей цепочке:
Image Processing).Attribute Detectors) для анализа графических характеристик изображения.reference images). Каждый детектор выдает «Значение уверенности» (Confidence Value). Если сумма этих значений превышает порог, объект считается распознанным.symbolic identifier (например, текст «Эйфелева башня»).Search Engine) как обычный запрос.Критическая. Этот патент, поданный в 2004 году, описывает фундаментальную архитектуру систем визуального поиска, таких как Google Lens. Все описанные в нем концепции — распознавание продуктов, зданий, лиц, OCR и перевод текста на лету — являются ключевыми функциями современных поисковых систем и активно развиваются Google.
Патент имеет высокое стратегическое значение для SEO (85/100). Он описывает не алгоритм ранжирования, а новый тип входящего запроса — визуальный. Это критически важно для e-commerce, локального поиска и издателей контента. Понимание того, как Google преобразует пиксели в сущности (symbolic identifiers), является основой для оптимизации графического контента и обеспечения его корректного распознавания системами визуального поиска.
symbolic identifier.Confidence Values от всех детекторов атрибутов превышает этот порог, система считает, что объект распознан.Claim 1 (Независимый пункт): Описывает базовую архитектуру системы визуального поиска.
object recognition program), которая анализирует входящие изображения и присваивает им символьное индексирование (symbolic indexing).Claim 11 (Независимый пункт): Детализирует процесс распознавания и запроса.
input image).reference images) на основе этих атрибутов. (Каждое эталонное изображение имеет связанный symbolic identifier).symbolic identifier входящему изображению на основе совпавшего эталонного изображения.symbolic identifier.Claim 18 (Независимый пункт): Описывает метод, аналогичный системе в Claim 11, фокусируясь на шагах обработки данных на сервере (получение изображения, определение атрибутов, сопоставление с эталонами, присвоение идентификатора, выполнение поиска, отправка результатов).
Claim 26 (Зависимый от 18): Конкретизирует механизм распознавания (сопоставления).
trained attribute detectors).confidence values), полученных от детекторов.predetermined threshold value).Claims 28, 29, 31 (Независимые пункты): Описывают применение метода для конкретных задач: распознавание промышленных товаров (Claim 28), зданий (Claim 29) и человеческих лиц (Claim 31). Процесс идентичен: получение изображения -> распознавание -> получение специфического symbolic identifier (например, название продукта, адрес здания, имя человека) -> поиск информации.
Claim 30 (Независимый пункт): Описывает метод для перевода текста на основе изображения (OCR и перевод).
character recognition system) для получения текстовых данных на первом языке.Изобретение охватывает несколько этапов поиска, формируя отдельный конвейер обработки визуальных запросов.
CRAWLING & INDEXING – Сканирование и Индексирование
Система требует предварительной подготовки данных. На этом этапе происходит сбор обучающих изображений (Training Images), обучение детекторов атрибутов (Attribute Detectors) и формирование базы эталонных изображений (Reference Images), связанных с символьными идентификаторами (сущностями). Это формирование визуального индекса Google.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Входящее изображение интерпретируется как запрос. Система распознавания изображений выполняет роль модуля понимания запроса: она анализирует пиксели, распознает объект и преобразует визуальный запрос в symbolic identifier, понятный поисковой системе.
RANKING & METASEARCH – Ранжирование и Метапоиск
После того как визуальный запрос преобразован в символьный, он обрабатывается стандартной поисковой системой. Система ранжирования ищет и сортирует информацию, релевантную этому symbolic identifier.
Входные данные:
Digital Image) с устройства пользователя.Выходные данные:
Symbolic Identifier (передается внутри системы от модуля распознавания к поисковой системе).Information About the Object Shown), отправляемый пользователю.Confidence Values превышают заранее определенный Threshold Value. Если уверенность низкая, система может не распознать объект или предложить несколько вариантов.Процесс А: Обучение системы (Офлайн)
Training Images) для различных объектов.Attribute Detectors), адаптированных к каждому объекту или классу объектов.Reference Images) и связывание их с соответствующими Symbolic Identifiers.Процесс Б: Обработка визуального запроса (Реальное время)
Input Image) и, опционально, данных о местоположении от пользователя.Attribute Detectors к входящему изображению.Confidence Value, указывающий на наличие его атрибута в изображении.Confidence Values и сравнение с Threshold Value.Symbolic Identifier, связанного с распознанным эталонным изображением. (В случае OCR — генерация текстовых данных).Symbolic Identifier в поисковую систему в качестве запроса. (В случае перевода — передача текста в систему перевода).Система использует ограниченный набор входных данных, фокусируясь на визуальной информации.
Digital Image). Качество, освещение и ракурс съемки влияют на процесс распознавания.Reference Images).Attribute Detectors).Symbolic Identifiers.Attribute Detector. Патент не детализирует формулу расчета, но указывает, что она отражает, насколько хорошо детектор распознает свой атрибут в изображении.Confidence Values от всех примененных детекторов.Attribute Detectors и Confidence Values является ядром этого процесса. Если объект не распознан (порог уверенности не достигнут), поиск не состоится.Reference Images), связанных с сущностями. Чтобы объект можно было найти через визуальный поиск, он должен присутствовать в этой базе и быть корректно аннотирован.Attribute Detectors. Это повышает вероятность того, что продукт будет корректно распознан и связан с правильным Symbolic Identifier при поиске через Google Lens.Reference Image и Symbolic Identifier.Attribute Detectors, снижают Confidence Value и делают невозможным распознавание объекта.Reference Images.Этот патент подтверждает, что визуальный поиск является стратегическим направлением развития Google. Для SEO это означает необходимость перехода от оптимизации текста к оптимизации сущностей и их визуальных представлений. Визуальный поиск стирает границы между онлайн и офлайн, особенно в ритейле и локальном поиске. Долгосрочная стратегия должна включать в себя управление визуальными активами бренда и обеспечение их максимальной «узнаваемости» алгоритмами машинного зрения Google.
Сценарий 1: Оптимизация карточки товара для Google Lens (E-commerce)
Reference Image) и в контексте использования (lifestyle фото).image.Attribute Detectors, распознает модель (достигает Threshold Value), генерирует Symbolic Identifier (например, «Nike Air Max 270 Black») и показывает ссылку на карточку товара магазина в результатах поиска.Сценарий 2: Оптимизация локального ресторана для визуального распознавания
Является ли этот патент описанием Google Lens?
Да, этот патент описывает фундаментальную архитектуру и методы, которые лежат в основе Google Lens и аналогичных систем визуального поиска. Он охватывает весь процесс от получения изображения с камеры мобильного телефона до преобразования его в поисковый запрос и возврата информации по распознанным объектам, включая продукты, здания, текст и лица.
Как Google определяет, что изображено на картинке?
Патент описывает использование «Детекторов атрибутов» (Attribute Detectors). Это модели, обученные распознавать специфические графические характеристики объекта. Когда изображение анализируется, эти детекторы выдают «Значения уверенности» (Confidence Values). Если сумма этих значений превышает определенный порог, система считает объект распознанным и сопоставляет его с эталонным изображением в своей базе.
Что такое «Символьный идентификатор» (Symbolic Identifier) в контексте визуального поиска?
Это результат преобразования визуальной информации в формат, понятный стандартной поисковой системе. Например, фотография Эйфелевой башни преобразуется в текст «Эйфелева башня» или идентификатор соответствующей сущности в Knowledge Graph. Этот идентификатор затем используется как обычный поисковый запрос.
Как этот патент влияет на SEO для интернет-магазинов?
Влияние критическое. Он описывает механизм, позволяющий пользователям находить товары, фотографируя их (Claim 28). Для SEO это означает, что изображения товаров должны быть оптимизированы для распознавания алгоритмами Google (четкость, качество, разные ракурсы) и должны присутствовать в индексе Google (Merchant Center, Image Sitemaps), чтобы выступать в роли эталонных изображений.
Как патент влияет на локальное SEO?
Патент явно указывает на распознавание зданий (Claim 29) и использование GPS-данных для повышения точности. Для локального SEO это подчеркивает важность наличия качественных и актуальных фотографий фасада и вывесок в Google Business Profile, чтобы система могла точно идентифицировать бизнес, когда пользователь его фотографирует.
Что важнее для визуального поиска: ALT-текст или содержание изображения?
Согласно этому патенту, содержание изображения является первичным. Система анализирует пиксели с помощью Attribute Detectors для распознавания объекта. ALT-текст и окружающий контент могут использоваться как дополнительные сигналы, но ядром визуального поиска является именно машинное зрение и распознавание образов.
Как можно помочь Google распознать объекты на моих изображениях?
Во-первых, используйте высококачественные и четкие изображения, на которых объект хорошо виден. Во-вторых, используйте структурированные данные (Schema.org), чтобы явно связать изображение с конкретной сущностью (продуктом, местом). Это помогает Google корректно формировать базу эталонных изображений и их Symbolic Identifiers.
Описывает ли патент использование OCR?
Да, Claim 30 и раздел «Text Recognition» описывают использование системы распознавания символов (character recognition system) для извлечения текста из изображений. Более того, патент описывает последующий перевод этого текста на другой язык, что является стандартной функцией Google Lens.
Что произойдет, если система не уверена в том, что она видит?
Если агрегированные значения уверенности (Confidence Values) не превышают порогового значения (Threshold Value), объект не будет считаться распознанным. В таком случае система не сможет сгенерировать точный Symbolic Identifier. На практике Google Lens в таких ситуациях может предложить несколько похожих вариантов или выделить несколько объектов на изображении.
Могут ли сторонние компании добавлять свои изображения в базу распознавания Google?
Да, патент упоминает (Claim 10), что система позволяет поставщикам информации самостоятельно делать новые записи в системе обработки изображений, чтобы их данные можно было найти через ввод изображения. На практике это реализуется через индексацию сайтов, загрузку фидов в Merchant Center и использование Google Business Profile.

Мультимедиа

Семантика и интент
Мультимедиа
Индексация

Семантика и интент
SERP
Индексация

Мультимедиа
Ссылки

Мультимедиа
Индексация
Google Shopping

Семантика и интент
Ссылки
Knowledge Graph

Персонализация
Семантика и интент
Поведенческие сигналы

Ссылки
Антиспам
EEAT и качество

Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
EEAT и качество

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Knowledge Graph
Семантика и интент
EEAT и качество

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
SERP
Поведенческие сигналы
