
Google использует систему параллельных поисковых движков (OCR, распознавание лиц, объектов, продуктов) для анализа визуального запроса (изображения). Система создает интерактивный документ, накладывая на исходное изображение визуальные идентификаторы (например, рамки или метки) для распознанных объектов. Эти идентификаторы служат ссылками на конкретные результаты поиска для каждого объекта.
Патент решает проблему обработки и представления результатов для сложных визуальных запросов (изображений), которые содержат несколько различных объектов или типов информации (например, текст, лицо и продукт на одном фото). Стандартный список результатов не позволяет пользователю легко понять, какой результат соответствует какому объекту. Изобретение улучшает пользовательский опыт (UX) в визуальном поиске, обеспечивая прямую связь между объектами на изображении и результатами поиска по ним.
Запатентована система и пользовательский интерфейс (UI) для визуального поиска. Суть изобретения заключается в методе параллельной обработки визуального запроса несколькими специализированными поисковыми системами (Parallel Search Systems) и последующей агрегации результатов в interactive results document. Этот документ визуально связывает конкретные результаты поиска с соответствующими подобластями (sub-portions) исходного изображения с помощью кликабельных идентификаторов.
Система функционирует следующим образом:
Visual Query).Front End Server направляет запрос одновременно в несколько поисковых систем (например, распознавание лиц, OCR, объектов, продуктов).interactive results document. На распознанные области накладываются visual identifiers (например, bounding boxes или labels), или создается структурированный список с миниатюрами (thumbnails) распознанных областей.Высокая. Описанные в патенте механизмы лежат в основе современных продуктов визуального поиска, таких как Google Lens. Способность распознавать несколько объектов в поле зрения камеры и предоставлять интерактивные результаты для каждого из них является ключевой функцией мобильных поисковых интерфейсов в 2025 году.
Влияние на SEO среднее (6/10). Патент напрямую не описывает алгоритмы ранжирования веб-страниц для текстовых запросов. Однако он имеет критическое значение для понимания того, как Google анализирует изображения и извлекает из них сущности, текст и информацию о продуктах. Это напрямую влияет на стратегии Image SEO, видимость товаров в Google Shopping и потенциал получения трафика через визуальный поиск (например, Google Lens).
Face Recognition Search System (распознавание лиц), OCR Search System (распознавание текста), Image-to-Terms Search System (распознавание объектов/категорий), распознавание штрихкодов, продуктов.sub-portion и содержит кликабельную ссылку на результаты поиска. Может быть реализован как Bounding Box, Label или Thumbnail image.Claim 1 (Независимый пункт): Описывает метод генерации страницы результатов поиска (SERP) для визуального запроса, фокусируясь на структуре выдачи (Col. 27-28).
first and second image search components / Parallel Search Systems), которым был отправлен запрос.region / sub-portion) исходного изображения, которые ассоциированы с каждым из этих результатов.Image Search Results Page), которая включает: thumbnail image (миниатюру), связанную с определенной областью исходного запроса, и ссылку на найденный ресурс.Claim 1 описывает структурированную выдачу (как на FIG. 15 патента), где результаты от разных движков представлены в разных секциях SERP и используют миниатюры, вырезанные из исходного запроса, для иллюстрации того, что было найдено.
Claim 2 (Зависимый от 1): Уточняет, что представление определенной области включает bounding box (ограничивающую рамку), которая очерчивает границу распознанной сущности в подобласти исходного изображения.
Claim 4 (Зависимый от 2): Описывает визуальное форматирование bounding box (например, цвет, стиль) на основе идентифицированного типа сущности (например, продукт, лицо, текст).
Claim 5 (Зависимый от 1): Описывает интеграцию с текстовым поиском. Если область изображения содержит текстовый элемент, метод включает получение дополнительных результатов от term query search component на основе этого текста и добавление их на страницу.
Claim 6 (Зависимый от 1): Описывает обработку лиц. Если область изображения содержит изображение лица, метод включает идентификацию атрибутов, связанных с человеком (например, имя, контактная информация, согласно описанию патента), и добавление этих атрибутов на страницу результатов.
Патент описывает архитектуру системы визуального поиска (например, Google Lens), которая функционирует параллельно основному веб-поиску.
INDEXING – Индексирование (Предпосылка)
Параллельные поисковые системы (Parallel Search Systems) полагаются на собственные специализированные индексы (например, Facial Image Database, Image Search Database), которые должны быть предварительно созданы и наполнены данными на этапе индексирования.
QUNDERSTANDING – Понимание Запросов (Визуальных)
Front End Visual Query Processing Server получает визуальный запрос и распределяет его. Также сюда относится опциональная предварительная обработка на стороне клиента (Local image analysis) для распознавания типов контента (например, обнаружение лиц или штрихкодов).
RANKING – Ранжирование (Визуальное)
Каждая из параллельных поисковых систем независимо обрабатывает запрос, извлекает кандидатов из своего индекса и ранжирует их, вычисляя оценки релевантности (relevancy score).
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Front End Server агрегирует результаты от всех параллельных систем. Модули Results Filtering и Results Ranking & Formatting фильтруют и определяют итоговый порядок результатов. На этом этапе происходит создание пользовательского интерфейса (Interactive Results Document / Image Search Results Page) и смешивание результатов разных модальностей.
Входные данные:
Выходные данные:
Interactive Results Document (изображение с интерактивными наложениями) и/или категоризированный список результатов поиска с миниатюрами (thumbnails).Процесс обработки визуального запроса
Front End Server.sub-portion исходного изображения соответствует каждому результату.category weight для упорядочивания групп результатов.Term Query Server System.thumbnails) распознанных областей.Interactive Results Document (согласно описанию и зависимым Claims): Генерация Visual Identifiers (рамок или меток) для идентифицированных подобластей. Применение визуального кодирования типа сущности (например, цвет рамки).Visual Query). Система анализирует паттерны для распознавания текста, лиц, объектов, логотипов и т.д.place recognition).Social Network Database) могут использоваться в контексте системы распознавания лиц для идентификации людей и предоставления информации о них (имя, контакты, текущее местоположение связанного устройства, согласно описанию и Claim 6). Тип клиентского устройства (мобильное или настольное).null value.Parallel Search Systems). Это ключевой аспект архитектуры визуального поиска.sub-portions). Google стремится идентифицировать отдельные сущности (текст, лица, объекты) внутри одного изображения.Interactive Results Document и структурированный SERP), который напрямую связывает результаты поиска с конкретным местом на изображении с помощью визуальных идентификаторов (рамок, меток или миниатюр).Image-to-Terms, автоматически запуская текстовые запросы для обогащения выдачи.Рекомендации направлены на оптимизацию под визуальный поиск (Visual Search Optimization), так как патент описывает именно эту систему (например, Google Lens).
object recognition). Четкость повышает вероятность корректного распознавания специализированными движками.OCR Search System работает параллельно, и четкий текст может стать отдельным вектором поиска и источником данных для Term Queries.Bounding Box и создать точную миниатюру (thumbnail).actionable search results), такие как опция покупки продукта или информация о персоне, упомянутые в патенте.sub-portions и снижают вероятность распознавания.Патент раскрывает техническую основу и философию интерфейсов типа Google Lens. Это подтверждает стратегический фокус Google на развитии визуального поиска как альтернативы текстовому. Для SEO это означает возрастающую важность оптимизации визуального контента (Image SEO). Бренды и ритейлеры должны учитывать, что изображения на их сайтах должны быть оптимизированы для максимальной распознаваемости системами Product recognition и OCR.
Сценарий: Оптимизация изображения товара для E-commerce под визуальный поиск
Visual Query, система Google задействует несколько параллельных систем. Она сгенерирует Image Search Results Page. Согласно Claim 1, она покажет структурированный список с отдельными областями для "Product Match" и "Logo Match", используя миниатюры (thumbnails) распознанных элементов. Пользователю предлагается результат, ведущий на оптимизированную карточку товара с опцией покупки (actionable search result).Описывает ли этот патент, как ранжируются изображения в Google Images?
Нет. Патент описывает архитектуру и интерфейс для обработки визуальных запросов, то есть когда пользователь сам загружает изображение или использует камеру (как в Google Lens). Он объясняет, как результаты обрабатываются и показываются пользователю в этом интерфейсе, а не то, как Google ранжирует изображения в своем основном индексе.
Что такое "параллельные поисковые системы" в контексте этого патента?
Это специализированные поисковые движки (компоненты), которые работают одновременно для анализа одного изображения. Патент упоминает распознавание лиц (Facial Recognition), оптическое распознавание текста (OCR), распознавание объектов (Image-to-Terms), продуктов, штрихкодов и достопримечательностей. Каждая система ищет совпадения в своей специализированной базе данных.
Что такое "интерактивный документ результатов"?
Это способ представления результатов. Система может показать исходное изображение и выделить на нем области (sub-portions) с помощью рамок или меток (visual identifiers). Также это может быть структурированная страница выдачи (SERP), где результаты представлены миниатюрами (thumbnails) распознанных областей.
Как система решает, что выделить рамкой или миниатюрой на изображении?
Если одна из параллельных поисковых систем находит результат с достаточно высокой оценкой релевантности (relevancy score) для определенной части изображения, система идентифицирует эту подобласть и создает для нее визуальный идентификатор (рамку или миниатюру).
Может ли система распознать несколько разных объектов на одном фото?
Да, это ключевая особенность патента. Если на фото есть человек, собака и текст, система попытается распознать все три элемента независимо, используя разные движки (распознавание лиц, объектов и OCR). В результате пользователь увидит отдельные интерактивные результаты для каждого распознанного элемента.
Какое значение это имеет для Image SEO и оптимизации под визуальный поиск?
Это подчеркивает важность четкости и качества изображений. Чтобы системы распознавания объектов или OCR могли корректно идентифицировать ваш контент, изображения должны быть высококачественными, а объекты — четко различимыми. Это увеличивает шансы на то, что ваш продукт или информация будут распознаны при визуальном поиске.
Использует ли Google OCR для текста на изображениях в визуальном поиске?
Да, патент явно указывает на использование OCR Search System как одной из параллельных систем. Это означает, что текст на изображениях (например, на упаковке продукта) анализируется и может использоваться как для поиска совпадений, так и для генерации автоматических текстовых запросов (Term Queries).
Что означает, что рамки могут быть отформатированы по типу сущности?
Патент (Claim 4) описывает возможность визуального кодирования. Например, система может использовать синие рамки для распознанных продуктов, зеленые для текста и красные для лиц. Это помогает пользователю быстро понять, какой тип информации был найден в каждой области.
Упоминается ли в патенте распознавание лиц и использование личных данных?
Да. Патент включает Facial Recognition Search System и упоминает использование Social Network Database. Claim 6 указывает на возможность системы идентифицировать людей на фото и предоставлять связанные с ними атрибуты (имя, контактные данные и т.д., согласно описанию патента), если это применимо.
Использует ли система данные о местоположении при визуальном поиске?
Да, в патенте упоминается возможность использования данных GPS или информации о местоположении, предоставляемой клиентским устройством. Эти данные могут помочь в распознавании места (place recognition) или локальных объектов, улучшая релевантность результатов.

Мультимедиа
SERP

Мультимедиа
Индексация
Google Shopping

Семантика и интент
SERP
Индексация

Мультимедиа
Индексация
Семантика и интент

Мультимедиа

Семантика и интент
SERP
Поведенческие сигналы

Knowledge Graph
EEAT и качество
Семантика и интент

EEAT и качество
SERP
Knowledge Graph

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
SERP

Local SEO
Антиспам
Поведенческие сигналы

EEAT и качество
Свежесть контента
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP
