
Патент Google, описывающий инфраструктуру поиска по изображениям. Система разбивает изображения на "визуальные слова" (признаки) и использует инвертированный индекс (posting lists) для быстрого поиска совпадений. Ключевая особенность — хранение геометрических данных (положение признаков) прямо в индексе, что позволяет быстро рассчитывать визуальное сходство и проверять пространственное расположение элементов на лету.
Патент решает проблему эффективности и скорости поиска визуально похожих изображений (Content-Based Image Retrieval) в очень больших коллекциях данных. Он направлен на ускорение процесса сопоставления (matching) и оценки сходства (scoring). Основная задача — интегрировать дорогостоящую геометрическую верификацию (проверку пространственного соответствия признаков) непосредственно в этап первичного поиска, избегая задержек и многократного доступа к данным.
Запатентована система и метод для быстрого поиска похожих изображений на основе модели "мешка визуальных слов" (Bag-of-Visual-Words). Суть изобретения заключается в методе параллельного обхода нескольких списков соответствия (posting lists) и вычисления оценки сходства на лету (on-the-fly), до того как обход будет завершен. Это достигается за счет хранения геометрических данных (geometry data) признаков непосредственно в posting lists и использования оптимизированной древовидной структуры для управления обходом.
Система работает в несколько этапов:
feature vectors), которые квантуются в visual words. В индекс (posting lists) сохраняются идентификаторы изображений вместе с geometry data (положение, масштаб) для каждого визуального слова.visual words.posting lists, соответствующие визуальным словам запроса. Для оптимизации того, какой список продвигать следующим, используется специальная древовидная структура (Tree Structure).geometry data, извлеченные прямо из индекса, для выполнения геометрической верификации (проверяя пространственное соответствие признаков).Feature Space Density), придавая больший вес редким словам.Высокая (для инфраструктуры Image Search / Visual Search). Хотя современные методы поиска изображений все чаще полагаются на нейросетевые эмбеддинги, модель Bag-of-Visual-Words с геометрической верификацией остается фундаментальной технологией, особенно для поиска точных совпадений. Описанные методы оптимизации обхода индекса и интеграции оценки критически важны для систем, работающих в реальном времени с большими объемами данных (например, Google Lens).
Патент имеет преимущественно инфраструктурное значение (4/10) и описывает внутренние механизмы движка поиска изображений (Image Search Engine). Он не дает прямых рекомендаций для SEO-специалистов по оптимизации веб-страниц или текстового контента. Однако он критически важен для глубокого понимания того, как Google анализирует визуальное содержание, определяет сходство и идентифицирует объекты на изображениях. Эти знания необходимы для разработки стратегий в области Image SEO и Visual Search.
Feature Cells). Каждая ячейка соответствует одному визуальному слову. Аналог слова в текстовом поиске.Visual Word существует свой Posting List, содержащий список идентификаторов изображений (document identifiers), в которых это слово встречается. В данном патенте списки также содержат Geometry data.Visual Word. Включает координаты (position) и масштаб (scale/size) области на изображении.Visual Word. Рассчитывается на основе количества векторов признаков, попавших в ячейку, и размера этой ячейки. Высокая плотность означает общий, недискриминативный признак (аналог IDF).Visual Word. Формируется в процессе кластеризации.Posting Lists. Позволяет быстро определить, какой список нужно продвинуть следующим, и идентифицировать совпадения.Tree Structure.geometric mapping) между двумя наборами точек (визуальными словами двух изображений).Claim 1 (Независимый пункт): Описывает основной метод вычисления оценки сходства изображения путем параллельного обхода нескольких posting lists.
visual words.posting lists. Каждый элемент списка содержит идентификатор изображения и связанные с ним geometry data. Для каждого списка поддерживается курсор (item cursor).geometry data для совпавших слов.before advancing to an end of the particular posting list). Оценка основана на сравнении визуальных слов запроса и кандидата с использованием их geometry data.Ядро изобретения — выполнение сложной оценки (с геометрической верификацией) непосредственно во время первичного обхода индекса, благодаря хранению необходимых данных (геометрии) в самом индексе.
Claim 4 (Зависимый): Детализирует механизм обхода с использованием Tree Structure.
Обход осуществляется путем продвижения курсора того списка, который идентифицирован в корневом узле (root node) древовидной структуры. Листовые узлы соответствуют posting lists.
Claim 6 (Зависимый): Указывает на модификацию оценки сходства.
Вычисленная оценка взвешивается на основе рассчитанной Feature Space Density для соответствующего визуального слова.
Claim 7 (Зависимый): Описывает оптимизацию обновления Tree Structure.
Обновление родительских узлов выполняется с использованием инструкций Conditional Move для повышения производительности процессора.
Claim 10 (Зависимый): Определяет метод расчета Feature Space Density.
Плотность рассчитывается на основе деления количества векторов признаков в ячейке (Feature Cell) на вычисленный размер этой ячейки.
Изобретение применяется исключительно в инфраструктуре поиска изображений (Image Search System), например, в Google Images (поиск по картинке) и Google Lens.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые предварительные вычисления:
Feature Vectors из изображений.Visual Words.Feature Space Density для каждого визуального слова.Index Database: создание Posting Lists, включающих идентификаторы изображений и соответствующие Geometry data.RANKING – Ранжирование (Этап L1 Retrieval / Отбор Кандидатов)
Это основная область применения патента в режиме реального времени.
Visual Words из изображения-запроса.Posting Lists с использованием Tree Structure.Входные данные:
Visual Words).Index Database (Posting Lists с Geometry data).Feature Space Density.Выходные данные:
Image Query).Visual Words с запросом.Процесс А: Офлайн-индексация и обучение
Feature Cells (Visual Words).Feature Space Density (количество точек / размер).Visual Word на основе плотности. Высокоплотные слова могут быть исключены из индекса.Posting Lists. Заполнение списков идентификаторами изображений и их Geometry data (координаты, масштаб). Списки сортируются по идентификаторам.Процесс Б: Обработка запроса в реальном времени
Feature Vectors и квантует их в Visual Words. (Система может выбрать подмножество слов с наименьшей плотностью).Posting Lists. Инициализируется Tree Structure, листовые узлы заполняются первыми элементами списков.Similarity Score. Это включает: Geometry data из индекса.RANSAC) для поиска оптимального отображения (geometric mapping). Патент приводит пример f(x,y)=[ax+b,cy+d].Feature Space Density.Posting List, который указан в корневом узле (наименее продвинутый список).Tree Structure обновляется снизу вверх для отражения нового состояния курсоров. Этот шаг оптимизирован с помощью Conditional Move Instructions.Патент фокусируется на визуальных и структурных данных внутри изображения.
Feature Vectors.Geometry data — пространственные характеристики областей признаков. Они включают: Visual Words, необходимое для активации оценки сходства.RANSAC), которое наилучшим образом совмещает координаты признаков запроса с координатами признаков найденного изображения.Visual Words).Geometric Mapping).Geometry data непосредственно в Posting Lists. Это позволяет выполнять сложную геометрическую верификацию на лету во время первичного обхода индекса, что радикально ускоряет поиск.Conditional Move Instructions) и структур данных (Tree Structure) для достижения максимальной скорости обхода индекса.Практическое применение ограничено областью Image SEO и оптимизацией под визуальный поиск (Visual Search/Google Lens).
Feature Vectors и определять Visual Words. Это повышает вероятность того, что изображение будет корректно проиндексировано и найдено в визуальном поиске.Feature Space Density), будут иметь больший вес при определении сходства и релевантности в визуальном поиске.Geometric Mapping, определив, что это один и тот же объект, несмотря на разную перспективу.Feature Space Density), снижает дискриминационную способность изображения. Система может придавать меньший вес таким изображениям при визуальном сопоставлении.RANSAC) и снизить оценку сходства при поиске по образцу.Патент подчеркивает, что для Google Image Search и Visual Search ключевыми факторами являются качество исходных данных (четкость изображения) и уникальность визуальной информации. Для E-commerce и контентных проектов стратегически важно инвестировать в создание собственного, качественного визуального контента. Понимание механизма BoVW и геометрической верификации помогает понять, как работают такие продукты, как Google Lens, и почему они могут находить товары или объекты по пользовательским фотографиям.
Сценарий: Поиск товара в E-commerce по фотографии пользователя (Visual Search)
Visual Words из фото (например, логотип, текстура материала, форма подошвы) и их координаты (Geometry Data).Posting Lists в поиске изображений с похожим набором Visual Words.Visual Words с запросом.RANSAC и Geometry data (извлеченные прямо из индекса), чтобы проверить, можно ли совместить признаки. Она определяет, что пространственное расположение логотипа относительно подошвы соответствует геометрической трансформации.Feature Space Density) и меньший вес общей форме.Влияет ли этот патент на ранжирование моего сайта в основном веб-поиске Google?
Нет, этот патент описывает исключительно инфраструктуру и алгоритмы системы поиска похожих изображений (Image Search Engine). Он не затрагивает факторы ранжирования веб-страниц по текстовым запросам. Его влияние ограничено поиском по картинкам (когда пользователь загружает изображение) и визуальным поиском (например, Google Lens).
Что такое "визуальное слово" (Visual Word) простыми словами?
Это небольшой фрагмент или локальный паттерн на изображении, который система распознает как отдельный признак (например, угол объекта, специфическая текстура, часть логотипа). Изображение рассматривается как "мешок" таких визуальных слов. Это позволяет сравнивать изображения, находя общие признаки, аналогично тому, как текстовый поиск ищет общие слова в документах.
Что такое "геометрическая верификация" и зачем она нужна?
Это проверка пространственного расположения признаков. Недостаточно, чтобы два изображения имели одинаковые визуальные слова; важно, чтобы эти слова располагались относительно друг друга схожим образом. Например, если на двух фото есть глаза, нос и рот, геометрическая верификация проверит, формируют ли они лицо с правильными пропорциями. Это отсеивает ложные совпадения.
Почему Google игнорирует некоторые визуальные признаки согласно патенту?
Система использует метрику Feature Space Density (плотность пространства признаков). Если какой-то признак встречается очень часто (например, голубое небо, простая линия), он имеет высокую плотность и низкую дискриминационную способность — он не помогает отличить одно изображение от другого. Такие признаки получают низкий вес или игнорируются, чтобы сфокусироваться на уникальных элементах.
Как этот патент связан с Google Lens?
Описанный механизм является фундаментальной технологией для продуктов типа Google Lens. Когда вы используете Lens для поиска объекта или товара по фотографии, система применяет эти алгоритмы для быстрого сканирования миллиардов изображений в индексе, поиска совпадающих визуальных слов и проверки геометрического соответствия, чтобы найти релевантные результаты.
Что важнее для этого алгоритма: четкость изображения или его содержание?
Важны оба аспекта. Четкость и высокое качество необходимы для того, чтобы система могла надежно извлечь визуальные признаки (Feature Vectors). Уникальное содержание гарантирует, что извлеченные признаки будут иметь низкую Feature Space Density, что повышает их значимость при оценке сходства.
Поможет ли оптимизация Alt-текста или заголовков для этого алгоритма?
Нет. Алгоритм, описанный в этом патенте, работает исключительно с визуальными данными (пикселями) изображения. Он не анализирует связанный текст, метаданные, Alt-атрибуты или окружающий контент на странице. Эти факторы используются другими алгоритмами ранжирования в Google Images, но не в этом конкретном механизме поиска визуальных совпадений.
Как система обрабатывает изображения одного и того же объекта, снятого под разными углами?
Система справляется с этим благодаря процессу геометрического отображения (Geometric Mapping), часто используя алгоритм RANSAC. Она пытается найти математическую трансформацию (включая изменение перспективы, масштаба, поворот), которая наилучшим образом совместит визуальные слова одного изображения с визуальными словами другого. Если соответствие найдено, изображения признаются похожими.
Что такое Posting List в контексте поиска изображений?
Это инвертированный индекс, адаптированный для визуальных данных. Вместо того чтобы связывать текстовое слово со списком документов, он связывает Visual Word (визуальный признак) со списком всех изображений в базе данных, где этот признак встречается. В данном патенте эти списки также хранят геометрические данные признаков.
Насколько актуален подход Bag-of-Visual-Words (BoVW) с развитием нейросетей?
Подход BoVW остается актуальным, но он все чаще дополняется или заменяется методами на основе глубокого обучения (Deep Learning), такими как глобальные эмбеддинги изображений. BoVW очень эффективен для поиска точных совпадений и идентификации конкретных объектов, в то время как эмбеддинги лучше справляются с определением семантического и тематического сходства.

Индексация
Мультимедиа

Семантика и интент
Мультимедиа
SERP

Индексация
Мультимедиа
Семантика и интент

Мультимедиа
Индексация
Семантика и интент

Мультимедиа
Семантика и интент
SERP

Поведенческие сигналы
SERP
EEAT и качество

Ссылки
Мультиязычность
Семантика и интент

Ссылки
SERP
Индексация

Мультимедиа
EEAT и качество
Семантика и интент

Индексация
Техническое SEO
Структура сайта

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

SERP
Ссылки
Структура сайта

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
Local SEO
