
Google оптимизирует визуальный поиск, группируя почти идентичные изображения (измененный размер, обрезка) в единый кластер. Система индексирует не отдельные картинки, а совокупность всех визуальных признаков ("визуальных слов") из всех вариантов в кластере. Это повышает эффективность индекса и гарантирует согласованность результатов при поиске по изображению.
Патент решает проблему несогласованности и неэффективности при поиске визуально похожих изображений (Query by Image). Почти идентичные дубликаты (near-duplicate images) — например, изображения с измененным размером, обрезанные или пережатые версии — могут генерировать разные наборы визуальных признаков (Visual Words). Это приводит к тому, что система может найти одну версию изображения, но пропустить другую, или обрабатывать их как разные объекты. Патент направлен на улучшение качества поиска, обеспечение согласованности результатов и повышение эффективности индексации.
Запатентована система, которая изменяет процесс индексации изображений, переходя от индексации отдельных файлов к индексации Collections of Near-Duplicate Images (Коллекций почти идентичных изображений). Система объединяет дубликаты в одну коллекцию и вычисляет Union of Visual Words — совокупность всех уникальных визуальных признаков из всех изображений коллекции. Эта коллекция затем индексируется как единое целое на основе этого объединенного набора признаков.
Механизм работает в несколько этапов:
Common Coordinate Frame), например, с помощью аффинных преобразований (Affine Transformation), чтобы нормализовать геометрические различия (масштаб, обрезка).Visual Words в этой общей системе координат.Union of Visual Words, включающий все уникальные признаки из всех изображений коллекции.Posting Lists) добавляется идентификатор коллекции (а не отдельных изображений), связанный с этим объединенным набором признаков.Высокая. Дедупликация, кластеризация и эффективное индексирование визуальных признаков являются фундаментальными задачами для любой крупномасштабной системы визуального поиска, такой как Google Images и Google Lens. Описанный подход к агрегации сигналов из дубликатов для создания более надежного и эффективного индекса лежит в основе современных систем визуального поиска.
Патент имеет умеренно высокое влияние на стратегию Image SEO (6.5/10). Хотя он описывает инфраструктуру визуального поиска (Query-by-Image) и не вводит традиционных факторов ранжирования, он раскрывает механизм того, как Google воспринимает и индексирует визуальный контент. Понимание того, что Google агрегирует визуальные сигналы из всех дубликатов, позволяет разрабатывать стратегии для максимизации совокупного "визуального веса" ключевых изображений путем обеспечения доступности и качества их вариаций.
Visual Word существует свой Posting List, содержащий идентификаторы коллекций (Collection ID), в которых встречается это слово.Geometric Mapping, который оптимизирует выравнивание между визуальными словами запроса и коллекции.Visual Words, присутствующих во всех изображениях данной коллекции, приведенных к Common Coordinate Frame. Является основой для индексации коллекции.Claim 1 (Независимый пункт): Описывает основной процесс индексирования коллекций изображений.
Common Coordinate Frame.Visual Words для каждого изображения в этой общей системе координат.Union of Visual Words для всей коллекции.Posting Lists для каждого слова из этого объединения.Claim 2 (Зависимый от 1): Описывает процесс поиска и ранжирования.
Visual Words.Visual Words с запросом.Claim 4 (Зависимый от 2): Уточняет порог совпадений.
Пороговое количество общих Visual Words, необходимое для признания коллекции релевантной, увеличивается по мере увеличения размера коллекции. Это необходимо, так как большие коллекции естественным образом имеют больше Visual Words в своем объединении, что повышает вероятность случайных совпадений.
Claim 6 (Зависимый от 2): Уточняет механизм расчета оценки.
Расчет оценки включает вычисление оценки для каждого совпадающего Visual Word на основе Geometric Mapping между визуальными словами запроса и визуальными словами коллекции. Это означает, что проверяется не только наличие признаков, но и их пространственное расположение.
Claim 7 (Зависимый от 1): Детализирует механизм выравнивания.
Выравнивание включает выбор эталонного изображения (Reference Image) в коллекции и определение Affine Transformation между эталонным изображением и каждым другим изображением коллекции.
Изобретение затрагивает инфраструктуру визуального поиска (Image Search System) и применяется на этапах индексирования и ранжирования.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Система выполняет кластеризацию изображений, выравнивание дубликатов к Common Coordinate Frame, вычисление Union of Visual Words и построение Index Database (Posting Lists). Ключевой момент: система индексирует идентификаторы коллекций (Collection IDs), а не отдельных изображений (Image IDs).
RANKING – Ранжирование (Retrieval и Scoring)
На этапе отбора кандидатов (Retrieval) система использует созданные Posting Lists для быстрого поиска коллекций, которые имеют достаточное количество общих Visual Words с изображением-запросом (с учетом динамических порогов). На этапе оценки (Scoring) система вычисляет Similarity Score, используя Geometric Mapping для проверки пространственного соответствия признаков между запросом и найденными коллекциями.
Входные данные:
Image Collection), вычисленные Feature Vectors.Visual Words.Выходные данные:
Collections of Near-Duplicate Images); Index Database с идентификаторами коллекций и связанными геометрическими данными.Image Search Results).Visual Words превышает определенный порог, который динамически зависит от размера коллекции.Процесс А: Индексация коллекций (INDEXING)
Affine Transformations, создавая Common Coordinate Frame.Visual Words и их координаты в Common Coordinate Frame.Union of Visual Words для коллекции.Posting Lists для каждого визуального слова из объединения.Процесс Б: Поиск по изображению (RANKING)
Visual Words.Posting Lists, соответствующие визуальным словам запроса, для идентификации коллекций-кандидатов.Similarity Score. Это включает поиск оптимального Geometric Mapping (например, с помощью RANSAC) и оценку того, насколько хорошо визуальные слова запроса пространственно совпадают с визуальными словами коллекции.Similarity Score, или выбрать одно репрезентативное изображение (например, самое большое).Патент фокусируется на обработке визуальных данных.
Feature Vectors.Feature Vectors.Visual Word. Эти данные нормализуются в Common Coordinate Frame.Union of Visual Words) всех признаков, извлеченных из всех известных его дубликатов. Это делает представление изображения более полным и устойчивым к артефактам отдельных версий (например, обрезке или сжатию).Common Coordinate Frame. Это позволяет системе игнорировать различия в масштабе и кадрировании, гарантируя, что геометрические данные (расположение признаков) сопоставимы.Visual Words, чтобы считаться релевантными. Это механизм защиты от шума и повышения точности (Precision).Geometric Mapping). Это позволяет отличать изображения с одинаковыми объектами, но разной композицией.Union of Visual Words, усиливая общую визуальную сигнатуру контента.Visual Words, что улучшает способность системы кластеризовать их и находить совпадения при поиске.Union of Visual Words, что потенциально снижает видимость контента в визуальном поиске.Visual Words. Это может помешать системе идентифицировать изображение как дубликат, изолируя его от коллекции и уменьшая его совокупный визуальный сигнал.near-duplicate images и объединит в одну коллекцию.Патент подтверждает, что визуальный поиск Google основан на сложных технологиях компьютерного зрения и дедупликации. Стратегическое значение для SEO заключается в понимании того, что Google стремится понять содержание изображения на уровне пикселей и индексирует визуальные концепты, а не файлы. Долгосрочная стратегия в Image SEO должна включать оптимизацию визуальных активов для улучшения их распознавания и кластеризации, рассматривая все вариации изображения как единое целое.
Сценарий: Оптимизация изображений товара в E-commerce
near-duplicate images.Common Coordinate Frame).Union of Visual Words: {Экран, Камера, Логотип}.Что такое "Визуальные слова" (Visual Words) в контексте этого патента?
Visual Words — это технический термин из компьютерного зрения. Система анализирует изображение, находит ключевые области интереса (Feature Regions) и вычисляет для них числовые характеристики (Feature Vectors). Затем эти векторы квантуются, то есть группируются в ограниченное число категорий. Эти категории и называются "визуальными словами". Они позволяют системе быстро сравнивать изображения, проверяя, какие визуальные слова у них общие.
Почему Google просто не индексирует каждое изображение отдельно?
Индексация каждого изображения отдельно неэффективна и ненадежна. Во-первых, это значительно увеличивает размер индекса и замедляет поиск. Во-вторых, почти идентичные дубликаты (например, обрезанная версия) могут иметь разные наборы Visual Words. Патент предлагает индексировать коллекции дубликатов, используя объединение всех их визуальных слов (Union of Visual Words), что делает поиск более полным, согласованным и быстрым.
Что такое "Объединение визуальных слов" (Union of Visual Words) и как оно помогает в SEO?
Это совокупность всех уникальных визуальных признаков, найденных во всех изображениях, входящих в коллекцию дубликатов. Если версия А имеет признаки {1, 2, 3}, а версия Б имеет признаки {2, 3, 4}, то их объединение будет {1, 2, 3, 4}. Для SEO это означает, что совокупный "визуальный вес" изображения увеличивается за счет агрегации сигналов из всех его вариаций, при условии, что они доступны для сканирования.
Зачем нужно выравнивание изображений по общей системе координат (Common Coordinate Frame)?
Выравнивание необходимо для нормализации геометрических различий между дубликатами. Если одно изображение обрезано или масштабировано, расположение его визуальных признаков смещается. Приведение всех изображений к единой системе координат (например, с помощью Affine Transformation) гарантирует, что одни и те же признаки будут иметь одинаковые координаты. Это критически важно для последующей геометрической верификации при ранжировании.
Что означает динамический порог совпадений, зависящий от размера коллекции?
Патент указывает, что чем больше коллекция изображений, тем больше у нее Visual Words в объединении. Это повышает вероятность случайных совпадений с любым запросом. Чтобы избежать этого, система повышает требования: для большой коллекции требуется большее количество общих Visual Words с запросом, чтобы считать ее релевантной, по сравнению с маленькой коллекцией. Это обеспечивает точность поиска.
Как система использует геометрическое отображение (Geometric Mapping) при ранжировании?
Недостаточно просто найти коллекцию с общими Visual Words. Система проверяет, расположены ли эти слова в той же пространственной конфигурации, что и в запросе. Для этого она ищет оптимальное геометрическое преобразование (например, сдвиг, масштаб), которое наилучшим образом совмещает признаки запроса и коллекции (используя, например, алгоритм RANSAC). Чем точнее пространственное совпадение, тем выше Similarity Score.
Как этот патент влияет на использование водяных знаков?
Влияние зависит от реализации. Небольшие, полупрозрачные водяные знаки вряд ли помешают системе определить дубликаты и сформировать коллекцию. Однако очень большие, непрозрачные водяные знаки, которые сильно изменяют ключевые визуальные признаки изображения, могут привести к тому, что изображение не будет распознано как часть коллекции, что может снизить его видимость в поиске.
Если у меня на сайте много разных размеров одного изображения, это хорошо или плохо согласно патенту?
Это хорошо, при условии, что все они доступны для сканирования и имеют достаточное качество. Наличие разных размеров помогает системе сформировать надежную коллекцию. Все визуальные признаки из этих версий будут объединены в Union of Visual Words, усиливая общую визуальную сигнатуру изображения.
Как система решает, какое изображение показать в выдаче, если найдена целая коллекция?
Патент предлагает несколько вариантов. Система может вернуть все изображения из коллекции, присвоив им одинаковый Similarity Score. Альтернативно, она может выбрать одно репрезентативное изображение. Критерии выбора могут включать размер изображения (выбор самого большого) или популярность (изображение, которое чаще выбирают пользователи).
Применяется ли этот патент к традиционному поиску по текстовым запросам?
Нет. Этот патент описывает инфраструктуру и алгоритмы, специфичные для систем визуального поиска (Query by Image), где запросом является само изображение (например, Google Lens или загрузка файла в Google Images). Он не затрагивает факторы ранжирования изображений по текстовым запросам, такие как alt-текст или контекст страницы.

Мультимедиа
Семантика и интент
SERP

Индексация
Мультимедиа

Мультимедиа
SERP

Семантика и интент
Мультимедиа
SERP

Мультимедиа
SERP
Семантика и интент

Поведенческие сигналы
Local SEO

Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Индексация
Ссылки
Техническое SEO

Ссылки
SERP
Семантика и интент

Семантика и интент
Структура сайта
Ссылки

Персонализация
Поведенческие сигналы
SERP

EEAT и качество
SERP
Knowledge Graph

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация
