
Google использует механизм для повышения эффективности и релевантности поиска похожих изображений. Система анализирует изображение-запрос и создает эталонный набор высококачественных результатов (используя ресурсоемкую кластеризацию). Затем она тестирует различные визуальные атрибуты (измерения), чтобы определить, какой из них лучше всего воспроизводит этот эталонный набор. Найденный ключевой атрибут сохраняется и используется для быстрого ранжирования в будущем, минуя дорогие вычисления.
Патент решает проблему баланса между качеством и скоростью в системах поиска похожих изображений (Search by Image). Методы, обеспечивающие высокое качество ранжирования, такие как кластеризация (clustering) результатов, являются вычислительно дорогими и слишком медленными для применения в реальном времени. Цель изобретения — достичь качества, сравнимого с кластеризацией, но со значительно меньшими вычислительными издержками (low-overhead).
Запатентована система оптимизации ранжирования изображений. Система обучается определять, какой специфический визуальный атрибут (называемый dimension или attribute) является ключевым для конкретного изображения-запроса (query image). Этот ключевой атрибут идентифицируется путем сравнения различных взвешенных ранжирований с эталонным набором (reference set of rankings), полученным через кластеризацию. В дальнейшем этот атрибут используется для быстрого ранжирования похожих запросов с помощью функции взвешенного расстояния (weighted distance function).
Система функционирует в двух режимах: обучение (офлайн или периодически) и применение (онлайн).
Режим обучения:
Reference Ranking Set с помощью ресурсоемкой кластеризации похожих результатов.Weighted Distance Function, которая сильно усиливает вес одного конкретного визуального атрибута (dimension).Kendall's Tau Distance). Выбирается атрибут, наиболее близкий к эталону.Image-dimension repository).Режим применения (Low-Overhead):
Weighted Distance Function, минуя этап кластеризации.Средняя-Высокая. Принцип оптимизации вычислений путем переноса сложных задач в офлайн и обучения более простых моделей для онлайн-применения остается фундаментальным для поисковых систем. Однако конкретная реализация, описанная в патенте (подан в 2012 г.) и основанная на фиксированных dimensions (например, связанных с форматами сжатия), вероятно, уступила место более сложным методам, использующим векторные представления (embeddings), сгенерированные глубокими нейронными сетями.
Влияние на SEO оценивается как среднее (5/10) и ограничено сферой Image SEO и Visual Search (Google Lens). Патент описывает внутренний механизм оптимизации ранжирования на основе визуального сходства. Он не вводит традиционных SEO-факторов (текст, ссылки). Однако он подчеркивает, что Google динамически определяет, какие именно визуальные характеристики (цвет, форма, текстура) являются ключевыми для конкретного изображения, что влияет на стратегию создания визуального контента.
pair-wise similarity comparison). Используется для создания высококачественного ранжирования.dimension, который был определен как оптимальный для его ранжирования.dimensions придается больший вес.Claim 1 (Независимый пункт): Описывает основной метод оптимизации ранжирования.
reference set of rankings).Ядром изобретения является процесс обучения для оптимизации будущих запросов. Система тестирует различные подходы к ранжированию и сравнивает их с эталоном. Цель — идентифицировать ключевой атрибут (dimension), который позволяет достичь высокого качества ранжирования. Затем этот атрибут используется для быстрого ранжирования похожих запросов в будущем, что позволяет избежать повторения дорогостоящих вычислений (таких как кластеризация, упомянутая в зависимых пунктах).
Claim 3 (Зависимый от 1): Уточняет генерацию эталонного набора.
Эталонный набор генерируется путем ранжирования изображений по сходству с запросом, их последующей группировки (кластеризации) и переранжирования на основе этой группировки.
Claim 5 (Зависимый от 1): Уточняет механизм ранжирования на основе кластеров.
Для каждого кластера определяется оценка сходства (similarity score) (например, на основе сходства хотя бы одного изображения в кластере с запросом). Ранжирование генерируется на основе этих оценок схожести кластеров.
Изобретение применяется в системах визуального поиска (Google Images, Google Lens) и затрагивает этапы индексирования и ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе из изображений извлекаются визуальные признаки (dimensions) и сохраняются в индексе.
Офлайн-обработка и анализ данных (Model Training)
Основной механизм обучения выполняется вне процесса обработки запроса в реальном времени:
Reference Ranking Set.dimensions с помощью Dimension selection engine.Image-dimension repository.RANKING – Ранжирование / RERANKING – Переранжирование
На этапе выполнения запроса (онлайн) система использует результаты обучения для ускорения:
Similar image identification engine) проверяет Image-dimension repository.Weighted Distance Function, сфокусированную на этом атрибуте, для быстрого ранжирования кандидатов (Low-Overhead Ranking). Это заменяет необходимость кластеризации в реальном времени.Входные данные:
Query Image).dimensions) для всех изображений.Image-dimension repository.Выходные данные:
dimensions. Упоминаются форматы JPEG, GIF, PNG, TIFF, WebP.Image-dimension repository, или когда для запроса еще не определен оптимальный атрибут.dimension для этого или визуально похожего изображения.Процесс А: Обучение и выбор оптимального атрибута (Выполняется офлайн или периодически)
Weighted Distance Function, которая придает большой вес атрибуту T.Kendall's Tau Distance.Image-dimension repository.Процесс Б: Быстрое ранжирование (Выполняется онлайн)
Image-dimension repository для поиска сохраненного оптимального атрибута для этого или похожего изображения.Weighted Distance Function, сфокусированной на этом атрибуте. (Этап кластеризации пропускается).Патент фокусируется исключительно на визуальных данных.
Dimensions (вектор признаков). Патент упоминает пример, где изображение может быть представлено набором из 59 измерений.Система использует несколько ключевых методов вычислений:
1. Функции расстояния (Distance Functions) и Алгоритмы кластеризации: Используются для измерения базового визуального несходства и для группировки результатов (упоминаются спектральная и иерархическая кластеризация).
2. Взвешенные функции расстояния (Weighted Distance Functions): Используются для расчета расстояния с акцентом на конкретный атрибут (t). Патент приводит несколько примеров формул. Например (Equation 1):
Где — расстояние с весом на атрибуте t, — базовое расстояние, c — константа, а — разница значений атрибута t между запросом и результатом.
3. Расстояние тау Кендалла (Kendall's Tau Distance): Используется для сравнения двух ранжирований (Equation 4):
Патент носит инфраструктурный характер и не дает прямых рекомендаций по оптимизации контента или технических аспектов сайта для улучшения ранжирования. Однако он дает понимание того, как работает визуальный поиск.
dimensions), использование высококачественных, четких изображений с хорошо различимыми признаками (цвет, форма, текстура) критически важно. Это помогает алгоритмам корректно извлекать признаки и точно оценивать визуальное сходство.dimensions и, как следствие, к плохому ранжированию в поиске похожих изображений.Патент подтверждает, что Google глубоко анализирует пиксели и использует машинное обучение для интерпретации визуального сходства на индивидуальном уровне для каждого изображения. Для SEO это напоминание о том, что визуальная составляющая контента анализируется на сложном техническом уровне, и качество исходного материала имеет первостепенное значение для видимости в Visual Search (Google Lens, Similar Images).
Практических примеров применения для SEO нет, так как патент описывает внутренний механизм ранжирования. Однако можно проиллюстрировать работу алгоритма.
Сценарий: Поиск похожих товаров (E-commerce)
Что такое "Dimension" (Измерение) или "Attribute" (Атрибут) в этом патенте?
Это конкретная визуальная характеристика изображения, представленная числовым значением во внутреннем формате системы. Это не метаданные, а признаки, извлеченные из пикселей (например, связанные с цветом, формой, текстурой). Если изображение представлено вектором из 59 значений, каждое из этих значений является dimension.
Как система определяет "идеальное" или эталонное ранжирование (Reference Ranking Set)?
Эталонное ранжирование генерируется офлайн с использованием вычислительно дорогих, но качественных методов. Основной метод, описанный в патенте, — это кластеризация (Clustering). Система группирует похожие результаты между собой и переранжирует их на основе этих групп. Это считается "идеальным", так как хорошо группирует визуально схожие объекты.
Зачем Google оптимизирует этот процесс, если кластеризация дает лучшие результаты?
Кластеризация требует сравнения каждого результата с каждым другим, что является вычислительно очень дорогой и медленной операцией. Ее невозможно выполнять в реальном времени для миллионов запросов. Описанный метод позволяет добиться схожего качества ранжирования значительно быстрее, используя предварительно вычисленные веса атрибутов.
Что такое Kendall's Tau Distance и зачем это нужно?
Это метрика, которая измеряет, насколько похожи порядки двух списков ранжирования. Она подсчитывает количество пар элементов, упорядоченных одинаково в обоих списках. Google использует её, чтобы определить, какой из взвешенных по атрибутам методов ранжирования лучше всего имитирует эталонное (кластеризованное) ранжирование.
Влияет ли этот патент на обычный поиск изображений по ключевым словам?
Нет. Патент специфически описывает методы ранжирования для сценариев, где запросом является само изображение (Search by Image или Similar Images). Он не затрагивает ранжирование изображений по текстовым запросам, где используются другие сигналы (текст на странице, alt-текст и т.д.).
Могу ли я как SEO-специалист повлиять на то, какой атрибут Google выберет как ключевой для моего изображения?
Напрямую повлиять на этот выбор нельзя, это результат внутреннего машинного обучения. Однако можно косвенно помочь системе, предоставляя высококачественные, четкие и визуально однозначные изображения. Это облегчает корректный анализ их визуальных характеристик и повышает точность сопоставления.
Применяется ли этот механизм каждый раз, когда я ищу по картинке?
Механизм быстрого ранжирования (low-overhead) применяется только в том случае, если система уже провела офлайн-анализ для этого конкретного изображения (или очень похожего на него) и сохранила оптимальный атрибут. Если анализ не проводился, система использует другие, возможно более медленные, методы ранжирования.
Актуален ли этот патент, учитывая развитие нейронных сетей и векторного поиска (embeddings)?
Конкретная реализация (например, фиксированные dimensions, связанные со сжатием) может быть устаревшей. Современные системы используют сложные векторы (embeddings). Однако сама идея — использовать офлайн-обучение для нахождения более эффективных и быстрых функций ранжирования в онлайне — остается фундаментальным принципом построения поисковых систем.
Может ли система выбрать несколько оптимальных атрибутов для одного изображения?
Да, патент предусматривает такую возможность. В описании и формулах (например, Equations 5-7) показано, как функция взвешенного расстояния может учитывать несколько атрибутов одновременно, если система определит, что это необходимо для достижения оптимального ранжирования.
Как система определяет, что новый запрос похож на тот, для которого уже вычислен оптимальный атрибут?
В патенте упоминается компонент Similar image identification engine. Он сравнивает входящее изображение с изображениями, для которых уже есть данные в Image-dimension repository. Если мера визуального сходства превышает определенный порог (similarity threshold), система использует сохраненный атрибут для нового запроса.

Мультимедиа
SERP

Семантика и интент
Мультимедиа
SERP

Мультимедиа
SERP
Семантика и интент

Индексация
Мультимедиа
Семантика и интент

Мультимедиа
SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы

Мультиязычность
Семантика и интент
Ссылки

Поведенческие сигналы

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

EEAT и качество
Техническое SEO
Ссылки

Персонализация
Поведенческие сигналы
Local SEO
