
Google использует механизм для обработки гибридных запросов (текст + изображение). Система находит изображения, которые одновременно релевантны тексту и визуально похожи на образец. Для этого создаются компактные визуальные дескрипторы и используются "визуальные ключи" для быстрого поиска. Финальная выдача ранжируется по степени визуального сходства с образцом.
Патент решает проблему неоднозначности текстовых запросов при поиске изображений. Например, по запросу "ягуар" пользователь может искать животное или автомобиль. Традиционный текстовый поиск не всегда может точно определить интент. Изобретение позволяет пользователю уточнить свой текстовый запрос с помощью изображения-образца (Query Image), чтобы система вернула результаты, соответствующие и тексту, и визуальному контексту. Также решается задача эффективности масштабируемого визуального поиска.
Запатентована система поиска визуального контента, которая обрабатывает гибридные запросы (текст + изображение). Суть изобретения заключается в методе объединения двух наборов результатов: релевантных тексту и визуально похожих на образец. Система пересекает эти наборы, фильтрует по порогу текстовой релевантности и выполняет финальное ранжирование строго по степени визуального сходства с изображением-образцом. Также патентуются эффективные методы для расчета этого сходства с использованием Content Descriptors и Visual Keys.
Система работает в несколько этапов:
Text Score) и поиск по изображению-образцу (результаты имеют Similarity Score).Content Descriptors, созданные путем извлечения признаков, снижения размерности (Kernel PCA) и сжатия (Delta Encoding).Visual Keys, сгенерированные с помощью структуры данных Spill Tree, которые быстро идентифицируют потенциально похожие изображения.Text Score превышает заданный порог.Text Scores и Similarity Scores комбинируются, при этом возможны корректировки (повышение/понижение).Content Descriptor образца и дескрипторами результатов.Высокая. Технологии визуального поиска и гибридных запросов активно развиваются (например, Google Lens, Circle to Search). Описанные в патенте методы создания компактных визуальных сигнатур и эффективного поиска сходства лежат в основе масштабируемых систем распознавания изображений и критически актуальны для современного поиска.
Патент имеет высокое значение (8/10) для SEO в области E-commerce и оптимизации под Image Search. Он демонстрирует, что Google способен понимать содержание изображения на уровне пикселей, а не только по метаданным. Для гибридных запросов визуальное сходство является определяющим фактором финального ранжирования, что подчеркивает стратегическую важность качества, уникальности и четкости изображений на сайте.
Feature Vector с помощью Kernel PCA и Delta Encoding. Используется для вычисления визуального сходства между изображениями.Content Descriptor. Включает кодирование значений элементов вектора относительно локальных (блочных) и глобальных максимумов.Content Descriptor и Visual Keys.Feature Vector. Используется для преобразования вектора большой размерности в более компактное представление перед сжатием в Content Descriptor.Visual Keys. Позволяет изображению принадлежать нескольким узлам (ветвям), если его признаки находятся близко к границе принятия решения между ветвями.Spill Tree. Отражает степень неопределенности при выборе ветви. Используется для ранжирования Visual Keys (меньше spill – выше ранг).Spill Tree. Используются для быстрого поиска потенциально похожих изображений.Claim 1 (Независимый пункт): Описывает основной метод обработки гибридного запроса.
text query), с соответствующими первыми оценками (first scores / Text Score).query image), с соответствующими вторыми оценками (second scores / Similarity Score). Эта оценка основана на дистанции между Content Descriptor образца и результата.Text Score) удовлетворяют первому порогу.Content Descriptor образца и Content Descriptor каждого результата (т.е. по визуальному сходству).Claim 2, 3, 4, 5 (Зависимые): Детализируют процесс создания Content Descriptor (Claim 2). Он включает хеширование Feature Vector (Claim 3), использование Principal Component Analysis (PCA) для снижения размерности (Claim 4) и сжатие с помощью Delta Encoding (Claim 5).
Claim 6 и 9 (Зависимые): Описывают корректировку оценок. Text Score может быть увеличен для топовых текстовых результатов (Claim 6) или уменьшен, если он ниже динамического порога (Claim 9).
Claim 8 (Зависимый): Описывает возможность переупорядочивания финальных результатов не только по дистанции до образца, но и по дистанции до уже отобранного топового результата в финальном наборе.
Изобретение затрагивает несколько этапов поиска, с фокусом на индексирование визуального контента и ранжирование гибридных запросов.
INDEXING – Индексирование и извлечение признаков
Ключевой этап для этого патента. Здесь происходят основные офлайн-вычисления:
Feature Vectors из изображений.Content Descriptors (включая Kernel PCA и Delta Encoding).Visual Keys с использованием Spill Tree.Content Descriptors и Visual Keys.RANKING – Ранжирование
При получении гибридного запроса система выполняет два параллельных процесса ранжирования:
Text Scores).Visual Keys и последующее вычисление точного сходства по Content Descriptors (генерация Similarity Scores).RERANKING – Переранжирование / METASEARCH – Смешивание
Основной этап применения логики патента (Claim 1):
Text Score.Visual Keys и Content Descriptors).Входные данные:
Query Text).Query Image).Content Descriptors и Visual Keys.Выходные данные:
Similarity Score, так и Text Score, превышающего установленный порог.Процесс А: Генерация Content Descriptor (Индексирование)
Feature Vector большой размерности.Feature Vector применяются множественные хеш-функции (например, weighted minhash) для создания вектора хешей.Intersection Kernel между вектором изображения и тренировочными примерами, используя вектор хешей и формулу: (где A – вероятность коллизии хешей). Результат умножается на матрицу проекции.Content Descriptor.Процесс Б: Генерация Visual Keys (Индексирование)
Feature Vector или Content Descriptor изображения.Spill Tree.Spill.Visual Keys изображения.Spill (наименьший spill – наивысший ранг).Процесс В: Обработка гибридного запроса (Ранжирование)
Query Text и Query Image.Text Scores.Similarity Scores (используя Visual Keys и/или Content Descriptors образца).Text Score выше порога.Text Score, если только визуальное сходство не очень велико – closeness factor).Content Descriptors и дескриптором образца.Feature Vector.Text Score.Content Descriptors двух изображений.Intersection Kernel. Считается как количество совпавших хешей в векторах хешей, деленное на общую длину вектора.Spill Tree. Используется для ранжирования Visual Keys.Text Score при фильтрации пересечения результатов. Порог дистанции для определения визуальных дубликатов.Content Descriptors), которые фиксируют суть визуального контента. SEO-оптимизация изображений не ограничивается метаданными.Kernel PCA, аппроксимация Intersection Kernel через хеширование, Delta Encoding) для сжатия данных и ускорения вычислений, что позволяет применять визуальный анализ ко всему индексу.Spill Tree для генерации Visual Keys позволяет мгновенно находить кандидатов на сходство, минуя попарное сравнение дескрипторов. Это также используется для быстрой фильтрации не-дубликатов.Text Score, но патент также предусматривает, что очень высокое визуальное сходство (closeness factor) может компенсировать понижение за низкий Text Score.Text Score, чтобы пройти пороговый фильтр. Необходимо следить за тем, чтобы alt-тексты, заголовки и окружающий контент точно описывали изображение и соответствовали целевым текстовым запросам.Content Descriptors и Visual Keys для идентификации и удаления дубликатов, использование уникальных изображений (например, собственные фото товаров вместо стоковых) повышает шансы на ранжирование и снижает риск фильтрации.Feature Vectors сайта совпадет с Feature Vector изображения-образца, загруженного пользователем.Этот патент подтверждает стратегический приоритет Google в развитии визуального поиска и его интеграции с традиционным поиском. Для SEO-специалистов это означает необходимость рассматривать изображения как полноценный контент, требующий оптимизации не только на уровне атрибутов, но и на уровне визуального содержания. Понимание того, как Google интерпретирует визуальные данные через Content Descriptors и Visual Keys, критично для адаптации к таким технологиям, как Google Lens и поиск по картинкам, особенно в e-commerce.
Сценарий: Оптимизация карточки товара в магазине одежды
Пользователь ищет "синее вечернее платье" (Query Text) и загружает фотографию платья определенного фасона с Pinterest (Query Image).
Content Descriptors и Visual Keys. Текстовое окружение дает высокий Text Score по запросу "синее вечернее платье".Content Descriptor фото с Pinterest с дескрипторами сайта и находит высокое сходство (сайт попадает во второй набор).Что такое Content Descriptor и почему он важен для SEO?
Content Descriptor – это компактная математическая "подпись" изображения, полученная путем сложного анализа его визуальных признаков (Feature Vector) и сжатия с помощью Kernel PCA и Delta Encoding. Для SEO это критически важно, так как именно сравнение этих дескрипторов определяет степень визуального сходства в поиске по картинкам и используется для дедупликации контента. Это означает, что Google оценивает сами пиксели, а не только метаданные.
Что важнее в гибридном поиске: релевантность тексту или сходство с картинкой?
Оба фактора необходимы, но приоритеты расставлены четко. Чтобы попасть в выдачу, изображение должно присутствовать в результатах и по тексту (и пройти порог Text Score), и по картинке. Однако финальное ранжирование отобранных результатов (согласно Claim 1) производится строго по степени визуального сходства с образцом. Визуальное сходство определяет позицию в ТОПе.
Как используются Visual Keys и Spill Tree?
Spill Tree – это структура, которая классифицирует изображения по их признакам. Visual Key — это идентификатор группы визуально похожих изображений (листовой узел в этом дереве). Система использует их для повышения эффективности. Вместо того чтобы сравнивать Content Descriptor запроса с миллиардами других, Google сначала определяет Visual Keys запроса и ищет совпадения только среди изображений с такими же ключами. Это значительно ускоряет поиск кандидатов.
Влияет ли этот патент на ранжирование обычных веб-страниц (не Image Search)?
Патент напрямую описывает ранжирование в поиске изображений при гибридном запросе. Прямого влияния на ранжирование "синих ссылок" в патенте нет. Однако, понимание визуального контента может использоваться в основном поиске для оценки качества страницы, определения релевантности контента или формирования смешанной выдачи (Universal Search), где блок с картинками может быть сформирован с использованием этих технологий.
Как патент помогает бороться с дубликатами изображений?
Патент описывает два механизма. Во-первых, быстрое сравнение Visual Keys: если у двух изображений нет общих топовых Visual Keys, они точно не дубликаты, и дорогостоящее сравнение дескрипторов не требуется. Во-вторых, если ключи совпадают, система вычисляет точную дистанцию между Content Descriptors. Если дистанция ниже порога, изображения считаются дубликатами и могут быть исключены из выдачи.
Что такое Kernel PCA и аппроксимация Intersection Kernel?
Это сложные математические методы для эффективной обработки огромных векторов признаков. Kernel PCA используется для снижения размерности данных с сохранением важной информации. Intersection Kernel измеряет сходство, но его расчет дорог. Патент предлагает аппроксимировать его с помощью хеширования (формула с вероятностью коллизии A), что значительно ускоряет процесс и позволяет применять анализ в масштабах веба.
Как SEO-специалисту повлиять на Feature Vector или Content Descriptor своего изображения?
Напрямую повлиять на математические значения нельзя, но можно повлиять на исходные данные – само изображение. Использование качественных, четких, высококонтрастных изображений с хорошо различимыми объектами позволит системе извлечь более сильные и релевантные признаки. Разнообразие ракурсов также помогает создать более полное визуальное представление объекта.
Может ли высокое визуальное сходство компенсировать низкую текстовую релевантность?
В определенной степени. Изображение обязано пройти минимальный порог Text Score, чтобы вообще рассматриваться. Однако патент упоминает механизм корректировки оценок, где фактор понижения за низкий Text Score может быть ослаблен, если изображение имеет очень высокую степень визуального сходства (closeness factor) с образцом.
Актуален ли этот патент для оптимизации под Google Lens?
Да, очень актуален. Google Lens часто используется для поиска информации по изображению, иногда с текстовым уточнением. Механизмы, описанные в патенте (генерация Content Descriptors, быстрый поиск сходства через Visual Keys и обработка гибридных запросов), лежат в основе функциональности, подобной Google Lens, особенно при поиске товаров или определении объектов.
Стоит ли использовать стоковые фотографии в контексте этого патента?
Использование стоковых фотографий несет риски. Поскольку система эффективно идентифицирует визуальные дубликаты с помощью Content Descriptors и Visual Keys, неуникальные изображения могут быть отфильтрованы из выдачи в пользу канонического источника или просто понижены. Для достижения максимальной видимости в Image Search рекомендуется использовать уникальный визуальный контент.

Семантика и интент
Мультимедиа
SERP

Семантика и интент
Knowledge Graph
Мультимедиа

Мультимедиа
SERP
Семантика и интент

Мультимедиа
EEAT и качество
Ссылки

Индексация
Мультимедиа
Семантика и интент

Local SEO
Поведенческие сигналы

SERP
Поведенческие сигналы
EEAT и качество

Ссылки
Антиспам
EEAT и качество

Поведенческие сигналы
Персонализация
Семантика и интент

Мультиязычность
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP

Антиспам
Ссылки
SERP
