
Патент Google описывает механизм для улучшения ранжирования в поиске по картинкам. Если для конкретного запроса нет обученной модели визуальной релевантности, система использует модель от похожего запроса. Оценка релевантности (Boost) корректируется с помощью "дробного множителя" (Fractional Adjustment Multiplier), который уменьшает влияние модели пропорционально степени различия между запросами.
Патент решает проблему повышения качества результатов в поиске по изображениям для запросов, по которым накоплено недостаточно данных (например, кликов) для обучения специализированной модели визуальной релевантности (Image Relevance Model, IRM). Это часто происходит с редкими, новыми или длиннохвостыми (long-tail) запросами. Изобретение позволяет улучшить ранжирование для таких запросов, используя знания (модели), накопленные для похожих, более популярных запросов.
Запатентована система для переноса оценок визуальной релевантности между похожими запросами. Если для текущего запроса (Query A) модель IRM недоступна, система находит похожий запрос (Query B) с обученной моделью. Эта модель IRM(B) применяется к изображениям Query A. Ключевым механизмом является Fractional Adjustment Multiplier (или Divisor), который корректирует (снижает) итоговое повышение в ранжировании (Boost) в зависимости от степени семантического различия между Query A и Query B.
Система функционирует на этапе ранжирования изображений:
Image Relevance Model.Degree of Similarity между двумя запросами на основе текстовых метрик (общие слова, синонимы, порядок слов).Content Feature Values) изображений, найденных по исходному запросу, генерируя базовые оценки релевантности (Boost Values).Degree of Similarity определяется Divisor (делитель). Чем меньше схожесть, тем больше делитель.Boost Values делятся на Divisor. Полученный результат (Fractional Adjustment Multiplier) применяется к исходным Information Retrieval (IR) scores изображений для переранжирования выдачи.Высокая. Принцип переноса знаний (Transfer Learning) между похожими задачами или запросами является фундаментальным для масштабирования современных поисковых систем. Хотя конкретные методы оценки визуальной релевантности эволюционировали (например, к векторным моделям типа CLIP), базовая идея использования данных от похожих запросов и корректировки оценок на основе семантической близости остается крайне актуальной в поиске по изображениям.
Патент имеет умеренное значение (6.5/10) для SEO, с сильным фокусом на вертикаль поиска по изображениям (Image Search). Он демонстрирует, что Google активно использует визуальные характеристики и поведенческие данные (клики) для ранжирования. Для SEO-специалистов ключевой вывод заключается в том, что успех в ранжировании изображений по популярным (head) запросам может косвенно улучшить видимость по связанным, менее частотным (long-tail) запросам благодаря описанному механизму переноса релевантности.
IR score изображения, рассчитанное на основе его Image Relevance Score. Используется для повышения ранга визуально релевантных изображений.Image Relevance Model.Boost Value, когда модель релевантности заимствуется от другого запроса. Определяется на основе Degree of Similarity; чем меньше схожесть, тем больше делитель.Boost, полученный после применения Divisor. Это скорректированное значение, которое применяется к IR score.Content Feature Values) и поведенческих данных (кликов). Оценивает визуальную релевантность изображения этому запросу.Degree of Similarity. Включают анализ Stop words (стоп-слов), Variants (синонимы или близкие термины), Optional words (необязательные слова) и порядок слов.IRM.Claim 1 (Независимый пункт): Описывает основной метод применения модели релевантности от похожего запроса при отсутствии модели для исходного запроса.
Image Relevance Models (IRM), каждая из которых обучена для уникального запроса и оценивает релевантность на основе визуальных признаков (visual features).Degree of Similarity между двумя запросами на основе схожести слов.Fractional Adjustment Value (Значение дробной корректировки) на основе Degree of Similarity. Утверждается, что это значение для высокой степени схожести ниже, чем для низкой степени схожести (т.е. чем больше схожесть, тем меньше пенальти/делитель).Image Relevance Adjustment Value (базовый бустинг) на основе визуальных признаков.Fractional Adjustment Value.Claim 4 (Зависимый от 1): Детализирует механизм расчета дробной корректировки.
Adjustment Multiplier, т.е. базовый Boost) на основе меры релевантности от IRM.Divisor (делитель).Degree of Similarity между двумя запросами.Изобретение применяется в рамках системы поиска по изображениям (Image Search Apparatus) и затрагивает несколько этапов обработки данных.
INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются и сохраняются визуальные характеристики изображений (Content Feature Values). Также офлайн происходит обучение Image Relevance Models на основе поведенческих данных (Click Logs, Query Logs).
QUNDERSTANDING – Понимание Запросов
Система должна уметь оценивать семантическую близость между различными запросами (Degree of Similarity), используя различные метрики (стоп-слова, синонимы, порядок слов), чтобы определить возможность переноса моделей.
RANKING – Ранжирование
На этом этапе генерируются первоначальные результаты поиска по изображениям с базовыми оценками (IR scores).
RERANKING – Переранжирование
Основной этап применения патента. Если для запроса нет своей IRM, система активирует механизм заимствования модели от похожего запроса. Рассчитывается Fractional Adjustment Multiplier, который применяется к IR scores для пересортировки результатов (создание Boosted IR Scores).
Входные данные:
IR scores.Content Feature Values) изображений.Image Relevance Models.Выходные данные:
Boosted IR Scores.Image Relevance Model.Процесс А: Офлайн-обучение (Предварительный этап)
Query Logs и Click Logs для расчета Relevance Feedback Score (например, CTR изображений по запросам).Training Images с высоким Relevance Feedback Score для конкретных запросов.Image Relevance Model (IRM) для каждого запроса, где достаточно данных. Модель учится связывать визуальные признаки (Content Feature Values) с релевантностью.Процесс Б: Обработка запроса (Рантайм)
IR Scores.Degree of Similarity между Query A и Query B. Анализируются метрики: стоп-слова, синонимы (variants), необязательные слова, порядок слов.Degree of Similarity определяется Divisor. (Например, синонимы -> Divisor=2; разный порядок слов -> Divisor=4).Image Relevance Scores (IRS).Boost Value.Fractional Boost = Boost Value / Divisor.Fractional Boost применяется к базовым IR Scores. Выдача пересортировывается.Content feature values, которые количественно описывают визуальное содержимое изображения (цвета, формы, текстуры). Патент упоминает, что эти данные могут быть представлены в виде "bag of features" или image content descriptor.Query logs и Click logs. Эти данные используются офлайн для обучения Image Relevance Models. Клики используются как индикатор релевантности (relevance feedback score).Degree of Similarity.Content Feature Values), а не только текстовых метаданных.Image Relevance Models обучаются на основе кликов пользователей (Click Logs). Система учится понимать, как выглядят релевантные изображения для конкретного запроса, основываясь на выборе пользователей.Fractional Adjustment Multiplier и Divisor), который уменьшает влияние заимствованной модели пропорционально семантическому различию между запросами. Чем дальше запрос от оригинала, тем меньше бустинг.Degree of Similarity между запросами напрямую влияет на ранжирование. Система детально анализирует текстовые различия, чтобы определить размер дисконта (Divisor).Content Feature Values).Relevance Feedback), это может привести к негативным поведенческим сигналам и ухудшению обучения моделей для связанных запросов.Патент подчеркивает стратегическое разделение между веб-поиском и поиском по изображениям. В Image Search визуальные сигналы, подкрепленные поведением пользователей, играют доминирующую роль. Система построена так, чтобы масштабировать понимание визуальной релевантности от известных запросов к неизвестным. Для SEO-стратегии это означает, что инвестиции в качественный, уникальный и визуально релевантный графический контент критически важны для получения трафика из поиска по картинкам.
Сценарий: Оптимизация изображений товаров в E-commerce
Image Relevance Model (IRM(B)). Модель знает, как выглядят эти кроссовки (форма, оттенки красного, логотип).Divisor = 3.Fractional Boost 4x к своему IR score по запросу Query A, что значительно улучшает его ранжирование, несмотря на отсутствие данных именно по этому редкому запросу.Что такое Image Relevance Model (IRM) и чем она отличается от обычного ранжирования?
IRM — это специализированная модель в поиске по картинкам, обученная для конкретного запроса. В отличие от базового ранжирования (которое дает IR score и часто опирается на текст вокруг картинки), IRM анализирует исключительно визуальные характеристики изображения (Content Feature Values). Она определяет, насколько внешний вид картинки соответствует тому, что пользователи обычно кликают по данному запросу.
Как Google определяет, что два запроса похожи?
Патент описывает несколько метрик для определения Degree of Similarity. Сюда входят: анализ стоп-слов (разница в артиклях или предлогах), использование вариантов слов (синонимы или близкие по смыслу термины, например, "здание" и "башня"), наличие необязательных слов (например, прилагательных типа "лучший"), а также порядок слов в запросе и наличие дополнительных слов.
Что такое Fractional Adjustment Multiplier и как он работает?
Это механизм дисконтирования (снижения) бустинга, когда система использует модель релевантности от другого запроса. Если запросы не идентичны, система применяет Divisor (делитель) к базовому бустингу. Например, если базовый бустинг 10x, а из-за различий в запросах делитель равен 2, то итоговый Fractional Adjustment Multiplier будет 5x. Чем меньше схожесть, тем больше делитель и меньше итоговый бустинг.
Применяется ли этот механизм, если у запроса уже есть собственная модель релевантности?
Согласно Claim 1, этот механизм активируется в ответ на то, что система определяет отсутствие собственной Image Relevance Model для полученного запроса. Он предназначен для решения проблемы нехватки данных по редким или новым запросам.
Как этот патент влияет на оптимизацию изображений для E-commerce?
Он имеет критическое значение. Это означает, что визуальное качество и четкость изображений товаров напрямую влияют на ранжирование. Кроме того, успешная оптимизация под общие запросы (например, "синий диван") может помочь ранжированию по специфическим запросам (например, "голубой вельветовый диван"), так как система сможет перенести сигналы релевантности, пусть и с дисконтом.
Означает ли это, что текстовая оптимизация (Alt-text, заголовки) больше не важна для Image Search?
Нет, она по-прежнему важна. Текстовая оптимизация в значительной степени влияет на базовый Information Retrieval (IR) Score. Описанный в патенте механизм применяется поверх этого базового скоринга в качестве бустинга (Boost). Чтобы получить максимальный эффект, необходимо иметь и высокий базовый IR score, и высокий Fractional Adjustment Multiplier.
Как система учится понимать, какие визуальные признаки важны для запроса?
Обучение происходит на основе поведенческих данных. Система анализирует Click Logs: если пользователи часто кликают на определенные изображения в ответ на запрос, система ищет общие визуальные признаки (Content Feature Values) у этих изображений и использует их для обучения Image Relevance Model для этого запроса.
Может ли этот механизм навредить ранжированию?
Теоретически, да. Если система ошибочно определит схожесть запросов или если заимствованная модель IRM присвоит вашим изображениям низкую оценку визуальной релевантности, итоговый множитель может быть низким или даже негативным (если система применяет дебустинг, хотя патент фокусируется на повышении). Это подчеркивает важность использования визуально релевантных изображений.
Патент упоминает конкретные значения для Делителя (Divisor). Стоит ли на них ориентироваться?
Патент приводит примеры (Делитель 2 для синонимов, 4 для разного порядка слов и т.д.) для иллюстрации принципа: чем больше различий, тем больше делитель. Однако конкретные значения являются лишь примерами реализации и могут меняться. SEO-специалистам следует фокусироваться на общем принципе: чем ближе ваш long-tail запрос к head-термину, тем больший бустинг вы потенциально можете получить.
Как этот патент соотносится с современными технологиями типа Google Lens или векторным поиском изображений?
Этот патент описывает более ранний подход, основанный на обучении моделей для конкретных текстовых запросов. Современные технологии, такие как векторные модели (например, CLIP), могут оценивать связь между изображением и текстом более гибко, без необходимости обучения отдельной модели для каждого запроса. Однако базовый принцип — использование визуальных сигналов для ранжирования и корректировка оценок на основе понимания запроса — остается актуальным и в новых системах.

Семантика и интент
Мультимедиа
SERP

Поведенческие сигналы
Мультимедиа
Семантика и интент

Мультимедиа
Семантика и интент

Мультимедиа
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа

Семантика и интент
SERP
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Поведенческие сигналы
Семантика и интент

EEAT и качество
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Персонализация
Поведенческие сигналы
Local SEO

Поведенческие сигналы
Персонализация
Local SEO
