
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
Патент решает проблему отсутствия специализированных моделей визуальной релевантности (image relevance models) для огромного количества многословных поисковых фраз (search phrases), особенно для редких или сложных (long-tail) запросов. Поскольку невозможно обучить модель для каждого уникального запроса, изобретение предлагает механизм для использования существующих моделей, обученных на частях исходного запроса (sub-queries), чтобы улучшить ранжирование изображений по полному запросу.
Запатентована система для оценки и выбора наилучшей модели подзапроса (sub-query model) в качестве модели релевантности для полной поисковой фразы. Система определяет, какая из доступных моделей подзапросов генерирует ранжирование изображений, наиболее близкое к фактическому ранжированию, основанному на взаимодействиях пользователей (interaction rankings, например, кликах) с этими изображениями по полной поисковой фразе.
Система работает следующим образом:
Interaction Ranking).Sub-Query Models).Sub-Query Model Ranking).Sub-Query Model Ranking похож на Interaction Ranking. Сходство измеряется метрикой Search Phrase Score. Модель с наивысшей оценкой выбирается для ранжирования изображений по исходной фразе.Высокая. Проблема обработки длинного хвоста запросов и масштабирования моделей машинного обучения остается критически важной для Google, особенно в визуальном поиске (Image Search, Google Lens). Хотя конкретные модели релевантности эволюционировали с момента подачи патента, базовая концепция использования данных о взаимодействии пользователей в качестве эталона для валидации и выбора моделей остается фундаментальной практикой.
Влияние на SEO оценивается как умеренное (6/10), но оно имеет высокое значение для стратегий продвижения в Google Images. Патент раскрывает, что ранжирование изображений по сложным запросам может зависеть от того, насколько хорошо изображение визуально соответствует доминирующей части запроса (подзапросу), для которого у Google есть сильная модель. Это подчеркивает фундаментальную роль пользовательских взаимодействий (кликов) как эталона релевантности.
Global Search Phrase Score) для множества различных поисковых фраз, включающих этот подзапрос. Модель глобального подзапроса может использоваться по умолчанию.visual features).Interaction Ranking, а высота столбца соответствует количеству взаимодействий (например, кликов).Interaction Ranking и Sub-query Model Ranking. Используется для выбора лучшей модели.Sub-query Model Ranking.Image Relevance Model, обученная для конкретного подзапроса.Sub-query Model к визуальным признакам этих изображений.Claim 1 (Независимый пункт): Описывает основной метод выбора модели релевантности для поисковой фразы.
Interaction Rankings для этих изображений на основе количества пользовательских взаимодействий.Sub-query Model Rankings. Ранжирование выполняется на основе модели подзапроса (image relevance model для этого подзапроса) и визуальных признаков (visual features) изображений.Search Phrase Score — мера сходства между позициями изображений в Interaction Rankings и Sub-query Model Rankings.Search Phrase Scores выбирается одна из моделей подзапросов в качестве модели для исходной поисковой фразы (та, чей скор удовлетворяет порогу).Claims 3, 4, 5 (Зависимые): Детализируют механизм сравнения рейтингов с помощью гистограмм.
Система создает Interaction Histogram (изображения упорядочены по взаимодействиям) и Sub-query Histogram (те же изображения переупорядочены по оценке модели). Search Phrase Score определяется на основе "уровня совпадения" (level of match) между этими двумя гистограммами. (В патенте упоминается возможность использования L1 similarity для измерения совпадения/перекрытия).
Claims 6, 7 (Зависимые): Описывают механизм идентификации Глобальных подзапросов.
Search Phrase Scores, полученные при её тестировании на других поисковых фразах.Global Search Phrase Score — агрегированная мера всех этих оценок.Global Search Phrase Score удовлетворяет порогу (globalization threshold), подзапрос идентифицируется как Global Sub-query.Изобретение применяется в рамках вертикали Поиска по картинкам (Image Search) и затрагивает несколько этапов обработки данных, преимущественно в офлайн-режиме для анализа и в реальном времени для ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются и сохраняются визуальные признаки (visual features) изображений, которые позже используются моделями релевантности.
RANKING – Ранжирование (Офлайн-компоненты и Аналитика)
Основная часть работы, описанной в патенте, происходит офлайн:
Image Relevance Models обучаются для конкретных запросов.Sub-query Models, расчет Search Phrase Scores и идентификация Global Sub-queries. Результаты сохраняются для использования в реальном времени.RANKING – Ранжирование (Онлайн-компоненты)
Во время обработки запроса пользователя в реальном времени:
Sub-query Model (из офлайн-анализа) или модель Global Sub-query.relevance scores).Входные данные (для процесса оценки):
Sub-query Models.Выходные данные (для процесса оценки):
Sub-query Model, ассоциированная с поисковой фразой.Global Sub-Queries.Image Relevance Model, но существуют модели для её подзапросов.Interaction Ranking.Anti-sub query terms (например, "без", "кроме"). В этом случае модель подзапроса может использоваться для понижения (демоутинга) релевантных ему изображений.Процесс А: Выбор модели подзапроса для поисковой фразы (Офлайн)
Interaction Ranking и количества взаимодействий.Sub-query Model Ranking, но высота столбцов соответствует исходному количеству взаимодействий.Interaction Histogram и Sub-query Histogram.Sub-query Model с наивысшим Search Phrase Score (при условии превышения порога) в качестве модели для исходной поисковой фразы "ABC".Процесс Б: Идентификация Глобальных подзапросов (Офлайн)
Sub-query Model (например, для "AB") собираются Search Phrase Scores, полученные при её оценке на множестве разных поисковых фраз (например, "ABC", "DAB", "ABE").Search Phrase Scores.Global Search Phrase Score порогу глобализации (globalization threshold).Global Sub-query. Его модель может использоваться для других фраз, содержащих этот подзапрос, без предварительной оценки.Патент фокусируется на использовании трех основных типов данных:
user interactions) с изображениями в ответ на конкретную поисковую фразу. Упоминаются клики (clicks) и наведения курсора (hovers). Эти данные формируют Interaction Ranking, который служит эталоном (ground truth) для оценки моделей.visual features или image feature values). Они являются входом для Image Relevance Models.Sub-query Models.Model Relevance Value.Interaction Ranking и Sub-query Model Ranking. Рассчитывается путем сравнения Interaction Histogram и Sub-query Histogram. Патент упоминает использование L1 similarity measure для измерения степени перекрытия гистограмм.Search Phrase Scores для одной модели, протестированной на разных фразах.Global Search Phrase Score.Interaction Ranking) как эталон (ground truth) для оценки и валидации своих моделей визуальной релевантности в Image Search. Если модель ранжирует изображения не так, как их выбирают пользователи, она считается неэффективной для данного запроса.Anti-sub query terms (например, "без"), что предотвращает некорректное применение моделей подзапросов и может использоваться для понижения нерелевантных изображений.Патент описывает внутренние механизмы Image Search, но из него можно извлечь важные практические рекомендации для SEO-специалистов, фокусирующихся на оптимизации изображений:
Interaction Ranking является эталоном релевантности, критически важно создавать изображения, которые пользователи захотят кликнуть. Изображения должны быть высокого качества, визуально привлекательными и четко отражать суть запроса.Global Sub-query). Если изображение отлично отвечает на запрос «торт на день рождения», оно имеет больше шансов ранжироваться по запросу «синий торт на день рождения для 5-летнего».Sub-query Models.Патент подтверждает стратегическую важность поведенческих факторов (в данном случае, кликов на изображения) в качестве основного валидатора алгоритмов ранжирования Google. Он демонстрирует, как Google стремится привести работу своих моделей машинного обучения в соответствие с реальными предпочтениями пользователей. Для SEO-стратегии это означает, что долгосрочный успех в Image Search зависит от глубокого понимания визуальных предпочтений аудитории и создания контента, который вызывает положительный отклик и четко соответствует ключевым визуальным концепциям.
Сценарий: Оптимизация изображения для интернет-магазина
Целевой запрос: "Красное винтажное платье в горошек" (Предположим, для него нет специальной модели).
Interaction Ranking). Предположим, пользователи чаще всего кликают на изображения, где четко виден узор "горошек".Search Phrase Score для этой модели максимален.Что такое Interaction Ranking и почему он важен?
Interaction Ranking — это ранжирование изображений, основанное на том, как часто пользователи взаимодействуют с ними (например, кликают) в ответ на конкретный запрос. В контексте данного патента он критически важен, так как служит эталоном (ground truth) пользовательских предпочтений. Google использует его для валидации и выбора своих моделей визуальной релевантности.
Означает ли этот патент, что CTR является главным фактором ранжирования в Image Search?
Не совсем. Патент показывает, что CTR (как форма взаимодействия) используется для *выбора* модели ранжирования, которая будет применена к запросу. Сама модель ранжирует изображения на основе визуальных признаков. Однако, если ваше изображение привлекает клики, это подтверждает для Google релевантность и способствует лучшему ранжированию изображений с похожими характеристиками.
Как Google определяет, какая часть сложного запроса является главной?
Google определяет это эмпирически. Система тестирует модели релевантности для разных частей запроса (подзапросов) и смотрит, какая из них лучше предсказывает поведение пользователей (Interaction Ranking). Та часть запроса, чья модель лучше соответствует кликам пользователей, и считается главной для данного визуального интента.
Что такое Глобальный подзапрос (Global Sub-query)?
Это подзапрос, модель релевантности которого стабильно хорошо работает для множества различных поисковых фраз. Например, если модель для "кроссовки Nike" хорошо ранжирует изображения по запросам "синие кроссовки Nike", "детские кроссовки Nike" и т.д., этот подзапрос может стать глобальным. Это позволяет Google применять эту надежную модель к любым новым запросам, содержащим "кроссовки Nike".
Влияет ли этот патент на ранжирование в основном веб-поиске?
Нет, данный патент описывает механизмы, специфичные для Поиска по картинкам (Image Search) и оценки визуальной релевантности. Он не описывает факторы ранжирования текстового контента в основном веб-индексе.
Как система обрабатывает отрицания, например, запрос "собаки без поводка"?
Патент упоминает Anti-sub query terms (например, "без"). Если такой термин обнаружен, система может отказаться от использования модели подзапроса (например, модели для "поводок") или использовать её для понижения результатов. В данном примере, изображения, которые модель для "поводок" оценила бы высоко, могут быть деприоритезированы.
Как SEO-специалисту использовать информацию о выборе моделей на практике?
Основное применение — это анализ выдачи Image Search для понимания доминирующего визуального интента. Если вы видите, что по сложному запросу ранжируются изображения с определенным стилем или фокусом, это означает, что Google выбрал модель, которая предпочитает эти характеристики. Вам нужно создавать визуально похожие и привлекательные для клика изображения.
Использует ли система текстовые факторы, такие как ALT-текст?
Патент фокусируется исключительно на выборе и применении моделей визуальной релевантности (Image Relevance Models), которые работают с визуальными признаками (visual features) изображений. Текстовые факторы используются в Image Search для начального отбора кандидатов, но данный патент их не обсуждает.
Что такое гистограммы взаимодействий и подзапросов и как они сравниваются?
Это способ сравнения рейтингов. Interaction Histogram упорядочивает изображения по кликам. Sub-query Histogram берет те же изображения с тем же количеством кликов, но переупорядочивает их так, как их ранжирует модель. Сравнивая перекрытие (overlap) этих двух гистограмм (например, используя L1 similarity), система определяет, насколько хорошо модель соответствует поведению пользователей.
Происходит ли выбор модели в реальном времени при запросе пользователя?
Нет. Процесс оценки моделей, сравнения гистограмм и выбора наилучшей Sub-Query Model для конкретной поисковой фразы происходит офлайн. В реальном времени (онлайн) система ранжирования использует уже предварительно выбранную модель для быстрого расчета релевантности изображений.

Мультимедиа
Семантика и интент
SERP

Мультимедиа
SERP
Поведенческие сигналы

Семантика и интент
Мультимедиа
SERP

Семантика и интент
Мультимедиа
Персонализация

Поведенческие сигналы
SERP
Мультимедиа

Персонализация
Семантика и интент
Поведенческие сигналы

Ссылки
SERP

Поведенческие сигналы
Индексация
SERP

Поведенческие сигналы
Персонализация
SERP

Ссылки
SERP
Семантика и интент

Семантика и интент
Local SEO
Персонализация

Поведенческие сигналы
SERP

Ссылки
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Ссылки
SERP
