
Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.
Патент решает проблему неоптимального ранжирования в поиске по картинкам, когда оценка релевантности основана преимущественно на офлайн-вычислениях или общих моделях, игнорируя специфику запроса и визуальное содержание. Это может приводить к неточному учету визуальных характеристик контента или игнорированию недавно проиндексированных изображений. Изобретение внедряет механизм онлайн-анализа (в реальном времени, во время обработки запроса), который корректирует ранжирование на основе визуального содержания изображения и его соответствия специфике конкретного запроса.
Запатентована система, которая обучает и применяет индивидуальные Image Relevance Models (Модели релевантности изображений) для конкретных популярных запросов. Эти модели оценивают визуальные характеристики изображения (представленные в виде компактного дескриптора) и генерируют Relevance Score Adjustment Factor (Коэффициент корректировки оценки релевантности). Этот коэффициент применяется онлайн (в течение Query Processing Window) для переранжирования результатов, изначально отобранных поисковой системой.
Система работает в двух режимах:
Qualified Queries (Квалифицированные запросы) — те, для которых достаточно данных о релевантных изображениях и взаимодействиях пользователей (кликах). Для каждого такого запроса обучается отдельная Image Relevance Model, которая учится связывать визуальные характеристики изображений с их релевантностью этому конкретному запросу.Similarity Score) с индексированными запросами, для которых есть модели. Выбирается модель наиболее похожего запроса. Эта модель анализирует визуальные признаки (Image Feature Values) кандидатов и вычисляет Relevance Score Adjustment Factor. Итоговый Relevance Score корректируется (с учетом масштабирования по схожести запросов), и результаты переранжируются.Высокая. Визуальный поиск и точное понимание содержания изображений (Computer Vision) являются ключевыми направлениями развития Google (например, Google Lens, MUM). Описанный механизм, позволяющий динамически корректировать ранжирование на основе визуальных сигналов с учетом специфики запроса в реальном времени, полностью соответствует современным тенденциям в Information Retrieval и Image SEO.
Патент имеет высокое значение для Image SEO (8.5/10). Он подтверждает, что ранжирование изображений не зависит исключительно от текстовых факторов (alt, surrounding text). Визуальные характеристики изображения напрямую влияют на его позицию через Relevance Score Adjustment Factor. Для достижения успеха критически важно, чтобы визуальное содержание изображения соответствовало тому типу контента, который исторически удовлетворял пользователей (на котором обучалась модель) по данному или похожему запросу.
Image Feature Values (например, 32 байта), оптимизированное для быстрого онлайн-анализа. Генерируется с помощью Hashing, PCA и Delta Encoding.Relevance Score Adjustment Factor.Historical Data Store, для которого может быть обучена Image Relevance Model.Image Relevance Model. Обучается итеративно для ранжирования изображений по текстовым запросам.Image Relevance Models.Image Relevance Model на основе визуальных признаков. Используется для изменения исходного Relevance Score.Claim 1 (Независимый пункт): Описывает весь процесс, включающий селективную офлайн-тренировку и онлайн-применение для переранжирования изображений.
Image Relevance Models ТОЛЬКО для этих запросов (и не обучает для запросов, не достигших порога). Каждая модель уникальна.Query Processing Window), что полученный запрос наиболее похож на определенный индексированный запрос (для которого есть модель), на основе Similarity Score.Query Processing Window): Relevance Score Adjustment Factor с использованием выбранной модели и Image Feature Values.Relevance Score.Ядро изобретения — это селективное обучение моделей для конкретных запросов (на основе данных) и применение этих моделей (или моделей похожих запросов) в реальном времени для переранжирования на основе визуальных признаков.
Claim 5 (Зависимый от 1): Уточняет механизм корректировки при использовании модели от похожего запроса.
Система масштабирует (scaling) вычисленный Relevance Score Adjustment Factor пропорционально величине Similarity Score между полученным запросом и индексированным запросом, чья модель была использована.
Если система использует модель запроса, который лишь отдаленно похож на текущий запрос пользователя (низкий Similarity Score), то влияние визуальной модели на итоговое ранжирование будет слабым. Если схожесть высокая или запрос совпадает, влияние будет сильным.
Claim 8 (Зависимый от 1): Определяет критерии для тренировки модели (Qualified Query).
Обучение модели происходит только для запросов, которые удовлетворяют двум условиям: (1) пороговое количество изображений имеют минимальную оценку релевантности для этого запроса И (2) произошло пороговое количество взаимодействий пользователей с результатами этого запроса.
Это подчеркивает важность наличия достаточного объема данных и обратной связи от пользователей для построения надежной модели.
Claim 9 (Зависимый от 1): Описывает технический процесс создания Compressed Image Content Descriptor для обеспечения скорости.
Для каждого изображения генерируется сжатый дескриптор путем: конкатенации признаков, хеширования (для сокращения размера), применения Kernel PCA для генерации вектора чисел с плавающей запятой и применения Delta Encoding к подмножеству этих чисел, имеющих наибольшую вариативность. Этот дескриптор сохраняется в кеше и используется моделью для вычисления корректировки.
Изобретение затрагивает несколько этапов поиска, связывая офлайн-обработку данных с онлайн-ранжированием в вертикали поиска по картинкам.
INDEXING – Индексирование и извлечение признаков
Image Feature Values (цвет, текстура и т.д.).Image Content Descriptor (с использованием Hashing, PCA, Delta Encoding) и сохраняются в индексе (Indexed Cache).(Офлайн-процессы, связанные с INDEXING и QUNDERSTANDING)
Historical Data Store (логи запросов и взаимодействий), идентифицирует Qualified Queries и обучает для них Image Relevance Models. Модели сохраняются в Image Relevance Model Store.QUNDERSTANDING – Понимание Запросов (Онлайн)
Similarity Score между полученным запросом и индексированными запросами, чтобы найти наилучшее соответствие для выбора модели.RANKING – Ранжирование (Онлайн)
Relevance Scores (вероятно, на основе текстовых, ссылочных и других стандартных сигналов).RERANKING – Переранжирование (Онлайн)
Query Processing Window. Система извлекает Image Content Descriptor для кандидатов, применяет выбранную Image Relevance Model, вычисляет и масштабирует Relevance Score Adjustment Factor, и пересортировывает результаты.Входные данные:
Relevance Scores.Image Content Descriptor для каждого изображения.Image Relevance Models.Выходные данные:
Relevance Scores.Qualified Queries) — то есть, достаточно популярные запросы с четким визуальным интентом (например, названия продуктов, пород животных, мест, эстетические запросы).Similarity Score). Если похожих запросов нет, механизм может не применяться.Image Relevance Model.Query Processing Window. Обучение моделей происходит офлайн, периодически.Процесс А: Офлайн-подготовка (Индексирование и Тренировка)
Image Feature Values. Они сжимаются через Hashing, PCA и Delta Encoding в Image Content Descriptor и сохраняются.Qualified Query.Qualified Query обучается индивидуальная Image Relevance Model (например, PAMIR). Модель учится предсказывать релевантность (основываясь на Relevance Feedback Score) на основе визуальных признаков изображений.Процесс Б: Онлайн-обработка запроса (Ранжирование)
Relevance Scores.Similarity Scores между полученным запросом и индексированными запросами, для которых есть модели.Similarity Score (наиболее похожий). Его Image Relevance Model выбирается для анализа.Image Content Descriptor (и при необходимости декомпрессируется).Relevance Score Adjustment Factor.Relevance Score Adjustment Factor масштабируется пропорционально Similarity Score (между полученным и индексированным запросом).Relevance Score каждого изображения корректируется с помощью масштабированного фактора.Патент фокусируется на использовании визуальных и поведенческих данных для улучшения ранжирования изображений.
Image Feature Values — цвет, гистограммы цвета или оттенков серого, текстура, края, углы, геометрическая информация. Эти данные являются основой для анализа моделью и хранятся в виде Image Content Descriptor.Historical Data Store (логи запросов и селектов/кликов). Используются для идентификации Qualified Queries и для обучения Image Relevance Models (чтобы понять, какие визуальные признаки коррелируют с выбором пользователя — Relevance Feedback Score).labels) и связанный текст используются для определения исходной релевантности и могут использоваться при офлайн-отборе кандидатов.Image Relevance Models для конкретных популярных запросов. Визуальные признаки, считающиеся релевантными для запроса А, могут отличаться от признаков для запроса Б.Similarity Score), чтобы избежать неточных корректировок.Image Content Descriptors (сгенерированных через PCA, Hashing и Delta Encoding) позволяет проводить сложный визуальный анализ в реальном времени (онлайн), что критично для скорости работы поиска и учета свежего контента.Relevance Score Adjustment Factor.Image Feature Values и формированию точного Image Content Descriptor. Это повышает вероятность корректной оценки моделью.Qualified Queries (имеют достаточный объем трафика и взаимодействий). Именно для них Google с наибольшей вероятностью обучит и применит специфические визуальные модели.Relevance Feedback Score) используются для обучения моделей, высокий CTR подтверждает визуальную релевантность вашего контента для системы.Relevance Score и попадание изображения в первичный набор кандидатов, который затем переранжируется визуальной моделью.Image Relevance Model, специфичная для запроса, вероятно, понизит такое изображение, если его визуальные признаки не соответствуют ожиданиям.Image Relevance Models для этой тематики.Этот патент подчеркивает переход Google от анализа текстовых меток к глубокому пониманию визуального содержания с помощью Computer Vision и Machine Learning. Стратегия Image SEO должна быть направлена на создание визуального контента, который не просто иллюстрирует текст, но и сам по себе является ответом на запрос пользователя. Понимание визуального интента становится столь же важным, как и понимание текстового интента. Долгосрочная стратегия требует инвестиций в качественный продакшн уникальных изображений, соответствующих ожиданиям аудитории в конкретной нише.
Сценарий: Оптимизация карточки товара для E-commerce
Задача: Улучшить ранжирование изображения товара "красное вечернее платье с открытой спиной" в Image Search.
Image Relevance Model для этого запроса (он Qualified). Модель научилась ассоциировать Image Feature Values, характерные для фотографий на моделях, с высокой релевантностью, так как пользователи кликали на них чаще.Image Content Descriptor нашего изображения, находит соответствие обученным визуальным паттернам и генерирует высокий положительный Relevance Score Adjustment Factor, повышая изображение в выдаче.Означает ли этот патент, что текстовая оптимизация (alt, title) больше не важна для Image SEO?
Нет, она по-прежнему критически важна. Текстовые факторы, скорее всего, используются для генерации исходного набора кандидатов и вычисления первичного Relevance Score. Описанный в патенте механизм отвечает за корректировку этой оценки и переранжирование на основе визуальных признаков. Без текстовой оптимизации изображение может вообще не попасть в набор кандидатов для анализа.
Как система определяет, какие визуальные признаки важны для конкретного запроса?
Система учится на исторических данных о поведении пользователей (Relevance Feedback Score). Если пользователи по запросу "свадебный букет пионы" чаще кликают на изображения с пастельными тонами и крупным планом, Image Relevance Model для этого запроса научится придавать больший вес соответствующим визуальным признакам (цветовой гамме, композиции). Система следует за предпочтениями пользователей.
Что такое "Квалифицированный запрос" (Qualified Query) и почему это важно?
Qualified Query — это запрос, по которому у Google достаточно данных (много релевантных изображений и много кликов пользователей) для надежного обучения модели. Это важно, потому что Google не тратит ресурсы на обучение моделей для редких или неоднозначных запросов. Основное влияние этот механизм оказывает на популярные и среднечастотные запросы.
Как этот механизм работает для совершенно новых или трендовых запросов?
Для совершенно нового запроса обученной модели не существует. Система попытается найти наиболее похожий индексированный запрос (Indexed Query) и использовать его модель. Однако, согласно патенту (Claim 5), влияние этой модели будет ослаблено пропорционально разнице между запросами (Similarity Score). По мере накопления данных по новому запросу, он может стать Qualified, и для него будет обучена собственная модель.
Что такое Image Content Descriptor и как он влияет на SEO?
Image Content Descriptor — это сильно сжатое представление визуальных характеристик изображения (упоминается размер около 32 байт). Он создается с помощью сложных преобразований (PCA, Hashing, Delta Encoding). Для SEO это означает, что Google не анализирует пиксели напрямую в момент запроса, а оперирует этим компактным дескриптором. Важно, чтобы изображение было качественным и четким, чтобы ключевые визуальные признаки были корректно отражены в этом дескрипторе.
Может ли система ошибочно понизить качественное изображение?
Да, если его визуальные характеристики сильно отличаются от того, что пользователи исторически предпочитали для данного запроса. Например, если вы предлагаете инновационный дизайн продукта, а пользователи привыкли к классическому виду, модель, обученная на старых данных, может изначально не распознать новый дизайн как релевантный и понизить его.
Как практически применить знания из этого патента для улучшения позиций в Google Images?
Необходимо проводить анализ визуальной выдачи (Visual SERP Analysis). Определите доминирующие визуальные паттерны (типы изображений, цвета, объекты, фон) в ТОПе по вашим целевым запросам. Создавайте контент, который соответствует этим паттернам, чтобы максимизировать вероятность получения высокого Relevance Score Adjustment Factor от специфичной для запроса модели.
Почему анализ происходит именно онлайн (в реальном времени)?
Онлайн-анализ гарантирует, что даже самые свежие, только что проиндексированные изображения будут оценены с использованием актуальной модели релевантности. Если бы этот анализ проводился только офлайн, новые изображения могли бы ранжироваться неточно до следующего цикла пересчета. Это обеспечивает свежесть и точность выдачи.
Что такое PAMIR, упоминаемый в патенте?
PAMIR (Passive-Aggressive Model for Image Retrieval) — это конкретный тип алгоритма машинного обучения, который может использоваться в качестве Image Relevance Model. Он обучается итеративно корректировать веса для различных визуальных признаков, чтобы максимизировать разницу в оценках между релевантными (на которые кликали) и нерелевантными изображениями для конкретного запроса.
Что важнее для Image SEO в контексте этого патента: визуальное содержание или CTR?
Они неразрывно связаны. Визуальное содержание должно соответствовать запросу, чтобы Image Relevance Model дала высокую оценку. Однако именно CTR (Relevance Feedback Score) используется для обучения этой модели и определения того, какое визуальное содержание считать релевантным. Необходимо и то, и другое: релевантное изображение, которое привлекает клики.

Семантика и интент
Мультимедиа
SERP

Мультимедиа
SERP

Семантика и интент
Мультимедиа
Индексация

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Мультимедиа
Персонализация

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Персонализация
EEAT и качество

Knowledge Graph
Семантика и интент
Ссылки

Семантика и интент
Local SEO
Персонализация

Индексация
Техническое SEO
Структура сайта

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
EEAT и качество
Антиспам

Local SEO
Поведенческие сигналы
Семантика и интент

Семантика и интент
Ссылки
Knowledge Graph

Семантика и интент
Поведенческие сигналы
SERP
