
Google использует модель машинного обучения для ранжирования изображений, которая совместно обрабатывает признаки запроса, самого изображения и посадочной страницы, на которой оно размещено. Это позволяет системе динамически определять важность визуальных характеристик изображения и контекста страницы в зависимости от конкретного запроса, улучшая релевантность выдачи.
Патент решает проблему неоптимального ранжирования в поиске по картинкам, свойственную традиционным системам. Ранее поисковые системы часто генерировали отдельные сигналы для характеристик изображения и характеристик посадочной страницы, а затем объединяли их с использованием фиксированной схемы взвешивания, одинаковой для всех запросов. Это не позволяло учитывать, что для одних запросов важнее само изображение, а для других — контекст страницы. Изобретение улучшает релевантность результатов поиска изображений за счет динамического, зависящего от запроса, комбинирования этих сигналов.
Запатентована система ранжирования результатов поиска изображений с использованием модели машинного обучения (image search result ranking machine learning model). Суть изобретения заключается в том, что модель обучена совместно обрабатывать признаки запроса, признаки изображения и признаки посадочной страницы (landing page), на которой размещено изображение. Это позволяет генерировать единую оценку релевантности (Relevance Score), комбинируя сигналы изображения и страницы в зависимости от контекста запроса (query-dependent manner).
Система работает следующим образом:
Query features), визуальные признаки изображения (Image features) и признаки посадочной страницы (Landing page features).single input) в модель машинного обучения (например, нейронную сеть).Relevance Score. Модель динамически определяет вес признаков изображения и страницы в зависимости от запроса.Relevance Scores (либо напрямую, либо путем корректировки исходных оценок ранжирования).Высокая. Применение глубокого машинного обучения для ранжирования является стандартом в современных поисковых системах. Интеграция визуальных сигналов и текстового контекста (мультимодальность) критически важна для улучшения понимания контента, особенно в поиске по картинкам. Описанный механизм соответствует актуальным тенденциям развития поиска.
Патент имеет высокое значение для стратегий SEO, особенно для оптимизации под Поиск по Картинкам (Image SEO). Он подтверждает, что Google не оценивает изображение в вакууме. Релевантность определяется комбинацией визуального содержания картинки и качества, авторитетности и контекста посадочной страницы. Для успешного ранжирования необходимо оптимизировать как само изображение, так и страницу, на которой оно размещено, обеспечивая их синергию.
pixel data), эмбеддинги (векторные представления контента, полученные, например, с помощью нейронной сети), а также результаты методов извлечения признаков (обнаружение краев, углов и т.д.).Relevance Score на основе совместной обработки признаков запроса, изображения и посадочной страницы.Claim 1 (Независимый пункт): Описывает основной метод ранжирования изображений.
Relevance Score путем комбинирования признаков (i) и (ii) способом, зависящим от запроса (query-dependent manner), на основе признаков самого запроса.Relevance Scores.Ядро изобретения — использование единой ML-модели для совместной обработки разнородных сигналов (визуальных и текстовых/контекстных) и динамическое определение их важности в зависимости от специфики запроса.
Claim 2 (Зависимый от 1): Уточняет процесс ранжирования.
Кандидаты могут иметь исходное ранжирование (initial ranking). Ранжирование на основе Relevance Scores, сгенерированных ML-моделью, заключается в корректировке этого исходного ранжирования.
Это указывает на то, что данная модель может использоваться на поздних этапах ранжирования (L2 или L3) для переранжирования предварительно отобранных кандидатов.
Claims 4, 5, 6 (Зависимые от 1): Приводят примеры признаков.
resource locator) страницы (Claim 5).freshness) страницы (Claim 6).Claim 7 (Зависимый от 1): Уточняет тип модели.
Модель машинного обучения может быть нейронной сетью.
Claims 8, 9, 10 (Зависимые от 1): Описывают процесс обучения модели.
Модель обучается на тренировочных примерах (Claim 8). Обучение может происходить с использованием парной функции потерь (pair-wise loss function), где тренировочные данные включают запрос, пару результатов и метку их относительной релевантности (Claim 9). Либо обучение может заключаться в генерации оценок, соответствующих целевым оценкам релевантности (например, оценкам асессоров или данным о кликах) (Claim 10).
Изобретение применяется в специализированной системе поиска изображений (Image Search System) и затрагивает несколько этапов поисковой архитектуры.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных. Извлекаются и сохраняются в индексе (Index Database) признаки изображений (например, вычисляются эмбеддинги с помощью визуальных моделей) и признаки посадочных страниц (контент, ссылки, свежесть, качество страницы и домена).
QUNDERSTANDING – Понимание Запросов
На этом этапе извлекаются признаки запроса (Query features), которые затем будут переданы в модель ранжирования. Понимание интента запроса критически важно, так как именно оно определяет, как модель будет взвешивать признаки изображения и страницы (query-dependent manner).
RANKING – Ранжирование
Основной этап применения патента. Модель может использоваться на одном из этапов каскадного ранжирования (например, L2 или L3).
Relevance Score.Relevance Score для определения порядка результатов. Это может быть прямая сортировка или использование его как сигнала для корректировки исходных оценок ранжирования (initial ranking scores).Входные данные:
Query features).Image features) для кандидата.Landing page features) для кандидата.Выходные данные:
Relevance Score для пары изображение-страница относительно запроса.Image features.Landing page features (качество контента, авторитетность сайта).YMYL-тематиках (важность авторитетности источника изображения).Алгоритм применяется при обработке запросов в системе поиска изображений. Он может использоваться как при поиске через специализированный интерфейс (Google Images), так и при генерации блока с картинками в универсальной выдаче.
В патенте не указаны специфические триггеры или пороговые значения для активации этой модели; предполагается, что это основной или один из основных механизмов ранжирования в Image Search.
Процесс ранжирования в реальном времени
image search result ranking machine learning model.Relevance Score для каждого кандидата. При этом модель определяет важность признаков изображения и страницы в зависимости от признаков запроса.Relevance Scores. Это может включать корректировку исходных оценок ранжирования с использованием Relevance Score как модификатора (например, путем сложения или умножения на фактор).Патент детально описывает категории признаков, используемых моделью машинного обучения.
Визуальные факторы (Image features):
embedding neural network).Контентные и Контекстные факторы (Landing page features):
alt-text labels) изображения.text surrounding the image).location of the image) (в пикселях, через HTML/XML DOM XPATH или CSS-селекторы).prominence of the image), измеряемая через относительный размер изображения при отображении на устройстве.Технические факторы (Landing page features):
resource locator) страницы.Временные факторы (Landing page features):
Freshness): дата первого сканирования или обновления страницы.Факторы авторитетности (Landing page features):
Ссылочные факторы (Landing page features):
Географические и Языковые факторы:
Пользовательские факторы:
Основная метрика, вычисляемая системой, — это Relevance Score.
Relevance Score: Генерируется моделью машинного обучения. Патент не предоставляет конкретную формулу, так как вычисление происходит внутри модели (например, нейронной сети). Эта оценка может быть откалибрована для прогнозирования:
likelihood of a user... would click on) или взаимодействия пользователя с результатом.human rater).Методы машинного обучения:
Обучение модели и функции потерь:
Модель обучается на данных с известными (ground truth) оценками релевантности (клики или оценки асессоров). Для обучения могут использоваться различные функции потерь (loss functions):
ground truth.location), значимость/размер (prominence), alt-текст и окружающий текст. Оптимизация этих элементов критична.freshness), авторитетность автора и домена, а также визуальные эмбеддинги изображения.adjusting the initial ranking), что указывает на его применение на этапах L2/L3 для точной настройки выдачи.location) и в достаточном размере (prominence). Избегайте размещения важных изображений в футере или малозаметных блоках.text surrounding the image). Эти элементы напрямую используются моделью как Landing page features.E-E-A-T напрямую влияет на ранжирование изображений с этого сайта.freshness) является учитываемым признаком.Image features (например, эмбеддингов).Landing page features.Image features, так и на уровне Landing page features.Этот патент подчеркивает стратегический переход Google к мультимодальному анализу контента. Для достижения успеха в Image SEO необходимо применять интегрированный подход, где визуальная оптимизация неотделима от контентной и технической оптимизации посадочной страницы. Стратегия должна фокусироваться на создании высококачественных страниц, где изображение и текст дополняют друг друга, предоставляя исчерпывающий ответ на запрос пользователя. Понимание того, что Google может динамически менять важность страницы и картинки в зависимости от запроса, требует гибкости в SEO-стратегиях для разных ниш и типов интентов.
Сценарий 1: Оптимизация карточки товара в E-commerce
freshness).location), сделать его крупным (prominence). Прописать alt-текст: «Вид сбоку красных кроссовок Nike Air Max 270». В тексте рядом описать особенности модели.Relevance Score.Сценарий 2: Оптимизация инфографики в информационной статье
query-dependent manner). Сильные Landing page features значительно повысят шансы на высокое ранжирование этой инфографики.Что означает «совместная обработка» признаков изображения и посадочной страницы?
Это означает, что система не вычисляет отдельно оценку качества изображения и оценку качества страницы, а затем складывает их. Вместо этого все признаки (визуальные, текстовые, контекстные, ссылочные) подаются в единую модель машинного обучения одновременно. Модель анализирует их взаимосвязи и синергию, чтобы определить итоговую релевантность пары «изображение + страница» запросу.
Что такое «query-dependent manner» (зависящий от запроса способ) комбинирования признаков?
Это ключевая особенность патента. Система динамически решает, что важнее для конкретного запроса: само изображение или страница, на которой оно находится. Например, для запроса «синий фон для рабочего стола» вес визуальных признаков изображения будет выше. Для запроса «фото последствий урагана во Флориде» вес признаков страницы (авторитетность источника, свежесть, контекст новости) будет значительно выше.
Означает ли этот патент, что качество самой посадочной страницы важнее качества изображения?
Не всегда, это зависит от запроса (см. предыдущий ответ). Однако патент четко указывает, что качество посадочной страницы (Landing page features) является неотъемлемой частью ранжирования изображения. Размещение отличного изображения на спамной или нерелевантной странице не приведет к хорошим результатам в Image Search.
Какие конкретно характеристики размещения изображения на странице учитывает Google?
Патент явно упоминает расположение изображения на странице (location), его значимость или видимость (prominence), которая часто измеряется размером изображения при отображении. Также критически важны alt-текст и текст, непосредственно окружающий изображение (text surrounding the image).
Как Google понимает, что изображено на картинке, согласно этому патенту?
Для этого используются Image features. К ним относятся анализ пиксельных данных и, что более важно, эмбеддинги изображения. Эмбеддинги — это векторные представления визуального содержания, обычно создаваемые с помощью нейронных сетей (например, моделей компьютерного зрения), которые позволяют системе понять объекты, сцены и контекст изображения.
Влияет ли свежесть контента на ранжирование в Google Images?
Да, патент (Claim 6) прямо указывает, что характеристика свежести (freshness) посадочной страницы является одним из признаков (Landing page features), которые подаются в модель машинного обучения. Это важно как для новостного контента, так и для «вечнозеленых» тем, где актуальность информации имеет значение.
Как этот патент связан с E-E-A-T?
Связь прямая. В патенте упоминается использование данных об авторе посадочной страницы и характеристик домена как входных признаков для модели ранжирования. Это соответствует сигналам E-E-A-T. Авторитетность источника влияет на оценку релевантности размещенных на нем изображений.
Стоит ли создавать отдельные страницы для каждого изображения (например, страницы вложений в WordPress)?
Исходя из логики патента, это плохая практика. Модель оценивает качество и контекст посадочной страницы. Страницы вложений обычно содержат только изображение и минимум текста («тонкий контент»), что приводит к слабым Landing page features. Лучше размещать изображения в контексте подробных, релевантных статей или карточек товаров.
Используется ли эта модель для всех результатов поиска изображений?
Патент описывает это как механизм ранжирования в системе поиска изображений. Он может применяться на поздних стадиях ранжирования (L2/L3) для переранжирования предварительно отобранных кандидатов (Claim 2). Это стандартный подход для внедрения сложных ML-моделей в высоконагруженные поисковые системы.
Как повлиять на визуальные эмбеддинги моих изображений?
Напрямую повлиять на них нельзя, так как они генерируются моделями Google. Однако можно повлиять на входные данные: используйте четкие, высококачественные, уникальные изображения с хорошо различимыми объектами. Это поможет моделям компьютерного зрения корректно интерпретировать содержание и сгенерировать сильные, релевантные эмбеддинги.

Семантика и интент
Мультимедиа
SERP

Мультимедиа
SERP
Поведенческие сигналы

Семантика и интент
Мультимедиа
Local SEO

Семантика и интент
Мультимедиа
SERP

Семантика и интент
Мультимедиа
Персонализация

Антиспам
Ссылки
Семантика и интент

Структура сайта
SERP
Ссылки

Поведенческие сигналы
Семантика и интент
Мультимедиа

Поведенческие сигналы
Семантика и интент
Мультимедиа

Local SEO
Поведенческие сигналы

Ссылки
SERP

Семантика и интент
Персонализация
EEAT и качество

Безопасный поиск
Поведенческие сигналы
Семантика и интент

SERP
Семантика и интент
Ссылки

Поведенческие сигналы
Ссылки
SERP
