
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
Патент решает проблему улучшения релевантности, качества и разнообразия результатов поиска по изображениям. Традиционные методы ранжирования изображений часто полагаются в основном на текстовые сигналы (текст вокруг изображения, alt text, заголовок страницы). Этот патент предлагает метод для более глубокого понимания интента запроса путем анализа визуального контента тех изображений, которые пользователи сами считают релевантными (на основе поведенческих данных). Это позволяет улучшить выдачу даже для многоязычных или неоднозначных запросов, где текстового анализа недостаточно.
Запатентована система для категоризации поисковых запросов на основе визуального анализа результатов поиска по изображениям. Ключевая особенность системы в том, что она анализирует не все изображения в выдаче, а только те, которые имеют достаточное количество положительных поведенческих сигналов (например, кликов). Визуальные характеристики этих отобранных изображений (аннотации) используются для определения категории запроса с помощью классификаторов машинного обучения. Полученная категория затем применяется для переранжирования результатов поиска.
Система работает в несколько этапов:
User Behavior Data (например, клики, время просмотра). Отбираются только те изображения, чьи поведенческие данные удовлетворяют определенному порогу.Image Annotators для извлечения визуальных характеристик (например, наличие лиц, текста, доминирующих цветов, является ли это скриншотом).Query Classifiers (моделям машинного обучения), которые определяют категорию запроса (например, «запрос о конкретном человеке», «цветовой запрос»).Высокая. Понимание интента пользователя и использование машинного обучения для анализа визуального контента являются центральными элементами современного поиска. Методы, описанные в патенте, напрямую связаны с улучшением качества поиска по изображениям и пониманием запросов за пределами простого текста, что критически важно в эпоху визуального поиска и интеграции мультимедиа в основную веб-выдачу.
Патент имеет высокое значение (8/10) для SEO, особенно для стратегий продвижения в поиске по изображениям и для сайтов с большим количеством визуального контента. Он демонстрирует, что Google активно использует комбинацию поведенческих факторов и визуального анализа для определения реального интента. Если визуальные характеристики изображений на сайте не соответствуют категории, которую Google присвоил запросу (основываясь на том, что кликают пользователи), эти изображения могут быть понижены в ранжировании, даже если они хорошо оптимизированы текстуально.
User Behavior Data. Включает информацию о том, как часто пользователи выбирают результат, а также продолжительность просмотра результата (dwell time). Упоминаются long click (длительный просмотр, индикатор релевантности) и short click (короткий просмотр, индикатор нерелевантности).Face Annotator, Fingerprint Annotator, Screenshot Annotator, Text Annotator, Graph/Chart Annotator, Dominant Color Annotator.Single Person Query, Diverse/Homogenous Query, Color Query.IR scores) и переупорядочивания результатов поиска.Click Data.Claim 1 (Независимый пункт): Описывает основной метод категоризации и применения.
score) и User Behavior Data (данные о взаимодействии пользователей с этим изображением как с результатом поиска по этому запросу).selected images), чьи User Behavior Data удовлетворяют пороговому значению.computer image annotators), каждый из которых визуально анализирует изображение для идентификации конкретных визуальных признаков.machine learning system generated classifiers). Это делается для ассоциирования запроса с одной или несколькими категориями, которые указывают на наличие конкретных визуальных признаков.first rank).Ядро изобретения заключается в использовании визуального анализа (через аннотаторы) только тех изображений, которые пользователи посчитали релевантными (фильтрация по User Behavior Data), для определения интента запроса (через ML-классификаторы), и последующего использования этого интента для переранжирования выдачи.
Claim 3 (Зависимый от 1): Уточняет применение категории single person query. Если запрос категоризирован как запрос об одном человеке, система увеличивает оценки (scores) тех изображений в выдаче, чьи аннотации указывают на наличие одного лица (single face).
Claim 4 (Зависимый от 1): Уточняет применение категории diverse query (разнообразный запрос). Если запрос категоризирован как разнообразный, система увеличивает оценки тех изображений, чьи аннотации указывают на то, что изображение является разнообразным (diverse).
Claim 5 (Зависимый от 1): Уточняет применение категории text query (текстовый запрос). Если запрос категоризирован как текстовый, система увеличивает оценки тех изображений, чьи аннотации указывают на наличие текста.
Claim 7 (Зависимый от 1): Уточняет, что по крайней мере один из аннотаторов генерирует отпечаток (fingerprint) для изображения, который представляет собой сжатую форму его визуальных признаков.
Изобретение затрагивает несколько этапов поисковой архитектуры, используя данные, собранные на этапе взаимодействия с пользователем, и влияя на этапы понимания запросов и ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе Image Annotators могут использоваться для предварительного анализа визуального контента изображений и сохранения Image Annotations (визуальных признаков) в индексе. Это позволяет системе быстро получать эти данные во время ранжирования.
QUNDERSTANDING – Понимание Запросов
Это один из основных этапов применения патента. Система использует результаты поиска по изображениям и накопленные User Behavior Data для глубокого понимания интента запроса за пределами его текста. Categorizer Engine определяет Query Categories. Этот процесс может выполняться как офлайн (предварительный расчет категорий для популярных запросов), так и онлайн.
RANKING / RERANKING – Ранжирование и Переранжирование
На этом этапе Rank Modifier Engine использует рассчитанные Query Categories для корректировки IR scores результатов поиска. Если запрос категоризирован (например, как Color Query), система повышает в выдаче изображения, чьи визуальные аннотации соответствуют этой категории (например, изображения с соответствующим доминирующим цветом).
Входные данные:
User Behavior Data (клики, время просмотра) для этих результатов.Выходные данные:
Image Annotations для выбранных изображений (промежуточные).Query Categories для первого запроса (промежуточные).Color Query (red).User Behavior Data.User Behavior Data. Анализируются только те изображения, которые удовлетворяют этому порогу (например, были выбраны пользователями определенное количество раз или имеют высокий показатель long clicks).Процесс А: Категоризация запроса (Может выполняться Офлайн или Онлайн)
User Behavior Data.long clicks).Image Annotators: Face Annotator определяет количество и размер лиц.Fingerprint Annotator создает визуальные отпечатки для сравнения схожести.Screenshot/Text/Graph Annotators определяют тип контента.Dominant Color Annotator определяет основные цвета.Image Annotations.Query Classifiers (например, на основе AdaBoost).Single Person Query, Color Query).Query Categories для будущего использования.Процесс Б: Применение категоризации при ранжировании (Онлайн)
Query Categories.IR scores).Rank Modifier Engine корректирует оценки результатов на основе категории запроса. Например: Single Person Query, повышаются изображения с одним лицом.Color Query, повышаются изображения с соответствующим доминирующим цветом.Diverse Query, система может способствовать разнообразию, анализируя кластеры отпечатков (fingerprints).Патент фокусируется на использовании визуальных и поведенческих данных.
User Behavior Data, включая: Click Data: время просмотра (dwell time), long clicks, short clicks.IR scores), сгенерированные поисковой системой.User Behavior Data (например, количество кликов или метрика, основанная на long clicks), необходимое для того, чтобы изображение было использовано в процессе категоризации.Fingerprint).Diverse/Homogenous Query Classifier) используются алгоритмы кластеризации на основе расстояния между визуальными отпечатками. Метрики включают количество кластеров, размер кластеров и схожесть между кластерами.Query Classifiers, представляющие вероятность того, что запрос принадлежит к определенной категории.Query Classifiers. Классификаторы обучаются на наборах данных, включающих запросы, векторы признаков (аннотации) и правильную категоризацию.User Behavior Data). Клики и время просмотра напрямую влияют на то, как Google поймет запрос в будущем.Image Annotators (распознавание лиц, цветов, текста, графиков) для извлечения признаков и Query Classifiers на основе ML (например, AdaBoost) для автоматического определения категории запроса.Single Person Query), система активно повышает в выдаче изображения, соответствующие этой категории (изображения с одним лицом), и может понижать не соответствующие.Fingerprints и кластеризации позволяет системе понять, ожидает ли пользователь разнообразную выдачу (много маленьких кластеров) или ищет конкретное изображение (один большой кластер, много дубликатов).Dominant Color Annotator и Color Query Classifier могут активно повышать такие изображения.Single Person Query Classifier будет отдавать предпочтение изображениям с одним лицом, а не групповым фото.long clicks). Изображения с хорошими поведенческими факторами станут основой для обучения системы категоризации и получат преимущество.Fingerprint Annotator позволяет Google легко определять дубликаты. В зависимости от категории запроса (Diverse или Homogenous), неуникальный контент может быть понижен.short clicks (быстрый возврат на выдачу), что негативно скажется на User Behavior Data и может привести к понижению в ранжировании.alt text, заголовки), игнорируя фактическое визуальное содержание. Если изображение визуально нерелевантно интенту, определенному Google, описанный механизм его понизит.Патент подтверждает, что Google рассматривает поиск по изображениям как сложную систему, требующую глубокого понимания визуального контента и интента пользователя, а не только анализа текста вокруг картинки. Стратегия SEO должна включать визуальную стратегию. Понимание того, как Google категоризирует запросы на основе визуальных данных и кликов, позволяет более точно соответствовать ожиданиям пользователей и требованиям алгоритмов. Это также подчеркивает важность синергии между качеством контента и поведенческими факторами.
Сценарий 1: Оптимизация для цветового запроса в E-commerce
Dominant Color Annotator фиксирует это. Color Query Classifier относит запрос к категории "Color Query: Red". При ранжировании система повысит изображения с доминирующим красным цветом.Сценарий 2: Оптимизация статьи о знаменитости
Face Annotator фиксирует наличие одного лица. Single Person Query Classifier относит запрос к категории Single Person Query. Система будет повышать портреты и понижать групповые фото или изображения без лиц.Как Google определяет, какие изображения анализировать для категоризации запроса?
Google не анализирует все изображения в выдаче. Система отбирает только те изображения, которые удовлетворяют определенному порогу User Behavior Data. Это означает, что анализируются изображения, на которые пользователи достаточно часто кликали или которые просматривали в течение длительного времени (long clicks). Таким образом, пользователи сами указывают Google, какие визуальные характеристики являются наиболее релевантными для данного запроса.
Что такое Image Annotators и какие они бывают?
Image Annotators — это специализированные модули, которые анализируют визуальный контент изображения для извлечения конкретных характеристик. В патенте упоминаются: Face Annotator (определяет количество и размер лиц), Fingerprint Annotator (создает визуальный отпечаток для определения схожести), Screenshot Annotator, Text Annotator, Graph/Chart Annotator (определяют тип контента) и Dominant Color Annotator (определяет основные цвета).
Как работает категоризация запросов?
После того как система собрала аннотации (визуальные характеристики) с популярных изображений, она передает эти данные в Query Classifiers. Это модели машинного обучения (в патенте упоминается AdaBoost), которые обучены определять тип запроса на основе этих данных. Например, если большинство кликнутых изображений содержат одно лицо, запрос будет классифицирован как Single Person Query.
Как именно категоризация влияет на ранжирование?
Когда система знает категорию запроса, она использует эту информацию для переранжирования результатов. Если запрос отнесен к категории Color Query: Blue, то Rank Modifier Engine увеличит оценки ранжирования (IR scores) для изображений, у которых доминирующим цветом является синий. Это приводит к повышению таких изображений в финальной выдаче.
Влияет ли этот патент на текстовый поиск?
Патент напрямую описывает улучшение поиска по изображениям. Однако он может оказывать косвенное влияние на текстовый (веб) поиск через механизмы смешивания (Universal Search/Blending). Если благодаря этой системе Google может более точно определить качественные и релевантные изображения, эти изображения с большей вероятностью будут показаны в основной веб-выдаче (например, в каруселях изображений или как часть сниппета).
Что важнее для Image SEO в контексте этого патента: alt text или само изображение?
Оба элемента важны, но этот патент подчеркивает критическую важность самого визуального контента изображения. Традиционные сигналы (как alt text) используются для первичного ранжирования. Однако финальное переранжирование основывается на визуальном соответствии категории запроса. Если изображение визуально не соответствует интенту, который Google определил через анализ кликов, оно будет понижено, несмотря на идеальный alt text.
Как система обрабатывает многоязычные запросы?
Одним из преимуществ этого метода является его независимость от языка. Система анализирует, на какие изображения кликают пользователи, независимо от того, на каком языке был задан запрос. Если пользователи по запросам "red apple" и "красное яблоко" кликают на одинаковые визуально красные изображения, система присвоит обоим запросам схожую категорию, связанную с красным цветом.
Как система определяет, ожидает ли пользователь разнообразную выдачу?
Для этого используется Fingerprint Annotator и Diverse/Homogenous Query Classifier. Система анализирует визуальные отпечатки популярных изображений и кластеризует их. Если изображения формируют много маленьких кластеров, запрос считается разнообразным (Diverse Query). Если они формируют один большой кластер (много дубликатов), запрос считается специфичным (Homogenous Query), и в этом случае дубликаты могут не понижаться так агрессивно.
Что делать, если мои изображения хорошо оптимизированы по тексту, но имеют мало кликов?
Необходимо работать над улучшением привлекательности и релевантности изображений. Если изображения имеют мало кликов, они не будут участвовать в процессе категоризации и не получат преимуществ от описанного механизма. Улучшайте качество изображений, делайте их более заметными в выдаче, чтобы собирать положительные User Behavior Data, особенно long clicks.
Может ли система ошибочно определить категорию запроса?
Да, как и любая система, основанная на машинном обучении и поведенческих данных. Например, если пользователи массово начнут кликать на нерелевантные изображения (например, в результате манипуляций). Однако использование метрик типа long clicks (длительное время просмотра) призвано минимизировать такие ошибки, так как оно лучше отражает удовлетворенность пользователя, чем просто факт клика.

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Мультимедиа
Персонализация

Мультимедиа
SERP
Поведенческие сигналы

Индексация
Поведенческие сигналы
Семантика и интент

Семантика и интент
Мультимедиа
SERP

Свежесть контента
Антиспам
Ссылки

Поведенческие сигналы
SERP
Антиспам

Ссылки
Краулинг
Техническое SEO

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Ссылки
SERP

Поведенческие сигналы
Ссылки
SERP

Персонализация
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Персонализация

Local SEO
Поведенческие сигналы

Ссылки
Семантика и интент
Индексация
