Как Google определяет намерение поиска изображений, анализируя контент топовых веб-результатов

Google использует систему для определения того, следует ли показывать блок с изображениями в поисковой выдаче. Вместо анализа только текста запроса, система анализирует характеристики контента (например, плотность изображений, соотношение изображений к тексту) на страницах, которые уже ранжируются в топе. Если эти страницы похожи на контент, который обычно удовлетворяет потребность в изображениях, система активирует показ блока картинок.

Описание

Какую задачу решает

Патент решает задачу определения истинного намерения пользователя (интента) за поисковым запросом, в частности, намерения получить результаты в виде изображений (image intent). Система определяет, когда целесообразно дополнить стандартные веб-результаты блоком изображений (Universal Search), когда следует показать только изображения, а когда — только веб-результаты. Это улучшает релевантность выдачи, адаптируя формат представления результатов под подразумеваемый интент.

Что запатентовано

Запатентован метод, который определяет measure of image intent (меру намерения поиска изображений) для запроса не путем прямого анализа самого запроса, а путем анализа документов, которые уже идентифицированы как релевантные этому запросу (топовых веб-результатов). Система извлекает атрибуты изображений (image attributes) из этих документов и сравнивает их с предварительно рассчитанными классификационными метриками (classification metrics). На основе этого сравнения определяется вероятность того, что пользователь искал изображения.

Как это работает

Система работает следующим образом:

Получение веб-результатов: В ответ на запрос система получает стандартный набор релевантных веб-документов.
Извлечение атрибутов: Анализируются топовые документы для извлечения image attributes. К ним относятся: количество изображений, плотность изображений (image density), соотношение изображений к тексту (image-to-text ratio), а также наличие и плотность специфических ключевых слов (например, «фото», «картинка»).
Классификация: Эти атрибуты сравниваются с classification metrics, полученными в результате офлайн-обучения классификатора на документах с известным высоким или низким image intent.
Оценка интента: Вычисляется image intent score (оценка намерения поиска изображений) для запроса.
Принятие решения (Triggering): В зависимости от того, превышает ли оценка определенные пороги, система решает, как форматировать выдачу: только веб-результаты, смешанная выдача (веб + изображения) или только изображения.

Актуальность для SEO

Высокая. Определение интента пользователя и динамическое формирование поисковой выдачи с включением вертикальных блоков (Universal Search) являются ключевыми элементами современного поиска. Описанный механизм, позволяющий определять интент на основе анализа контента ранжирующихся страниц, остается актуальным подходом к триггерингу вертикалей.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO-стратегии, особенно в области Image SEO и оптимизации структуры SERP. Он показывает, что структура и контент страниц, ранжирующихся в топе, напрямую влияют на то, появится ли блок изображений в выдаче по данному запросу. SEO-специалисты могут влиять на триггеринг блока изображений (как способствуя его появлению, так и препятствуя ему) через оптимизацию контентных характеристик своих страниц, таких как плотность изображений и соотношение текста к картинкам.

Детальный разбор

Термины и определения

Classification Metrics (Классификационные метрики)

Набор данных, используемый для определения measure of image intent. Включает атрибуты (ключевые слова, плотность изображений и т.д.), характерные для документов, связанных с высоким или низким намерением поиска изображений. Эти метрики генерируются путем офлайн-анализа предварительно определенных наборов документов.

Document (Документ)

Любой машиночитаемый продукт (веб-страница, файл, статья и т.д.).

Image Attributes (Атрибуты изображений)

Характеристики, извлекаемые из документа, связанные с изображениями. Ключевые атрибуты, упомянутые в патенте:

Quantity of keywords (Количество ключевых слов, связанных с изображениями).
Keyword density (Плотность ключевых слов).
Quantity of images or videos (Количество изображений или видео).
Image-to-text ratio (Соотношение изображений к тексту).
Image density (Плотность изображений – площадь, занимаемая изображениями, относительно общей площади документа).

Image Intent (Намерение поиска изображений)

Вероятность того, что пользователь, вводя запрос, намеревался получить результаты в виде изображений или видео.

Image Intent Score (Оценка намерения поиска изображений)

Числовая оценка, рассчитанная для документа или группы документов, отражающая measure of image intent. Может быть основана на комбинации различных оценок (например, Keyword Score, Image Density Score).

Image Result (Результат изображения)

Любая ссылка на изображение или видео, релевантное запросу (например, миниатюра, ссылка, заголовок).

Measure of Image Intent (Мера намерения поиска изображений)

Оценка, представляющая вероятность того, что для данного запроса предназначены результаты в виде изображений.

Search Result (Поисковый результат)

Ссылка на документ (например, веб-страницу), идентифицированный как релевантный запросу. Обычно включает заголовок, ссылку и сниппет.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод определения необходимости показа изображений.

Система получает запрос от клиента.
Получаются поисковые результаты (документы), релевантные запросу.
Идентифицируются image attributes одного или нескольких из этих документов.
Получаются classification metrics, которые содержат информацию для определения measure of image intent и идентифицируют набор ключевых слов.
Определяется measure of image intent для запроса на основе сравнения image attributes документов и classification metrics. При этом image attributes для конкретного документа включают как минимум одно из: (i) количество ключевых слов в документе, совпадающих с набором из classification metrics, или (ii) плотность этих ключевых слов в документе.
Определяется, удовлетворяет ли measure of image intent пороговому значению (threshold).
Генерируется страница результатов поиска (search results document), которая выборочно включает результаты изображений или стандартные поисковые результаты в зависимости от того, был ли достигнут порог.
Страница результатов предоставляется клиенту.

Claim 6 (Зависимый от 5, который зависит от 1): Детализирует процесс расчета measure of image intent путем присвоения отдельных оценок (scores) по разным атрибутам.

Система рассчитывает комбинированную оценку (combined score) для документа, основываясь как минимум на двух из следующих действий:

Присвоение первой оценки на основе количества совпадающих ключевых слов.
Присвоение второй оценки на основе плотности ключевых слов.
Присвоение третьей оценки на основе количества изображений/видео.
Присвоение четвертой оценки на основе image-to-text ratio.
Присвоение пятой оценки на основе image density.

Claim 7 (Зависимый от 1): Определяет три возможных исхода форматирования выдачи на основе image intent score (который является measure of image intent) и двух порогов (First Threshold и Second Threshold, где Second < First).

Если оценка удовлетворяет Первому порогу (высокий интент): Выдача включает image results БЕЗ стандартных search results.
Если оценка НЕ удовлетворяет Второму порогу (низкий интент): Выдача включает стандартные search results БЕЗ image results.
Если оценка НЕ удовлетворяет Первому порогу, НО удовлетворяет Второму (средний интент): Выдача включает комбинацию search results и image results.

Claim 9 (Зависимый от 1): Описывает офлайн-процесс генерации classification metrics (обучение классификатора).

Получение первых результатов поиска по запросам, которые заведомо связаны с намерением поиска изображений.
Получение вторых результатов поиска по запросам, которые заведомо НЕ связаны с намерением поиска изображений.
Идентификация атрибутов изображений (first image attributes) для первой группы документов.
Идентификация атрибутов изображений (second image attributes) для второй группы документов.
Генерация classification metrics на основе сравнения первых и вторых атрибутов.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные на этапе индексирования, для принятия решений на этапе метапоиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе система может предварительно (офлайн) анализировать документы для извлечения image attributes (плотность изображений, соотношение к тексту, наличие ключевых слов) и сохранять их в индексе. Также на этом этапе (или в рамках отдельного офлайн-процесса) происходит обучение классификатора и генерация Classification Metrics.

RANKING – Ранжирование
На этом этапе генерируется первичный набор веб-результатов (search results), релевантных запросу.

METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Основное применение патента происходит здесь. Это механизм триггеринга (Triggering) вертикали изображений.

Анализ результатов ранжирования: Система анализирует документы, полученные на этапе RANKING (или извлекает их image attributes из индекса).
Определение интента: Вычисляется measure of image intent для всего набора топовых документов.
Принятие решения о смешивании: На основе этой меры и пороговых значений система решает, нужно ли запрашивать результаты из вертикали изображений (image results) и как форматировать итоговую выдачу (только веб, только изображения или смешанно).

Входные данные:

Поисковый запрос.
Набор релевантных веб-документов (Search Results).
Image Attributes для этих документов (извлеченные на лету или из индекса).
Classification Metrics (предварительно рассчитанные).

Выходные данные:

Сформированная страница результатов поиска (Search results document) с определенным форматированием (включая или исключая image results).

На что влияет

Форматы SERP (Universal Search): Напрямую влияет на появление, формат и позицию блока изображений в основной поисковой выдаче.
Специфические запросы: Влияет на любые запросы, где интент может быть неоднозначным (например, «Hollywood glamour», который может подразумевать статьи о стиле или фотографии актрис).
Конкретные типы контента: Влияет на видимость контента, богатого изображениями (галереи, портфолио), и текстового контента (статьи, исследования). Структура контента определяет вероятность триггеринга блока картинок.

Когда применяется

Алгоритм применяется при обработке поискового запроса для определения оптимального формата выдачи.

Триггеры активации: Активируется после получения первичного набора веб-результатов для анализа их контента.
Пороговые значения: Ключевым элементом являются пороги (Thresholds) для Image Intent Score. Патент определяет как минимум два порога, которые разделяют выдачу на три типа: высокий интент (порог 1), средний интент (порог 2) и низкий интент (ниже порога 2).

Пошаговый алгоритм

Процесс А: Обработка запроса в реальном времени

Получение запроса: Система получает поисковый запрос.
Генерация веб-результатов: Система генерирует первичные поисковые результаты (документы), релевантные запросу.
Выборка документов: Отбираются документы, ассоциированные с выбранными топовыми результатами.
Идентификация атрибутов: Идентифицируются Image Attributes (количество и плотность ключевых слов, количество и плотность изображений, соотношение изображений к тексту) для этих документов. Это может происходить на лету или путем извлечения из индекса.
Получение метрик: Извлекаются предварительно рассчитанные Classification Metrics.
Расчет оценок для документов: Для каждого документа генерируются оценки (scores) на основе сравнения его Image Attributes и Classification Metrics. Может использоваться модель вероятности (например, Байесовская модель). Генерируется комбинированная оценка (combined score) для каждого документа.
Расчет общей оценки интента: Определяется общая оценка намерения поиска изображений (Total Image Intent Score) для запроса на основе оценок отдельных документов (например, путем усреднения или суммирования).
Принятие решения о форматировании выдачи: Общая оценка сравнивается с порогами:
- Если оценка удовлетворяет Первому порогу (Высокий интент): Предоставить Image Results БЕЗ Search Results.
- Если оценка НЕ удовлетворяет Второму порогу (Низкий интент): Предоставить Search Results БЕЗ Image Results.
- Если оценка между порогами (Средний интент): Предоставить Search Results И Image Results (смешанная выдача).

Процесс Б: Офлайн-обучение классификатора (Генерация Classification Metrics)

Инициация обучения: Получение инструкции на обучение классификатора для определения вероятности image intent.
Сбор данных для обучения: Получение предопределенных наборов документов для категорий, связанных с вероятностью image intent (например, набор документов с высоким интентом и набор с низким интентом).
Анализ документов: Анализ документов в каждой категории.
Идентификация метрик: Идентификация Classification Metrics (характерных значений атрибутов, порогов, ключевых слов), ассоциированных с каждой категорией на основе проанализированных документов.
Сохранение метрик: Сохранение Classification Metrics для использования в Процессе А.

Какие данные и как использует

Данные на входе

Система использует конкретные контентные и структурные факторы для определения интента.

Контентные факторы (Текст): Текст документов анализируется для выявления специфических ключевых слов (Keywords), которые коррелируют с намерением поиска изображений (например, «image», «picture», «photograph», «movie», «video», «camera»). Также рассчитывается общее количество текста для определения плотности и соотношений.
Мультимедиа факторы (Изображения/Видео): Определяется количество изображений или видео (Quantity of images or videos) в документе.
Структурные факторы: Анализируется структура и верстка документа для определения площади, занимаемой изображениями, и площади, занимаемой текстом.

Какие метрики используются и как они считаются

Система вычисляет несколько ключевых метрик на основе входных данных:

Keyword Density (Плотность ключевых слов): Рассчитывается на основе количества ключевых слов, связанных с изображениями, и общего количества текста в документе.
Image-to-text Ratio (Соотношение изображений к тексту): Рассчитывается на основе количества изображений/видео и количества текста.
Image Density (Плотность изображений): Рассчитывается на основе площади, занимаемой изображениями/видео, и общей площади документа или площади, занимаемой текстом.

На основе этих метрик вычисляются оценки (Scores):

Keyword Score (KW), Keyword Density Score (KD), Image Score (I), Image Ratio Score (IR), Image Density Score (ID).
Методы расчета оценок: Патент упоминает возможность использования дискриминативных классификаторов (например, SVM) или вероятностных моделей (например, Наивный Байес). В случае Байеса, оценка рассчитывается как вероятность принадлежности документа к классу «высокий image intent» при наличии определенных атрибутов.

Выводы

Интент определяется контентом выдачи, а не только запросом: Ключевой вывод патента — Google может определять намерение пользователя (в данном случае, image intent), анализируя характеристики документов, которые уже ранжируются по этому запросу. Если топовые страницы богаты изображениями, система делает вывод, что запрос имеет высокий image intent.
Конкретные атрибуты для классификации: Система использует не абстрактное «качество», а конкретные, измеримые атрибуты: Image Density, Image-to-Text Ratio, а также наличие и плотность специфических ключевых слов, связанных с изображениями.
Влияние на структуру SERP (Triggering): Этот механизм напрямую управляет триггерингом блока изображений в Universal Search. Решение о показе блока и его формате принимается на основе сравнения Image Intent Score с порогами.
Три уровня интента: Система не просто определяет наличие или отсутствие интента, а классифицирует его по уровням (низкий, средний, высокий), что приводит к разным форматам выдачи (только веб, смешанная, только изображения).
Офлайн-обучение и онлайн-применение: Система полагается на классификатор, обученный офлайн (Classification Metrics) на известных примерах, что позволяет быстро применять модель к результатам поиска в реальном времени.

Практика

Best practices (это мы делаем)

Оптимизация под Image Intent для трафика из картинок: Если цель — получить трафик из Google Images или стимулировать появление блока картинок в веб-выдаче, необходимо насыщать страницу релевантными изображениями и оптимизировать ее структуру под «высокий image intent». Это включает:
- Повышение Image-to-Text Ratio (больше изображений относительно текста).
- Повышение Image Density (изображения занимают значительную площадь страницы).
- Использование ключевых слов, коррелирующих с изображениями (например, «галерея», «фото», «примеры»), если это уместно.
Оптимизация структуры контента для управления SERP: Если цель — занять высокую позицию в веб-выдаче, и блок изображений мешает (например, отвлекает внимание или сдвигает ваш результат вниз), следует оптимизировать страницу под «низкий image intent». Это предполагает фокус на тексте, снижение плотности изображений и минимизацию соотношения изображений к тексту.
Анализ структуры контента конкурентов: Анализируйте топовые результаты по целевым запросам. Если в топе преобладают страницы с высокой плотностью изображений, это сигнализирует о высоком image intent, распознаваемом Google. Для успешного ранжирования необходимо соответствовать этим характеристикам контента.

Worst practices (это делать не надо)

Игнорирование структуры контента при анализе интента: Ошибка полагать, что интент определяется только типом запроса (информационный/коммерческий). Необходимо учитывать и форматный интент (текст/видео/изображения), который Google определяет по структуре контента в топе.
Несоответствие структуры страницы интенту запроса: Попытка ранжировать сугубо текстовую статью по запросу, где Google определил высокий image intent (и в топе находятся галереи), скорее всего, будет безуспешной. И наоборот, попытка ранжировать галерею по запросу с низким image intent.
Бессистемное добавление изображений: Добавление изображений без учета их влияния на Image Density и Image-to-Text Ratio не позволит эффективно управлять сигналом image intent.

Стратегическое значение

Патент подтверждает, что Google анализирует структуру контента для понимания того, как лучше всего ответить на запрос. Это подчеркивает важность «форматной релевантности» — соответствия формата контента ожиданиям пользователя, которые Google определяет через анализ существующих топовых результатов. Стратегия должна включать анализ и оптимизацию не только семантики текста, но и структурных характеристик страницы, таких как баланс текста и медиа-контента, для соответствия распознанному интенту.

Практические примеры

Сценарий 1: Стимулирование появления блока изображений (Image SEO)

Цель: Появиться в блоке изображений по запросу «идеи дизайна маленькой кухни».

Анализ: Изучаем топовые страницы. Предположим, они имеют высокое соотношение изображений к тексту и содержат слова «фото» и «примеры».
Действия: Создаем страницу-галерею. Увеличиваем Image Density, размещая множество качественных фотографий, занимающих большую площадь экрана. Сокращаем количество текста до необходимого минимума (подписи, краткие описания), тем самым увеличивая Image-to-Text Ratio. Включаем в текст слова «фото» и «идеи».
Результат: Страница сигнализирует о высоком image intent. Это повышает вероятность того, что Google покажет блок изображений по этому запросу и включит туда картинки с нашей страницы.

Сценарий 2: Предотвращение появления блока изображений

Цель: Удержать высокую позицию в веб-выдаче по запросу «лечение гипертонии» и не допустить, чтобы блок изображений сместил результат вниз.

Анализ: Изучаем запрос. Это YMYL-запрос, требующий глубокого текстового ответа. Топовые страницы — авторитетные медицинские статьи.
Действия: Создаем подробную, экспертную статью. Используем изображения (схемы, инфографику) умеренно. Поддерживаем низкий Image-to-Text Ratio (много текста, мало картинок). Обеспечиваем низкую Image Density (изображения не доминируют на странице). Избегаем слов, сильно коррелирующих с поиском картинок.
Результат: Страница сигнализирует о низком image intent. Это снижает вероятность того, что Google активирует блок изображений в выдаче, позволяя веб-результатам занимать верхние позиции без смещения.

Вопросы и ответы

Как именно система определяет, хочет ли пользователь видеть картинки?

Система не анализирует сам запрос напрямую для этого. Вместо этого она смотрит на документы, которые уже ранжируются в топе по этому запросу. Если эти документы имеют характеристики, свойственные страницам с изображениями (например, много картинок, мало текста), система делает вывод, что у запроса высокий image intent, и решает показать блок с изображениями.

Какие конкретные характеристики страницы анализирует Google согласно патенту?

Патент выделяет пять основных атрибутов (Image Attributes): количество изображений или видео на странице; соотношение изображений к тексту (Image-to-Text Ratio); плотность изображений (Image Density – какую площадь они занимают); наличие специфических ключевых слов, связанных с картинками (например, «фото», «картинка»); и плотность этих ключевых слов.

Что такое Image Density и чем она отличается от Image-to-Text Ratio?

Image-to-Text Ratio — это соотношение количества изображений к количеству текста. Image Density, согласно патенту, основана на площади (area). Это означает, что одна большая картинка может дать более высокую Image Density, чем несколько маленьких, даже если Image-to-Text Ratio останется прежним.

Может ли система показать только результаты из Google Картинок, без веб-ссылок?

Да. Патент описывает три сценария. Если Image Intent Score превышает самый высокий порог (First Threshold), система может отформатировать выдачу так, чтобы она включала только результаты изображений (Image Results) и исключала стандартные веб-результаты (Search Results).

Как SEO-специалист может использовать это знание для увеличения трафика из Google Images?

Чтобы увеличить трафик из картинок, нужно оптимизировать страницы так, чтобы они сигнализировали о высоком image intent. Это достигается путем увеличения количества релевантных изображений, повышения Image Density и Image-to-Text Ratio, а также уместного использования слов, связанных с изображениями. Это повысит вероятность триггеринга блока картинок в SERP.

Как можно использовать этот механизм, чтобы убрать блок картинок из выдачи, если он мешает?

Если блок картинок нежелателен (например, сдвигает ваш органический результат вниз), нужно оптимизировать свою страницу (и, в идеале, повлиять на нишу в целом) так, чтобы сигнализировать о низком image intent. Это означает фокус на текстовом контенте, снижение плотности изображений и поддержание низкого соотношения изображений к тексту.

Откуда Google берет данные для обучения этой системы (Classification Metrics)?

Система тренируется офлайн. Для этого используются предопределенные наборы запросов, для которых точно известен уровень Image Intent (высокий или низкий). Система анализирует документы, которые ранжируются по этим запросам, и выявляет закономерности в их Image Attributes. На основе этого обучения формируются Classification Metrics.

Анализируются ли атрибуты изображений на лету при запросе пользователя?

Патент допускает оба варианта. Система может анализировать документы и извлекать Image Attributes в момент запроса. Однако также упоминается, что эти компоненты могут работать офлайн и сохранять информацию в индексе для использования во время запроса, что значительно ускоряет процесс.

Влияет ли этот патент на ранжирование внутри блока изображений?

Нет, этот патент не описывает алгоритмы ранжирования изображений. Он описывает исключительно механизм принятия решения о том, следует ли вообще показывать блок изображений (триггеринг) и в каком формате должна быть представлена выдача (только веб, только картинки или смешанно).

Что важнее для определения Image Intent: количество картинок или их размер?

Патент учитывает оба фактора через разные метрики. Количество учитывается в Quantity of images и Image-to-Text Ratio. Размер (площадь) учитывается в Image Density. Система рассчитывает комбинированную оценку (Combined Score), которая агрегирует все эти метрики, поэтому важен общий баланс.