
Google использует систему для автоматического выбора наилучшего изображения, представляющего содержание статьи или веб-страницы. Система анализирует все изображения на странице, оценивая их характеристики (размер, формат, расположение, контекст) и присваивая им оценку (Image Data Score). Цель – отличить содержательные фотографии от элементов дизайна или иконок. Изображение с наивысшей оценкой выбирается в качестве репрезентативного для показа в SERP, Новостях или Discover.
Патент решает проблему выбора наиболее подходящего изображения для представления контента статьи (веб-страницы, документа и т.д.) в результатах поиска. Стандартные идентификаторы статей (URL, заголовок) часто недостаточно информативны для пользователя. Цель изобретения — автоматически идентифицировать репрезентативное изображение (Representative Image), которое лучше всего отражает суть контента, чтобы улучшить пользовательский опыт и помочь пользователям быстрее оценивать релевантность результатов поиска, не кликая по ссылкам.
Запатентована система и метод для алгоритмического выбора репрезентативного изображения из множества изображений, присутствующих в статье. Система анализирует различные характеристики каждого изображения (image data) и генерирует сигнал данных изображения (Image Data Signal). На основе этого сигнала вычисляется оценка данных изображения (Image Data Score), которая определяет вероятность того, что изображение является содержательным (photo-type file), а не элементом дизайна (design-type file). Изображение с наилучшей оценкой выбирается в качестве представителя статьи.
Система работает следующим образом:
Representative Image.Критически высокая. Выбор главного изображения страницы имеет огромное значение для отображения контента в Google Images, Google News, Google Discover и в основной поисковой выдаче (SERP), где все чаще используются миниатюры рядом с результатами. Понимание механизма выбора напрямую влияет на оптимизацию изображений для повышения CTR и видимости контента.
Патент имеет критическое значение для SEO. Он раскрывает детальный механизм, который Google использует для выбора главного изображения страницы. Это напрямую влияет на визуальное представление сайта в результатах поиска и, следовательно, на кликабельность (CTR). Понимание факторов, влияющих на Image Data Score, позволяет SEO-специалистам оптимизировать изображения так, чтобы система выбирала наиболее привлекательные и релевантные картинки для представления их контента.
Image Data Signal. Отражает вероятность того, что изображение является репрезентативным для статьи.Image Data) изображения.Claim 1 (Независимый пункт): Описывает основной метод выбора изображения.
article of interest).Image Data Signals для этих изображений.Image Data Scores на основе сигналов и самой статьи.predefined threshold).topically similar) на первую.Default Image из второй статьи в качестве репрезентативного изображения для первой статьи.Claim 3 (Зависимый): Детализирует, что входит в определение Image Data Signals. Это ключевой пункт для SEO, перечисляющий факторы анализа: расширение файла, имя файла, размер файла, размеры изображения, соотношение сторон, частота появления в нескольких статьях, расположение в статье, данные рядом с изображением, подпись к изображению, текст рядом с изображением, распределение цвета, текст в ссылках на изображение, текст рядом со ссылками на изображение, заголовки на страницах, ссылающихся на изображение, и количество цветов.
Claim 6 (Зависимый от 1): Уточняет, что выбор репрезентативного изображения может заключаться в выборе изображения с наивысшим Image Data Score.
Claim 7 (Зависимый от 6): Указывает, что Representative Image может включать окружающий контекст выбранного изображения (например, система может сделать скриншот области вокруг изображения, а не просто использовать файл изображения).
Claim 8 и 10 (Зависимые от 1): Уточняют, что система также может определять и оценивать Default Image (скриншоты, иконки и т.д.) наравне с обычными изображениями.
Изобретение применяется на этапе индексирования и влияет на отображение результатов на финальных этапах.
CRAWLING – Сканирование и Сбор данных
На этом этапе система собирает статью (например, веб-страницу) и все связанные с ней ресурсы, включая изображения.
INDEXING – Индексирование и извлечение признаков
Основное применение патента. Во время обработки проиндексированного контента система (в патенте упоминается Indexer) анализирует все изображения, связанные со статьей.
Image Data Signal и Image Data Score для каждого изображения.Default Image).METASEARCH / RERANKING – Отображение результатов
На финальных этапах, когда формируется страница результатов (SERP), система (в патенте упоминается Formatter и Display Processor) использует предварительно выбранное Representative Image для отображения рядом с результатом поиска, в блоках Новостей, Discover и т.д.
Входные данные:
Выходные данные:
Representative Image, ассоциированный со статьей в индексе.predefined threshold для Image Data Score. Если ни одно изображение не набирает достаточного балла, активируется механизм выбора Default Image (включая механизм заимствования из похожих статей).Процесс выбора репрезентативного изображения (во время индексирования):
Default Image (например, скриншот, фавикон).image caption - сильный положительный сигнал), окружающего текста, а также текста ссылок, указывающих на это изображение. Проверка, не является ли изображение кнопкой отправки формы.Default Images).predefined threshold).Image Data Score.Default Image (скриншот, иконка) ИЛИ (согласно Claim 1) система ищет тематически похожую статью и выбирает изображение из нее.Система использует широкий спектр данных для оценки изображений:
File extension name (.jpg, .gif, .png, .bmp).File type (определяется по заголовкам файла; например, GIF часто для дизайна, JPEG для фото).File size (в байтах; большие файлы чаще являются фото).Image dimensions (горизонтальный и вертикальный размер в пикселях; большие размеры предпочтительнее).Image aspect ratio (соотношение сторон; стандартные предпочтительнее экстремальных, например, 100:1).Color distribution (распределение цвета/гистограмма; высокое распределение указывает на фото).Number of colors (количество уникальных цветов; большее количество указывает на фото).Location of image within an article (расположение в разметке/на экране; начало статьи предпочтительнее, верхний левый угол часто логотип).Data adjacent to image (окружающие данные, например, текст или графика).Image caption (наличие и содержание подписи к картинке; сильный положительный сигнал).Text adjacent to image (окружающий текст).submission of a form; такие изображения исключаются).Text in links to the image (анкорный текст ссылок на изображение с других страниц).Text nearby links to the image (околоссылочный текст).Headings and other text in pages that link to the image (текст и заголовки на страницах, ссылающихся на изображение).Image frequency over multiple articles (частота появления изображения в индексе или на конкретном сайте; высокая частота указывает на элемент дизайна/логотип).Image Data Scoring Function). Это алгоритм, который взвешивает все вышеперечисленные факторы. Цель расчета — максимизировать вероятность выбора photo-type file и минимизировать вероятность выбора design-type file. Патент не приводит конкретную формулу, но описывает, как факторы влияют на результат.Image Data Score. Если порог не превышен ни одним изображением, активируется выбор Default Image.photo-type), которые отражают тему статьи, от элементов дизайна, логотипов, иконок и навигации (design-type).caption) и окружающий текст являются сильными сигналами для определения его важности.Default Image. Особо примечательно (Claim 1), что в качестве такого изображения может быть использована картинка из другой, но тематически похожей статьи. Это показывает стремление Google обеспечить визуальное представление контента любой ценой.photo-type, а не design-type. Они должны быть уникальными для статьи, так как система пессимизирует часто повторяющиеся картинки (Image frequency).photo-type файлами.image caption) является сильным сигналом того, что изображение является содержательным. Используйте семантическую верстку: тег <figcaption> внутри <figure>.text adjacent to image), релевантен самому изображению и теме статьи.text in links) и околоссылочный текст (text nearby links) релевантны.Image Data Score может быть понижен из-за высокой частотности.design-type или к низкому Image Data Score.submission of a form, явно исключаются из рассмотрения как репрезентативные.Default Image или взять изображение с другого сайта, который он сочтет тематически похожим (Claim 1).Патент подчеркивает важность визуального контента в современном поиске. Для SEO-стратегии критически важно не просто наличие изображений, а их качество, уникальность и правильное структурирование внутри контента. Алгоритм выбора репрезентативного изображения напрямую влияет на привлекательность сниппета и CTR в ключевых каналах трафика (News, Discover, SERP). Стратегия должна включать процессы создания уникального визуального контента и техническую оптимизацию его представления для поисковых систем.
Сценарий: Оптимизация статьи для Google Discover и News
Задача: Убедиться, что Google выберет конкретное, высококачественное и привлекательное изображение в качестве главного для новостной статьи.
Действия:
photo-type).<figure> и добавляем релевантную подпись через <figcaption>. <figure> <img src="image.jpg" alt="Описание картинки"> <figcaption>Релевантная подпись к картинке (Caption)</figcaption> </figure> Ожидаемый результат: Система анализирует характеристики: большой размер (+), много цветов (+), стандартные пропорции (+), расположение в начале (+), наличие подписи (+), уникальность (+). Image Data Score будет высоким, и это изображение будет выбрано как репрезентативное.
Какие факторы Google использует, чтобы выбрать главное изображение страницы?
Патент описывает комплексный анализ. Ключевые факторы включают: характеристики файла (предпочтение большим размерам, стандартным пропорциям, форматам типа JPEG/PNG), содержимое файла (предпочтение большому количеству цветов), частотность (пессимизация изображений, которые часто повторяются на сайте или в интернете) и контекст (предпочтение изображениям в начале статьи, с подписями и релевантным окружающим текстом).
Что такое "photo-type" и "design-type" изображения в контексте этого патента?
Photo-type – это содержательные изображения (фотографии, иллюстрации), которые отражают суть статьи. Design-type – это элементы интерфейса, логотипы, иконки, навигационные элементы. Алгоритм Google стремится выбрать photo-type изображение в качестве репрезентативного и отфильтровать design-type.
Влияет ли формат файла (JPG vs GIF) на выбор главного изображения?
Да, влияет. В патенте указано, что GIF часто используется для файлов типа "дизайн", а JPEG – для файлов типа "фото". Также система анализирует количество цветов и их распределение; изображения с большим количеством цветов (что характерно для JPEG/PNG/WebP) имеют больше шансов быть выбранными, чем изображения с ограниченной палитрой.
Насколько важно расположение изображения на странице?
Это очень важно. Система анализирует location of image within an article. Изображения, расположенные ближе к началу контента, часто считаются более важными. Изображения, расположенные в углах (например, вверху слева), могут быть классифицированы как логотипы.
Как уникальность изображения влияет на его выбор?
Уникальность критична. Система проверяет image frequency over multiple articles. Если изображение часто встречается на разных страницах сайта или в интернете, оно, скорее всего, будет классифицировано как элемент дизайна, навигации или стоковая картинка и не будет выбрано в качестве репрезентативного для конкретной статьи.
Что произойдет, если на моей странице нет изображений или они все низкого качества?
Система активирует резервный механизм и выберет Default Image. Это может быть заглушка, иконка (favicon), скриншот страницы. Более того, согласно Claim 1, Google может найти другую тематически похожую статью (возможно, на другом сайте) и использовать изображение из нее для представления вашего контента.
Как использование подписей к картинкам (captions) влияет на SEO изображений?
Наличие подписи (image caption) является сильным положительным сигналом. Это указывает системе на то, что изображение является содержательным (photo-type), а не просто элементом дизайна. С точки зрения SEO, рекомендуется использовать тег <figcaption> для важных изображений.
Учитывает ли Google текст ссылок (анкоры), указывающих на изображение?
Да. Патент явно упоминает, что text in links to the image, text nearby links (околоссылочный текст) и даже заголовки на страницах, которые ссылаются на изображение, используются для определения его контекста и оценки.
Может ли Google выбрать логотип сайта в качестве главного изображения статьи?
Алгоритм специально разработан так, чтобы этого не происходило. Логотипы обычно имеют высокую частоту повторений на сайте, часто располагаются в стандартных местах (например, вверху слева) и могут иметь меньше цветов. Все эти факторы понижают их Image Data Score для конкретной статьи.
Как оптимизировать изображение, чтобы именно оно стало главным?
Необходимо максимизировать его Image Data Score. Разместите уникальное, качественное изображение (большой размер, много цветов, стандартные пропорции) в самом начале статьи. Добавьте к нему подпись (caption) и окружите релевантным текстом. Убедитесь, что оно не выглядит как баннер или элемент навигации.

Мультимедиа
Семантика и интент
SERP

Мультимедиа
EEAT и качество
SERP

Семантика и интент
Мультимедиа
SERP

Мультимедиа
Поведенческие сигналы
SERP

Knowledge Graph
Мультимедиа
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Персонализация
SERP

Семантика и интент
Ссылки
SERP

Поведенческие сигналы
Персонализация
EEAT и качество

Поведенческие сигналы
Ссылки
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Семантика и интент
Персонализация
SERP

Индексация
SERP
Персонализация
