SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает главное (репрезентативное) изображение страницы для показа в результатах поиска

METHODS AND SYSTEMS FOR IDENTIFYING AN IMAGE AS A REPRESENTATIVE IMAGE FOR AN ARTICLE (Методы и системы для идентификации изображения в качестве репрезентативного изображения для статьи)
  • US7580568B1
  • Google LLC
  • 2004-03-31
  • 2009-08-25
  • Мультимедиа
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для автоматического выбора наилучшего изображения, представляющего содержание статьи или веб-страницы. Система анализирует все изображения на странице, оценивая их характеристики (размер, формат, расположение, контекст) и присваивая им оценку (Image Data Score). Цель – отличить содержательные фотографии от элементов дизайна или иконок. Изображение с наивысшей оценкой выбирается в качестве репрезентативного для показа в SERP, Новостях или Discover.

Описание

Какую проблему решает

Патент решает проблему выбора наиболее подходящего изображения для представления контента статьи (веб-страницы, документа и т.д.) в результатах поиска. Стандартные идентификаторы статей (URL, заголовок) часто недостаточно информативны для пользователя. Цель изобретения — автоматически идентифицировать репрезентативное изображение (Representative Image), которое лучше всего отражает суть контента, чтобы улучшить пользовательский опыт и помочь пользователям быстрее оценивать релевантность результатов поиска, не кликая по ссылкам.

Что запатентовано

Запатентована система и метод для алгоритмического выбора репрезентативного изображения из множества изображений, присутствующих в статье. Система анализирует различные характеристики каждого изображения (image data) и генерирует сигнал данных изображения (Image Data Signal). На основе этого сигнала вычисляется оценка данных изображения (Image Data Score), которая определяет вероятность того, что изображение является содержательным (photo-type file), а не элементом дизайна (design-type file). Изображение с наилучшей оценкой выбирается в качестве представителя статьи.

Как это работает

Система работает следующим образом:

  • Сбор данных: Система получает статью и идентифицирует все связанные с ней изображения.
  • Анализ характеристик: Для каждого изображения анализируются различные факторы: характеристики файла (размер, формат, пропорции), содержимое файла (количество цветов, распределение цвета), частота использования (повторяется ли на других страницах) и контекст (расположение на странице, окружающий текст, подписи).
  • Расчет оценки (Image Data Score): На основе собранных характеристик вычисляется оценка для каждого изображения, отражающая его репрезентативность.
  • Сравнение и выбор: Оценки сравниваются между собой или с пороговым значением. Изображение с наивысшей оценкой выбирается как Representative Image.
  • Резервный вариант (Default Image): Если ни одно изображение не подходит (оценки ниже порога), система может использовать изображение по умолчанию (например, скриншот, иконку) или, как указано в Claim 1, найти тематически похожую статью и взять изображение оттуда.

Актуальность для SEO

Критически высокая. Выбор главного изображения страницы имеет огромное значение для отображения контента в Google Images, Google News, Google Discover и в основной поисковой выдаче (SERP), где все чаще используются миниатюры рядом с результатами. Понимание механизма выбора напрямую влияет на оптимизацию изображений для повышения CTR и видимости контента.

Важность для SEO

Патент имеет критическое значение для SEO. Он раскрывает детальный механизм, который Google использует для выбора главного изображения страницы. Это напрямую влияет на визуальное представление сайта в результатах поиска и, следовательно, на кликабельность (CTR). Понимание факторов, влияющих на Image Data Score, позволяет SEO-специалистам оптимизировать изображения так, чтобы система выбирала наиболее привлекательные и релевантные картинки для представления их контента.

Детальный разбор

Термины и определения

Article (Статья)
Любой элемент контента: веб-страница (HTML, PDF), документ, электронное письмо, медиафайл и т.д.
Default Image (Изображение по умолчанию)
Резервное изображение, используемое, если в статье нет подходящих картинок. Может быть скриншотом, иконкой (например, favicon), иконкой приложения или изображением из другой, тематически похожей статьи.
Design-type file / Icon-type file (Файл типа "Дизайн" / "Иконка")
Изображение, выполняющее функцию элемента интерфейса, навигации, логотипа или рекламы. Обычно имеет меньше цветов, нестандартные пропорции и часто повторяется на разных страницах. Система стремится отфильтровать такие файлы.
Image Data (Данные изображения)
Набор характеристик изображения, используемых для анализа (размер, формат, контекст, цветность и т.д.).
Image Data Score (Оценка данных изображения)
Числовая оценка, рассчитываемая на основе Image Data Signal. Отражает вероятность того, что изображение является репрезентативным для статьи.
Image Data Signal (Сигнал данных изображения)
Композитный сигнал, агрегирующий различные характеристики (Image Data) изображения.
Photo-type file (Файл типа "Фото")
Содержательное изображение, которое передает общий смысл статьи. Обычно имеет больше цветов, высокое распределение цвета и стандартные пропорции. Система стремится идентифицировать такие файлы как репрезентативные.
Representative Image (Репрезентативное изображение)
Изображение, выбранное системой как наилучший представитель контента статьи. Используется для отображения в результатах поиска (миниатюра/thumbnail).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора изображения.

  1. Система получает данные, идентифицирующие несколько изображений внутри интересующей статьи (article of interest).
  2. Определяются Image Data Signals для этих изображений.
  3. Определяются Image Data Scores на основе сигналов и самой статьи.
  4. Оценки сравниваются с предопределенным порогом (predefined threshold).
  5. Если оценка изображения превышает порог, это изображение выбирается как репрезентативное.
  6. Критически важный момент (Fallback): Если оценки всех изображений внутри статьи ниже порога:
    1. Система определяет вторую статью, тематически похожую (topically similar) на первую.
    2. Система выбирает Default Image из второй статьи в качестве репрезентативного изображения для первой статьи.

Claim 3 (Зависимый): Детализирует, что входит в определение Image Data Signals. Это ключевой пункт для SEO, перечисляющий факторы анализа: расширение файла, имя файла, размер файла, размеры изображения, соотношение сторон, частота появления в нескольких статьях, расположение в статье, данные рядом с изображением, подпись к изображению, текст рядом с изображением, распределение цвета, текст в ссылках на изображение, текст рядом со ссылками на изображение, заголовки на страницах, ссылающихся на изображение, и количество цветов.

Claim 6 (Зависимый от 1): Уточняет, что выбор репрезентативного изображения может заключаться в выборе изображения с наивысшим Image Data Score.

Claim 7 (Зависимый от 6): Указывает, что Representative Image может включать окружающий контекст выбранного изображения (например, система может сделать скриншот области вокруг изображения, а не просто использовать файл изображения).

Claim 8 и 10 (Зависимые от 1): Уточняют, что система также может определять и оценивать Default Image (скриншоты, иконки и т.д.) наравне с обычными изображениями.

Где и как применяется

Изобретение применяется на этапе индексирования и влияет на отображение результатов на финальных этапах.

CRAWLING – Сканирование и Сбор данных
На этом этапе система собирает статью (например, веб-страницу) и все связанные с ней ресурсы, включая изображения.

INDEXING – Индексирование и извлечение признаков
Основное применение патента. Во время обработки проиндексированного контента система (в патенте упоминается Indexer) анализирует все изображения, связанные со статьей.

  1. Извлечение признаков (Feature Extraction): Система извлекает все характеристики, описанные в патенте (размер, формат, контекст, частота, цветность).
  2. Расчет оценок: Вычисляется Image Data Signal и Image Data Score для каждого изображения.
  3. Выбор репрезентативного изображения: Происходит сравнение оценок и выбор наилучшего изображения (или Default Image).
  4. Сохранение: Выбранное изображение (или ссылка на него) сохраняется в индексе как атрибут данной статьи. Оно также может быть сохранено в специализированном репозитории.

METASEARCH / RERANKING – Отображение результатов
На финальных этапах, когда формируется страница результатов (SERP), система (в патенте упоминается Formatter и Display Processor) использует предварительно выбранное Representative Image для отображения рядом с результатом поиска, в блоках Новостей, Discover и т.д.

Входные данные:

  • Контент статьи (текст, разметка).
  • Изображения, связанные со статьей (файлы).
  • Данные о контексте изображений (расположение, окружающий текст).
  • Данные о частоте использования изображений (из индекса).
  • Данные о ссылках на изображения.

Выходные данные:

  • Идентификатор (ID или URL) выбранного Representative Image, ассоциированный со статьей в индексе.

На что влияет

  • Типы контента: Влияет на любой контент, содержащий изображения: новостные статьи, блоги, карточки товаров, информационные лонгриды.
  • Форматы контента и SERP features: Критически влияет на отображение в Google Images, Google News, Google Discover, а также на миниатюры (thumbnails) в стандартной веб-выдаче и в rich results (например, Article, Product).
  • Влияние на CTR: Выбор привлекательного и релевантного изображения напрямую влияет на кликабельность результата в поиске.

Когда применяется

  • Условия работы: Алгоритм применяется каждый раз, когда система индексирует или переиндексирует статью, содержащую одно или несколько изображений.
  • Триггеры активации: Наличие изображений в контенте. Система должна выбрать одно изображение для представления статьи.
  • Пороговые значения: Система использует predefined threshold для Image Data Score. Если ни одно изображение не набирает достаточного балла, активируется механизм выбора Default Image (включая механизм заимствования из похожих статей).

Пошаговый алгоритм

Процесс выбора репрезентативного изображения (во время индексирования):

  1. Инициализация: Система получает данные статьи и список ассоциированных изображений. Также могут быть рассмотрены кандидаты Default Image (например, скриншот, фавикон).
  2. Цикл анализа изображений: Для каждого изображения в списке выполняется анализ характеристик:
    1. Определение характеристик файла: Анализ расширения, типа файла (предпочтение JPEG перед GIF для фото), размера файла (предпочтение большим файлам), размеров изображения (отсев слишком маленьких), соотношения сторон (отсев нестандартных пропорций, например, 100:1 или стандартных рекламных размеров).
    2. Определение содержимого файла: Анализ распределения цвета и количества цветов (предпочтение изображениям с большим количеством цветов как потенциальным фото).
    3. Определение частотных характеристик: Проверка, как часто это изображение встречается в других статьях или на этом же сайте (часто повторяющиеся изображения пессимизируются как элементы дизайна/навигации).
    4. Определение контекста: Анализ расположения (предпочтение изображениям в начале статьи, отсев в углах), наличия подписи (image caption - сильный положительный сигнал), окружающего текста, а также текста ссылок, указывающих на это изображение. Проверка, не является ли изображение кнопкой отправки формы.
  3. Генерация Image Data Signal: Агрегация всех собранных характеристик для каждого изображения.
  4. Расчет Image Data Score: Вычисление финальной оценки репрезентативности для каждого изображения (включая потенциальные Default Images).
  5. Сравнение с порогом: Сравнение оценок с предопределенным порогом (predefined threshold).
  6. Выбор изображения:
    1. Если есть оценки выше порога: Выбирается изображение с наивысшим Image Data Score.
    2. Если все оценки ниже порога: Активируется резервный механизм. Выбирается Default Image (скриншот, иконка) ИЛИ (согласно Claim 1) система ищет тематически похожую статью и выбирает изображение из нее.
  7. Сохранение результата: Выбранное изображение помечается как репрезентативное для данной статьи.

Какие данные и как использует

Данные на входе

Система использует широкий спектр данных для оценки изображений:

  • Мультимедиа факторы (Характеристики файла и содержимого):
    • File extension name (.jpg, .gif, .png, .bmp).
    • File type (определяется по заголовкам файла; например, GIF часто для дизайна, JPEG для фото).
    • File size (в байтах; большие файлы чаще являются фото).
    • Image dimensions (горизонтальный и вертикальный размер в пикселях; большие размеры предпочтительнее).
    • Image aspect ratio (соотношение сторон; стандартные предпочтительнее экстремальных, например, 100:1).
    • Color distribution (распределение цвета/гистограмма; высокое распределение указывает на фото).
    • Number of colors (количество уникальных цветов; большее количество указывает на фото).
  • Структурные и Контентные факторы (Контекст):
    • Location of image within an article (расположение в разметке/на экране; начало статьи предпочтительнее, верхний левый угол часто логотип).
    • Data adjacent to image (окружающие данные, например, текст или графика).
    • Image caption (наличие и содержание подписи к картинке; сильный положительный сигнал).
    • Text adjacent to image (окружающий текст).
    • HTML/XML код, определяющий, связано ли изображение с отправкой формы (submission of a form; такие изображения исключаются).
  • Ссылочные факторы (Внешний контекст):
    • Text in links to the image (анкорный текст ссылок на изображение с других страниц).
    • Text nearby links to the image (околоссылочный текст).
    • Headings and other text in pages that link to the image (текст и заголовки на страницах, ссылающихся на изображение).
  • Индексные данные (Частотность):
    • Image frequency over multiple articles (частота появления изображения в индексе или на конкретном сайте; высокая частота указывает на элемент дизайна/логотип).

Какие метрики используются и как они считаются

  • Image Data Score: Основная метрика, рассчитываемая с помощью функции оценки (Image Data Scoring Function). Это алгоритм, который взвешивает все вышеперечисленные факторы. Цель расчета — максимизировать вероятность выбора photo-type file и минимизировать вероятность выбора design-type file. Патент не приводит конкретную формулу, но описывает, как факторы влияют на результат.
  • Predefined Threshold: Пороговое значение, с которым сравнивается Image Data Score. Если порог не превышен ни одним изображением, активируется выбор Default Image.

Выводы

  1. Комплексная оценка изображений: Google использует сложный многофакторный анализ для выбора главного изображения страницы. Оцениваются не только само изображение (размер, формат, цвет), но и его контекст (расположение, подписи, окружающий текст) и частота использования.
  2. Цель – найти контент, а не дизайн: Основная цель алгоритма — отличить содержательные изображения (photo-type), которые отражают тему статьи, от элементов дизайна, логотипов, иконок и навигации (design-type).
  3. Важность контекста и структуры: Расположение изображения на странице, наличие подписи (caption) и окружающий текст являются сильными сигналами для определения его важности.
  4. Анализ частотности как фильтр спама/дизайна: Если изображение повторяется на многих страницах сайта или в интернете, оно с высокой вероятностью будет классифицировано как элемент дизайна или навигации и не будет выбрано в качестве репрезентативного.
  5. Резервный механизм заимствования (Fallback Mechanism): Если на странице нет качественных изображений, Google может использовать Default Image. Особо примечательно (Claim 1), что в качестве такого изображения может быть использована картинка из другой, но тематически похожей статьи. Это показывает стремление Google обеспечить визуальное представление контента любой ценой.
  6. Влияние ссылок на изображение: Текст ссылок, указывающих на изображение, и контент ссылающихся страниц также учитываются при оценке.

Практика

Best practices (это мы делаем)

  • Размещайте главное изображение в начале контента: Система отдает предпочтение изображениям, расположенным ближе к началу статьи. Избегайте размещения важных изображений в самом низу или в местах, которые могут быть интерпретированы как логотип (например, в самом верху слева).
  • Используйте содержательные, уникальные изображения: Создавайте или подбирайте изображения, которые являются photo-type, а не design-type. Они должны быть уникальными для статьи, так как система пессимизирует часто повторяющиеся картинки (Image frequency).
  • Оптимизируйте характеристики файлов:
    • Размер и Пропорции: Используйте достаточно крупные изображения (не иконки) со стандартным соотношением сторон (например, 4:3, 16:9, 3:2). Избегайте экстремальных пропорций (например, 100:1) или стандартных рекламных размеров.
    • Формат и Цветность: Используйте современные форматы (JPEG, PNG, WebP), которые поддерживают большое количество цветов. Система ассоциирует высокое количество цветов с photo-type файлами.
  • Добавляйте подписи (Captions): Наличие подписи (image caption) является сильным сигналом того, что изображение является содержательным. Используйте семантическую верстку: тег <figcaption> внутри <figure>.
  • Обеспечьте релевантный контекст: Убедитесь, что текст, окружающий изображение (text adjacent to image), релевантен самому изображению и теме статьи.
  • Оптимизируйте ссылки на изображения: Если на ваши изображения ссылаются другие сайты, убедитесь, что анкорный текст (text in links) и околоссылочный текст (text nearby links) релевантны.

Worst practices (это делать не надо)

  • Использование стоковых или неуникальных изображений как главных: Если изображение часто встречается в индексе Google, его Image Data Score может быть понижен из-за высокой частотности.
  • Размещение логотипа или баннера как первого изображения в контенте: Элементы дизайна, имеющие стандартные размеры рекламных баннеров или высокую частоту использования, будут отфильтрованы.
  • Использование изображений низкого качества: Маленькие размеры, низкое количество цветов или слишком сильное сжатие могут привести к классификации изображения как design-type или к низкому Image Data Score.
  • Использование картинок как кнопок отправки форм: Изображения, используемые для submission of a form, явно исключаются из рассмотрения как репрезентативные.
  • Отсутствие изображений в важном контенте: Это приведет к активации резервного механизма, и Google может показать непривлекательный Default Image или взять изображение с другого сайта, который он сочтет тематически похожим (Claim 1).

Стратегическое значение

Патент подчеркивает важность визуального контента в современном поиске. Для SEO-стратегии критически важно не просто наличие изображений, а их качество, уникальность и правильное структурирование внутри контента. Алгоритм выбора репрезентативного изображения напрямую влияет на привлекательность сниппета и CTR в ключевых каналах трафика (News, Discover, SERP). Стратегия должна включать процессы создания уникального визуального контента и техническую оптимизацию его представления для поисковых систем.

Практические примеры

Сценарий: Оптимизация статьи для Google Discover и News

Задача: Убедиться, что Google выберет конкретное, высококачественное и привлекательное изображение в качестве главного для новостной статьи.

Действия:

  1. Выбор изображения: Выбираем уникальную фотографию по теме статьи (photo-type).
  2. Техническая оптимизация: Сохраняем изображение в формате JPEG или WebP с разрешением не менее 1200px по ширине (рекомендация Google для Discover) и стандартным соотношением сторон 16:9. Проверяем, что файл достаточно большой и содержит много цветов.
  3. Размещение: Вставляем изображение сразу после заголовка H1 или первого абзаца.
  4. Структурирование (Контекст): Оборачиваем изображение в теги <figure> и добавляем релевантную подпись через <figcaption>.
    <figure> <img src="image.jpg" alt="Описание картинки"> <figcaption>Релевантная подпись к картинке (Caption)</figcaption> </figure>
  5. Окружающий текст: Убеждаемся, что текст до и после изображения тесно связан с ним по смыслу.
  6. Исключение конкуренции: Проверяем, что до этого изображения в коде нет других крупных картинок (например, большого логотипа в шапке), которые могли бы конкурировать за выбор.

Ожидаемый результат: Система анализирует характеристики: большой размер (+), много цветов (+), стандартные пропорции (+), расположение в начале (+), наличие подписи (+), уникальность (+). Image Data Score будет высоким, и это изображение будет выбрано как репрезентативное.

Вопросы и ответы

Какие факторы Google использует, чтобы выбрать главное изображение страницы?

Патент описывает комплексный анализ. Ключевые факторы включают: характеристики файла (предпочтение большим размерам, стандартным пропорциям, форматам типа JPEG/PNG), содержимое файла (предпочтение большому количеству цветов), частотность (пессимизация изображений, которые часто повторяются на сайте или в интернете) и контекст (предпочтение изображениям в начале статьи, с подписями и релевантным окружающим текстом).

Что такое "photo-type" и "design-type" изображения в контексте этого патента?

Photo-type – это содержательные изображения (фотографии, иллюстрации), которые отражают суть статьи. Design-type – это элементы интерфейса, логотипы, иконки, навигационные элементы. Алгоритм Google стремится выбрать photo-type изображение в качестве репрезентативного и отфильтровать design-type.

Влияет ли формат файла (JPG vs GIF) на выбор главного изображения?

Да, влияет. В патенте указано, что GIF часто используется для файлов типа "дизайн", а JPEG – для файлов типа "фото". Также система анализирует количество цветов и их распределение; изображения с большим количеством цветов (что характерно для JPEG/PNG/WebP) имеют больше шансов быть выбранными, чем изображения с ограниченной палитрой.

Насколько важно расположение изображения на странице?

Это очень важно. Система анализирует location of image within an article. Изображения, расположенные ближе к началу контента, часто считаются более важными. Изображения, расположенные в углах (например, вверху слева), могут быть классифицированы как логотипы.

Как уникальность изображения влияет на его выбор?

Уникальность критична. Система проверяет image frequency over multiple articles. Если изображение часто встречается на разных страницах сайта или в интернете, оно, скорее всего, будет классифицировано как элемент дизайна, навигации или стоковая картинка и не будет выбрано в качестве репрезентативного для конкретной статьи.

Что произойдет, если на моей странице нет изображений или они все низкого качества?

Система активирует резервный механизм и выберет Default Image. Это может быть заглушка, иконка (favicon), скриншот страницы. Более того, согласно Claim 1, Google может найти другую тематически похожую статью (возможно, на другом сайте) и использовать изображение из нее для представления вашего контента.

Как использование подписей к картинкам (captions) влияет на SEO изображений?

Наличие подписи (image caption) является сильным положительным сигналом. Это указывает системе на то, что изображение является содержательным (photo-type), а не просто элементом дизайна. С точки зрения SEO, рекомендуется использовать тег <figcaption> для важных изображений.

Учитывает ли Google текст ссылок (анкоры), указывающих на изображение?

Да. Патент явно упоминает, что text in links to the image, text nearby links (околоссылочный текст) и даже заголовки на страницах, которые ссылаются на изображение, используются для определения его контекста и оценки.

Может ли Google выбрать логотип сайта в качестве главного изображения статьи?

Алгоритм специально разработан так, чтобы этого не происходило. Логотипы обычно имеют высокую частоту повторений на сайте, часто располагаются в стандартных местах (например, вверху слева) и могут иметь меньше цветов. Все эти факторы понижают их Image Data Score для конкретной статьи.

Как оптимизировать изображение, чтобы именно оно стало главным?

Необходимо максимизировать его Image Data Score. Разместите уникальное, качественное изображение (большой размер, много цветов, стандартные пропорции) в самом начале статьи. Добавьте к нему подпись (caption) и окружите релевантным текстом. Убедитесь, что оно не выглядит как баннер или элемент навигации.

Похожие патенты

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
  • US8775436B1
  • 2014-07-08
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google выбирает лучшую целевую страницу (Landing Page) для результатов поиска по картинкам
Google использует запатентованный метод для выбора наилучшего контекста для изображения в поиске по картинкам. Когда одно и то же или похожее изображение появляется на нескольких сайтах, система оценивает качество и важность каждой веб-страницы (Web Score). Страница с наивысшей оценкой выбирается в качестве официальной целевой страницы (Landing Page), на которую попадает пользователь при клике на результат.
  • US9158857B2
  • 2015-10-13
  • Мультимедиа

  • EEAT и качество

  • SERP

Как Google определяет намерение поиска изображений, анализируя контент топовых веб-результатов
Google использует систему для определения того, следует ли показывать блок с изображениями в поисковой выдаче. Вместо анализа только текста запроса, система анализирует характеристики контента (например, плотность изображений, соотношение изображений к тексту) на страницах, которые уже ранжируются в топе. Если эти страницы похожи на контент, который обычно удовлетворяет потребность в изображениях, система активирует показ блока картинок.
  • US9195717B2
  • 2015-11-24
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google выбирает главное изображение для сущности, анализируя тематичность веб-страниц и визуальные характеристики картинки
Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на которых оно размещено. Изображения с нерелевантных страниц отфильтровываются. Финальный выбор делается на основе визуальных характеристик, таких как распознавание лиц, логотипов или флагов.
  • US9110943B2
  • 2015-08-18
  • Knowledge Graph

  • Мультимедиа

  • Семантика и интент

Популярные патенты

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах
Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.
  • US20180113919A1
  • 2018-04-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google индексирует контент внутри мобильных приложений для показа в результатах поиска (App Indexing)
Google использует механизм для индексации контента, который пользователи просматривают в нативных мобильных приложениях. Система получает данные о просмотренном контенте и deep links напрямую от приложения на устройстве. Эта информация сохраняется в индексе (персональном или публичном) и используется для генерации результатов поиска, позволяя пользователям переходить к контенту внутри приложений напрямую из поисковой выдачи.
  • US10120949B2
  • 2018-11-06
  • Индексация

  • SERP

  • Персонализация

seohardcore