SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования

RANKING AND SELECTING IMAGES FOR DISPLAY FROM A SET OF IMAGES (Ранжирование и выбор изображений для показа из набора изображений)
  • US9858295B2
  • Google LLC
  • 2015-06-23
  • 2018-01-02
  • Мультимедиа
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.

Описание

Какую проблему решает

Патент решает задачу автоматического и эффективного выбора изображений наивысшего качества (highest overall quality) из большого набора (например, загруженного пользователями) для демонстрации (featured display или showcase). Цель — обеспечить надежный автоматизированный отбор "лучших" изображений, обладающих наибольшей общей привлекательностью, без необходимости ручной кураторской работы, экономя время и вычислительные ресурсы.

Что запатентовано

Запатентована система ранжирования изображений, которая оценивает качество на основе комбинации как минимум двух из трех классов характеристик: Visual Capture Characteristics (техническое качество съемки), Visual Content Characteristics (содержание изображения) и Social Popularity Characteristics (социальная популярность). Система вычисляет индивидуальные оценки для каждого класса, комбинирует их в общую оценку (Overall Score) и ранжирует изображения. Ключевой особенностью является возможность исключения изображений на основе нежелательного контента (например, лиц) и учет репутации пользователей при оценке социальных сигналов.

Как это работает

Система работает в несколько этапов:

  • Предварительный отбор: Изображения проходят первичную проверку по базовым критериям (например, разрешение, приватность, базовый уровень шума). Эта стадия менее ресурсоемка и отсеивает неподходящие варианты, формируя набор кандидатов (Candidate Images).
  • Анализ характеристик: Для кандидатов анализируются три класса характеристик: техническое качество (резкость, экспозиция), содержание (распознавание объектов, лиц, ландшафтов) и социальные сигналы (просмотры, комментарии, шеры, рейтинги).
  • Фильтрация контента: Система может исключить изображения, содержащие нежелательный контент (например, лица или текст).
  • Скоринг и Взвешивание: Каждой характеристике присваивается Individual Score. При оценке социальных сигналов учитывается Reputation Score пользователей. Затем индивидуальные оценки взвешиваются (используя машинное обучение для определения весов) и комбинируются в Overall Score.
  • Ранжирование и Выбор: Изображения ранжируются по Overall Score, и лучшие выбираются для показа.

Актуальность для SEO

Высокая. Оценка качества мультимедийного контента критически важна для Google Images, Google Discover, а также для ранжирования веб-страниц, где изображения играют значительную роль. Принципы, заложенные в патенте — комбинация технического качества, семантики контента и сигналов вовлеченности пользователей (включая оценку авторитетности источника сигнала) — полностью соответствуют современным подходам к ранжированию.

Важность для SEO

Патент имеет высокое значение для SEO, особенно в контексте оптимизации под Google Images и Discover. Он детально описывает многофакторную модель оценки качества изображений, подчеркивая, что для высокого ранжирования изображение должно быть не только технически качественным и релевантным по содержанию, но и генерировать положительные сигналы вовлеченности от авторитетных пользователей. Игнорирование любого из этих трех аспектов снижает потенциал видимости изображения.

Детальный разбор

Термины и определения

Candidate Image (Изображение-кандидат)
Изображение, прошедшее предварительный отбор по базовым критериям (initial set of characteristics) и допущенное к детальному анализу и ранжированию.
Individual Score (Индивидуальная оценка)
Числовая оценка, присваиваемая определенному классу характеристик изображения (например, отдельная оценка для Visual Capture, отдельная для Social Popularity). Может быть комбинацией оценок разных типов внутри одного класса.
Initial Set of Characteristics (Начальный набор характеристик)
Характеристики, проверяемые на раннем этапе для быстрого отсева неподходящих изображений. Они требуют меньше вычислительных ресурсов для анализа (например, разрешение, настройки приватности, базовый шум).
Overall Score (Общая оценка)
Итоговая оценка качества изображения, являющаяся взвешенной комбинацией Individual Scores. Определяет ранг изображения.
Reputation Score (Оценка репутации)
Метрика, присваиваемая пользователю, который предоставил социальные данные (комментарий, рейтинг). Используется для взвешивания социальных сигналов, чтобы снизить влияние спама или фейковых отзывов.
Social Popularity Characteristics (Характеристики социальной популярности)
Метрики, основанные на взаимодействии пользователей с изображением: количество просмотров, время просмотра, количество комментариев, количество шеров (share count), рейтинги (rating count), добавление в избранное.
Visual Capture Characteristics (Характеристики визуального захвата)
Технические визуальные характеристики изображения, часто связанные с моментом съемки: резкость (размытость), уровень экспозиции, яркость, контраст, насыщенность, шум, композиция.
Visual Content Characteristics (Характеристики визуального контента)
Типы и атрибуты контента, изображенного на картинке: лица, объекты, животные, здания, ландшафты, текст. Определяются с помощью технологий распознавания образов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления выбранных изображений для показа.

  1. Система анализирует характеристики множества изображений. Анализ включает Visual Content Characteristics и один или более из: Visual Capture Characteristics и Social Popularity Characteristics.
  2. Анализ Visual Content Characteristics включает:
    • Сравнение обнаруженных типов контента со списком определенных типов контента (list of one or more particular content types), который включает тип контента "человеческие лица".
    • Обозначение для исключения (designating for exclusion) изображений, которые содержат контент, соответствующий этому списку.
  3. Система определяет Individual Scores для проанализированных характеристик изображений (не исключенных). Оценки основаны на обнаруженных типах контента.
  4. Система определяет Overall Scores на основе комбинации Individual Scores.
  5. Система определяет ранжирование изображений на основе Overall Scores.
  6. Система выбирает одно или несколько изображений на основе ранжирования, при этом изображения, обозначенные для исключения, не выбираются.
  7. Система вызывает показ выбранных изображений.

Ядро изобретения — это система ранжирования, которая комбинирует разные типы сигналов качества (визуальные, контентные, социальные) и при этом активно исключает изображения на основе специфических типов контента (явно упомянуты лица) перед финальным выбором.

Claim 2 (Зависимый от 1): Добавляет этап предварительного отбора.

До анализа основных характеристик система выбирает подмножество изображений-кандидатов из общего набора на основе initial set of characteristics.

Claim 3 (Зависимый от 2): Уточняет эффективность предварительного отбора.

Обработка initial set of characteristics требует меньше вычислительных ресурсов, чем обработка основных характеристик.

Claim 8 (Зависимый от 1): Детализирует расчет Individual Score.

Если характеристика включает несколько типов (например, разные типы социального взаимодействия), то расчет Individual Score включает взвешивание каждого типа по-разному и комбинирование взвешенных типов.

Claim 9 (Зависимый от 1): Детализирует расчет Overall Score.

При определении Overall Scores разные Individual Scores (например, оценка за контент и оценка за социальную популярность) взвешиваются по-разному.

Claim 11 (Зависимый от 10): Вводит учет репутации пользователей.

Пользователи, предоставляющие входные данные для Social Popularity Characteristics, проверяются на наличие Reputation Score. Определение Individual Scores включает взвешивание социальных характеристик на основе этого Reputation Score.

Где и как применяется

Изобретение охватывает этапы индексирования (для извлечения признаков) и ранжирования (для оценки и выбора).

CRAWLING – Сканирование и Сбор данных
На этом этапе собираются сами изображения и связанные с ними социальные данные (комментарии, шеры, рейтинги) из различных источников (например, веб-сайтов, социальных сетей, фотохостингов).

INDEXING – Индексирование и извлечение признаков
Основная часть анализа характеристик происходит здесь.

  • Извлечение признаков (Feature Extraction):
    • Анализируются Visual Capture Characteristics (резкость, экспозиция, шум).
    • Анализируются Visual Content Characteristics (распознавание объектов, лиц, ландшафтов, текста).
    • Обрабатываются Social Popularity Characteristics, собранные на этапе Crawling.
    • Определяется Reputation Score пользователей, связанных с социальными данными.
  • Предварительный отбор (Candidate Selection): Может происходить в конце этапа индексирования или в начале этапа ранжирования. Система использует Initial Set of Characteristics для быстрого отсева изображений (например, по разрешению или приватности).

RANKING – Ранжирование
Этот этап используется для оценки и сортировки изображений-кандидатов.

  • Скоринг: Вычисляются Individual Scores для каждого класса характеристик. Социальные сигналы взвешиваются с учетом Reputation Score.
  • Фильтрация: Изображения с нежелательным контентом (например, лицами) исключаются из рассмотрения.
  • Комбинирование: Вычисляется Overall Score путем взвешенного комбинирования Individual Scores. Веса могут определяться с помощью машинного обучения.
  • Сортировка: Изображения ранжируются по Overall Score.

RERANKING – Переранжирование
На этом этапе могут применяться корректировки. Например, патент упоминает возможность выбора изображений с учетом предпочтений пользователя, который будет их просматривать (персонализация).

Входные данные:

  • Набор изображений для оценки.
  • Социальные данные, связанные с изображениями (просмотры, шеры, комментарии, рейтинги).
  • Данные о репутации пользователей (Reputation Score).
  • Списки нежелательных типов контента (например, "лица").
  • Модели машинного обучения для распознавания контента и определения весов.

Выходные данные:

  • Ранжированный список изображений.
  • Выбранные изображения наивысшего качества для показа.

На что влияет

  • Типы контента: Система явно влияет на изображения с распознаваемым контентом. Пейзажи, закаты, пляжи, цветы и популярные животные могут получать преимущество. Изображения с лицами, текстом, нежелательными объектами (насекомые, мусор) могут быть исключены или понижены.
  • Форматы контента: Влияет на статичные изображения и, возможно, на ключевые кадры видео.
  • Техническое качество: Изображения с высоким разрешением, хорошей резкостью и правильной экспозицией получают значительное преимущество.

Когда применяется

  • Триггеры активации: Алгоритм может активироваться периодически (например, ежедневно для выбора "фото дня"), при загрузке новых изображений в систему или в реальном времени при формировании выдачи (например, в Google Images).
  • Условия работы: Применяется, когда необходимо выбрать наиболее привлекательные (general appeal) изображения из большого набора, особенно для публичной демонстрации (featured display, обои, скринсейверы).

Пошаговый алгоритм

Этап 1: Предварительная обработка и отбор кандидатов

  1. Получение изображения: Система получает изображение из набора.
  2. Анализ начальных характеристик: Система анализирует Initial Set of Characteristics (например, разрешение, настройки приватности, базовый шум). Этот анализ менее ресурсоемок.
  3. Проверка требований: Система проверяет, удовлетворяют ли начальные характеристики требованиям (например, разрешение выше порога, статус публичный).
  4. Решение:
    • Если НЕТ: Изображение отклоняется и исключается из дальнейшего ранжирования.
    • Если ДА: Изображение помечается как Candidate Image.
  5. Итерация: Повторение шагов 1-4 для всех изображений в наборе.

Этап 2: Детальный анализ и Скоринг

  1. Выбор кандидата: Система выбирает Candidate Image для анализа.
  2. Анализ Социальной Популярности:
    • Определение Social Popularity Characteristics (просмотры, шеры, рейтинги).
    • Проверка Reputation Score пользователей, предоставивших данные.
    • Расчет Individual Score для социальной популярности, взвешивая данные на основе репутации. Разные типы взаимодействия (например, шеры и просмотры) могут иметь разные веса.
  3. Анализ Визуального Контента:
    • Определение Visual Content Characteristics (распознавание объектов, лиц, ландшафтов).
    • Сравнение с списком нежелательного контента. Если контент нежелателен (например, обнаружено лицо), изображение может быть исключено или получить минимально возможный вес.
    • Расчет Individual Score для визуального контента. Разные типы контента (например, закат и мусор) имеют разные веса.
  4. Анализ Визуального Захвата:
    • Определение Visual Capture Characteristics (резкость, экспозиция, шум). Может использоваться машинное обучение для оценки эстетики.
    • Расчет Individual Score для визуального захвата. Разные технические аспекты (например, яркость и шум) могут иметь разные веса.
  5. Комбинирование оценок:
    • Взвешивание Individual Scores. Веса для каждого класса (Социальный, Контент, Захват) определяются (например, через машинное обучение) для максимизации общей привлекательности.
    • Комбинирование взвешенных оценок в Overall Score.

Этап 3: Ранжирование и Выбор

  1. Ранжирование: Изображение помещается в ранжированный список на основе Overall Score.
  2. Итерация: Повторение Этапа 2 для всех кандидатов.
  3. Выбор: Система выбирает одно или несколько изображений с наивысшим рейтингом для показа. Может учитываться персонализация для конечного пользователя.
  4. Показ: Выбранные изображения предоставляются для демонстрации.

Какие данные и как использует

Данные на входе

Патент детально описывает три основных класса входных данных:

1. Технические факторы (Visual Capture Characteristics и Initial Set)

  • Разрешение (Resolution): Используется на начальном этапе для отсева слишком маленьких изображений.
  • Шум (Noise): Оценивается как на начальном этапе (базовый), так и на основном (детальный анализ цветового шума).
  • Размытость/Резкость (Blurriness/Sharpness): Оценка четкости изображения.
  • Экспозиция (Exposure Level): Оценка уровня экспонированности (пересвет/недосвет).
  • Яркость (Brightness), Контраст (Contrast), Насыщенность (Saturation/Vibrance).
  • Композиция (Image Composition): Расположение основного объекта относительно границ кадра и других объектов.
  • EXIF данные: Могут использоваться для оценки качества на основе бренда/модели камеры.

2. Контентные факторы (Visual Content Characteristics)

  • Распознанные объекты и сущности: Лица, животные, здания, транспортные средства, ландшафты (горы, озера, пляжи), достопримечательности.
  • Текст (Text): Распознанный текст на изображении (может считаться нежелательным контентом).
  • Ключевые слова/Метки (Keywords/Labels): Описания контента, сгенерированные автоматически (например, с помощью Deep Learning) или добавленные пользователями.
  • Метаданные локации (Location data): Используются для помощи в распознавании достопримечательностей или ландшафтов.

3. Поведенческие и Социальные факторы (Social Popularity Characteristics)

  • Количество просмотров (Number of views) и Время просмотра (Length of times viewed).
  • Количество шеров (Share count): Включая решеры.
  • Рейтинги (Rating count): Количество и значение положительных/отрицательных оценок.
  • Комментарии (Number of comments): Количество и тональность (позитивные/негативные).
  • Добавление в избранное/закладки (Favorite/Bookmark lists).

4. Пользовательские факторы

  • Приватность (Privacy characteristic): Публичный или приватный статус изображения.
  • Репутация пользователя (Reputation Score): Оценка надежности пользователя, предоставившего социальные данные (для борьбы со спамом) или загрузившего изображение.
  • Предпочтения пользователя (User preferences): Могут использоваться на этапе выбора для персонализации показа.

Какие метрики используются и как они считаются

  • Пороги для Initial Set: Минимальное разрешение, максимальный уровень шума, требование публичного статуса.
  • Individual Scores: Вычисляются для каждого класса характеристик. Внутри класса разные типы могут взвешиваться по-разному (например, шеры важнее просмотров; закаты важнее мусора).
  • Веса для классов: Коэффициенты, применяемые к Individual Scores при расчете Overall Score. Патент предполагает использование машинного обучения (например, регрессии) для определения этих весов на основе оценок реальных пользователей.
  • Reputation Weighting: Социальные данные от пользователей с низким Reputation Score могут быть дисконтированы или проигнорированы. Данные от экспертов (например, профессиональных фотографов) могут получать повышенный вес.
  • Content Exclusion: Бинарное исключение или присвоение крайне негативного веса при обнаружении нежелательного контента (например, лиц, текста).

Выводы

  1. Три столпа качества изображения: Патент формализует оценку качества изображений как комбинацию трех ключевых компонентов: Техническое качество (Visual Capture), Содержание (Visual Content) и Вовлеченность (Social Popularity). Для достижения максимального ранжирования необходимо оптимизировать все три аспекта.
  2. Взвешенная модель и Машинное обучение: Система использует взвешенную модель, где значимость каждого компонента (и подкомпонентов внутри них) может варьироваться. Веса определяются с помощью машинного обучения на основе реальных человеческих оценок привлекательности изображений. Это означает, что "идеальные" параметры могут меняться со временем.
  3. Критичность технического качества: Внедрен двухэтапный процесс, где базовые технические требования (разрешение, шум) используются для быстрого отсева (Initial Set). Несоответствие базовым требованиям исключает изображение из ранжирования независимо от его содержания или популярности.
  4. Контент имеет значение и может быть фильтром: Система не просто оценивает содержание, но и активно фильтрует его. Определенные типы контента (явно упомянуты лица и текст) могут быть причиной полного исключения изображения из выдачи или его сильного понижения, если это требуется контекстом показа (например, для обоев).
  5. Качество социальных сигналов (E-E-A-T для вовлеченности): Патент подчеркивает важность не только количества социальных взаимодействий, но и их качества. Вводится понятие Reputation Score пользователя, который влияет на вес его отзыва или рейтинга. Сигналы от авторитетных пользователей (экспертов) весят больше, а спам дисконтируется.

Практика

Best practices (это мы делаем)

  • Обеспечение максимального технического качества: Загружайте изображения в высоком разрешении, с минимальным уровнем шума, идеальной резкостью и правильной экспозицией. Это критично для прохождения как начального фильтра (Initial Set), так и для получения высокого Individual Score по Visual Capture Characteristics.
  • Оптимизация композиции и эстетики: Поскольку система использует машинное обучение для оценки визуальной привлекательности и композиции, следует придерживаться общепринятых стандартов фотографии и дизайна. Это повышает вероятность положительной оценки моделью.
  • Фокус на универсально привлекательном контенте: Создавайте контент, который имеет широкую привлекательность (general appeal). Патент упоминает, что контент вроде закатов, пляжей, цветов и популярных животных может оцениваться выше.
  • Стимулирование органического вовлечения: Поощряйте пользователей взаимодействовать с изображением (лайки, шеры, комментарии, добавление в закладки), так как Social Popularity является важным компонентом Overall Score.
  • Построение репутации автора/источника: Работайте над повышением Reputation Score аккаунтов, которые публикуют и комментируют контент. Сигналы от авторитетных источников имеют больший вес. Это соответствует принципам E-E-A-T, примененным к источникам пользовательских сигналов.
  • Анализ контекста размещения: Понимайте, где изображение может быть показано. Если цель — попасть в общие подборки (например, обои или Discover), возможно, стоит избегать изображений с лицами или большим количеством текста, так как патент явно указывает на возможность их исключения.

Worst practices (это делать не надо)

  • Игнорирование технических дефектов: Публикация размытых, шумных, пересвеченных или недоэкспонированных изображений значительно снижает их шансы на высокое ранжирование.
  • Загрузка изображений низкого разрешения: Такие изображения могут быть отсеяны еще на этапе предварительного отбора (Initial Set).
  • Накрутка социальных сигналов: Использование ботов или фейковых аккаунтов для генерации просмотров, лайков или комментариев неэффективно, так как система использует Reputation Score для дисконтирования сигналов от низкокачественных источников.
  • Фокус на спорном или низкокачественном контенте: Изображения, которые могут быть восприняты негативно широкой аудиторией (например, мусор, непристойный контент), получат низкий Individual Score по Visual Content Characteristics.

Стратегическое значение

Патент подтверждает, что оценка качества мультимедиа в Google является сложной, многофакторной задачей, использующей машинное обучение. Для SEO-стратегии это означает, что оптимизация изображений выходит далеко за рамки заполнения ALT-тегов. Необходимо рассматривать изображение как самостоятельную единицу контента, требующую технической оптимизации, семантической релевантности и подтверждения ценности через пользовательское вовлечение. Механизм учета репутации источника сигналов также подчеркивает глобальный тренд Google на борьбу с манипуляциями и приоритет авторитетных данных (E-E-A-T).

Практические примеры

Сценарий: Оптимизация изображений для статьи в блоге о путешествиях для попадания в Google Discover

  1. Задача: Повысить вероятность показа изображений из статьи в рекомендациях Discover.
  2. Действия на основе патента:
    • Visual Capture: Использовать только профессиональные фотографии с высоким разрешением (не менее 1200px по ширине), идеальной резкостью и яркими цветами. Проверить композицию.
    • Visual Content: Выбрать фотографии с универсально привлекательными пейзажами (например, горы, океан). Убедиться, что на главных фото нет большого количества текста или водяных знаков. Если используются фото с людьми, убедиться, что они не являются фокусом, или быть готовым к тому, что система может их отфильтровать для общих показов.
    • Social Popularity: Сразу после публикации статьи активно продвигать ее в социальных сетях, стимулируя шеры и комментарии к посту с этими изображениями. Поощрять взаимодействие от авторитетных тревел-блогеров (повышенный вес из-за Reputation Score).
  3. Ожидаемый результат: Система оценивает изображения как высококачественные по всем трем параметрам, что приводит к высокому Overall Score и увеличивает вероятность их выбора для показа в Google Discover или высокое ранжирование в Google Images.

Вопросы и ответы

Какие три основных класса характеристик использует Google для оценки качества изображений согласно этому патенту?

Google использует комбинацию как минимум двух из трех классов: 1) Visual Capture Characteristics (техническое качество: резкость, экспозиция, шум); 2) Visual Content Characteristics (содержание: объекты, лица, ландшафты); 3) Social Popularity Characteristics (вовлеченность: просмотры, шеры, рейтинги). Для максимального ранжирования важно оптимизировать все три аспекта.

Насколько важно техническое качество изображения (разрешение, резкость)?

Оно критически важно. Патент описывает двухэтапный процесс. На первом этапе (Initial Set of Characteristics) изображения с низким разрешением или высоким уровнем шума могут быть полностью исключены из рассмотрения. На втором этапе детальный анализ резкости и экспозиции (Visual Capture) вносит значительный вклад в общую оценку (Overall Score).

Патент упоминает исключение изображений с лицами. Значит ли это, что изображения с людьми ранжируются хуже?

Не обязательно, но это возможно в определенных контекстах. Патент явно указывает, что система может быть настроена на исключение определенных типов контента, и приводит "человеческие лица" как пример (Claim 1). Это может делаться для защиты приватности или когда требуются универсальные изображения (например, для обоев). SEO-специалистам следует учитывать контекст: для новостей лица важны, но для попадания в общие эстетические подборки (возможно, Discover) изображения без лиц могут иметь преимущество.

Как Google защищается от накрутки лайков и шеров для изображений?

Система использует Reputation Score пользователя, который взаимодействует с изображением. Если лайки, комментарии или шеры исходят от аккаунтов с низкой репутацией (спам, боты), вес этих социальных сигналов будет значительно снижен или обнулен. Важны органические взаимодействия от реальных, авторитетных пользователей.

Что такое Initial Set of Characteristics и почему это важно?

Это набор характеристик, которые требуют меньше вычислительных ресурсов для анализа (например, разрешение, приватность, базовый шум). Они используются для быстрого предварительного отсева неподходящих изображений. Это важно, потому что если изображение не проходит этот базовый фильтр, оно не попадает на этап детального ранжирования.

Используется ли машинное обучение в этом процессе?

Да. Патент упоминает использование машинного обучения для определения весов различных характеристик при расчете Individual Scores и Overall Score. Система обучается на основе человеческих оценок, чтобы понять, какая комбинация характеристик делает изображение наиболее привлекательным.

Влияет ли текст на изображении на его ранжирование?

Да, текст относится к Visual Content Characteristics. Патент указывает, что система может распознавать текст и рассматривать его как нежелательный контент в определенных контекстах, что может привести к понижению в рейтинге или исключению изображения. Следует минимизировать текст на изображениях, если он не является необходимым.

Какой тип контента система считает наиболее привлекательным?

Патент не дает исчерпывающего списка, но упоминает, что контент с широкой привлекательностью (general appeal), такой как закаты, пляжи, цветы и популярные животные, может получать более высокие веса при расчете Individual Score за контент. И наоборот, контент вроде мусора или сцен разрушения оценивается ниже.

Применяется ли этот алгоритм для ранжирования в Google Images?

Хотя патент в примерах фокусируется на выборе "featured images" (например, для социальной сети или обоев), описанные механизмы оценки качества — комбинация технического качества, анализа контента и социальных сигналов — являются фундаментальными для ранжирования мультимедиа. Высока вероятность, что эти принципы лежат в основе алгоритмов Google Images и Google Discover.

Как этот патент связан с E-E-A-T?

Связь прослеживается через механизм Reputation Score. Система оценивает авторитетность и надежность источника социальных сигналов. Это применение принципов E-E-A-T к оценке пользовательского вовлечения: сигнал от эксперта (например, известного фотографа) весит больше, чем сигнал от анонимного пользователя или спам-аккаунта.

Похожие патенты

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
  • US8775436B1
  • 2014-07-08
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google выбирает главное (репрезентативное) изображение страницы для показа в результатах поиска
Google использует систему для автоматического выбора наилучшего изображения, представляющего содержание статьи или веб-страницы. Система анализирует все изображения на странице, оценивая их характеристики (размер, формат, расположение, контекст) и присваивая им оценку (Image Data Score). Цель – отличить содержательные фотографии от элементов дизайна или иконок. Изображение с наивысшей оценкой выбирается в качестве репрезентативного для показа в SERP, Новостях или Discover.
  • US7580568B1
  • 2009-08-25
  • Мультимедиа

  • SERP

Как Google выбирает главные изображения для локаций и достопримечательностей, используя качество, клики и веб-контекст
Google использует иерархическую систему для выбора наилучшего репрезентативного изображения для локаций (городов) и достопримечательностей. Система оценивает фотографии по двум основным критериям: релевантности (основанной на кликах пользователей в поиске по картинкам и контексте веб-страниц, где размещено изображение) и визуальному качеству (четкость, экспозиция). Для крупных локаций система выбирает лучшее изображение из числа лучших фотографий её ключевых достопримечательностей.
  • US9076079B1
  • 2015-07-07
  • Мультимедиа

  • Поведенческие сигналы

  • Local SEO

Как Google контекстуально выбирает изображения и отзывы для локаций на основе атрибутов запроса пользователя
Google использует машинное обучение для анализа изображений и отзывов о местах (например, ресторанах) и связывания их с конкретными атрибутами (например, "есть детское меню", "вид на горы"). При поиске система динамически ранжирует этот контент, отдавая приоритет тем изображениям и отзывам, которые наиболее релевантны атрибутам, указанным в запросе пользователя.
  • US10671660B2
  • 2020-06-02
  • Семантика и интент

  • Мультимедиа

  • Local SEO

Популярные патенты

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче
Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.
  • US9424360B2
  • 2016-08-23
  • Local SEO

  • Поведенческие сигналы

Как Google использует внешние данные для оценки репутации сущностей и их взаимной привлекательности в вертикальном поиске
Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления скрытых атрибутов и расчета «Репутационной значимости» каждой сущности. На основе этих данных определяется метрика «Двухстороннего соответствия», которая используется для ранжирования.
  • US10853432B2
  • 2020-12-01
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска
Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.
  • US20150006290A1
  • 2015-01-01
  • Поведенческие сигналы

  • Персонализация

  • Local SEO

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.
  • US8892549B1
  • 2014-11-18
  • EEAT и качество

  • Семантика и интент

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

seohardcore