Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google динамически изменяет вес визуального качества изображения в ранжировании в зависимости от запроса

    IMAGE SELECTION BASED ON IMAGE QUALITY (Выбор изображений на основе качества изображения)
    • US8738553B1
    • Google LLC
    • 2014-05-27
    • 2009-07-22
    2009 SERP Мультимедиа Патенты Google Поведенческие сигналы

    Google использует систему машинного обучения для оценки визуального качества изображений (резкость, цвет, экспозиция). Ключевая особенность — динамическая корректировка веса этого фактора. Если исторические данные показывают, что пользователи по конкретному запросу предпочитают кликать на визуально качественные изображения чаще, чем в среднем, система увеличивает влияние качества на ранжирование именно для этого запроса.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неоптимального ранжирования в поиске по картинкам, когда стандартные алгоритмы, основанные преимущественно на текстовой релевантности (окружающий текст, alt-атрибуты), могут высоко ранжировать изображения с низким визуальным качеством (размытые, с плохой экспозицией или цветопередачей). Это ухудшает пользовательский опыт. Изобретение внедряет механизм для интеграции оценки визуального качества в процесс ранжирования, причем степень этого влияния адаптируется под интент пользователя.

    Что запатентовано

    Запатентована система (Image Quality Subsystem), которая оценивает визуальное качество изображений и динамически регулирует вес этого фактора для каждого конкретного запроса. Система вычисляет независимую от запроса оценку качества (Initial Quality Score) с помощью обученной модели. Затем она определяет Transformation Factor (Меру Важности) для запроса, анализируя поведение пользователей (Relevance Feedback Data). Итоговый Query Specific Quality Score используется для корректировки ранжирования.

    Как это работает

    Система работает в несколько этапов:

    • Обучение и Индексирование (Офлайн): Модель машинного обучения (Image Classification Model) обучается отличать качественные изображения на основе визуальных признаков (цвет, текстура, резкость). При индексировании для изображений вычисляется Initial Quality Score.
    • Анализ Поведения (Офлайн/Периодически): Система анализирует клики пользователей (Relevance Feedback Data). Если пользователи по запросу X чаще кликают на качественные картинки, чем в среднем по другим запросам, для запроса X устанавливается высокий Transformation Factor.
    • Ранжирование (В реальном времени): При получении запроса система комбинирует Initial Quality Score изображения и Transformation Factor запроса для получения Query Specific Quality Score. Эта оценка затем используется для вычисления финального Adjusted Relevance Score (например, по формуле, включающей экспоненту e^(Query Score)).

    Актуальность для SEO

    Высокая. В 2025 году визуальный поиск (Google Images, Lens, Discover) является критически важным каналом. Пользователи ожидают высокого визуального качества, особенно в коммерческих и эстетически ориентированных нишах. Этот патент описывает фундаментальный механизм, позволяющий Google алгоритмически оценивать эстетику и динамически интегрировать ее в ранжирование, что полностью соответствует современным трендам.

    Важность для SEO

    Патент имеет высокое значение (8/10) для SEO-стратегий, особенно для Image SEO и сайтов с визуальным контентом (eCommerce, дизайн, фотография). Он подтверждает, что оптимизация визуальных характеристик изображения (резкость, экспозиция) является прямым фактором ранжирования. Более того, он показывает, что вес этого фактора динамичен и зависит от интента запроса и поведения пользователей в конкретной нише.

    Детальный разбор

    Термины и определения

    Adjusted Relevance Score (Скорректированная оценка релевантности)
    Финальная оценка ранжирования изображения, полученная путем модификации исходной оценки релевантности с помощью оценки качества (Query Specific или Initial).
    Feature Vector (Вектор признаков)
    Набор числовых значений (Image Feature Values), представляющих визуальные характеристики изображения (цвет, текстура, резкость, края). Используется как входные данные для модели.
    Image Classification Model (Модель классификации изображений)
    Модель машинного обучения (упоминаются PAMIR, SVM), обученная отличать высококачественные изображения от низкокачественных на основе их Feature Vectors.
    Initial Quality Score / Initial Score (Исходная оценка качества)
    Независимая от запроса (query-independent) оценка визуального качества изображения, вычисленная Image Classification Model.
    Measure of Importance (Мера Важности)
    Синоним Transformation Factor. Значение, определяющее, насколько сильно визуальное качество должно влиять на ранжирование для конкретного запроса.
    PAMIR (Passive-Aggressive Model for Images)
    Один из упомянутых алгоритмов машинного обучения, используемый для тренировки Image Classification Model.
    Query Specific Quality Score / Query Score (Оценка качества с учетом запроса)
    Оценка, вычисленная на основе Initial Quality Score и Transformation Factor для конкретного запроса. Отражает важность качества изображения в контексте данного запроса.
    Relevance Feedback Data (Данные обратной связи по релевантности)
    Данные о взаимодействии пользователей с результатами поиска (например, клики, CTR, selection rate), используемые для определения Transformation Factor.
    Transformation Factor (Коэффициент трансформации)
    См. Measure of Importance.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод динамической корректировки ранжирования на основе качества с учетом специфики запроса.

    1. Система получает Measure of Importance (Меру Важности / Transformation Factor) качества изображения для конкретного запроса.
    2. Метод получения этой Меры Важности:
      • Сравнение (A) количества взаимодействий пользователей с высококачественными изображениями в ответ на этот запрос и (B) количества взаимодействий с высококачественными изображениями в ответ на другие запросы. (Высокое качество определяется как превышение порогового значения визуального качества).
      • Выбор Меры Важности на основе разницы между A и B.
    3. В ответ на получение запроса система выбирает изображения на основе Query Scores.
    4. Query Score для изображения рассчитывается на основе его Visual Quality Score и полученной Measure of Importance для данного запроса.

    Ядро изобретения — это метод определения того, насколько качество важно для конкретного запроса, путем сравнения поведения пользователей по этому запросу со средним поведением. Если пользователи данного запроса проявляют повышенный интерес к визуально качественным картинкам, система динамически увеличивает вес фактора качества.

    Claim 5 (Зависимый от 1): Уточняет механизм выбора Меры Важности.

    Если система определяет, что количество взаимодействий (A) для этого запроса выше, чем (B) для других запросов, то выбирается Measure of Importance, которая выше базовой (baseline) Меры Важности. Это подтверждает механизм динамического бустинга.

    Claim 7 (Независимый пункт): Описывает метод обучения модели для общей (независимой от запроса) оценки качества.

    1. Выбираются обучающие изображения (Training Images), разделенные на позитивные (высокая релевантность/позиция в выдаче) и негативные.
    2. Идентифицируются Feature Vectors.
    3. Image Classification Model обучается генерировать Initial Quality Score.
    4. Далее описывается использование этой модели для корректировки ранжирования с использованием общего (query-independent) Transformation Factor.

    Где и как применяется

    Изобретение затрагивает несколько этапов поисковой архитектуры, связывая офлайн-анализ, индексирование и ранжирование.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит извлечение визуальных признаков (Feature Vectors: цвет, текстура, резкость). С использованием предварительно обученной Image Classification Model вычисляются и сохраняются в индексе Initial Quality Scores (независимые от запроса оценки визуального качества).

    QUNDERSTANDING / RANKING (Офлайн-компонент)
    Система анализирует исторические данные (Historical Data) и поведение пользователей (Relevance Feedback Data). Цель — определить Transformation Factor (Measure of Importance) для конкретных запросов. Это позволяет понять интент пользователя с точки зрения его ожиданий к визуальному качеству.

    RANKING / RERANKING – Ранжирование и Переранжирование
    Основное применение патента в реальном времени (вероятно, в Google Images):

    1. Система получает набор релевантных изображений с исходными оценками релевантности.
    2. Извлекаются Initial Quality Scores для изображений и Transformation Factor для запроса.
    3. Вычисляются Query Specific Quality Scores.
    4. Вычисляются Adjusted Relevance Scores, которые определяют финальный порядок выдачи.

    Входные данные:

    • Визуальные данные изображения (для извлечения признаков).
    • Исходные оценки релевантности (Initial Relevance Scores).
    • Relevance Feedback Data (для расчета фактора).

    Выходные данные:

    • Initial Quality Score (в индексе).
    • Transformation Factor (в базе данных весов).
    • Adjusted Relevance Score (для формирования SERP).

    На что влияет

    • Конкретные типы контента и ниши: Наибольшее влияние в нишах, где эстетика критична: eCommerce (одежда, интерьеры), фотография, дизайн, путешествия, кулинария, знаменитости. Патент также упоминает возможность расчета агрегированной оценки качества для веб-страницы (Web page quality score), сайта или домена на основе качества содержащихся на них изображений (FIG. 6).
    • Специфические запросы: Влияет на запросы, где пользователи ищут эстетику или высокое разрешение (например, «идеи дизайна гостиной», «фото знаменитости»). Меньше влияет на запросы, где важна информативность (например, «схема подключения», «архивные документы»).

    Когда применяется

    Алгоритм применяется при ранжировании изображений, но его влияние динамически модулируется:

    • Условия активации Бустинга: Бустинг за качество активируется, когда Transformation Factor для запроса превышает базовый уровень. Это происходит, если исторические данные показывают, что пользователи этого запроса предпочитают высококачественные изображения больше, чем в среднем.
    • Условия Пессимизации (или нейтралитета): Если Transformation Factor низкий, влияние Initial Quality Score на ранжирование минимально.

    Пошаговый алгоритм

    Процесс А: Обучение модели оценки качества (Офлайн)

    1. Сбор и Разметка данных: Выборка изображений, классифицированных на «Позитивные» (например, Топ-10 выдачи) и «Негативные» (например, позиции 31-40).
    2. Извлечение признаков: Вычисление Feature Vectors (цвет, текстура, резкость) для каждого изображения.
    3. Итеративное обучение модели (например, PAMIR):
      1. Выбор тренировочного изображения.
      2. Вычисление оценки качества с текущими весами модели.
      3. Если изображение классифицировано неверно, корректировка весов модели на основе его Feature Vector.
    4. Валидация: Проверка точности модели на тестовой выборке до достижения стоп-условия.

    Процесс Б: Расчет Коэффициента Трансформации (Офлайн/Периодически)

    1. Сбор данных обратной связи: Агрегация Relevance Feedback Data (кликов) для различных запросов.
    2. Оценка качества результатов: Определение, какие из кликнутых изображений являются высококачественными (Initial Quality Score выше порога).
    3. Сравнительный анализ: Для запроса Q сравнивается частота кликов на высококачественные изображения по этому запросу с частотой кликов на высококачественные изображения в среднем по другим запросам.
    4. Определение Коэффициента: Если частота по запросу Q значительно выше средней, Transformation Factor для Q устанавливается выше базового уровня.

    Процесс В: Ранжирование изображений (В реальном времени)

    1. Получение запроса Q и первичный отбор кандидатов (Original_Score).
    2. Получение оценок и фактора: Извлечение Initial Quality Scores (IS) для изображений и Transformation Factor (TF) для запроса Q.
    3. Вычисление оценки с учетом запроса: Расчет Query Specific Quality Score (QS). Например, QS = IS * TF.
    4. Корректировка ранжирования: Расчет Adjusted Relevance Score. В патенте приводится пример формулы (Relationship 2): Adjusted Score = Original_Score * e^(Query Score).
    5. Финальная сортировка: Упорядочивание изображений по Adjusted Relevance Score.

    Какие данные и как использует

    Данные на входе

    • Мультимедиа / Контентные факторы (Визуальные признаки): Система использует Feature Vectors, извлеченные непосредственно из пиксельных данных. Упоминаются:
      • Цветовые гистограммы (Color histograms).
      • Признаки текстуры (Texture detection, основанные на пространственном изменении интенсивности пикселей).
      • Признаки краев и углов (Edge detection, Corner detection).
      • Другие методы: Scale-Invariant Feature Transform (SIFT), Discrete Cosine Transforms (DCT), Geometric Blur.
      • Анализ на разных масштабах (multiple scales) изображения.
    • Поведенческие факторы: Relevance Feedback Data. Критически важны для определения Transformation Factor. Включают:
      • Частота выбора (Selection rate / CTR) изображения в результатах поиска по конкретному запросу.
      • Явная обратная связь от пользователей (Explicit user feedback), если доступна.

    Какие метрики используются и как они считаются

    • Initial Quality Score (IS): Вычисляется моделью машинного обучения (Image Classification Model, например, PAMIR или SVM). Является результатом функции от Feature Vector изображения.
    • Transformation Factor (TF) / Measure of Importance: Определяется путем анализа поведенческих данных. Вычисляется на основе разницы между частотой взаимодействия с высококачественными изображениями для данного запроса и средней частотой для других запросов.
    • Query Specific Quality Score (QS): Функция от IS и TF. В патенте приводится пример вычисления как произведения: QS = IS * TF.
    • Adjusted Relevance Score: Скорректированная оценка ранжирования. В патенте приводится конкретная формула (Relationship 2): Adjusted Score = Original_Score * e^(Query Score). Это указывает на экспоненциальное влияние оценки качества на финальный результат.
    • Методы анализа: Упоминается подход «Bag of visual terms» (мешок визуальных терминов), при котором признаки индексируются на основе частоты их встречаемости без учета пространственного расположения.

    Выводы

    1. Визуальное качество — это измеримый фактор ранжирования: Google использует модели машинного обучения для объективной оценки визуальных характеристик изображений (резкость, цвет, текстура), превращая эстетику в алгоритмический сигнал (Initial Quality Score).
    2. Вес фактора качества динамический и зависит от запроса: Это ключевой вывод. Качество изображения не имеет фиксированного веса. Система определяет Transformation Factor для каждого запроса, решая, насколько сильно качество должно влиять на выдачу.
    3. Поведение пользователей определяет важность качества: Transformation Factor рассчитывается на основе анализа кликов (Relevance Feedback Data). Если пользователи в определенной нише предпочитают красивые картинки, Google адаптируется и повышает вес качества для соответствующих запросов.
    4. Экспоненциальное влияние на ранжирование: Упомянутая формула Adjusted Score = Original_Score * e^(Query Score) предполагает, что влияние качества на итоговый рейтинг может быть очень значительным (экспоненциальным), особенно при высоких значениях Query Score.
    5. Потенциальное влияние на качество сайта: Патент описывает возможность расчета агрегированной оценки качества для веб-страниц и сайтов на основе качества размещенных на них изображений, что может влиять на ранжирование в веб-поиске.

    Практика

    Best practices (это мы делаем)

    • Инвестиции в высококачественный визуальный контент: Приоритет отдается профессиональной фотографии и дизайну. Изображения должны быть резкими, хорошо экспонированными, с точной цветопередачей. Это напрямую влияет на Initial Quality Score.
    • Анализ интента и ожиданий качества в нише: Необходимо понимать, насколько важна эстетика для целевых запросов. В нишах eCommerce, дизайна, путешествий (где ожидается высокий Transformation Factor) требования к качеству должны быть максимальными.
    • Оптимизация технических параметров изображений: Использование достаточного разрешения и минимизация артефактов сжатия, которые могут негативно повлиять на извлечение Feature Vectors (текстуры, резкости).
    • Стимулирование положительной обратной связи (CTR): Создание привлекательных изображений, которые пользователи захотят кликнуть. Высокий CTR на качественных изображениях может способствовать увеличению Transformation Factor для ваших целевых запросов в долгосрочной перспективе.

    Worst practices (это делать не надо)

    • Использование низкокачественных изображений: Размытые, плохо освещенные, пикселизированные изображения получат низкий Initial Quality Score и будут пессимизироваться, особенно по запросам с высоким Transformation Factor.
    • Игнорирование визуальной составляющей в пользу только SEO-текстов: Фокус исключительно на оптимизации Alt-текста и окружающего контента при использовании посредственных изображений неэффективен. Система может предпочесть менее релевантное по тексту, но более качественное визуально изображение.
    • Чрезмерное сжатие изображений в ущерб качеству: Агрессивное сжатие для увеличения скорости загрузки может привести к потере деталей текстуры и резкости, что снизит Initial Quality Score. Необходим баланс между скоростью и качеством.

    Стратегическое значение

    Патент подтверждает стратегический курс Google на глубокое понимание визуального контента с помощью компьютерного зрения, выходящее за рамки простого распознавания объектов. Способность алгоритмически оценивать эстетическое качество и динамически адаптировать его вес под интент пользователя делает инвестиции в качественный контент обязательным условием успеха в Image Search. Это подчеркивает философию адаптивного ранжирования Google, где вес факторов меняется в зависимости от контекста.

    Практические примеры

    Сценарий: Адаптивное ранжирование одного изображения по разным запросам

    Представим изображение: качественная, но не идеальная фотография ноутбука Apple.

    Запрос 1: «Ремонт материнской платы Macbook Pro» (Технический интент)

    1. Анализ: Пользователи ищут схемы, инструкции. Визуальная эстетика второстепенна.
    2. Transformation Factor: Низкий. Поведение пользователей не показывает предпочтения к эстетике.
    3. Ранжирование: Initial Quality Score изображения учитывается слабо. Ранжирование в основном зависит от релевантности контента страницы и информативности изображения.

    Запрос 2: «Обои на рабочий стол Macbook Pro» (Эстетический интент)

    1. Анализ: Пользователи ищут максимально красивые изображения.
    2. Transformation Factor: Высокий. Анализ кликов показывает, что пользователи почти всегда выбирают самые качественные изображения.
    3. Ранжирование: Initial Quality Score учитывается очень сильно (экспоненциальный буст). Наше изображение (качественное, но не идеальное) может быть понижено в выдаче в пользу более профессиональных и художественных фотографий.

    Вопросы и ответы

    Как Google определяет визуальное качество изображения (Initial Quality Score)?

    Система использует модель машинного обучения (Image Classification Model), обученную на большом наборе данных. Модель анализирует Feature Vectors изображения — числовые представления его визуальных характеристик, таких как цветовые гистограммы, текстура, резкость краев и контраст. На основе этих данных вычисляется оценка качества, независимая от запроса.

    Что такое Transformation Factor и почему он важен?

    Transformation Factor (или Measure of Importance) — это множитель, который определяет, насколько сильно визуальное качество должно влиять на ранжирование для конкретного запроса. Он важен, потому что делает вес фактора качества динамическим. Для запросов типа «идеи интерьера» он будет высоким, а для «схема проводки» — низким, что позволяет адаптировать выдачу под ожидания пользователей.

    Как Google рассчитывает Transformation Factor для запроса?

    Он рассчитывается на основе анализа исторических данных о поведении пользователей (Relevance Feedback Data). Система сравнивает, как часто пользователи кликают на высококачественные изображения по этому запросу, с тем, как часто это происходит в среднем по другим запросам. Если по данному запросу предпочтение качеству выше среднего, Transformation Factor увеличивается.

    Насколько сильно качество изображения влияет на ранжирование?

    Влияние может быть очень значительным. В патенте приводится формула Adjusted Score = Original_Score * e^(Query Score). Это означает, что влияние качества экспоненциальное. При высоком Query Score (высокое качество изображения * высокий Transformation Factor запроса) бустинг может быть очень агрессивным.

    Влияет ли этот патент только на Google Images или на основную веб-выдачу тоже?

    Основное применение — ранжирование в Google Images. Однако патент упоминает возможность расчета агрегированной оценки качества для веб-страниц и сайтов на основе качества их изображений. Это может влиять на оценку качества ресурса в целом и, следовательно, на ранжирование в веб-поиске, а также в Google Discover.

    Нужно ли жертвовать скоростью загрузки ради максимального качества изображения?

    Необходимо найти баланс. Скорость загрузки остается критически важным фактором. Однако этот патент показывает, что чрезмерное сжатие, ведущее к потере резкости, текстуры и появлению артефактов, может снизить Initial Quality Score и навредить ранжированию в Image Search. Используйте современные форматы (WebP, AVIF) и адаптивное сжатие.

    Как оптимизировать изображения для этого алгоритма?

    Фокусируйтесь на фундаментальных аспектах фотографии и дизайна: резкость (особенно главного объекта), правильная экспозиция (без пересветов и провалов в тенях), точная цветопередача и достаточное разрешение. Убедитесь, что изображение выглядит профессионально и привлекательно для вашей целевой аудитории.

    Влияет ли размер или разрешение изображения на Initial Quality Score?

    Патент не указывает разрешение как прямой признак, но упоминает анализ признаков на разных масштабах (multi-scale analysis). Изображения с низким разрешением часто имеют меньше деталей текстуры и более размытые края, что, вероятно, приведет к более низкому Initial Quality Score при анализе Feature Vectors.

    Может ли мой сайт повлиять на Transformation Factor для моих целевых запросов?

    Теоретически, да. Если вы постоянно публикуете высококачественные изображения, которые привлекают много кликов в вашей нише, вы вносите вклад в общую статистику поведения пользователей по этим запросам (Relevance Feedback Data). Это может постепенно привести к увеличению Transformation Factor для этих запросов, усиливая ваше преимущество.

    Что такое PAMIR, упоминаемый в патенте?

    PAMIR (Passive-Aggressive Model for Images) — это алгоритм машинного обучения, используемый для тренировки Image Classification Model. Это линейная модель, которая итеративно обновляет свои веса, агрессивно корректируя их при обнаружении ошибок классификации во время обучения. Она эффективна для задач ранжирования и классификации изображений.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.