Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует тематическое соответствие между изображением и страницей для ранжирования в поиске по картинкам

    CONTEXTUAL BASED IMAGE SEARCH RESULTS (Результаты поиска изображений на основе контекста)
    • US11055335B2
    • Google LLC
    • 2021-07-06
    • 2016-07-15
    2016 EEAT и качество Индексация Мультимедиа Патенты Google

    Google использует систему для оценки того, насколько визуальное содержание изображения соответствует теме веб-страницы, на которой оно размещено. Система независимо определяет темы страницы (из текста) и темы изображения (используя компьютерное зрение) и рассчитывает показатель соответствия (Topic Match Score). В поиске по картинкам предпочтение отдается изображениям, которые не только релевантны запросу, но и тематически соответствуют контенту страницы-хоста.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему нерелевантности контекста в поиске по изображениям. Проблема возникает, когда изображение само по себе релевантно запросу, но размещено на веб-странице (ресурсе), тема которой не соответствует интенту пользователя. Например, изображение Эйфелевой башни на странице о фототехнике не удовлетворит пользователя, ищущего информацию о достопримечательности. Система стремится гарантировать, что высоко ранжируемые изображения размещены на страницах с релевантным контекстом, улучшая пользовательский опыт.

    Что запатентовано

    Запатентована система, которая оценивает тематическое соответствие (topical similarity) между изображением и страницей, на которой оно размещено. Система независимо определяет темы текста страницы (Resource Topics) и темы визуального контента изображения (Image Topics), используя, например, компьютерное зрение. Затем вычисляется Topic Match Score — мера релевантности между этими двумя наборами тем. Этот показатель используется как сигнал ранжирования в поиске по картинкам.

    Как это работает

    Система работает в два этапа:

    • Индексирование (Офлайн): Система анализирует веб-страницу, определяя ее Resource Topics на основе текста. Затем она анализирует изображение (независимо от текста страницы), определяя Image Topics. Вычисляется Topic Match Score, показывающий насколько темы изображения совпадают с темами страницы. Также может учитываться заметность изображения (Image Prominence Score) — размер и расположение на странице. Эти данные сохраняются в индексе.
    • Ранжирование (Онлайн): При получении запроса система определяет стандартную релевантность изображения запросу (Relevance Score). Затем вычисляется итоговый Search Score, который учитывает как Relevance Score, так и сохраненный в индексе Topic Match Score. Изображения с высоким тематическим соответствием странице-хосту получают преимущество.

    Актуальность для SEO

    Высокая. Учитывая развитие технологий компьютерного зрения (например, Google Lens, MUM) и фокус Google на предоставлении контекстуально релевантных результатов в мультимодальном поиске, этот механизм является важным компонентом современного поиска по картинкам. Он обеспечивает лучшее качество выдачи, связывая визуальный контент с текстовым контекстом.

    Важность для SEO

    Патент имеет высокое значение (85/100) для стратегий Image SEO и контент-маркетинга. Он формализует контекст страницы как прямой фактор ранжирования для изображений. Для достижения высоких позиций в поиске по картинкам недостаточно оптимизировать само изображение; критически важно, чтобы визуальное содержание изображения строго соответствовало основной теме страницы, на которой оно размещено, и чтобы изображение было заметно расположено.

    Детальный разбор

    Термины и определения

    Image Annotation System (Система аннотирования изображений)
    Система, которая обрабатывает изображение (например, используя компьютерное зрение и машинное обучение) для определения его содержания и присваивает ему аннотации или метки. Используется для определения Image Topics.
    Image Prominence Score (Оценка заметности изображения)
    Метрика, оценивающая, насколько заметно изображение отображается на странице. Учитывает такие характеристики, как размер изображения, расположение (в центре или сбоку), количество пикселей.
    Image Topics (Темы изображения)
    Набор тем или меток, описывающих содержание, изображенное на картинке. Определяются независимо от текста страницы, на которой размещено изображение.
    Relevance Score (Оценка релевантности)
    Стандартная оценка, измеряющая релевантность Image Topics поисковому запросу пользователя.
    Resource Topics (Темы ресурса)
    Набор тем, описывающих содержание текста веб-страницы (ресурса).
    Search Score (Итоговая оценка поиска)
    Финальная оценка, используемая для ранжирования изображения. Вычисляется на основе Relevance Score и Topic Match Score (и, опционально, Image Prominence Score).
    Topic Match Score (Оценка соответствия тем)
    Ключевая метрика патента. Мера релевантности между Image Topics (что изображено) и Resource Topics (о чем страница).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает офлайн-процесс индексации и расчета соответствия тем.

    1. Система обрабатывает ресурсы, содержащие изображения и текст.
    2. Определяются Resource Topics на основе текста ресурса.
    3. Для каждого изображения:
      • Определяются Image Topics (что изображено). Ключевое уточнение (Claim 1): «определенные темы изображения не основаны на тексте ресурса». Это подчеркивает независимый анализ визуального контента.
      • Определяются Topic Match Scores — мера релевантности между Image Topics и Resource Topics.
    4. Данные (Image Topics, Resource Topics, Topic Match Scores) сохраняются в индексе.

    Claim 2, 3, 4 (Зависимые): Вводят концепцию заметности изображения.

    • Система определяет Image Prominence Scores (Claim 2).
    • Topic Match Scores рассчитываются на основе как релевантности тем, так и Image Prominence Scores (Claim 3).
    • Механизм расчета включает корректировку (adjusting) меры релевантности тем с помощью Image Prominence Scores (Claim 4).

    Claim 5 и 6 (Зависимые): Факторы заметности включают размер изображения (Claim 5) и позицию отображения на странице при рендеринге (Claim 6).

    Claim 7 (Зависимый): Уточняет метод определения Image Topics. Изображение отправляется в Image Annotation System, которая использует компьютерную обработку изображений (computer image processing) для определения содержания.

    Claim 8 (Зависимый): Описывает онлайн-процесс ранжирования.

    1. Получение поискового запроса на изображение.
    2. Определение Search Score для изображений, что включает:
      • Определение Relevance Score (релевантность запроса к Image Topics).
      • Вычисление Search Score на основе Relevance Score и сохраненных в индексе Topic Match Scores.

    Claim 9 (Зависимый от 2): Уточняет, что итоговый Search Score вычисляется на основе Relevance Score, Prominence Score и Topic Match Scores.

    Где и как применяется

    Изобретение применяется на двух ключевых этапах поисковой архитектуры.

    INDEXING – Индексирование и извлечение признаков
    Основная часть работы происходит на этом этапе в офлайн-режиме. Система (Image/Resource Topic Scorer) анализирует ресурсы.

    • Извлечение признаков (Feature Extraction): Система извлекает Resource Topics из текста (NLP) и Image Topics из визуального контента (Computer Vision, используя Image Annotation System).
    • Вычисление статических сигналов: Рассчитываются Topic Match Score и Image Prominence Score. Также анализируется рендеринг страницы.
    • Входные данные: Текст ресурса, данные изображения (пиксели, метаданные), данные о структуре и рендеринге ресурса (HTML/CSS).
    • Выходные данные: Image Topics, Resource Topics, Topic Match Score и Image Prominence Score, сохраненные в индексе (Image Topic Match Score Index).

    RANKING – Ранжирование (Поиск по картинкам)
    На этом этапе система использует предварительно рассчитанные оценки в реальном времени.

    • Оценка кандидатов: Image Scorer рассчитывает Relevance Score (релевантность изображения запросу).
    • Финальное ранжирование: Search Scorer вычисляет итоговый Search Score, комбинируя динамический Relevance Score со статическими Topic Match Score и Image Prominence Score.
    • Входные данные: Поисковый запрос, Image Topics кандидатов, данные из Image Topic Match Score Index.
    • Выходные данные: Отсортированный список изображений (Image SERP).

    На что влияет

    • Типы контента: Влияет на все типы изображений, индексируемых Google (фотографии, иллюстрации, инфографика), размещенные на веб-страницах (статьи, карточки товаров, новости).
    • Форматы контента: Снижает видимость декоративных или общих стоковых изображений, если они не соответствуют конкретной теме страницы.

    Когда применяется

    • Условия работы алгоритма: Механизм применяется всегда при индексировании страниц с изображениями и при ранжировании результатов в ответ на запрос, направленный на поиск изображений (image-seeking query).
    • Исключения и особые случаи (Динамические изображения): Патент описывает обработку изображений, которые меняются при перезагрузке страницы (например, в ротаторах или рекламе). В таких случаях заметность (prominence) определяется как очень низкая, или релевантность изображения игнорируется/понижается системой.

    Пошаговый алгоритм

    Процесс А: Индексирование и расчет Topic Match Score (Офлайн)

    1. Выбор ресурса: Система выбирает ресурс (веб-страницу), содержащий изображения и текст.
    2. Определение тем ресурса: Resource Topic Identifier анализирует текст ресурса (тело статьи, заголовки, анкорный текст) для определения Resource Topics.
    3. Определение тем изображения: Для каждого изображения Image Topic Identifier определяет Image Topics. Это делается независимо от текста страницы, например, путем отправки изображения в Image Annotation System.
    4. Определение заметности (Опционально): Система анализирует характеристики отображения изображения (размер, локация, пиксели) для расчета Image Prominence Score. Проверяется статичность изображения.
    5. Расчет соответствия тем: Topic Match Scorer сравнивает набор Image Topics с набором Resource Topics. Используются функции схожести (например, бинарное совпадение или семантическая близость) для вычисления Topic Match Score.
    6. Корректировка оценки (Опционально): Topic Match Score корректируется с учетом Image Prominence Score. Более заметные и релевантные изображения получают более высокий итоговый балл.
    7. Сохранение данных: Данные сохраняются в Image Topic Match Score Index.

    Процесс Б: Ранжирование изображений (Онлайн)

    1. Получение запроса: Система получает запрос на поиск изображений.
    2. Определение релевантности запросу: Image Scorer для каждого изображения-кандидата определяет Relevance Score (релевантность запроса к Image Topics).
    3. Получение данных из индекса: Система извлекает предварительно рассчитанный Topic Match Score (и Image Prominence Score, если используется).
    4. Расчет итоговой оценки: Search Scorer вычисляет финальный Search Score, используя скоринговую функцию, которая принимает на вход Relevance Score и Topic Match Score.
    5. Ранжирование: Ranker сортирует изображения в соответствии с их Search Scores и формирует выдачу.

    Какие данные и как использует

    Данные на входе

    Контентные факторы (Текстовые):

    • Текст ресурса (веб-страницы). Используется для определения Resource Topics. Упоминаются: тело текста, заголовок ресурса, анкорный текст.

    Мультимедиа факторы (Визуальные):

    • Данные изображения (пиксели). Используются Image Annotation System (компьютерное зрение) для определения Image Topics.
    • Метаданные изображения (metadata tags). Упоминаются как возможный источник для определения Image Topics (Claim 11).

    Технические/Структурные факторы (для Prominence):

    • Размер изображения (Image size).
    • Расположение изображения на странице (Location/Display position).
    • Количество пикселей (Pixel count).
    • Статичность изображения (проверка, меняется ли изображение при перезагрузке страницы).

    Какие метрики используются и как они считаются

    • Resource Topics и Image Topics: Определяются с помощью семантического анализа текста и компьютерной обработки изображений соответственно.
    • Topic Match Score: Рассчитывается путем сравнения Image Topics и Resource Topics. Упоминаются методы расчета:
      • Бинарное скорирование (Binary scoring) совпавших тем.
      • Оценка на основе схожести тем (Topic similarity), например, семантическая близость.
    • Image Prominence Score: Агрегированная оценка на основе размера, расположения и пикселей.
    • Скорректированный Topic Match Score: Функция, которая объединяет базовый Topic Match Score и Image Prominence Score. Описана обобщенная функция: TM(I) = f(IT, RT, P(I)).
    • Search Score: Итоговая оценка. Функция, которая принимает Relevance Score и Topic Match Score (и опционально Prominence Score) в качестве входных данных.

    Выводы

    1. Контекст страницы — прямой фактор ранжирования изображений: Патент подтверждает, что тематика страницы, на которой размещено изображение (Topic Match Score), является прямым сигналом ранжирования в поиске по картинкам. Изображения на нерелевантных страницах будут понижаться, даже если они соответствуют запросу.
    2. Независимый анализ визуального контента (Computer Vision): Критически важно, что Image Topics определяются независимо от текста страницы (Claim 1), в основном с помощью Image Annotation System (Claim 7). Это означает, что Google полагается на собственное понимание того, что изображено на картинке, а не только на SEO-атрибуты (вроде alt-text).
    3. Визуально-текстуальная когерентность: Система поощряет страницы, где визуальный и текстовый контент тематически согласованы. Высокий Topic Match Score достигается, когда то, что изображено, совпадает с тем, о чем текст.
    4. Важность размещения и заметности (UX): Image Prominence Score (размер и расположение) влияет на итоговую оценку (Claims 2, 3, 9). Изображения, размещенные на видном месте, имеют преимущество, если они тематически релевантны.
    5. Обработка динамического контента: Система умеет определять и дисконтировать изображения, которые динамически меняются при загрузке страницы, считая их менее релевантными контексту.

    Практика

    Best practices (это мы делаем)

    • Обеспечение строгого тематического соответствия: Размещайте изображения, которые напрямую иллюстрируют или дополняют основную тему текста страницы. Визуальный контент должен соответствовать текстовому для максимизации Topic Match Score.
    • Оптимизация под компьютерное зрение: Используйте четкие, высококачественные изображения, где основной объект легко идентифицируется. Это поможет Image Annotation System корректно определить Image Topics.
    • Стратегическое размещение ключевых изображений: Размещайте наиболее важные и релевантные изображения на заметных позициях (ближе к началу, в центре) и в достаточном размере. Это повышает Image Prominence Score.
    • Использование уникальных изображений: Создавайте уникальный визуальный контент, точно соответствующий вашему тексту. Это повышает вероятность высокого Topic Match Score по сравнению с общими стоковыми фото.
    • Проверка статичности контента: Убедитесь, что ключевые изображения не меняются динамически при каждой загрузке страницы (например, в слайдерах), так как это может привести к игнорированию или понижению их релевантности.

    Worst practices (это делать не надо)

    • Использование кликбейтных или нерелевантных изображений: Размещение изображений, которые не имеют отношения к теме статьи, приведет к низкому Topic Match Score и понижению в поиске по картинкам.
    • Использование общих стоковых фотографий: Размещение generic-изображений для декоративных целей, если их содержание слабо связано с конкретной темой статьи.
    • Размещение важных изображений в «слепых зонах»: Скрытие ключевых изображений внизу страницы, в сайдбарах или в виде маленьких превью негативно скажется на Image Prominence Score.
    • Оптимизация только через Alt-text: Полагаться только на текстовые атрибуты недостаточно. Если визуальное содержание не соответствует теме страницы, изображение не будет ранжироваться высоко, так как система анализирует само изображение.

    Стратегическое значение

    Этот патент подчеркивает важность когерентности контент-стратегии и переход к мультимодальному анализу. Он демонстрирует, как Google объединяет свои возможности в NLP (для понимания текста страницы) и компьютерном зрении (для понимания изображения), чтобы оценить качество результата. Для SEO это означает, что оптимизация изображений должна рассматриваться как неотъемлемая часть создания качественного, тематически целостного контента, где каждый элемент работает на раскрытие основной темы.

    Практические примеры

    Сценарий: Ранжирование изображения по запросу «фото Эйфелевой башни».

    Сравним два одинаковых изображения Эйфелевой башни, размещенных на разных сайтах.

    1. Изображение А: Размещено на странице туристического блога об истории Эйфелевой башни.
      • Image Topics: Эйфелева башня, Париж, архитектура.
      • Resource Topics: Эйфелева башня, история, туризм в Париже.
      • Topic Match Score: Очень высокий.
      • Результат: Высокий финальный Search Score. Изображение ранжируется высоко.
    2. Изображение Б: Размещено на странице сайта фотошколы в статье про техники ночной съемки (используется как пример).
      • Image Topics: Эйфелева башня, Париж, архитектура.
      • Resource Topics: Ночная съемка, выдержка, ISO, техники фотографии.
      • Topic Match Score: Низкий.
      • Результат: Финальный Search Score значительно снижен из-за низкого Topic Match Score. Изображение ранжируется ниже, чем Изображение А, хотя оно так же релевантно запросу.

    Вопросы и ответы

    Является ли Alt-text фактором в этом патенте?

    Нет, Alt-text не упоминается как фактор для этого механизма. Более того, в Claim 1 явно указано, что определение тем изображения (Image Topics) не основано на тексте ресурса (страницы). Патент фокусируется на анализе визуального контента с помощью Image Annotation System (компьютерного зрения) и сравнении его с темой страницы.

    Как система определяет, что изображено на картинке (Image Topics)?

    Основной способ (Claim 7) — это использование Image Annotation System. Эта система применяет компьютерное зрение и машинное обучение для распознавания объектов, сцен и концепций на изображении. Также упоминается возможность использования существующих метаданных (metadata tags) изображения (Claim 11).

    Что такое Image Prominence Score и как его повысить?

    Это оценка того, насколько заметно изображение на странице. Она учитывает размер, расположение (в центре или сбоку) и количество пикселей. Чтобы его повысить, размещайте ключевые изображения в крупном размере и на центральных позициях основного контента. Заметные изображения считаются более репрезентативными для темы страницы.

    Поможет ли этот механизм ранжироваться стоковым фотографиям?

    Скорее всего, он усложнит ранжирование общих стоковых фотографий. Если стоковое фото используется как декоративный элемент и его содержание слабо связано с конкретной темой статьи, оно получит низкий Topic Match Score. Чтобы стоковое фото ранжировалось хорошо, оно должно идеально соответствовать узкой теме страницы.

    Что произойдет, если изображение релевантно запросу, но не релевантно странице?

    В этом случае изображение получит высокий Relevance Score (релевантность запросу), но низкий Topic Match Score (релевантность странице). Итоговый Search Score будет снижен. Такое изображение уступит позиции другому изображению, которое, возможно, чуть менее релевантно запросу, но размещено на тематически соответствующей странице.

    Как обрабатываются страницы, где изображение меняется при каждой загрузке (например, слайдеры)?

    Патент рассматривает этот случай. Если система обнаруживает, что изображения в определенном месте меняются при перезагрузке (динамические изображения), заметность (prominence) любого изображения в этом месте определяется как очень низкая. Релевантность таких изображений может быть проигнорирована или сильно понижена системой.

    Что важнее: соответствие изображения запросу или соответствие изображения контексту страницы?

    Оба фактора критичны. Система использует двухфакторную модель, комбинируя Relevance Score (запрос к изображению) и Topic Match Score (изображение к странице). Если один из показателей очень низкий, итоговая оценка также будет низкой. Нельзя компенсировать отсутствие одного за счет другого.

    Влияет ли этот механизм на ранжирование самой веб-страницы в основном поиске (Web Search)?

    Патент описывает применение этого механизма исключительно для ранжирования результатов в поиске по изображениям (Image Search). Он не содержит информации о том, используются ли Topic Match Score или Image Prominence Score как сигналы для ранжирования веб-страниц в основном поиске.

    Как проверить, правильно ли Google понимает темы моего изображения?

    Можно использовать инструменты на основе Google Cloud Vision API (например, вкладка «Labels» или «Objects» в демо-версии) или Google Lens. Это позволит увидеть, какие аннотации (Image Topics) система присваивает изображению. Затем нужно сравнить эти аннотации с основной тематикой вашей веб-страницы.

    Как этот механизм влияет на E-commerce сайты?

    Влияние критично. Фотографии товаров должны быть размещены на страницах, которые тематически строго соответствуют этим товарам (карточки товаров, релевантные категории). Также важна заметность (Prominence) главного фото товара на странице. Размещение фото товара в блоге в нерелевантном контексте даст меньший эффект в Image Search.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.