Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google идентифицирует «кликбейт» изображения и корректирует их ранжирование в зависимости от типа запроса

    CLICK MAGNET IMAGES (Изображения-магниты для кликов)
    • US20150088859A1
    • Google LLC
    • 2015-03-26
    • 2012-06-21
    2012 Антиспам Мультимедиа Патенты Google Поведенческие сигналы

    Google использует систему для идентификации изображений, которые привлекают клики по причинам, не связанным с их качеством или релевантностью (например, сенсационный контент). Система анализирует категории запросов, по которым кликают на изображение. Если изображение получает непропорционально много кликов по определенным категориям (юмор, насилие и т.д.), оно классифицируется как «Click Magnet». Затем его ранжирование корректируется: понижается для общих запросов и повышается для запросов, ищущих сенсационный контент.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему искажения результатов поиска по изображениям из-за использования Click-Through Rate (CTR) как сильного сигнала ранжирования. Проблема заключается в том, что некоторые изображения получают большое количество кликов по причинам, не связанным с их качеством или релевантностью запросу (например, сенсационное, шокирующее или смешное изображение). Если полагаться только на CTR, такие изображения вытесняют более релевантные результаты по общим запросам, ухудшая качество выдачи.

    Что запатентовано

    Запатентована система для идентификации и классификации Click Magnet Images (изображений-магнитов для кликов). Суть изобретения — анализировать не просто общее количество кликов на изображение, а контекст этих кликов, а именно категории запросов, которые к ним привели. Если изображение получает значительную долю кликов по запросам определенных категорий (например, насилие, юмор, шок-контент), оно классифицируется как Click Magnet.

    Как это работает

    Система работает в несколько этапов:

    • Сбор данных: Для каждого изображения создается Selection Vector, фиксирующий, сколько раз на него кликнули по каждому конкретному запросу.
    • Классификация запросов: Запросы классифицируются. Запросы, относящиеся к сенсационным категориям, помечаются как Click Magnet Seeking Queries.
    • Классификация изображений: Рассчитывается соотношение кликов, полученных от Click Magnet Seeking Queries, к общему числу кликов. Если соотношение превышает порог, изображение классифицируется как Click Magnet Image.
    • Классификация сайтов: Сайты также классифицируются как Click Magnet Sites, если они публикуют слишком много таких изображений. Этот статус может переопределить классификацию всех изображений на сайте.
    • Ранжирование: При получении нового запроса система определяет его тип. Если это общий запрос, Click Magnet Images понижаются в выдаче. Если это Click Magnet Seeking Query, такие изображения повышаются.

    Актуальность для SEO

    Высокая. Проблема кликбейта и точная интерпретация поведенческих сигналов (CTR) остаются критически важными задачами для Google. Механизмы, позволяющие поисковой системе отличать клики, основанные на релевантности, от кликов, основанных на сенсационности, необходимы для поддержания качества поиска по картинкам.

    Важность для SEO

    Патент имеет высокое значение для стратегий в области SEO для изображений (Image SEO). Он демонстрирует, что высокий CTR изображения не гарантирует высоких позиций по общим запросам, если система считает изображение «кликбейтом». Это подчеркивает важность соответствия характера изображения интенту запроса и вводит понятие качества на уровне сайта (Click Magnet Site) для Image Search.

    Детальный разбор

    Термины и определения

    Click Magnet Image (Изображение-магнит для кликов)
    Изображение, которое получает большое количество кликов (selections) по причинам, отличным от его качества и релевантности поисковым запросам (например, из-за сенсационности, юмора, шокирующего содержания).
    Click Magnet Seeking Query (CMSQ) (Запрос, ищущий магниты для кликов)
    Поисковый запрос, классифицированный как направленный на поиск контента определенных категорий (например, насильственного, смешного, экстремального).
    Non-Click Magnet Seeking Query (Non-CMSQ) (Обычный запрос)
    Запрос, не классифицированный как Click Magnet Seeking.
    Click Magnet Site (Сайт-магнит для кликов)
    Веб-сайт, классифицированный на основе высокого соотношения публикуемых им Click Magnet Images к общему количеству изображений на сайте.
    Non-Click Magnet Site
    Веб-сайт, публикующий мало или не публикующий вовсе Click Magnet Images.
    Proper Subset of Categories (Определенное подмножество категорий)
    Набор категорий, используемых для идентификации Click Magnet Seeking Queries. В патенте упоминаются примеры: violent (насильственный), sexual (сексуальный), gory (кровавый), morbid (мрачный), funny (смешной), extreme (экстремальный).
    Selection Vector (Вектор выбора)
    Структура данных для изображения, содержащая элементы, соответствующие уникальным поисковым запросам. Значение каждого элемента пропорционально количеству кликов на изображение, когда оно показывалось в ответ на этот запрос.
    Classification Subsystem (Подсистема классификации)
    Компонент поисковой системы, отвечающий за идентификацию Click Magnet Images, запросов и сайтов.
    Ranking Subsystem (Подсистема ранжирования)
    Компонент, который ранжирует результаты поиска изображений и использует классификацию Click Magnet для корректировки позиций.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод идентификации Click Magnet Images.

    1. Получение Selection Vector для множества изображений (клики по каждому запросу).
    2. Идентификация категории для каждого запроса в векторах.
    3. Для каждого изображения:
      • Определение первого числа кликов (first number of selections): клики, полученные по запросам, категории которых входят в Proper Subset (т.е. по CMSQ).
      • Определение общего числа кликов на изображение.
      • Определение того, является ли изображение Click Magnet Image, на основе первого числа и общего числа кликов.

    Claim 2 (Зависимый от 1): Уточняет метод определения на шаге 3.

    Определение статуса Click Magnet Image включает расчет соотношения (ratio) между первым числом кликов (от CMSQ) и общим числом кликов. Если это соотношение удовлетворяет пороговому значению, изображение признается Click Magnet Image.

    Claim 15 (Зависимый от 1): Описывает альтернативный метод расчета соотношения.

    Вместо сравнения с общим числом кликов, рассчитывается соотношение между первым числом кликов (от CMSQ) и вторым числом кликов (от запросов, категории которых не входят в Proper Subset, т.е. от Non-CMSQ). Если это соотношение удовлетворяет порогу, изображение признается Click Magnet Image.

    Claim 4 (Зависимый от 1): Описывает процесс классификации веб-сайтов.

    Для веб-сайта определяется количество публикуемых им Click Magnet Images и общее количество изображений. На основе этих данных сайт классифицируется как Click Magnet Web Site или Non-Click Magnet Web Site.

    Claim 6 (Зависимый от 5, который зависит от 4): Описывает распространение классификации сайта на изображения.

    Утверждается, что каждое изображение, опубликованное на сайте, классифицированном как Click Magnet Site (где соотношение превысило порог), определяется как Click Magnet Image.

    Claim 3 (Зависимый от 2): Описывает механизм переопределения (Override) классификации изображения.

    Даже если изображение изначально идентифицировано как Click Magnet Image (на основе Ratio в Claim 2), система проверяет все сайты, которые его публикуют. Если определяется, что ни один из этих сайтов не является Click Magnet Web Site, то система определяет, что изображение НЕ является Click Magnet Image.

    Claim 11 и 12 (Зависимые от 1): Описывают применение классификации в ранжировании.

    Система модифицирует ранжирование Click Magnet Image, чтобы повысить его рейтинг для CMSQ (Claim 11), и понизить его рейтинг для Non-CMSQ (Claim 12).

    Где и как применяется

    Изобретение затрагивает несколько этапов поискового процесса, фокусируясь на анализе исторических данных и применении результатов на этапе ранжирования в Image Search Subsystem.

    CRAWLING & Data Acquisition – Сбор данных
    Система собирает исторические данные (Historical Data), включая логи поисковых запросов и данные о кликах на результаты поиска (Selection data). Эти данные критически важны для построения Selection Vectors.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе (или в рамках офлайн-процессов) происходит основная работа Classification Subsystem. Система анализирует исторические данные, классифицирует запросы, изображения и сайты. Результаты классификации (метки Click Magnet) сохраняются в индексе (Indexed Cache) как признаки изображений и сайтов для быстрого доступа во время ранжирования.

    QUNDERSTANDING – Понимание Запросов
    Система должна классифицировать запросы как Click Magnet Seeking или нет. Это может происходить как офлайн (при анализе логов), так и в реальном времени при получении запроса пользователя, например, с помощью классификатора (classifier) или сравнения с предопределенными категориями.

    RANKING / RERANKING – Ранжирование / Переранжирование
    Основное применение патента. Ranking Subsystem использует предварительно рассчитанные классификации изображений и классификацию текущего запроса для корректировки ранжирования. Происходит повышение (promote) или понижение (demote) изображений в зависимости от совпадения их типа с типом запроса.

    Входные данные:

    • Исторические данные о запросах и кликах (Historical Data).
    • Индекс изображений и сайтов (Indexed Cache).
    • Набор предопределенных Click Magnet Categories.
    • Входящий поисковый запрос пользователя.

    Выходные данные:

    • Классификация изображений и сайтов (офлайн).
    • Отсортированный набор результатов поиска по изображениям с скорректированными оценками ранжирования (онлайн).

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на поиск по изображениям (Image Search). Особенно затрагивает сенсационный, вирусный, юмористический или шокирующий визуальный контент.
    • Специфические запросы: Влияет как на общие запросы (где кликбейт понижается), так и на специфические запросы, направленные на поиск сенсационного контента (где он повышается).
    • Конкретные ниши или тематики: Наибольшее влияние в нишах, связанных с новостями, знаменитостями, развлечениями, юмором, а также в тематиках, где часто встречается шок-контент (насилие, экстрим).

    Когда применяется

    • Триггеры активации: Процессы классификации (изображений и сайтов) выполняются периодически в офлайн-режиме на основе накопленных исторических данных. Процесс корректировки ранжирования активируется при каждом запросе в поиске по картинкам.
    • Условия и пороги: Применение зависит от множества пороговых значений (thresholds): порог соотношения кликов для классификации изображения; пороги (T1, T2) соотношения изображений для классификации сайта. Также упоминается возможность использования порога размера сайта (T3) для учета его классификации.

    Пошаговый алгоритм

    Система состоит из нескольких взаимосвязанных процессов.

    Процесс А: Первичная идентификация Click Magnet Images (Офлайн)

    1. Генерация Selection Vector: Для каждого изображения собираются данные о кликах по всем запросам, по которым оно показывалось.
    2. Классификация запросов: Каждый запрос в векторах классифицируется как Click Magnet Seeking Query (CMSQ) или Non-Click Magnet Seeking Query (Non-CMSQ).
    3. Подсчет кликов по категориям: Для каждого изображения подсчитывается количество кликов от CMSQ и общее количество кликов.
    4. Расчет соотношения (Ratio): Вычисляется соотношение кликов от CMSQ к общему числу кликов (или к числу кликов от Non-CMSQ).
    5. Классификация изображений: Если соотношение удовлетворяет порогу, изображение помечается как Click Magnet Image (CMI).
    6. Сохранение: Классификация сохраняется в индексе.

    Процесс Б: Классификация сайтов и уточнение классификации изображений (Офлайн)

    1. Анализ сайта: Для веб-сайта идентифицируется общее количество изображений и количество CMI (определенных в Процессе А).
    2. Расчет соотношения сайта: Вычисляется соотношение CMI к общему числу изображений на сайте.
    3. Применение порогов: Соотношение сравнивается с порогами T1 (верхний) и T2 (нижний). (Опционально проверяется порог размера сайта T3).
    4. Классификация сайта и Переклассификация изображений:
      • Если Ratio > T1: Сайт классифицируется как Click Magnet Site. Все изображения на сайте могут быть переклассифицированы как CMI.
      • Если Ratio < T2: Сайт классифицируется как Non-Click Magnet Site.
      • Иначе: Сайт остается неклассифицированным.
    5. Уточнение классификации изображений (Override): Если изображение было помечено как CMI в Процессе А, но все сайты, которые его публикуют, являются Non-Click Magnet Sites (и ни один не является Click Magnet Site), классификация изображения изменяется на Non-CMI.

    Процесс В: Итеративное уточнение (Офлайн, Опционально)

    1. Получение списка CMI: Используются результаты Процессов А и Б.
    2. Генерация таблицы Запрос-Изображение: Создается инвертированная структура данных.
    3. Уточнение CMSQ: Идентифицируются запросы, по которым было выбрано значительное количество уникальных CMI (или высокое соотношение кликов на CMI). Эти запросы помечаются как CMSQ.
    4. Ранжирование изображений для CMSQ: Для каждого нового CMSQ изображения ранжируются по количеству кликов.
    5. Уточнение CMI: Изображения с самым высоким рейтингом для этих CMSQ классифицируются как CMI.
    6. Процессы А, Б и В могут повторяться итеративно.

    Процесс Г: Ранжирование (Реальное время)

    1. Получение запроса: Система получает поисковый запрос.
    2. Идентификация и первичное ранжирование: Определяются релевантные изображения и их базовые оценки ранжирования.
    3. Классификация запроса: Система определяет, является ли входящий запрос CMSQ.
    4. Корректировка ранжирования:
      • Если запрос является CMSQ: Ранжирование CMI повышается (promote), а Non-CMI может понижаться (demote).
      • Если запрос не является CMSQ: Ранжирование Non-CMI повышается, а CMI понижается.
    5. Предоставление результатов: Изображения предоставляются пользователю согласно скорректированному ранжированию.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании поведенческих данных и данных о классификации контента.

    • Поведенческие факторы: Являются основой изобретения. Используются исторические данные (Historical Data) о поисковых сессиях: текст запросов, показанные результаты и действия пользователя (клики). Эти данные агрегируются в Selection Vectors.
    • Контентные факторы (Косвенно): Тексты запросов используются для их классификации по категориям (например, с помощью NLP или классификаторов).
    • Структурные факторы: Данные о том, на каких сайтах опубликовано каждое изображение (используются для Процесса Б).

    Какие метрики используются и как они считаются

    • Image Click Magnet Ratio (Соотношение для изображения): Метрика для определения статуса CMI. Рассчитывается двумя способами:
      1. (Клики от CMSQ) / (Общее число кликов)
      2. (Клики от CMSQ) / (Клики от Non-CMSQ)
    • Website Click Magnet Ratio (Соотношение для сайта): Метрика для определения статуса сайта. Рассчитывается как: (Количество CMI на сайте) / (Общее количество изображений на сайте).
    • Пороговые значения (Thresholds): Используются для принятия решений о классификации на основе рассчитанных соотношений. Упоминаются пороги для изображений, а также пороги T1 и T2 для сайтов.
    • Классификатор запросов: Механизм (например, на основе машинного обучения, binary classifier, списка n-грамм, LSI), определяющий категорию запроса и его принадлежность к Click Magnet Seeking типу.

    Выводы

    1. Контекст клика важнее его количества: Патент демонстрирует, что Google анализирует не только CTR изображения, но и причины этих кликов. Клики, полученные по сенсационным запросам, имеют иной вес, чем клики по общим запросам.
    2. Активная борьба с искажением выдачи сенсационным контентом: Система разработана для предотвращения ситуаций, когда «кликбейт» изображения доминируют в выдаче по общим запросам. Google готов понижать изображения с высоким CTR, если считает их Click Magnets.
    3. Многоуровневая классификация (Изображение, Запрос, Сайт): Классификация происходит на трех уровнях, которые влияют друг на друга. Изображения классифицируются на основе кликов, сайты — на основе изображений, а запросы — на основе содержания или того, на что кликают пользователи.
    4. Влияние репутации сайта и механизм переопределения (Override): Классификация сайта может переопределить статус отдельных изображений. Все изображения на Click Magnet Site могут считаться Click Magnets. И наоборот, если изображение размещено только на авторитетных (Non-Click Magnet) сайтах, оно может избежать классификации как Click Magnet, даже если статистика кликов указывает на обратное (Claim 3).
    5. Важность классификации запросов для ранжирования: Определение того, ищет ли пользователь сенсационный контент (CMSQ) или нет, является ключевым фактором, определяющим, будут ли Click Magnet Images повышены или понижены в выдаче.
    6. Итеративный процесс обучения: Система может использовать найденные Click Magnet Images для лучшего понимания того, какие запросы являются Click Magnet Seeking, и наоборот, создавая петлю обратной связи для улучшения классификаторов.

    Практика

    Best practices (это мы делаем)

    • Четкое соответствие изображения интенту запроса: Для общих информационных или коммерческих запросов используйте качественные, информативные и профессиональные изображения. Избегайте сенсационности, если она не является целью запроса. Это гарантирует, что клики будут интерпретированы как подтверждение релевантности.
    • Использование сенсационного контента только в релевантном контексте: Если ваш контент по своей природе является юмористическим или шокирующим, и это соответствует тематике сайта, оптимизируйте его под запросы, которые Google классифицирует как Click Magnet Seeking Queries. В этом случае система будет способствовать его продвижению по этим запросам.
    • Поддержание «чистого» профиля изображений на сайте: Для сайтов общей тематики важно следить за общим качеством публикуемых изображений. Большое количество Click Magnet Images может привести к классификации всего ресурса как Click Magnet Site, что негативно скажется на ранжировании по несенсационным запросам.
    • Использование авторитетных площадок для дистрибуции контента: Патент указывает (Claim 3), что размещение изображения исключительно на Non-Click Magnet Sites может защитить его от классификации как Click Magnet, даже если статистика кликов спорная.

    Worst practices (это делать не надо)

    • Использование кликбейт-миниатюр для общих запросов: Попытки привлечь трафик на информационный или коммерческий контент с помощью шокирующих, сексуализированных или вводящих в заблуждение изображений. Система идентифицирует такие изображения как Click Magnets и понизит их для общих запросов.
    • Игнорирование контекста высокого CTR: Нельзя полагаться только на высокий CTR изображения как на показатель успеха. Если клики приходят из-за сенсационности, а не релевантности, это может привести к понижению позиций по целевым запросам.
    • Смешивание профессионального и сенсационного контента на одном домене: Размещение большого количества «кликбейт» изображений рядом с профессиональным контентом увеличивает риск того, что весь сайт будет классифицирован как Click Magnet Site.

    Стратегическое значение

    Этот патент подтверждает высокий уровень сложности алгоритмов Google Images и то, что поведенческие сигналы не используются напрямую. Ранжирование изображений зависит от интерпретации природы изображения и интента пользователя. Стратегия Image SEO должна учитывать, что Google активно сегментирует контент по его характеру (сенсационный vs. информативный) и соответствующим образом корректирует выдачу, чтобы предотвратить манипуляции, основанные на использовании «кликбейта».

    Практические примеры

    Сценарий 1: Пессимизация шокирующего изображения по общему запросу

    1. Ситуация: Пользователь ищет информацию о породе собак и вводит запрос «Доберман» (Non-CMSQ).
    2. Контент: В выдаче присутствует изображение добермана с окровавленной пастью после драки. Оно имеет высокий CTR.
    3. Анализ системы: Система классифицировала это изображение как Click Magnet Image, так как 80% кликов на него приходят по запросам из категорий «violence» и «gory» (например, «жестокое нападение собаки»).
    4. Результат: Алгоритм ранжирования активно понижает (demote) это шокирующее изображение в выдаче по запросу «Доберман», отдавая предпочтение стандартным фотографиям породы.

    Сценарий 2: Повышение смешного изображения по релевантному запросу

    1. Ситуация: Пользователь ищет развлекательный контент и вводит запрос «смешные коты в костюмах» (CMSQ).
    2. Анализ системы: Изображение кота в костюме Бэтмена классифицировано как Click Magnet Image (категория «funny»).
    3. Результат: Алгоритм ранжирования повышает (promote) это изображение в выдаче, так как оно соответствует сенсационному интенту пользователя.

    Вопросы и ответы

    Что такое «Click Magnet Image» согласно патенту?

    Это изображение, которое привлекает большое количество кликов по причинам, не связанным с его качеством или релевантностью запросу. Примерами могут служить сенсационные, смешные, шокирующие или экстремальные изображения. Система идентифицирует их не по содержанию картинки, а по тому, какие категории запросов приводят к кликам на нее.

    Означает ли этот патент, что CTR больше не является важным фактором ранжирования изображений?

    Нет, CTR остается важным сигналом. Однако этот патент показывает, что Google не использует «сырой» CTR. Система анализирует контекст кликов. Высокий CTR полезен, если он обусловлен релевантностью, но может быть вреден, если он обусловлен кликбейтом при ранжировании по общим запросам.

    Какие категории запросов Google считает «Click Magnet Seeking» (CMSQ)?

    Патент приводит конкретные примеры категорий, которые используются для идентификации таких запросов: violent (насильственный), sexual (сексуальный), gory (кровавый), morbid (мрачный), funny (смешной) и extreme (экстремальный). Если запрос попадает в одну из этих категорий, он может быть классифицирован как CMSQ.

    Как система классифицирует запросы по этим категориям?

    Патент упоминает несколько методов. Это может быть основано на терминах в запросе или с использованием машинного обучения, например, бинарного классификатора (binary classifier), обученного на n-граммах или с использованием методов NLP, таких как Latent Semantic Indexing (LSI).

    Что такое «Click Magnet Site» и как он определяется?

    Это сайт, который публикует значительное количество Click Magnet Images. Система рассчитывает соотношение таких изображений к общему числу изображений на сайте. Если это соотношение превышает определенный верхний порог (T1), сайт классифицируется как Click Magnet Site.

    Как классификация сайта влияет на ранжирование его изображений?

    Классификация сайта может переопределять статус отдельных изображений. В патенте указано (Claim 6), что все изображения, опубликованные на Click Magnet Site, могут быть автоматически классифицированы как Click Magnet Images, даже если их индивидуальная статистика кликов этого не подтверждает.

    Существует ли механизм защиты для изображений, которые ошибочно классифицированы как «Click Magnet»?

    Да, патент описывает механизм переопределения (Claim 3). Если изображение было классифицировано как Click Magnet на основе статистики кликов, но оно опубликовано исключительно на сайтах, классифицированных как Non-Click Magnet Sites (авторитетные ресурсы), и ни на одном Click Magnet Site, система может отменить классификацию Click Magnet для этого изображения.

    Как система использует эту классификацию при ранжировании?

    Система корректирует ранжирование в зависимости от типа запроса. Если запрос общий (Non-CMSQ), то Click Magnet Images понижаются в выдаче. Если запрос направлен на поиск сенсационного контента (CMSQ), то Click Magnet Images повышаются в выдаче.

    Влияет ли размер сайта на этот механизм?

    Да, патент упоминает такую возможность. При классификации сайтов система может учитывать общее количество изображений на сайте. Сайты, которые публикуют слишком мало изображений (не удовлетворяют порогу, например T3), могут не классифицироваться как Click Magnet Site или Non-Click Magnet Site, независимо от соотношения кликбейтных изображений.

    Оценивает ли система само изображение (визуальный контент)?

    Нет. Согласно этому патенту, классификация Click Magnet Image основана исключительно на анализе поведенческих данных (Selection Vectors) и категорий запросов, которые приводят к кликам. Визуальный анализ содержания изображения для определения его «кликбейтности» в данном патенте не описан.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.