Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует географические и языковые данные о кликах для локализации Поиска по Картинкам

    CUSTOMIZING IMAGE SEARCH FOR USER ATTRIBUTES (Кастомизация поиска изображений на основе атрибутов пользователя)
    • US9146997B2
    • Google LLC
    • 2015-09-29
    • 2008-04-23
    2008 Мультимедиа Мультиязычность Патенты Google Персонализация

    Google анализирует, какие изображения предпочитают пользователи из разных регионов и говорящие на разных языках. Если предпочтения локальной группы сильно отличаются от глобальных трендов для данного запроса, Google переранжирует выдачу по картинкам, чтобы показать этой группе более релевантные для них изображения, основываясь на истории кликов похожих пользователей.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неоднозначности запросов в поиске по изображениям, когда релевантность визуального контента сильно зависит от культурного, языкового или географического контекста пользователя. Система устраняет ситуации, когда глобально популярные изображения не соответствуют ожиданиям пользователей в определенной локации (locale attribute) или языковой группе (language attribute). Например, визуальные предпочтения для одного и того же запроса могут кардинально отличаться в разных странах.

    Что запатентовано

    Запатентована система для выборочной кастомизации результатов поиска изображений на основе атрибутов пользователя (язык и местоположение). Система использует исторические данные о кликах (statistics of accesses или click data) для сравнения глобальной популярности изображений с популярностью среди пользователей с аналогичными атрибутами. Если предпочтения локальной группы существенно отличаются от глобальных, система переранжирует результаты, отдавая приоритет изображениям, которые чаще выбирала эта локальная группа.

    Как это работает

    Ключевой механизм основан на сравнении двух наборов данных и вычислении их схожести:

    • Идентификация атрибутов: Система определяет язык и местоположение пользователя (формируя Attribute-pair, например, Indian-English).
    • Сравнение наборов: Система сравнивает First Set of Images (изображения, популярные среди всех пользователей) и Second Set of Images (изображения, популярные среди пользователей с теми же атрибутами). Оба набора обычно представлены как Top K lists.
    • Вычисление схожести: Рассчитывается показатель схожести (Set Similarity) между двумя наборами.
    • Условное ранжирование: Если схожесть высокая (выше порога), используется глобальное ранжирование (на основе First Set). Если схожесть низкая (ниже порога), выдача переранжируется на основе предпочтений локальной группы (на основе Second Set).

    Актуальность для SEO

    Высокая. Персонализация, локализация и учет культурного контекста остаются ключевыми направлениями развития поиска, особенно визуального (Image Search, Video). Способность адаптировать выдачу под специфические ожидания разных групп пользователей критически важна для поддержания качества поиска в глобальной среде.

    Важность для SEO

    Патент имеет значительное влияние (75/100) на стратегии международного SEO и продвижения в Поиске по Картинкам. Он показывает, что глобальная популярность изображения не гарантирует высоких позиций во всех регионах. Для успешного ранжирования изображение должно быть не только оптимизировано технически, но и визуально и культурно релевантно целевой аудитории в конкретном регионе, что подтверждается кликами именно этой группы пользователей.

    Детальный разбор

    Термины и определения

    Attribute-pair (Пара атрибутов)
    Комбинация атрибутов пользователя, используемая для сегментации данных. Чаще всего это комбинация местоположения и языка (locale-language attribute-pair), например, «Indian-English».
    First Set of Images (Первый набор изображений)
    Набор изображений, отобранный на основе статистики доступов всех пользователей (глобальная популярность) по данному запросу. Обычно это глобальный Top K list.
    Locale Attribute / Language Attribute (Атрибут местоположения / Языковой атрибут)
    Ключевые характеристики пользователя, используемые для кастомизации поиска.
    Performance Data (Данные об эффективности)
    Термин, используемый в Claims для обозначения данных, на основе которых происходит ранжирование (синоним Statistics of Accesses).
    Second Set of Images (Второй набор изображений)
    Набор изображений, отобранный на основе статистики доступов только тех пользователей, чьи атрибуты совпадают с атрибутами текущего пользователя (специфичная популярность). Обычно это локальный Top K list.
    Set Similarity / Result Similarity (Схожесть наборов / Схожесть результатов)
    Метрика, определяющая степень совпадения между Первым и Вторым наборами изображений. Используется для принятия решения о необходимости персонализации ранжирования.
    Statistics of Accesses (Статистика доступов)
    Исторические данные о взаимодействии пользователей с результатами поиска, в частности, количество кликов (click data) конкретного изображения в ответ на запрос.
    Top K list (Топ-K список)
    Список из K наиболее часто выбираемых изображений (например, Топ-10) для определенной группы пользователей.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод адаптивного ранжирования изображений.

    1. Система получает множество результатов поиска изображений в ответ на запрос.
    2. Идентифицируется Первый набор результатов (и связанных с ними изображений), ранее предоставленный Первой группе пользователей (глобальные пользователи).
    3. Идентифицируется Второй набор результатов (и связанных с ними изображений), ранее предоставленный Второй группе пользователей, обладающих характеристикой (атрибутом), совпадающей с характеристикой текущего пользователя.
    4. Вычисляется Result Similarity (Схожесть результатов) на основе количества одинаковых изображений, присутствующих как в первом, так и во втором наборе изображений.
    5. Ранжирование текущих результатов поиска выполняется на основе ОДНОГО из двух наборов данных: First Performance Data (данные Первого набора) ИЛИ Second Performance Data (данные Второго набора). Выбор зависит от вычисленной Result Similarity.

    Claim 2 и 3 (Зависимые): Определяют логику выбора данных для ранжирования.

    Если Result Similarity соответствует определенному уровню схожести (т.е. выше или равно порогу), для ранжирования используется First Performance Data (глобальные данные). Если схожесть не соответствует этому уровню (т.е. ниже порога), используются Second Performance Data (данные, специфичные для атрибутов пользователя).

    Claim 4 и 5 (Зависимые): Уточняют, что представляют собой наборы изображений.

    Первый и Второй наборы изображений соответствуют определенному количеству результатов поиска, которые наиболее часто выбирались (most frequently selected) соответствующими группами пользователей (т.е. это Top K lists).

    Claim 6 и 7 (Зависимые): Уточняют характеристики (атрибуты) пользователя.

    Характеристикой является географическое положение (geographic location) или язык (language). Они могут быть определены, например, на основе кода страны поисковой системы (e.g., google.it).

    Где и как применяется

    Изобретение применяется в системе поиска по изображениям (Image Search) и затрагивает несколько этапов поисковой архитектуры.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит сбор, обработка и хранение поведенческих данных. Система должна индексировать не только сами изображения, но и Statistics of Accesses (данные о кликах). Критически важно, что эти данные хранятся в сегментированном виде, с привязкой к User Attributes (язык и локация пользователя, совершившего клик).

    QUNDERSTANDING – Понимание Запросов
    На этом этапе система должна определить атрибуты текущего пользователя в реальном времени. Это включает определение Locale Attribute (например, через IP-адрес, домен поисковика, профиль пользователя) и Language Attribute (например, язык интерфейса, язык запроса).

    RANKING / RERANKING – Ранжирование и Переранжирование
    Это основной этап применения патента. После того как система получила начальный набор релевантных изображений, активируется механизм кастомизации:

    1. Из индекса извлекаются данные о кликах: глобальные и специфичные для атрибутов пользователя.
    2. Формируются Top K lists (Первый и Второй наборы).
    3. Вычисляется Set Similarity.
    4. Происходит условное переранжирование результатов на основе выбранного набора данных (глобального или локального).

    Входные данные:

    • Запрос пользователя.
    • Атрибуты пользователя (Language/Locale Attribute-pair).
    • Начальный набор изображений, удовлетворяющих запросу.
    • База данных статистики доступов (Statistics of Accesses).

    Выходные данные:

    • Отсортированный (потенциально персонализированный) набор результатов поиска изображений.

    На что влияет

    • Конкретные типы контента: Влияет на все типы визуального контента, индексируемые в поиске по изображениям: статичные картинки, движущиеся изображения (GIF), изображения внутри мультимедиа.
    • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы, а также запросы, связанные с культурными особенностями, местными событиями, продуктами, традициями (например, запросы «свадьба», названия блюд, имена собственные, которые могут иметь разное значение в разных локациях).
    • Конкретные ниши или тематики: Сильное влияние в тематиках, где визуальное восприятие зависит от культурного контекста: мода, еда, путешествия, развлечения.

    Когда применяется

    • Условия работы алгоритма: Алгоритм активируется при обработке запроса в поиске по изображениям, при условии наличия достаточного количества исторических данных о кликах как в глобальном масштабе, так и для конкретной группы пользователей.
    • Триггеры активации персонализации: Персонализированное ранжирование (на основе Второго набора) активируется только тогда, когда Set Similarity между глобальными и локальными предпочтениями оказывается ниже установленного порога (Threshold). Если предпочтения совпадают, используется глобальное ранжирование для экономии ресурсов.

    Пошаговый алгоритм

    Процесс обработки запроса на изображения:

    1. Получение запроса и Идентификация атрибутов: Система получает запрос и определяет язык и местоположение пользователя (Attribute-pair).
    2. Поиск изображений: Идентифицируется коллекция изображений, удовлетворяющих запросу (начальное ранжирование).
    3. Формирование Первого набора (Глобальный): На основе статистики доступов всех пользователей формируется First Set of Images (глобальный Top K list).
    4. Формирование Второго набора (Специфичный): На основе статистики доступов пользователей с теми же атрибутами формируется Second Set of Images (локальный Top K list).
    5. Вычисление схожести (Set Similarity): Система рассчитывает степень совпадения между Первым и Вторым наборами. В патенте приводится формула: (Количество общих изображений в обоих наборах) / (Минимальное количество изображений в одном из наборов).
    6. Сравнение с порогом (Threshold): Полученная схожесть сравнивается с заданным пороговым значением.
    7. Принятие решения о ранжировании:
      • Если Схожесть >= Порог: Результаты поиска сортируются на основе глобальной статистики доступов (используется Первый набор).
      • Если Схожесть < Порог: Результаты поиска сортируются на основе статистики доступов пользователей с указанным атрибутом (используется Второй набор).
    8. Презентация результатов: Отсортированный набор результатов предоставляется пользователю.

    Какие данные и как использует

    Данные на входе

    Система использует следующие типы данных:

    • Поведенческие факторы (Ключевые): Statistics of Accesses (Click Data). Это основной фактор, используемый для ранжирования в данном патенте. Учитывается количество кликов по изображению в ответ на запрос, сегментированное по группам.
    • Географические факторы: Locale Attribute. Местоположение пользователя, определяемое по IP-адресу, домену поисковой системы (e.g., google.it), данным профиля или cookies.
    • Пользовательские факторы (Языковые): Language Attribute. Язык пользователя, определяемый по языку интерфейса, языку запроса, настройкам браузера или на основе локации.

    Какие метрики используются и как они считаются

    • Top K list: Список K наиболее кликабельных изображений для определенной группы пользователей. Рассчитывается путем сортировки изображений по убыванию количества кликов.
    • Set Similarity Score: Метрика схожести двух Top K lists. Патент предлагает формулу для нормализации оценки:
      Схожесть = (# Общих изображений в Наборе 1 и Наборе 2) / min(# Изображений в Наборе 1, # Изображений в Наборе 2).
      Эта метрика не зависит от порядка изображений в списках, а только от их присутствия (пересечения множеств).
    • Threshold (Порог Схожести): Предопределенное значение (в описании патента упоминается пример 0.41), которое определяет границу между «достаточно схожими» и «существенно различными» наборами.

    Выводы

    1. Поведенческие факторы как прямой сигнал ранжирования в Image Search: Патент явно описывает использование данных о кликах (Statistics of Accesses) для определения порядка результатов в поиске по изображениям.
    2. Сегментация CTR по демографии: Google не просто использует глобальный CTR. Система сегментирует данные о кликах по языку и местоположению (Attribute-pair) и использует эти сегментированные данные для локализации и персонализации выдачи.
    3. Приоритет локальной релевантности над глобальной: Если предпочтения локальной группы пользователей сильно отличаются от глобальных трендов (низкая Set Similarity), система отдает приоритет локальным предпочтениям. Это механизм культурной адаптации выдачи.
    4. Условная кастомизация и эффективность: Система не пытается кастомизировать каждую выдачу. Кастомизация активируется только при значительном расхождении предпочтений (ниже Threshold). Это позволяет экономить ресурсы, используя глобальное ранжирование в большинстве случаев, когда предпочтения совпадают.
    5. Важность культурного контекста для визуального контента: Для успеха в международном Image SEO необходимо понимать, как визуальный контент воспринимается в разных культурах и регионах. Технической оптимизации недостаточно.

    Практика

    Best practices (это мы делаем)

    • Культурная и визуальная адаптация контента: Создавайте и оптимизируйте изображения с учетом специфики целевого рынка. Изображение, релевантное в США, может быть нерелевантным в Индии. Используйте визуальные образы, которые резонируют с местной аудиторией, чтобы повысить локальный CTR.
    • Локализация контекста изображения: Убедитесь, что текст, окружающий изображение (подписи, статья, ALT-текст), написан на языке целевой аудитории и соответствует местному контексту. Это помогает связать изображение с правильным Attribute-pair и повышает базовую релевантность.
    • Использование сигналов локализации: Применяйте стандартные инструменты международного SEO (например, атрибуты Hreflang для страниц, где размещены изображения, локальные домены), чтобы помочь Google корректно атрибутировать контент и клики пользователей к нужному региону/языку.
    • Анализ CTR в Image Search по регионам: Мониторьте показатели кликабельности ваших изображений в разных целевых регионах (например, используя данные GSC). Низкий CTR в конкретном регионе может указывать на визуальную или культурную нерелевантность, что приведет к понижению позиций именно для этой аудитории.

    Worst practices (это делать не надо)

    • Стратегия «One-Size-Fits-All» для изображений: Использование одинаковых стоковых фотографий или универсальных изображений для всех языковых и региональных версий сайта. Этот подход игнорирует механизм кастомизации, описанный в патенте, и может привести к низкому локальному CTR.
    • Игнорирование культурных особенностей: Размещение изображений, которые могут быть неправильно интерпретированы, сочтены неуместными или просто неинтересными в целевом регионе.
    • Попытки манипуляции глобальным CTR: Использование накруток для повышения глобальной кликабельности изображения. Если реальные пользователи в целевом регионе не кликают на изображение, механизм кастомизации может отдать предпочтение локальным результатам, нивелируя эффект глобальных накруток. Клики из нецелевых регионов не помогут локальному ранжированию.

    Стратегическое значение

    Патент подтверждает стратегическую важность глубокого понимания пользовательского интента в контексте его культуры и местоположения, особенно для визуального поиска. Он демонстрирует, что Google рассматривает Image Search не как универсальный индекс, а как динамически адаптируемую систему, где релевантность определяется поведением конкретных групп пользователей. Для международного SEO это означает необходимость перехода от простого перевода контента к его полноценной культурной локализации, включая визуальные элементы.

    Практические примеры

    Сценарий: Оптимизация изображений для международного интернет-магазина одежды

    Задача: Ранжироваться по запросу «красное платье» (red dress) в Великобритании и Индии.

    1. Анализ предпочтений: Анализируем текущую выдачу Image Search. В Великобритании популярны вечерние и коктейльные платья западного стиля. В Индии популярны как западные стили, так и традиционные красные сари или лехенга (часто свадебные).
    2. Прогноз работы механизма: Google определит, что Top K list для Великобритании и Top K list для Индии имеют низкую Set Similarity по этому запросу.
    3. Действия (Локализованный подход): На британской версии использовать фото коктейльного платья. На индийской версии использовать изображения традиционного красного наряда или адаптировать подачу западных стилей под локальный контекст.
    4. Ожидаемый результат: Изображения соответствуют культурным ожиданиям в каждом регионе. Это ведет к высокому локальному CTR. Когда пользователь из Индии ищет «red dress», Google активирует кастомизированное ранжирование (из-за низкой схожести) и повысит в выдаче изображения, популярные в Индии (например, сари), обеспечивая сайту лучшие позиции.

    Вопросы и ответы

    Применяется ли этот патент только к Поиску по Картинкам (Image Search)?

    Да, патент US9146997B2 и описанные в нем методы специфичны для поиска изображений (Query for images). В тексте уточняется, что это включает статические изображения, движущиеся изображения и изображения в мультимедийном контенте. Он не описывает применение этих методов в основном веб-поиске (текстовые результаты).

    Как именно Google определяет язык и местоположение пользователя?

    Патент упоминает несколько методов для определения Locale и Language attributes. К ним относятся: использование IP-адреса клиента, анализ URL поискового интерфейса (например, использование google.it указывает на Италию), данные из профиля пользователя, cookies, язык интерфейса, а также определение языка самого введенного запроса.

    Что такое «Set Similarity» и как она рассчитывается?

    Set Similarity — это метрика, показывающая, насколько глобальные предпочтения (First Set) совпадают с предпочтениями конкретной группы (Second Set). Патент предлагает формулу: количество общих изображений в обоих наборах (Топ-K списках), деленное на минимальное количество изображений в одном из наборов. Важно, что эта метрика учитывает только присутствие изображения в Топе, а не его позицию в этом топе.

    Что произойдет, если для моей ниши или региона недостаточно данных о кликах?

    Если данных недостаточно для формирования надежного Второго набора (Second Set of Images) из-за нехватки кликов от пользователей с определенными атрибутами, система не сможет надежно рассчитать Set Similarity. В этом случае система, скорее всего, будет по умолчанию использовать глобальное ранжирование (First Set of Images).

    Означает ли это, что CTR является фактором ранжирования в Image Search?

    Да, этот патент прямо указывает на использование Statistics of Accesses (данных о кликах) как основы для определения порядка результатов в поиске по изображениям. Более того, он подчеркивает важность не просто глобального CTR, а CTR, сегментированного по языку и местоположению пользователя.

    Всегда ли Google использует локальные предпочтения для ранжирования картинок?

    Нет. Система сначала проверяет, насколько локальные предпочтения отличаются от глобальных. Если они очень похожи (сходство выше порога), используется глобальное ранжирование. Локальные предпочтения используются только тогда, когда они существенно расходятся с глобальными трендами для данного запроса.

    Как этот патент влияет на оптимизацию Alt-текстов и имен файлов?

    Патент не упоминает Alt-тексты или имена файлов. Он фокусируется исключительно на поведенческих данных (кликах) и атрибутах пользователя. Однако стандартная оптимизация (Alt-тексты, имена файлов, окружающий текст) по-прежнему необходима для начального этапа ранжирования (Retrieval), чтобы изображение в принципе попало в коллекцию кандидатов, к которой затем применяется описанный механизм переранжирования.

    Если мое изображение популярно глобально, но не популярно в целевой стране, что произойдет?

    Если предпочтения в целевой стране значительно отличаются от глобальных (низкое Set Similarity), Google активирует кастомизированное ранжирование для этой страны. В этом случае ваше глобально популярное изображение будет понижено в локальной выдаче в пользу изображений, которые более популярны среди местных пользователей.

    Может ли использование hreflang помочь в контексте этого патента?

    Да, косвенно. Корректная реализация hreflang помогает поисковой системе понять, какая версия контента предназначена для какого языка и региона. Это помогает Google правильно агрегировать поведенческие сигналы (клики) для нужного сегмента пользователей (Attribute-Pair), что повышает точность работы описанного механизма кастомизации.

    Как использовать этот патент при запуске сайта на новом языке или в новом регионе?

    При выходе на новый рынок необходимо провести исследование визуальных предпочтений и культурных особенностей целевой аудитории. Не полагайтесь на универсальные стоковые фото. Инвестируйте в создание или подбор локализованного визуального контента. Это поможет быстрее набрать локальный CTR и занять высокие позиции в Image Search для новой аудитории.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.