Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует масштабируемый интерфейс (Zoomable UI) и кластеризацию для организации Поиска по картинкам

    GROUPING AND PRESENTING IMAGES (Группировка и представление изображений)
    • US20150170333A1
    • Google LLC
    • 2015-06-18
    • 2011-09-15
    2011 Мультимедиа Патенты Google

    Google использует систему визуализации для поиска по картинкам, которая группирует похожие изображения на основе визуальных признаков и метаданных и отображает их в масштабируемом 2D-интерфейсе. При отдалении (zoom-out) система показывает меньше репрезентативных (канонических) изображений, часто выбираемых на основе их рейтинга. При приближении (zoom-in) раскрывается больше деталей внутри кластеров.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему эффективной навигации и быстрого обзора большого количества результатов поиска изображений, особенно на устройствах с ограниченным размером экрана (мобильные телефоны, планшеты). Цель — предоставить пользователю «визуальную сводку» (visual summary) коллекции изображений и позволить постепенно исследовать интересующие области, не перегружая интерфейс деталями.

    Что запатентовано

    Запатентована система и метод для представления изображений в масштабируемом пользовательском интерфейсе (Zoomable User Interface — ZUI). Изобретение включает механизм группировки изображений на основе сходства для создания иерархической структуры и интерфейс, который отображает изображения в двумерной сетке (two dimensional grid). Интерфейс динамически меняет детализацию (granularity): при отдалении (zoom-out) группы похожих изображений заменяются их представителями.

    Как это работает

    Система работает в несколько этапов:

    • Анализ сходства: Вычисляется Similarity Matrix, оценивающая сходство между парами изображений на основе визуальных признаков, метаданных, текста и поведения пользователей.
    • Группировка и Маппинг: Используются сложные методы машинного обучения. KPCA и MDS применяются для снижения размерности признаков, а SOM или иерархическая кластеризация — для группировки и проецирования изображений в 2D-пространство так, чтобы похожие изображения оказались рядом.
    • Выбор Канонических Изображений: Для каждого кластера определяется Canonical Image (репрезентативное изображение). Выбор часто основывается на исходном Ranking Score изображения в поиске.
    • Презентация в ZUI: Изображения отображаются в сетке (Image Space Pyramid). При масштабировании интерфейс плавно переключается между уровнями детализации, заменяя группы их представителями или наоборот, используя эффекты прозрачности.

    Актуальность для SEO

    Средняя. Базовые технологии, описанные в патенте — иерархическая кластеризация, анализ визуального и семантического сходства, выбор репрезентативных изображений — остаются фундаментальными для организации результатов в Google Images, Google Photos и Google Lens. Однако конкретная реализация ZUI, описанная в патенте (интерфейс, похожий на навигацию по карте), может отличаться от стандартных интерфейсов поиска по картинкам на 2025 год.

    Важность для SEO

    Влияние на SEO умеренное (4/10). Это преимущественно патент об интерфейсе (UI/UX), описывающий представление уже ранжированных результатов. Однако он имеет критическое значение для Image SEO, так как раскрывает механизм выбора Canonical Image. Поскольку этот выбор может зависеть от исходного Ranking Score, высокое ранжирование изображения критически важно для того, чтобы оно стало представителем кластера и получило максимальную видимость (visibility) на обзорных уровнях.

    Детальный разбор

    Термины и определения

    Canonical Image / Representative Image (Каноническое / Репрезентативное изображение)
    Изображение, выбранное для представления целого кластера похожих изображений на более отдаленном уровне масштабирования. Служит «визуальной сводкой» группы. Выбор может основываться на Ranking Score или других показателях релевантности.
    Granularity (Гранулярность/Детализация)
    Степень детализации 2D-сетки. Zoom-in увеличивает гранулярность (больше мелких изображений); zoom-out уменьшает ее (меньше крупных изображений).
    Image Space Pyramid (Пирамида пространства изображений)
    Многоуровневая структура данных. Нижний уровень содержит все изображения, а каждый последующий верхний уровень содержит подмножество репрезентативных изображений с предыдущего уровня.
    KPCA (Kernelized Principal Component Analysis)
    Ядерный метод главных компонент. Метод снижения размерности. В патенте используется для анализа признаков изображений на глобальном наборе данных (из разных запросов, офлайн).
    MDS (Multidimensional Scaling)
    Многомерное шкалирование. Используется для анализа уровня сходства и снижения размерности признаков изображений в рамках конкретного запроса (онлайн).
    Similarity Matrix (Матрица сходства)
    Матрица N×N, содержащая значения сходства между парами изображений. Сходство основано на визуальных признаках, метаданных, тексте и поведении пользователей (co-click).
    SOM (Self-Organizing Map)
    Самоорганизующаяся карта Кохонена. Тип нейронной сети, используемый для кластеризации и проецирования многомерных данных в 2D-сетку.
    Zoomable User Interface (ZUI)
    Масштабируемый пользовательский интерфейс, позволяющий изменять масштаб просмотра контента.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод взаимодействия с интерфейсом при отдалении (zoom out) в ответ на поисковый запрос.

    1. Представление UI с 2D-сеткой изображений, сгруппированных по сходству.
    2. Получение ввода для отдаления (zoom out) и определение нового уровня масштабирования (image zoom level).
    3. Модификация интерфейса:
      • Уменьшение гранулярности сетки (меньше отображаемых изображений).
      • Замена нескольких изображений группы меньшим подмножеством (smaller subset).
    4. Ограничения на подмножество:
      • Размер подмножества предопределен и зависит от уровня масштабирования.
      • Размер строго больше одного (more than one), но меньше размера группы.
      • Подмножество содержит репрезентативное изображение (representative image).
      • Это репрезентативное изображение отображается в большем размере после отдаления, чем до него.

    Это описывает механизм динамической замены контента в зависимости от масштаба. Важно отметить юридическое ограничение в Claim 1, что после zoom-out группа должна быть представлена *более чем одним* изображением, что отличается от общего описания (Description), где часто подразумевается замена на одно каноническое изображение.

    Claim 17 (Независимый пункт): Описывает систему, разделенную на серверную (группировка) и клиентскую (отображение и взаимодействие) части, реализующую метод, аналогичный Claim 1.

    Claim 18 (Зависимый от 17): Детализирует гибридный метод группировки изображений на сервере.

    1. Вычисление первых n измерений вектора признаков с использованием KPCA на глобальном наборе данных (из множества предыдущих запросов – офлайн).
    2. Вычисление вторых m измерений с использованием MDS на результатах текущего запроса (онлайн).
    3. Кластеризация изображений для отображения в двумерное пространство.
    4. Определение для каждой позиции в 2D сетке: (i) ближайшего изображения и (ii) приоритета (priority indication) для остальных изображений относительно этой позиции.

    Описан сложный подход к кластеризации, который учитывает как глобальный контекст (через KPCA), так и локальный контекст текущего запроса (через MDS), для оптимального расположения в интерфейсе.

    Где и как применяется

    Изобретение затрагивает несколько этапов обработки данных и представления результатов.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе извлекаются визуальные и не визуальные признаки изображений. Также происходит предварительный расчет глобальных моделей (например, KPCA) офлайн.

    RANKING – Ранжирование (Вертикаль Изображений)
    Система получает на вход уже ранжированные результаты поиска (ranked image search results). Исходные Ranking Scores могут использоваться на следующем этапе для выбора Canonical Image.

    METASEARCH / RERANKING (Этап постобработки и представления результатов)
    Основное применение патента.

    1. Анализ и Группировка (Сервер): Полученные результаты анализируются. Вычисляется Similarity Matrix. Происходит кластеризация (с использованием MDS, SOM) и построение иерархии (Image Space Pyramid).
    2. Выбор Представителей (Сервер): Определяются Canonical Images для разных уровней масштабирования.
    3. Формирование Интерфейса (Клиент): Данные передаются клиенту для рендеринга ZUI. Клиент обрабатывает действия пользователя (zoom-in/out) и управляет плавными переходами (smooth transitions) между уровнями масштабирования.

    Входные данные:

    • Запрос пользователя.
    • Ранжированный список результатов поиска с Ranking Scores.
    • Векторы признаков изображений и метаданные.

    Выходные данные:

    • Структурированные данные для ZUI: иерархия изображений (Image Space Pyramid), координаты в 2D сетке, идентификаторы Canonical Images.
    • Код (HTML/JS) для рендеринга и управления ZUI на стороне клиента.

    На что влияет

    • Конкретные типы контента: Влияет на представление изображений и, потенциально, видео (упоминается в патенте).
    • Специфические запросы: Наибольшее влияние на широкие запросы, возвращающие большое количество разнообразных изображений, где требуется структурирование для навигации (например, товары, достопримечательности).
    • Устройства: Особая ценность отмечена для устройств с небольшими экранами (мобильные телефоны, планшеты).

    Когда применяется

    • Условия работы: Применяется в интерфейсах поиска по картинкам или просмотра фотоальбомов для организации большого набора визуальных данных.
    • Триггеры активации: Взаимодействие пользователя с масштабированием (zoom in/out) активирует переключение между уровнями детализации при достижении пороговых значений коэффициента масштабирования.

    Пошаговый алгоритм

    Патент описывает два основных процесса: группировка (бэкенд) и представление (фронтенд).

    Процесс А: Группировка и Маппинг (Гибридный метод, Бэкенд)

    1. Получение данных: Получение L ранжированных изображений для запроса.
    2. Расчет сходства: Вычисление матрицы сходства A (L×L).
    3. Локальный анализ (MDS): Применение MDS к матрице A для генерации m-мерных векторов признаков (учитывает контекст запроса).
    4. Глобальный анализ (KPCA): Получение n-мерных векторов признаков с помощью KPCA (учитывает глобальный контекст всех изображений).
    5. Объединение признаков: Комбинирование векторов из KPCA и MDS.
    6. Кластеризация и Маппинг (SOM): Применение SOM к объединенным векторам для проецирования на двумерную сетку (N×N).
    7. Уточнение координат (Coordinate Refinement): Разрешение коллизий SOM для назначения уникальных 2D координат каждому изображению.
    8. Выбор представителей: Вычисление приоритета репрезентативности и выбор Canonical Images для построения иерархии (Image Space Pyramid).

    Процесс Б: Представление в ZUI (Фронтенд)

    1. Инициализация: Отображение 2D сетки на начальном уровне масштабирования (z).
    2. Обработка ввода: Получение ввода zoom-in или zoom-out, пересчет коэффициента масштабирования (s).
    3. Масштабирование (Rescaling): Изменение размера изображений на текущем уровне в соответствии с s.
    4. Проверка порога: Определение момента перехода на новый уровень масштабирования (например, когда z=logk(s)z = log_k(s)z=logk​(s) достигает порога).
    5. Плавный переход (Smooth Transition):
      • Выравнивание (Alignment): Совмещение изображений на уровне z с их версиями на новом уровне (z+1 или z-1).
      • Рендеринг с прозрачностью: Одновременный рендеринг двух уровней с использованием эффектов прозрачности (alpha-fading). Пример расчета прозрачности (α): α=log2(s)−[log2(s)]α = log_2(s) — [log_2(s)]α=log2​(s)−[log2​(s)].
    6. Обновление отображения: Завершение перехода. При zoom-out группы заменяются меньшим числом представителей (которые становятся крупнее), при zoom-in – наоборот.

    Какие данные и как использует

    Данные на входе

    Система использует широкий спектр сигналов для определения сходства и выбора канонических изображений:

    • Мультимедиа факторы (Визуальные признаки): Интенсивность (intensity), цвет (гистограммы, цветовые пространства RGB, YIQ), края (edges), текстура (texture), форма (shape), локальные признаки (local features), результаты распознавания лиц (facial similarity), wavelet based techniques.
    • Контентные факторы (Текстовые признаки): Текст, ассоциированный с изображением (на веб-странице), аннотации (text annotations), имена файлов, метки (labels).
    • Географические и Временные факторы (Метаданные): Время и место съемки (location, time).
    • Поведенческие факторы: Информация о совместных кликах (co-click information).
    • Ссылочные факторы: Упоминается возможность использования ссылок при расчете альтернативного рейтинга для выбора Canonical Image.
    • Системные данные: Исходные Ranking Scores от поисковой системы.

    Какие метрики используются и как они считаются

    • Similarity Value (Значение сходства): Оценка сходства между парой изображений в Similarity Matrix. Рассчитывается путем агрегации визуальных, текстовых и поведенческих сигналов.
    • Image Feature Vector (Вектор признаков изображения): Многомерный вектор, агрегирующий признаки. Формируется гибридным подходом: часть через KPCA (глобальный контекст), часть через MDS (контекст запроса).
    • Ranking Score / Relevancy Score: Исходная оценка ранжирования или оценка релевантности. Используется как один из критериев для выбора Canonical Image внутри кластера.
    • Representativeness Priority (Приоритет репрезентативности): Скалярное значение, вычисляемое для выбора изображения для отображения на определенном уровне масштабирования.
    • Scaling Factor (s) и Zoom Level (z): Параметры, управляющие масштабом в интерфейсе.

    Выводы

    1. Фокус на UI/UX и организации контента: Это в первую очередь патент о пользовательском интерфейсе и визуализации данных, а не об алгоритмах ранжирования. Он описывает, как организовать уже ранжированные результаты для удобства пользователя.
    2. Сложный анализ сходства: Google использует комплексный подход к определению сходства изображений, комбинируя визуальные признаки, метаданные, текстовый контекст и поведенческие сигналы (co-clicks).
    3. Продвинутая кластеризация (KPCA/MDS/SOM): Для организации визуального пространства используются сложные методы машинного обучения. Гибридный подход учитывает как глобальный контекст (KPCA), так и локальный контекст запроса (MDS).
    4. Критичность Canonical Image: Концепция выбора наилучшего изображения (Canonical Image) для представления кластера является центральной. Это изображение получает наибольшую видимость на обзорных уровнях.
    5. Ранжирование влияет на видимость через каноникализацию: Ключевой инсайт для SEO: исходный Ranking Score изображения является одним из основных сигналов для его выбора в качестве Canonical Image. Высокий ранг увеличивает видимость в кластеризованных интерфейсах.

    Практика

    Патент в первую очередь описывает UI/UX. Он не содержит практических выводов для ранжирования веб-сайтов (Web SEO). Все приведенные ниже рекомендации относятся к оптимизации изображений (Image SEO) и основаны на механизмах группировки и выбора канонических изображений.

    Best practices (это мы делаем)

    • Приоритет базового ранжирования в Image Search: Это ключевая стратегия. Поскольку Ranking Score часто используется для выбора Canonical Image, необходимо применять все стандартные методы Image SEO (оптимизация alt, контекста, скорости, получение ссылок) для достижения высоких позиций. Это повышает вероятность того, что ваше изображение станет представителем кластера.
    • Обеспечение точного контекста и метаданных: Так как сходство рассчитывается комплексно (визуал + контекст), необходимо убедиться, что контекст вокруг изображения (текст, метаданные, имена файлов) точно описывает его содержание. Это помогает системе корректно кластеризовать изображение.
    • Создание высококачественного визуального контента: Четкие, качественные и релевантные изображения имеют больше шансов быть высоко ранжированными и, как следствие, выбранными в качестве Canonical Image.

    Worst practices (это делать не надо)

    • Массовое создание дубликатов (Image Spinning): Эта тактика неэффективна. Система сгруппирует все похожие варианты в один кластер, и только одно изображение (лучшее по рангу) будет показано как Canonical Image. Остальные будут скрыты на обзорных уровнях.
    • Игнорирование контекстуальных сигналов: Фокусировка только на визуальных аспектах при игнорировании текста и метаданных, которые активно используются для расчета сходства.
    • Использование неуникальных стоковых фото как основных: Если изображение идентично многим другим в индексе, оно попадет в большой кластер. Вероятность стать Canonical Image зависит исключительно от его ранжирования по сравнению с копиями на других сайтах.

    Стратегическое значение

    Патент подтверждает, что Google анализирует изображения далеко за пределами простых ключевых слов, используя передовые методы машинного обучения для понимания визуального и семантического сходства. Стратегия SEO должна учитывать, что Google стремится создать «визуальную сводку» выдачи. Для того чтобы стать частью этой сводки, изображение должно быть не только релевантным, но и лучшим (по рангу и качеству) среди похожих вариантов.

    Практические примеры

    Сценарий: Оптимизация изображений товара для E-commerce

    Задача: Увеличить видимость нового товара (например, красного платья) в поиске по картинкам.

    1. Ситуация: Магазин загружает 10 фото платья (разные ракурсы, детали, lifestyle фото).
    2. Применение инсайтов патента: Система, вероятно, сгруппирует эти фото в один или несколько кластеров. Нужно сделать так, чтобы главное фото стало Canonical Image.
    3. Действие: Выбрать лучшее главное фото (четкое, привлекательное). Максимально оптимизировать его для ранжирования (alt, имя файла, Schema.org Product, скорость загрузки). Убедиться, что страница товара авторитетна и хорошо ранжируется.
    4. Цель: Добиться наивысшего Ranking Score для главного фото среди всех фото этого товара (включая те, что размещены на других сайтах).
    5. Ожидаемый результат: Главное фото выбирается как Canonical Image. В интерфейсах, использующих кластеризацию, оно представляет весь кластер, обеспечивая максимальную видимость и привлекая трафик.

    Вопросы и ответы

    Является ли этот патент алгоритмом ранжирования изображений?

    Нет, это не алгоритм ранжирования. Патент описывает систему организации и представления уже ранжированных результатов (ranked image search results) в масштабируемом пользовательском интерфейсе (ZUI). Он определяет, как изображения группируются по сходству и как они отображаются пользователю.

    Как этот патент влияет на SEO, если он не о ранжировании?

    Влияние связано с видимостью (visibility). Патент указывает, что для представления группы похожих изображений выбирается Canonical Image. Выбор часто основывается на исходном Ranking Score. Следовательно, чем выше ранжируется ваше изображение изначально, тем больше у него шансов стать каноническим и быть показанным пользователю.

    Что такое Canonical Image и как оно выбирается?

    Canonical Image — это изображение, представляющее целый кластер похожих картинок на обзорных уровнях масштабирования. Оно выбирается на основе наивысшего Ranking Score внутри кластера, либо на основе отдельной оценки релевантности (Relevancy Score) или качества.

    Какие факторы Google использует для определения схожести изображений?

    Используется комплексный подход: визуальные признаки (цвет, текстура, форма, объекты, лица), метаданные (время, место съемки), текстовый контекст (имена файлов, alt, окружающий текст) и поведенческие факторы (например, данные о совместных кликах – co-click information).

    Что означают термины KPCA, MDS и SOM?

    Это методы машинного обучения для анализа и кластеризации. KPCA анализирует глобальные данные изображений (офлайн). MDS фокусируется на схожести в рамках конкретного запроса (онлайн). SOM (Самоорганизующаяся карта) используется для проецирования этих сложных данных на простую двумерную сетку интерфейса.

    Использует ли Google этот масштабируемый интерфейс (ZUI) сейчас?

    Конкретная реализация ZUI, описанная в патенте (похожая на бесконечную карту), не является стандартным интерфейсом Google Images на 2025 год. Однако базовые технологии группировки, анализа сходства и выбора репрезентативных изображений лежат в основе организации контента в сервисах Google.

    Что делать, если у меня много похожих изображений (например, вариации товара)?

    Система сгруппирует их в один кластер. Вам нужно сфокусироваться на том, чтобы самое важное изображение (например, главное фото товара) имело наилучшие сигналы ранжирования и было максимально качественным, чтобы именно оно было выбрано как Canonical Image.

    Что такое Image Space Pyramid?

    Это иерархическая модель организации изображений. На самом детальном уровне находятся все результаты поиска. На каждом следующем уровне вверх количество изображений уменьшается, и остаются только Canonical Images, представляющие группы из нижнего уровня. Это позволяет реализовать масштабируемый интерфейс.

    Поможет ли этот патент в борьбе с дубликатами изображений?

    Да, он помогает дедупликации выдачи на уровне интерфейса. Если в выдаче есть несколько копий одного изображения (или очень похожие изображения), система сгруппирует их в один кластер и выберет только одну копию (обычно с наивысшим рангом) для показа в качестве Canonical Image.

    Что означает ограничение в Claim 1 о том, что после zoom-out должно остаться «более одного» изображения от группы?

    Это юридическая формулировка в Claim 1, определяющая защищенный объем изобретения. Она указывает, что запатентованный метод при отдалении заменяет группу не одним единственным изображением, а небольшим подмножеством (например, двумя). Это может отличаться от реализаций, описанных в общем тексте патента (Description), где часто подразумевается замена на одно каноническое изображение.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.