
Google валидирует текстовые метки изображений (например, Alt-текст или имена файлов) с помощью визуального анализа. Система строит граф, связывающий визуально похожие изображения. Симулируя навигацию пользователя по этому графу (алгоритм, подобный PageRank), Google определяет, какие метки наиболее релевантны фактическому содержанию изображения, отфильтровывая шум и повышая качество поиска по картинкам.
Патент решает проблему низкого качества и зашумленности текстовых меток (labels или keywords), ассоциированных с изображениями. Зачастую эти метки извлекаются автоматически из окружающего текста, имен файлов или метаданных и могут быть неинформативными (например, «круто», «IMG_001.jpg») или нерелевантными фактическому визуальному содержанию изображения. Это ухудшает качество результатов поиска по картинкам.
Запатентована система ранжирования изображений и их меток, использующая графовый итеративный алгоритм (часто называемый VisualRank). Суть изобретения в том, что релевантность метки определяется через анализ визуального сходства этого изображения с другими. Система рассчитывает Transitional Probability (вероятность перехода) между визуально похожими изображениями и использует эту вероятность для распространения и валидации релевантности меток по всему графу изображений.
Система работает по следующему принципу:
Similarity Score) на основе извлеченных признаков (цвет, текстура, объекты).Transitional Probability P(A→B) — вероятность того, что пользователь перейдет от изображения A к изображению B. Учитывается, что пользователи предпочитают похожие, но не идентичные картинки.TRA/TRB). Метка считается релевантной, если она валидирована похожими изображениями.Высокая. Визуальное понимание контента является ключевым направлением развития поиска (Google Lens, MUM). Хотя конкретные методы извлечения визуальных признаков эволюционировали (например, переход от упомянутого SIFT к нейросетевым эмбеддингам), фундаментальный принцип использования визуального сходства для валидации семантики изображений, заложенный в этом патенте (VisualRank), остается крайне актуальным.
Патент имеет высокое значение (8/10) для SEO, особенно в области оптимизации изображений. Он показывает, что оптимизация текста вокруг изображения (alt, title, окружающий контент) недостаточна, если само изображение визуально нерелевантно теме или не похоже на другие качественные изображения в этом тематическом кластере. Качество и содержание самого визуального актива играют решающую роль в том, как Google его проиндексирует и по каким запросам будет ранжировать.
Similarity Score и других факторов.Transitional Probability. Вероятность достигает пика при высоком сходстве, но падает близко к 1.0 (почти дубликаты).Claim 1 (Независимый пункт): Описывает основной метод работы системы.
score) для изображения по отношению к терминам.probabilities of navigating) между изображениями и расчет оценки на основе этих вероятностей.Ядро изобретения — использование вероятностей переходов между изображениями для определения релевантности меток.
Claim 2 и 3 (Зависимые от 1): Уточняют происхождение вероятностей навигации.
Вероятности навигации определяются с использованием степеней сходства (degrees of similarity) (Claim 2), которые, в свою очередь, определяются путем сравнения признаков (features) изображений (Claim 3).
Claims 4, 5, 6, 7 (Зависимые от 2): Описывают дополнительные факторы, влияющие на вероятность перехода.
Вероятность навигации может базироваться не только на визуальном сходстве, но и на:
Quality metrics (метрики качества изображения, такие как фокус, насыщенность) (Claims 4, 5).Relationship metrics (метрики связи между страницами, на которых размещены изображения) (Claim 6).Это критически важно: качество изображения и контекст его размещения влияют на его вес в графе.
Claim 11 (Зависимый от 1): Описывает итеративный характер расчета оценки (механизм VisualRank).
Определение оценки для изображения (Target) включает комбинирование оценок других изображений (Other), умноженных на вероятность перехода от Other к Target (probability adjusted scores).
Это математическое описание итеративного алгоритма распространения релевантности по графу, аналогичного PageRank.
Изобретение применяется преимущественно на этапе индексирования для обработки и анализа изображений.
CRAWLING – Сканирование и Сбор данных
Система получает изображения и исходный контент (метаданные, окружающий текст), используемый для генерации начальных меток.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента:
Image Features Module анализирует пиксели и извлекает визуальные признаки (Features). Также рассчитываются Image Quality Metrics.Image Similarity Module сравнивает признаки и строит граф визуального сходства.Probabilities Module определяет Transitional Probabilities между изображениями в графе, используя сходство, качество и контекст.Scoring and Ranking Module выполняет итеративный расчет (VisualRank, используя TRA/TRB) для определения финальных оценок релевантности меток.Image Indexing Module сохраняет изображения в Image Repository/Index, индексируя их по валидированным и взвешенным меткам.RANKING – Ранжирование
Image Search Server использует индекс с валидированными метками. Когда поступает запрос, система ищет и ранжирует изображения, используя эти уточненные данные.
Этап 1: Подготовка данных
Этап 2: Построение графа сходства
Similarity Score путем сравнения визуальных признаков.Similarity Score, Image Quality Metric и Relationship Metrics. Используется Бета-распределение для снижения вероятности перехода к почти дубликатам.Этап 3: Итеративное ранжирование меток (VisualRank)
Этап 4: Финализация
Global/Local Features (интенсивность, цвет, края, текстура, ключевые точки SIFT).Image Quality Metrics): цветовая глубина, уровень фокуса, насыщенность.Relationship Metrics (например, изображения с одного сайта).co-click data) для уточнения оценки Transitional Probability.Similarity Score, Image Quality Metric и Relationship Metrics. Предлагается использовать Бета-распределение от сходства.TRA (Стандартное случайное блуждание):
TRA(Mi,Q)=∑(P(Mj→Mi)∗TRA(Mj,Q))
TRB (Случайное блуждание с телепортацией): Аналогично стандартному PageRank, включает коэффициент затухания (d) и возможность телепортации к любому изображению, связанному с запросом Q.
TRB(Mi,Q)=[Teleportation]+d∗∑(P(Mj→Mi)∗TRB(Mj,Q))
Transitional Probabilities).Image Quality Metrics, такие как фокус, насыщенность) напрямую влияют на Transitional Probability (Claims 4, 5). Более качественные изображения получают преимущество.Relationship Metrics, Claim 6). Изображения с авторитетных или тематически связанных ресурсов могут получать преимущество.Transitional Probability (использование Бета-распределения) предполагает, что пользователи реже переходят к почти идентичным изображениям. Система предпочитает похожие, но не идентичные результаты.Image Quality Metrics (фокус, насыщенность) влияют на Transitional Probability, технически качественные изображения получают преимущество в алгоритме VisualRank и лучше ранжируются.Image Quality Metrics будут иметь низкую Transitional Probability, что снизит их эффективность в поиске по картинкам.Этот патент подчеркивает, что для Google Image Search визуальное содержание первично, а текст вторичен. Стратегия SEO должна фокусироваться на качестве и содержании самого визуального актива. Google способен кластеризовать изображения по визуальному сходству и определять канонические метки для всего кластера. Если оптимизированное изображение не попадает в релевантный визуальный кластер, оно не будет хорошо ранжироваться, независимо от текстовой оптимизации.
Сценарий: Оптимизация карточки товара в E-commerce
Задача: Продвинуть изображение нового смартфона «Pixel 9» в поиске по картинкам.
Transitional Probability).Что такое VisualRank, упоминаемый в связи с этим патентом?
VisualRank — это неофициальное название алгоритма, описанного в этом патенте. Это аналог PageRank, применяемый к изображениям. Вместо анализа ссылок между страницами, он анализирует визуальное сходство между изображениями. Релевантность меток и авторитетность изображений распространяются по графу визуально похожих картинок с помощью итеративного алгоритма случайного блуждания.
Означает ли этот патент, что Alt-text больше не важен для SEO изображений?
Нет, Alt-text остается важным сигналом. Он служит источником исходных меток (кандидатов) для инициализации алгоритма. Однако патент описывает механизм, который валидирует эти исходные метки на основе визуального содержания. Если Alt-text не соответствует тому, что изображено, он будет проигнорирован или его вес будет значительно снижен.
Что такое Transitional Probability и почему она важна?
Transitional Probability P(A→B) — это оценка вероятности того, что пользователь перейдет от изображения A к изображению B. Это вес ребра в графе изображений. Именно эти вероятности используются в алгоритме VisualRank для распространения релевантности меток. Она рассчитывается на основе визуального сходства, качества изображения B и связи между источниками A и B.
Как техническое качество изображения (например, резкость) влияет на SEO согласно патенту?
Патент явно указывает (Claims 4, 5), что метрики качества изображения (Image Quality Metrics, такие как фокус, насыщенность) используются при расчете Transitional Probability. Предполагается, что пользователи предпочитают переходить к более качественным изображениям. Следовательно, технически качественные изображения получают более высокий вес в алгоритме VisualRank и ранжируются лучше.
Как этот алгоритм борется с дубликатами изображений?
Патент предлагает использовать Бета-распределение при расчете вероятности перехода. Это означает, что вероятность перехода растет по мере увеличения сходства, но только до определенного момента. Если изображения становятся слишком похожими (почти дубликаты), вероятность перехода снижается. Это помогает системе предпочитать похожие, но разнообразные результаты, а не точные копии.
Влияет ли контекст размещения (сайт, страница) на ранжирование изображения?
Да. Патент упоминает (Claim 6) использование Relationship Metrics при расчете Transitional Probability. Изображения, размещенные на связанных ресурсах (например, на одном и том же сайте или тематически близких страницах), могут считаться более связанными, что увеличивает вероятность перехода между ними и влияет на итоговый ранг.
Как этот патент влияет на использование стоковых фотографий?
Стоковые фотографии часто являются точными дубликатами, что может привести к снижению Transitional Probability. Кроме того, если они используются в нерелевантном контексте, VisualRank не подтвердит их метки. Для SEO эффективнее использовать уникальные, качественные и строго релевантные изображения, которые визуально поддерживают контент страницы.
Может ли система присвоить изображению метку, которой не было в исходных данных (Alt-text, имя файла)?
Основной фокус патента (Claim 1) — ранжирование и валидация существующих меток. Он не описывает генерацию новых меток с нуля. Однако, путем анализа графа он может значительно усилить слабые метки и полностью отбросить сильные, если они не подтверждаются визуальным контентом, что изменяет итоговый набор ассоциаций в индексе.
Чем отличаются алгоритмы TRA и TRB, описанные в патенте?
TRA — это стандартный алгоритм случайного блуждания, основанный только на вероятностях перехода. TRB больше похож на классический PageRank: он включает коэффициент затухания (d) и возможность "телепортации" к любому изображению, связанному с запросом. TRB более стабилен и гарантирует сходимость алгоритма.
Актуальны ли методы анализа изображений (SIFT, гистограммы), упомянутые в патенте 2008 года?
Конкретные методы извлечения признаков (SIFT, гистограммы) сегодня в значительной степени заменены более продвинутыми технологиями на основе глубокого обучения (нейросетевые эмбеддинги). Однако сама архитектура системы — построение графа сходства и использование итеративного алгоритма для ранжирования меток — остается фундаментальной концепцией, не зависящей от конкретного метода расчета сходства.

Индексация
Мультимедиа
Семантика и интент

Семантика и интент
Мультимедиа
SERP

Мультимедиа
Семантика и интент
Индексация

Ссылки
Мультимедиа
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа

Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Семантика и интент

Индексация
Ссылки
SERP

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Индексация
Мультимедиа

Local SEO
Поведенческие сигналы

Поведенческие сигналы
SERP
