
Google анализирует визуальные характеристики изображений и строит граф сходства. Релевантные ключевые слова распространяются от размеченных изображений к похожим, но неразмеченным или плохо размеченным изображениям. Это позволяет поисковой системе понять реальное содержание картинки, основываясь на визуальных данных, и отфильтровать шум в метаданных или окружающем тексте.
Патент решает проблему низкой точности и зашумленности меток (ключевых слов), используемых для индексации изображений. Традиционные методы полагаются на текст, окружающий изображение, метаданные (например, Exif) или имена файлов. Эти данные часто бывают неинформативными (например, «круто», «wow»), отсутствуют или нерелевантны содержанию картинки. Это ухудшает качество результатов поиска по изображениям.
Запатентована система для автоматического аннотирования, уточнения и взвешивания терминов, ассоциированных с изображениями, на основе анализа их визуального сходства. Система строит Similarity Graph (Граф Сходства), где узлы — это изображения, а вес ребер — степень их визуального сходства. Затем релевантные термины распространяются (Term Propagation) по этому графу, позволяя системе определить наиболее точные ключевые слова на основе визуального контента.
Система работает в несколько этапов:
Image Features), например, с помощью SIFT или цветовых гистограмм.Degree of Similarity) между парами изображений.Similarity Graph, где ребра между изображениями взвешены по степени их сходства.Высокая. Точное понимание изображений на основе визуального контента критически важно для современных поисковых систем (Google Images, Google Lens). Описанный механизм, часто называемый VisualRank, и лежащие в его основе принципы (использование графовых структур и итеративное распространение сигналов) остаются фундаментальными в системах Information Retrieval для масштабируемого улучшения качества разметки изображений.
Патент имеет высокое значение для стратегий Image SEO. Он демонстрирует, что Google может определять тематику изображения, основываясь преимущественно на его визуальном содержании, потенциально корректируя или игнорируя оптимизированный ALT-текст или окружающий контент, если визуальные сигналы сильнее или противоречат тексту. Это подчеркивает критическую важность использования четких, релевантных и визуально консистентных изображений.
Image Features.Keypoints).Similarity Graph, который хранит исходные термины, ассоциированные с изображением. Он «внедряет» эти термины с начальным весом в соответствующий узел изображения.Injector Node.Degree of Similarity.Similarity Graph. Вес термина корректируется весом ребра при передаче.Term Propagation.Claim 1 (Независимый пункт): Описывает базовый метод ассоциации терминов с изображением.
degrees of similarity) между парами изображений (включая первое изображение и другие).respective weight). Этот вес основан на степенях сходства между первым изображением и другими изображениями.Claim 3 (Зависимый от 2 и 1): Уточняет, что сходство определяется путем идентификации и сравнения признаков (features) первого и второго изображений.
Claim 7 (Зависимый от 3): Уточняет тип признаков. Признаки являются масштабно-инвариантными (scale-invariant features), что соответствует методам типа SIFT.
Claim 8 (Зависимый от 1): Детализирует механизм присвоения весов через использование графа.
weighted graph data structure). Узлы соответствуют изображениям, ребра взвешены на основе степени сходства.propagating) к первому узлу. Вес термина присваивается на основе весов ребер, соединенных с этим узлом.Claim 16 (Независимый пункт): Описывает метод с явным акцентом на графовую структуру и процесс распространения (VisualRank).
Claim 25 (Независимый пункт): Описывает использование системы для определения поисковых запросов.
Similarity Graph.Similarity Graph (и веса сходства для конкретного изображения), чтобы идентифицировать набор терминов для поискового запроса.Изобретение применяется в инфраструктуре поисковой системы для улучшения качества индекса изображений.
CRAWLING – Сканирование и Сбор данных
На этом этапе система собирает изображения и связанный с ними контент (метаданные, окружающий текст), который используется для первоначальной ассоциации терминов (исходные данные для Injector Nodes).
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента.
Image Features Module анализирует пиксели и извлекает визуальные признаки (SIFT, гистограммы). Image Terms Module извлекает исходные текстовые термины.Image Similarity Module вычисляет Similarity Scores между парами изображений.Similarity Graph Module строит граф сходства.Image Indexing Module сохраняет уточненные и взвешенные термины в индексе (Image Repository).RANKING – Ранжирование
На этом этапе Image Search Module использует результаты работы алгоритма. Система сопоставляет запрос пользователя с уточненными терминами в индексе для поиска релевантных изображений.
Входные данные:
Выходные данные:
Term Weights).Этап А: Подготовка данных и построение графа
TF-IDF для фильтрации неинформативных терминов.SIFT, цветовые гистограммы).Similarity Score для каждой пары.Similarity Score. Ребра с низким весом могут быть удалены (elided) для оптимизации.Injector Nodes. Они соединяются с соответствующим узлом изображения однонаправленным ребром (например, с весом 1). Исходные термины помещаются в Injector Nodes.Этап Б: Итеративное распространение терминов (VisualRank)
Injector Nodes нормализуются (например, чтобы их сумма на узле равнялась 1).Injector Nodes) в предыдущей итерации, умноженных на вес ребра между M и N. Формула: .Этап В: Финализация
Система использует два основных типа данных: визуальные (для расчета сходства) и текстовые (для исходных меток).
Image Features: SIFT).Keypoints).Exif (title, description, keywords). Также используются для получения исходных терминов.Image Features. Патент упоминает различные методы: функции сравнения гистограмм (например, сумма абсолютных разностей бинов) или подсчет количества общих ключевых точек (shared keypoints), деленное на общее количество ключевых точек. Итоговая оценка может быть линейной комбинацией оценок по разным признакам.Similarity Score между двумя изображениями в графе.Term Propagation. Вес термина на узле зависит от весов этого термина на соседних узлах и весов соединяющих ребер.Similarity Graph. Это подход, аналогичный PageRank, но основанный на визуальном сходстве, а не на ссылках.SIFT, указывает на способность Google распознавать объекты независимо от масштаба, ракурса или освещения, что делает систему сходства очень точной.Image Features, Keypoints) и находить релевантные визуальные соответствия в Similarity Graph.Term Propagation.Injector Nodes. Точные исходные данные повышают вероятность того, что система подтвердит и усилит эти метки.Term Propagation) присвоит им низкий Term Weight, так как они не подтверждаются метками визуально похожих изображений.Image Features. Это снижает точность расчета сходства и эффективность аннотирования.Патент подтверждает стратегию Google на понимание контента напрямую (в данном случае, визуально), а не только через текстовые посредники. В контексте Image SEO это означает, что оптимизация смещается от работы с тегами к работе с самим визуальным активом. Долгосрочная стратегия должна включать создание качественного, уникального и консистентного визуального контента, который помогает поисковой системе правильно классифицировать объекты на изображениях.
Сценарий 1: Оптимизация карточки товара в E-commerce
Term Propagation термины «красное платье», «вечернее платье», «Модель X» с высоким весом переносятся на ваши изображения от авторитетных источников.Сценарий 2: Использование стокового фото в блоге (Негативный пример)
Similarity Graph оно сильно связано с сотнями других сайтов, использующих его в контексте «работа из дома», «фриланс», «онлайн-курсы».Injector Node), получает очень низкий вес.Что такое VisualRank и как он связан с этим патентом?
VisualRank — это неофициальное название подхода Google к анализу изображений, описанного в этом патенте (авторы патента также публиковали работы по VisualRank). Это применение логики алгоритма PageRank к изображениям. Вместо анализа гиперссылок система анализирует визуальное сходство. Если авторитетное (хорошо аннотированное) изображение А визуально похоже на изображение Б, оно передает свой авторитет и свои метки изображению Б.
Означает ли этот патент, что Alt-text и имена файлов больше не важны?
Нет, они критически важны. Alt-text, имена файлов и окружающий текст формируют исходный набор терминов, которые помещаются в Injector Nodes. Эти исходные данные являются "зерном" для всего процесса распространения. Чем точнее исходные данные, тем выше вероятность, что система быстро и правильно определит основные метки изображения, но система может их скорректировать, если они противоречат визуальным данным.
Как система определяет визуальное сходство?
Патент описывает использование различных визуальных признаков (Image Features): цвет, интенсивность, текстура, края. Особо выделяется использование локальных признаков, вычисляемых вокруг ключевых точек (Keypoints), например, с помощью алгоритма SIFT. Сходство (Similarity Score) рассчитывается путем сравнения этих признаков, например, через сравнение гистограмм или подсчет количества совпадающих ключевых точек.
Может ли этот алгоритм навредить, присвоив моему изображению неправильные ключевые слова?
Да, это возможно. Если ваше изображение визуально очень похоже на популярные изображения из другой тематики (например, вы используете популярное стоковое фото в нерелевантном контексте), система может перенести эти нерелевантные термины через Similarity Graph. Именно поэтому рекомендуется использовать уникальные и четкие изображения, соответствующие вашей тематике.
Как повлиять на процесс распространения терминов (Term Propagation)?
Напрямую повлиять сложно, но можно создать оптимальные условия. Во-первых, предоставляйте точные исходные метки (Alt-текст, Schema.org). Во-вторых, используйте визуально консистентные изображения для одной темы. Если у вас 10 фотографий одного объекта, убедитесь, что они похожи и все корректно подписаны. Они будут усиливать друг друга в Similarity Graph.
Что такое SIFT и почему он важен для SEO?
SIFT (Scale-Invariant Feature Transform) — это алгоритм компьютерного зрения для описания локальных особенностей изображения. Он устойчив к изменениям масштаба, освещения и поворота. Его упоминание означает, что Google может распознать объект на вашем фото, даже если он снят с другого ракурса или в другом масштабе, чем на других изображениях в индексе. Для SEO это подчеркивает важность наличия четких объектов на фото.
Применяется ли этот алгоритм в реальном времени при загрузке нового изображения?
Нет. Построение Similarity Graph для миллиардов изображений и выполнение итераций Term Propagation — это крайне ресурсоемкие процессы. Они выполняются в пакетном (batch) режиме для всего корпуса изображений во время обновления индекса, а не в реальном времени.
Как этот патент соотносится с современными AI моделями типа Google Lens или MUM?
Этот патент описывает более ранний подход, основанный на классическом компьютерном зрении (SIFT) и графовых алгоритмах. Современные модели (Lens, MUM, CLIP) используют глубокое обучение для создания сложных векторных представлений (embeddings), которые фиксируют семантику изображения гораздо глубже. Однако описанные здесь принципы — использование сходства для переноса информации — остаются актуальными и могут дополнять современные подходы.
Влияет ли качество и размер изображения на работу этого алгоритма?
Да, безусловно. Высокое качество и четкость изображения облегчают извлечение надежных визуальных признаков (Image Features) и ключевых точек (Keypoints). Это позволяет точнее рассчитать Similarity Score и найти действительно похожие изображения, что в итоге приводит к более точной ассоциации терминов.
Что произойдет, если мое изображение уникально и не имеет похожих аналогов в индексе?
Если изображение действительно уникально, Similarity Graph не найдет для него близких соседей (или вес ребер будет очень низким). В этом случае алгоритм Term Propagation окажет на него слабое влияние. Ранжирование такого изображения будет в большей степени зависеть от его исходных меток (alt-текст, окружающий контент).

Мультимедиа
SERP

Семантика и интент
Мультимедиа
SERP

Индексация
Мультимедиа
Семантика и интент

Мультимедиа
Семантика и интент
SERP

Индексация
Мультимедиа

Поведенческие сигналы
SERP

Мультиязычность
Поведенческие сигналы
Персонализация

Поведенческие сигналы
SERP

Local SEO
Антиспам
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Ссылки
Краулинг
Техническое SEO

Поведенческие сигналы
Антиспам
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

EEAT и качество
Свежесть контента
Семантика и интент
