
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
Патент решает две ключевые проблемы в поиске изображений. Во-первых, традиционный поиск по тексту может возвращать нерелевантные изображения, если связанный с ними текст (например, на веб-странице) неточно описывает контент картинки. Во-вторых, поиск на основе только визуального сходства (Query by Image) часто возвращает изображения, которые выглядят похоже, но семантически не связаны с тем, что интересует пользователя.
Запатентована система и метод для идентификации и ранжирования изображений в ответ на изображение-запрос (Query Image). Суть изобретения заключается в комбинации семантического анализа (используя текстовые метки Labels) и визуального анализа (используя Visual Similarity Scores). Система использует модель визуального сходства (Image Similarity Model), обученную на основе человеческих оценок (Similarity Feedback), и применяет несколько уровней постобработки и фильтрации (Ranking Refinement Rules) для обеспечения релевантности и однородности результатов.
Система работает в несколько этапов:
High Confidence Labels). Это делается путем анализа меток, связанных с визуально похожими изображениями, найденными в интернете.Visual Similarity Score относительно изображения-запроса с помощью модели, обученной на человеческих оценках. Оценка может быть повышена (boosted), если обнаружены общие отличительные признаки (Common Distinct Set of Image Feature Values).Relevance Scores (основанным на визуальном сходстве). Затем применяются правила фильтрации: удаляются изображения, не обладающие доминирующей характеристикой (Dominant Characteristic), или те, что не удовлетворяют условиям визуальной близости к другим результатам (Similarity Conditions).Высокая. Описанные механизмы лежат в основе современных систем обратного поиска по изображению (Reverse Image Search), таких как Google Lens и Search by Image. Комбинация визуальных и семантических сигналов, а также использование машинного обучения, тренированного на человеческих оценках для понимания визуального сходства, являются стандартом в этой области.
Патент имеет высокое значение для Image SEO. Он раскрывает, как Google определяет семантическое значение изображения (метки) и как оценивает визуальное сходство. Ключевой вывод: для успешного ранжирования в поиске по картинкам необходимо обеспечить, чтобы текст, окружающий изображение на вашем сайте, соответствовал консенсусу меток, которые Google находит на визуально похожих изображениях по всему интернету. Также важна визуальная четкость и наличие узнаваемых объектов.
Image Feature Scores) двух изображений.Visual Similarity Score. Обучается на основе Similarity Feedback Data.High Confidence Labels.Dominant Characteristic, Nearest Neighbor Condition), используемые для фильтрации и повышения качества финального набора результатов.Visual Similarity Score и, возможно, других сигналах (например, Relevance Feedback).Image Similarity Model.Image Feature Scores с помощью Image Similarity Model.Claim 1 (Независимый пункт): Описывает основной процесс поиска по изображению-запросу с использованием обученной модели и фильтрации.
query labels) для изображения-запроса.Visual Similarity Scores для кандидатов. Ключевой момент: модель сходства обучается на основе пользовательских оценок (user similarity feedback) — когда пользователи указывают, какое из двух изображений более похоже на эталонное — и расстояний между признаками (feature distances).Relevance Scores на основе визуального сходства.nearest neighbors — наиболее визуально похожих изображений) с изображением-запросом.Защищается система "Query by Image", которая использует семантические сигналы (метки) для первичного отбора и модель визуального сходства, обученную на человеческих оценках, для ранжирования. Также защищен механизм фильтрации по общим ближайшим соседям для обеспечения визуальной консистентности выдачи.
Claim 7 (Зависимый): Детализирует механизм повышения оценки (Boosting).
common distinct set of image feature values), указывающий на наличие одного и того же объекта.Visual Similarity Score кандидата усиливается (умножается на boost factor).Система способна распознавать идентичные объекты (например, конкретные товары или достопримечательности) и агрессивно повышать такие результаты в выдаче.
Claim 8 (Зависимый): Детализирует механизм фильтрации по доминирующей характеристике.
dominant characteristic), присутствующая в изображении-запросе и пороговом числе топовых кандидатов (например, "черно-белое изображение").Это механизм для обеспечения однородности выдачи. Если запрос и большинство результатов черно-белые, цветное изображение может быть удалено, даже если оно похоже по содержанию.
Патент описывает работу вертикального поиска по изображениям (Image Search Vertical).
INDEXING – Индексирование и извлечение признаков
На этом этапе система вычисляет и сохраняет Image Feature Scores (цвет, текстура, SIFT и т.д.) для индексируемых изображений. Также извлекаются исходные метки (Initial Labels) из окружающего текста, метаданных и anchor-текстов.
RANKING (L1 Retrieval) – Ранжирование (Отбор кандидатов)
Процесс начинается с получения или генерации High Confidence Labels для Query Image. Эти метки используются как текстовые запросы для быстрого отбора семантически релевантных кандидатов из индекса изображений.
RANKING (L2/L3 Scoring) – Ранжирование (Оценка)
На этом этапе система использует Image Similarity Model (обученную офлайн на Similarity Feedback Data) для расчета Visual Similarity Scores отобранных кандидатов относительно Query Image. Применяется механизм Boosting, если обнаружены Common Distinct Set of Image Feature Values. Рассчитываются финальные Relevance Scores.
RERANKING – Переранжирование
Финальный этап, на котором применяются Ranking Refinement Rules для улучшения качества и однородности выдачи. Сюда входят фильтрация по Dominant Characteristic и проверка условий сходства (Similarity Conditions), таких как Nearest Neighbor Condition (Claim 1) или Co-distance Condition.
Входные данные:
Query Image).Image Feature Scores и Labels.Image Similarity Model.Выходные данные:
Result Images).High Confidence Labels для изображения-запроса.Процесс А: Обработка запроса (Ранжирование)
High Confidence Labels для Query Image (см. Процесс Б).Candidate Images.Image Feature Scores и с помощью Image Similarity Model рассчитывается Visual Similarity Score.Common Distinct Set of Image Feature Values. Если найден, оценка визуального сходства усиливается.Relevance Scores (на основе визуального сходства и, возможно, других сигналов).Relevance Scores.Nearest Neighbor Condition или Co-distance Condition). Изображения, не удовлетворяющие условиям (аутлаеры), удаляются.Result Images предоставляется пользователю.Процесс Б: Генерация High Confidence Labels (Может выполняться офлайн или онлайн)
Initial Labels (из метаданных, окружающего текста, данных о похожих изображениях).Visual Similarity Score найденных изображений относительно исходного.Relevance Score (учитывая авторитетность источников, Relevance Feedback, визуальное сходство источника метки).High Confidence Labels.Процесс В: Обучение Image Similarity Model (Офлайн)
Similarity Feedback Data) о том, какое изображение (А или Б) пользователи считают более похожим на эталон.Image Feature Scores.Feature Distances между тренировочными изображениями и эталоном.alt-атрибуты, хотя в патенте явно не указаны, но подразумеваются как metadata), заголовок веб-страницы. Используются для генерации Initial Labels.Initial Labels.Relevance Feedback (например, CTR изображений в поиске). Используется при расчете Relevance Scores для меток и, возможно, для финального ранжирования изображений.Similarity Feedback Data (человеческие оценки сходства триплетов). Критически важны для обучения Image Similarity Model.Image Feature Scores. Включают цвет (color histograms), текстуру, края (edges), SIFT (scale-invariant feature transform), geometric blur. Вычисляются на разных масштабах (image scales).Feature Distances между двумя изображениями с использованием Image Similarity Model (например, скалярное произведение вектора расстояний и вектора весов модели).Visual Similarity Score, если обнаружен Common Distinct Set of Image Feature Values.Visual Similarity Score, может включать другие сигналы.High Confidence Labels. Учитывает количество и авторитетность веб-страниц, использующих метку, Relevance Feedback, и Visual Similarity Score изображения, с которым связана метка.Initial Labels. Может основываться на авторитетности источника, количестве похожих изображений с такой же меткой, количестве различных кластеров изображений с этой меткой.Labels) для первичного отбора кандидатов, а визуальное сходство (Visual Similarity Score) — для основного ранжирования.High Confidence Labels показывает, что Google определяет семантику изображения, анализируя, как это изображение (и визуально похожие на него) описывается на разных сайтах в интернете. Текст на одной конкретной странице может быть переопределен глобальным консенсусом.Image Similarity Model обучается на прямых пользовательских оценках (Similarity Feedback). Это значит, что система стремится имитировать человеческое восприятие сходства.Common Distinct Set), она применяет Boost Factor. Это дает преимущество изображениям с четкими, узнаваемыми объектами (товары, логотипы).Ranking Refinement Rules. Изображение должно не только быть похожим на запрос, но и вписываться в общий набор результатов (по Dominant Characteristic и Similarity Conditions).alt-текст) точно описывает то, что изображено. Этот текст должен соответствовать тому, как этот объект обычно описывается в интернете, чтобы Google мог корректно сформировать High Confidence Labels.Common Distinct Set of Image Feature Values для применения Boosting, использование четких изображений с хорошо различимыми объектами повышает шансы на высокое ранжирование при поиске по этому объекту.Query Images, поданным пользователями.High Confidence Labels нивелирует эту тактику, так как она ищет консенсус среди визуально похожих изображений, игнорируя аномальные метки.Image Feature Scores и снижают вероятность обнаружения Common Distinct Set, что негативно сказывается на Visual Similarity Score.Этот патент подчеркивает стратегическую важность интеграции Image SEO в общую стратегию контент-маркетинга. Он демонстрирует, что для Google изображение и его текстовый контекст неразрывно связаны через механизм перекрестной валидации в вебе. Понимание того, как Google использует визуальное сходство для определения семантики, позволяет создавать более эффективный контент, который будет хорошо работать как в стандартном поиске, так и в вертикали по изображениям, а также в системах типа Google Discover и Lens.
Сценарий: Оптимизация карточки товара (e-commerce)
Image Feature Scores и повышает шанс активации Boost Factor, если пользователь ищет именно эту модель.alt-тексте используется точное название модели (например, "Samsung Galaxy S25 Ultra Titanium Blue").High Confidence Label "Samsung Galaxy S25 Ultra Titanium Blue". Изображение получает высокие шансы ранжироваться по запросам, связанным с этой меткой, и при поиске по картинке этой модели.Как Google определяет, что означает изображение, если на моей странице текст отличается от других сайтов?
Система использует механизм генерации High Confidence Labels. Она анализирует не только вашу страницу, но и все найденные в интернете визуально похожие изображения. Если текст на вашей странице сильно отличается от того, как этот визуальный объект описывается на большинстве других сайтов (консенсус), система может проигнорировать ваши метки и использовать те, которые считает более достоверными на основе глобального анализа.
Что такое "Модель визуального сходства, обученная на человеческих оценках"?
Это означает, что Google не просто сравнивает технические параметры (пиксели, цвета). Система обучается на основе Similarity Feedback: людям показывали три картинки и спрашивали, какая из двух больше похожа на первую. Модель настраивает веса различных визуальных признаков (цвет, форма, текстура), чтобы её оценка сходства максимально соответствовала человеческому восприятию.
Что такое "Boosting" за "Common Distinct Set" и как это использовать в SEO?
Это механизм повышения оценки сходства, если система обнаруживает идентичный уникальный объект на двух изображениях (например, Эйфелеву башню или конкретную модель кроссовок). В SEO это означает, что для товаров, логотипов или уникального контента критически важно использовать четкие, качественные изображения, на которых объект хорошо узнаваем, чтобы система могла его идентифицировать и применить этот бустинг.
Что такое фильтрация по "Dominant Characteristic"?
Это правило для обеспечения однородности выдачи. Если изображение-запрос и большинство топовых результатов имеют общую черту (например, все являются "рисунками" или "черно-белыми фото"), то система может удалить из выдачи изображение, которое этой чертой не обладает (например, цветное фото), даже если оно похоже по содержанию. Это помогает сделать выдачу более визуально консистентной.
Как система использует текст для поиска по картинке?
Текст (в виде High Confidence Labels) используется на первом этапе — для отбора кандидатов (Retrieval). Если изображение семантически не связано с метками запроса, оно не попадет в кандидаты. Однако финальное ранжирование отобранных кандидатов в большей степени зависит от визуального сходства (Visual Similarity Score).
Влияет ли этот патент на ранжирование в обычном веб-поиске?
Патент напрямую описывает работу вертикали Image Search. Однако он дает важное понимание того, как Google интерпретирует семантику изображений. Эта интерпретация (понимание, что изображено на картинке) может использоваться как сигнал качества и релевантности контента в основном веб-поиске, а также в таких сервисах, как Google Discover.
Что важнее для Image SEO согласно этому патенту: alt-текст или визуальное качество?
Важны оба аспекта. Текстовый контекст (включая alt) помогает сформировать Initial Labels и повлиять на High Confidence Labels. Визуальное качество и четкость напрямую влияют на расчет Visual Similarity Score и возможность получения Boosting. Одно не работает без другого: некачественное изображение с хорошим текстом получит низкую оценку сходства, а качественное изображение с неверным текстом может получить нерелевантные метки.
Как бороться с тем, что мои уникальные изображения ассоциируются с неправильными метками?
Если Google присваивает неверные метки, это значит, что либо контекст на вашей странице вводит систему в заблуждение, либо визуально ваше изображение похоже на другие объекты. Необходимо усилить семантические сигналы на странице: сделать текст более точным, использовать структурированные данные (Schema.org/Product или ImageObject) и убедиться, что контент страницы в целом соответствует тематике изображения.
Что такое условие "Nearest Neighbor Condition" в ранжировании?
Это правило фильтрации, которое требует, чтобы изображение-кандидат имело определенное количество общих "ближайших соседей" (самых похожих картинок) с изображением-запросом. Если кандидат похож на запрос, но его ближайшие соседи совсем другие, он считается выбросом (аутлаером) и может быть удален из выдачи. Это повышает общую визуальную связанность результатов.
Использует ли система распознавание лиц?
Патент не упоминает распознавание лиц напрямую, но упоминает Image Feature Scores, которые могут включать детекцию объектов. Также упоминается, что если пороговое число изображений включает человеческое лицо, то характеристика "face" может быть определена как Dominant Characteristic для фильтрации результатов.

Семантика и интент
Мультимедиа
Персонализация

Мультимедиа
Семантика и интент
Индексация

Мультимедиа
Семантика и интент

Семантика и интент
Knowledge Graph
Мультимедиа

Мультимедиа
Семантика и интент
SERP

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
EEAT и качество
SERP

Ссылки
SERP
Индексация

Ссылки
Антиспам
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
Семантика и интент
SERP

Local SEO
Поведенческие сигналы
Семантика и интент

Безопасный поиск
Поведенческие сигналы
Семантика и интент

EEAT и качество
Антиспам
Ссылки

Антиспам
SERP
Поведенческие сигналы
