
Google использует систему для визуального поиска похожих товаров. Система обнаруживает лицо на изображении, удаляет фон и участки кожи, чтобы изолировать предмет одежды. Затем, используя размер лица для нормализации масштаба, извлекаются небольшие фрагменты текстуры. Они обрабатываются нейронной сетью для классификации узора (игнорируя цвет) и создается цветовая гистограмма. Это позволяет находить визуально похожие товары.
Патент решает проблему неточности систем визуального поиска при анализе изображений, содержащих отвлекающие элементы. В контексте E-commerce (одежда) традиционные методы часто ошибочно учитывают фон, лицо модели или её позу вместо характеристик самого товара (узор, цвет). Изобретение направлено на точную изоляцию предмета одежды, нормализацию его масштаба и эффективную характеризацию визуальных признаков.
Запатентована система и метод характеризации изображений путем изоляции и анализа релевантного объекта (одежды). Метод включает агрессивное удаление фона, лиц и участков кожи для выделения ключевого фрагмента (clothing subsection). Критическим элементом является нормализация масштаба этого фрагмента с использованием размера обнаруженного лица как эталона. Затем система использует обучаемую сеть (например, Convolutional Neural Network) для анализа стандартизированных по размеру патчей (fixed-size patches) для генерации характеристик узора.
Система работает как конвейер обработки изображений:
Watershed). Обнаруживается лицо (например, Haar-wavelets). Анализируется тон кожи лица, и все участки кожи удаляются. Выделяется оставшийся крупнейший фрагмент (одежда).fixed-size patches (например, 32x32 пикселя).gray scaling) и подаются в нейронную сеть для классификации узора. Результат агрегируется в Pattern category histogram.Color histogram.Similarity engine для поиска визуально похожих изображений в базе данных.Высокая. Визуальный поиск (Google Lens, Google Images, Product Search) является критически важным компонентом поиска, особенно для E-commerce. Описанные методы, включая использование сверточных нейронных сетей (CNN), анализ патчей и продвинутое извлечение признаков, лежат в основе современных систем компьютерного зрения, используемых Google для понимания содержания изображений товаров.
Влияние на SEO значительно (8/10), но специфично для Image SEO и E-commerce. Патент описывает конкретный механизм, который Google может использовать для определения визуального сходства товаров. Он подчеркивает, что система активно пытается игнорировать модель и фон, фокусируясь исключительно на узоре и цвете самого продукта. Это напрямую влияет на то, как должны быть оптимизированы изображения товаров для максимальной видимости в визуальном поиске.
Color analysis module.Tanh) и слоев субдискретизации (Max-pooling).Clothing Subsection для анализа нейронной сетью.Similarity Engine.Claim 1 (Независимый пункт): Описывает основной процесс характеризации изображения и поиска похожих изображений одежды.
characterization data) для множества изображений, включая feature record с категориями узоров (pattern categories).characterization data для входного изображения, включающая строгую последовательность шагов: clothing subsection). Этот шаг требует удаления фона, удаления лица И удаления других участков кожи.fixed size patches).learning network для генерации feature record (характеристики узора).Ядром изобретения является специфический конвейер нормализации и характеризации. Ключевые моменты: использование размера лица для стандартизации масштаба, агрессивная сегментация для изоляции одежды и использование специализированной нейронной сети, которая анализирует узор независимо от цвета (color-blind pattern recognition).
Claims 17-18 (Зависимые): Уточняют, что система также генерирует Color Histogram, и поиск учитывает как узор, так и цвет.
Claims 19-20 (Зависимые): Уточняют, что система может определять расстояние между лицом и одеждой (face to clothing distance) и использовать это при выборе похожих изображений (позволяет классифицировать тип одежды).
Патент описывает инфраструктуру системы визуального поиска (например, Google Lens, Google Images), затрагивающую этапы индексирования и ранжирования.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения. Когда система индексирует изображения (из фидов товаров или веба), она применяет описанный конвейер. Происходит обнаружение лиц, сегментация, масштабирование, обработка CNN и анализ цвета. Полученные Pattern category histogram и Color histogram сохраняются в базе данных (Image Database) как метаданные (characterization data).
RANKING – Ранжирование (Retrieval)
Когда пользователь выполняет визуальный поиск, входное изображение проходит через тот же конвейер извлечения признаков в реальном времени. Полученные гистограммы затем используются Similarity engine для быстрого поиска (Retrieval) и ранжирования предварительно обработанных изображений из индекса, которые имеют схожие характеристики.
Входные данные:
Выходные данные:
Pattern category histogram (Feature record).Color histogram.face to clothing distance), возраст/пол модели.Процесс обработки изображения (Индексирование или Запрос)
Watershed method).Haar-wavelets).Gray scaling).Pattern Category Histogram.Color Analysis Module для генерации Color Histogram.Similarity Engine (например, используя LSH).Система использует исключительно данные, содержащиеся в самом изображении.
k-means) и генерации Color Histogram.k-means в пространстве HSV для идентификации и удаления участков кожи.grayscaled patches). Анализ цвета выполняется отдельно. Система распознавания узоров является "цветонезависимой" (color-blind).fixed-size patches), что делает анализ устойчивым к складкам и позам.patches). Узоры должны быть достаточно четкими, чтобы даже небольшой патч (32x32 пикселя) был репрезентативным.Watershed method), чистый контраст облегчает точную сегментацию и изоляцию clothing subsection.Color Histogram является отдельным фактором для поиска, цвета на фотографии должны точно соответствовать реальному товару.fixed-size patches будут содержать артефакты сжатия, а не реальный узор, что ухудшит характеризацию.Патент подтверждает, что для SEO изображений в E-commerce визуальные характеристики (узор, цвет) являются основными факторами для определения сходства в системах визуального поиска (Google Lens). Он подчеркивает важность оптимизации под машинное зрение. Стратегия должна фокусироваться на том, чтобы помочь Google легко изолировать и проанализировать сам товар на фотографии.
Сценарий: Оптимизация изображения полосатого платья для визуального поиска
Означает ли этот патент, что Google игнорирует лицо модели при поиске изображений?
И да, и нет. Система активно использует лицо для двух целей: для определения тона кожи (чтобы удалить остальные части тела) и для нормализации масштаба изображения. Однако после этого само лицо и личность модели игнорируются при анализе узора и цвета одежды. Цель состоит в том, чтобы найти похожую одежду, а не похожего человека.
Как Google стандартизирует масштаб изображений, сделанных с разного расстояния?
Патент описывает конкретный метод нормализации масштаба для фотографий с людьми. Система определяет размер лица на изображении и использует его как эталон. Затем фрагмент одежды (clothing subsection) масштабируется пропорционально этому размеру. Это гарантирует, что анализируемые фрагменты (patches) имеют одинаковый физический масштаб, независимо от кадрирования фото.
Что лучше для Image SEO: использовать фотографии с моделями или только продукт (flat lay)?
Описанный в патенте (Claim 1) метод специально разработан для обработки изображений с моделями и полагается на обнаружение лица. Наличие модели помогает системе понять масштаб и лучше изолировать одежду. Поэтому для работы именно этого алгоритма предпочтительны фотографии с моделями. Рекомендуется использовать оба типа фотографий в карточке товара, так как Google использует множество алгоритмов.
Имеет ли значение фон изображения для Image SEO согласно этому патенту?
Да, имеет. Хотя патент описывает методы удаления фона (например, Watershed method), сложный или шумный фон может затруднить точную сегментацию и изоляцию предмета одежды. Для наилучших результатов рекомендуется использовать чистый, контрастный фон, который облегчает системе задачу изоляции продукта.
Как анализируются узор и цвет? Это один процесс?
Нет, это два отдельных процесса. Анализ узора выполняется сверточной нейронной сетью (CNN), которая обрабатывает небольшие патчи, преобразованные в оттенки серого (grayscaled). Анализ цвета выполняется отдельно модулем Color Analysis Module, который создает Color Histogram. Это позволяет системе находить совпадения как по узору, так и по цвету независимо.
Что такое "Патч" (Patch) и почему Google его использует?
Patch — это небольшой фрагмент изображения фиксированного размера (например, 32x32 пикселя). Использование множества таких патчей вместо анализа всего изображения позволяет нейронной сети эффективнее обучаться распознаванию текстур и узоров, независимо от формы одежды или позы модели. Это также увеличивает объем обучающих данных.
Какой тип нейронной сети описан в патенте?
Описана сверточная нейронная сеть (Convolutional Neural Network, CNN). Архитектура включает несколько сверточных слоев для выделения признаков (фильтры), слои нелинейности (tanh) для повышения обучаемости и слои пулинга (max-pooling) для уменьшения размерности. Финальные слои представляют собой многослойный персептрон (MLP) для классификации.
Что произойдет, если на фото нет лица?
Основной метод (Claim 1) требует наличия лица. Если лицо не обнаружено, в описании патента упоминается альтернативный, менее точный метод (S112-S118). Он полагается на обнаружение краев и поиск самой большой области с однородным цветом и узором. Нормализация масштаба по лицу в этом случае не производится.
Насколько детализированной должна быть текстура изображения?
Текстура должна быть достаточно четкой, чтобы при извлечении небольшого фрагмента (fixed-size patch, например 32x32 пикселя) узор был различим. Изображения очень низкого разрешения или с сильными артефактами сжатия могут привести к неточной классификации узора нейронной сетью.
Может ли эта система определить тип одежды (например, юбка или футболка)?
Да. В патенте (Claims 19-20 и описание S308) упоминается определение класса одежды на основе расстояния и расположения лица относительно извлеченного фрагмента (face to clothing distance). Например, если фрагмент находится близко к лицу, это, вероятно, верхняя часть одежды. Эта информация может использоваться как фильтр при поиске.

Мультимедиа
Индексация
Google Shopping

Индексация
Мультимедиа

Мультимедиа
SERP
Поведенческие сигналы

Семантика и интент
Мультимедиа
SERP

Мультимедиа
Ссылки

Семантика и интент
Индексация
Структура сайта

SERP
Семантика и интент
EEAT и качество

Local SEO
Поведенческие сигналы
Свежесть контента

Персонализация
EEAT и качество
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Мультимедиа
EEAT и качество
Ссылки

Семантика и интент
Персонализация
EEAT и качество

Knowledge Graph
Свежесть контента
Семантика и интент

Ссылки
Мультиязычность
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа
