
Google использует метод квантования "Shape-Gain" для повышения точности и скорости поиска похожих изображений. Система разделяет векторы признаков на направление (Shape/Форма, определяющее визуальный паттерн) и магнитуду (Gain/Усиление, определяющее интенсивность). Раздельное кодирование этих компонентов позволяет создавать более точные компактные коды (хэши) для эффективного сравнения миллиардов изображений.
Патент решает проблему эффективности и точности поиска похожих элементов (в первую очередь, изображений) в сверхбольших базах данных. Предыдущие методы генерации компактных бинарных хэш-кодов (Binary Hash Codes) часто сталкивались с "потолком производительности" (performance ceiling), когда точность переставала улучшаться с увеличением длины кода. Патент определяет, что это ограничение вызвано игнорированием "ошибки магнитуды" (Magnitude Error) – искажения информации о длине (интенсивности) вектора при кодировании.
Запатентована система квантования векторов, называемая "Shape-Gain" (Форма-Усиление). Суть изобретения заключается в разделении исходного вектора признаков на два независимых компонента: направление (Shape или Angle) и магнитуду (Gain или Magnitude). Каждый компонент кодируется отдельно для минимизации соответствующих ошибок, что позволяет создать более точные компактные сигнатуры (скетчи) для быстрого поиска.
Система работает следующим образом:
Shape) и компонент магнитуды (Gain).PCA (для снижения размерности) и модифицированная итеративная квантизация (ITQ) для оптимизации вращения данных перед бинаризацией.k-means, для минимизации ошибки магнитуды.Высокая. Векторный поиск (Vector Search) и эффективные методы квантования являются фундаментом современных систем информационного поиска, особенно для мультимедиа (Google Images, Google Lens) и семантического поиска. Хотя методы генерации исходных векторов эволюционировали (например, нейросетевые эмбеддинги вместо упомянутых GIST или BoW), необходимость в их эффективном сжатии и быстром поиске остается критически важной.
Влияние на SEO умеренное (5/10) и касается в основном Image SEO. Патент является инфраструктурным и не описывает факторы ранжирования веб-страниц. Однако он раскрывает базовую технологию, которую Google использует для оценки визуального сходства в масштабе. Это важно для функций поиска по картинке, обнаружения дубликатов и визуального поиска товаров. Понимание механизма подчеркивает, что индексируется не только сам визуальный паттерн (Shape), но и его интенсивность/контрастность (Gain).
Magnitude трактуется как норма/интенсивность вектора. Однако в Claim 1 она определяется как "позиция визуального аспекта внутри изображения". В Claims 17/18 упоминаются атрибуты пикселя (цвет, интенсивность и т.д.). Метод адаптируется к разным интерпретациям.Magnitude Error).Claim 1 (Независимый пункт): Описывает основной метод поиска похожих изображений с использованием раздельного кодирования.
query vector).Claim 6 (Зависимый от 1): Детализирует процесс кодирования направления (Shape), соответствующий применению PCA и ITQ.
eigenvectors) (Шаги PCA).Claim 8 (Зависимый от 6): Уточняет цель вращения (Шаг ITQ).
Вращение выполняется для минимизации средней разницы угла (Angle Error) между исходным вектором и его закодированным направлением.
Claim 9 (Зависимый от 1): Детализирует процесс кодирования магнитуды (Gain) с использованием скалярного квантования.
Применяется кластеризация k-means clustering к магнитудам. Центры кластеров выбираются так, чтобы минимизировать сумму расстояний (Magnitude Error) между магнитудами и ближайшим центром.
Claims 12 и 13 (Зависимые): Описывают оптимизацию вычислений.
Для ускорения поиска генерируются предварительно вычисленные таблицы поиска (look-up tables) для магнитуд и углов. Расстояние определяется с использованием этих таблиц.
Этот патент описывает инфраструктурные процессы, связанные с индексацией и поиском мультимедийного контента (в первую очередь, изображений).
INDEXING – Индексирование и извлечение признаков
Основной этап применения.
GIST, BoW).Shape-Gain Sketches). Это включает обучение и применение PCA, ITQ и k-means. Коды сохраняются в индексе для быстрого поиска.RANKING – Ранжирование (Этап L1 Retrieval / Отбор кандидатов)
Механизм используется на самом первом этапе поиска в системах, требующих быстрого сравнения визуального сходства (Image Search, Google Lens).
Hamming Distance и таблицы поиска) до миллиардов кодов в базе данных.Входные данные:
Database Vectors).Query Vector).Выходные данные:
Shape-Gain Sketches).Процесс А: Индексирование и Обучение (Офлайн)
PCA для уменьшения размерности и минимизации Projection Error.ITQ) для минимизации Angle Error при последующей бинаризации.k-means clustering к значениям магнитуд для определения оптимальных центров скалярного квантования (минимизация Magnitude Error).Shape-Gain Sketches.look-up tables для быстрого расчета расстояний.Процесс Б: Поиск (Онлайн)
Query Vector и его преобразование в Shape-Gain Sketch с использованием предобученных параметров. (Возможен также асимметричный поиск, где запрос не квантуется).Патент фокусируется на обработке векторов признаков, а не на традиционных SEO-факторах.
GIST и Bag of Words (BoW). Эти векторы инкапсулируют информацию о текстуре, цвете, форме и контрастности изображения.k-means – минимизировать MSE.ITQ – максимизировать этот косинус (минимизировать угол).
Magnitude Error) было идентифицировано как ключевое ограничение предыдущих методов.ITQ для Shape, k-means для Gain) позволяет сохранить больше информации в компактном бинарном коде и повысить точность поиска.look-up tables позволяет проводить сравнение с миллиардами изображений в реальном времени.Magnitude (интенсивность признака, его позиция на изображении или атрибут пикселя), что указывает на гибкость применения метода к разным типам признаков.Патент является инфраструктурным. Практические выводы касаются исключительно Image SEO и основаны на понимании того, как система интерпретирует и сравнивает визуальное содержание.
Gain (интенсивность) может быть закодирован некорректно, что затруднит сопоставление.Патент подтверждает стратегический приоритет Google на понимание контента на уровне пикселей, а не только через метаданные (alt-text) и окружающий текст. Это фундаментальная технология, обеспечивающая инфраструктуру для масштабирования визуального поиска (Visual Search). Для SEO-специалистов это подчеркивает растущую важность оптимизации под такие интерфейсы, как Google Lens и блоки визуального поиска товаров.
Сценарий: Оптимизация изображений товаров для E-commerce под Визуальный Поиск
Shape) будут закодированы точно. Хороший контраст и детализация гарантируют, что интенсивность признаков (Gain) будет также корректно зафиксирована в векторном представлении.Что такое "Форма" (Shape) и "Усиление" (Gain) в контексте изображения?
"Форма" (Shape или направление вектора) представляет собой основной визуальный паттерн – контуры, текстуру, распределение объектов. "Усиление" (Gain или магнитуда вектора) представляет интенсивность этого паттерна – насколько он выражен, контрастен или ярок. Патент утверждает, что для точного поиска важно кодировать оба компонента раздельно.
Почему раздельное кодирование Shape и Gain лучше стандартного хеширования?
Стандартные методы часто игнорируют магнитуду (Gain), фокусируясь только на направлении (Shape). Это приводит к значительной ошибке магнитуды (Magnitude Error), которая ограничивает общую точность поиска – возникает "потолок производительности". Раздельное кодирование позволяет оптимизировать ошибки для Shape и Gain независимо, что дает более точное представление исходного вектора в сжатом коде.
Влияет ли этот патент на ранжирование в обычном веб-поиске?
Нет, прямого влияния нет. Патент описывает инфраструктурный механизм для быстрого поиска по схожести (Information Retrieval), который используется для отбора кандидатов в системах визуального поиска, таких как Google Images или Google Lens. Он не описывает алгоритмы ранжирования веб-страниц.
Как этот патент связан с нейросетями и эмбеддингами?
Современные системы используют нейросети для создания векторных представлений данных – эмбеддингов. Эти эмбеддинги имеют высокую размерность и требуют много ресурсов для хранения и поиска. Метод Shape-Gain – это техника сжатия (квантования) этих эмбеддингов в компактные бинарные коды для их эффективного хранения и быстрого поиска.
Поможет ли этот механизм обнаружить дубликаты изображений?
Да, это одна из основных задач подобных систем. Генерация точных компактных кодов и быстрое вычисление расстояний позволяет эффективно находить полные дубликаты и близкие копии (near-duplicates) изображений в масштабах всего интернета, что улучшает дедупликацию контента.
Нужно ли SEO-специалистам оптимизировать изображения специально под Shape-Gain?
Нет, напрямую оптимизировать под алгоритм квантования невозможно. Однако, поскольку система анализирует Shape (форму) и Gain (интенсивность), следует предоставлять высококачественные, четкие и контрастные изображения. Это гарантирует, что исходные векторы признаков будут точными, что улучшит видимость в визуальном поиске.
Влияет ли этот патент на важность атрибута alt или имени файла?
Патент не упоминает текстовые факторы. Alt-атрибуты и имена файлов остаются критически важными для Image SEO, так как они помогают понять контекст и семантику изображения. Описанная технология отвечает за визуальное сопоставление, а текстовые факторы – за семантическое ранжирование по ключевым словам.
Что такое ITQ (Iterative Quantization), упоминаемое в патенте?
ITQ – это метод, который находит оптимальное вращение данных перед их квантованием в бинарный код. Вращение помогает минимизировать ошибку квантования. В данном патенте ITQ используется специфически для минимизации угловой ошибки (Angle Error) при кодировании компонента Shape (направления).
В патенте есть разночтения в определении "Magnitude". Что это значит?
Это указывает на вариативность реализации, описанную в патенте. В основном описании Magnitude трактуется как норма (длина) вектора признаков (интенсивность). В Claims (Формуле изобретения) упоминаются альтернативные варианты для изображений, где Magnitude может означать позицию признака на изображении или атрибут пикселя. Это показывает гибкость метода.
Применим ли этот метод для поиска похожих текстов или видео?
Да, технология универсальна и применима к любым данным, представленным в виде векторов. Если текст или видео преобразованы в векторные эмбеддинги, метод Shape-Gain может быть использован для их сжатия и быстрого поиска похожих документов или видеофрагментов, аналогично тому, как он используется для изображений.

Мультимедиа
SERP
Семантика и интент

Индексация
Семантика и интент

Семантика и интент
Индексация

Мультимедиа

Индексация
Мультимедиа

Ссылки
Индексация
Краулинг

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
SERP
EEAT и качество

Семантика и интент
Поведенческие сигналы
Local SEO

Поведенческие сигналы
Индексация
SERP

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Антиспам
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP
