
Google использует механизм поиска, принимающий на вход два или более изображения. Система анализирует их для выявления общих атрибутов (стиль, цвет, тип объекта) и генерирует векторные представления (эмбеддинги). Если изображения вводятся последовательно, система вычисляет «траекторию» интереса пользователя в векторном пространстве и проецирует поиск в этом направлении, чтобы найти результаты, соответствующие эволюционирующему визуальному интенту.
Патент решает ограничения традиционного поиска по одному изображению, который часто чрезмерно фокусируется на точном совпадении, ограничивая обнаружение альтернатив. Одиночный визуальный поиск может также выдавать результаты по нерелевантным признакам (например, поиск по фото знаменитости может вернуть другие фото этой знаменитости, а не одежду, которую искал пользователь). Система устраняет неоднозначность визуального интента, позволяя пользователям уточнять поиск с помощью нескольких изображений, комбинировать визуальные концепции или указывать направление поиска.
Запатентована система поиска, которая обрабатывает запросы, состоящие из нескольких изображений (multi-image query). Система определяет намерение пользователя путем анализа комбинации входных изображений. Это достигается двумя основными методами: 1) определением общих атрибутов (shared attributes) между изображениями; 2) использованием моделей эмбеддингов (embedding models) для анализа взаимосвязей и траекторий поиска в векторном пространстве, особенно когда изображения предоставляются последовательно.
Система работает по нескольким сценариям:
Высокая. Визуальный поиск (например, Google Lens) и мультимодальные запросы становятся ключевыми элементами взаимодействия пользователей с поисковыми системами, особенно в e-commerce и контент-дискавери. Описанные механизмы уточнения поиска через последовательные визуальные взаимодействия и комбинирование концепций напрямую отражают текущие тренды развития поисковых технологий на основе ИИ и векторного поиска.
Патент имеет высокое значение (85/100) для SEO, особенно в нишах, зависящих от визуальной составляющей (e-commerce, мода, дизайн, недвижимость). Он показывает, как Google может интерпретировать сложные визуальные интенты. Для SEO это подчеркивает критическую важность качества, разнообразия и четкости атрибутов изображений на сайте, а также необходимость оптимизации под векторный поиск, чтобы продукты и контент корректно располагались в пространстве эмбеддингов и могли быть найдены через сложные мульти-изображенческие запросы.
Claim 1 (Независимый пункт): Описывает основную систему мульти-изображенческого поиска, комбинирующую анализ атрибутов и временную проекцию эмбеддингов.
shared attributes) между ними.user interaction time) с Первым изображением предшествовало времени взаимодействия со Вторым.Ядро изобретения в Claim 1 заключается в использовании последовательности взаимодействия пользователя (временных данных) для вычисления Третьего Эмбеддинга, что подразумевает анализ направления или эволюции поискового намерения.
Claim 11 (Независимый пункт, Метод): Детализирует метод поиска на основе эмбеддингов с фокусом на временной последовательности.
Claim 12 (Зависимый от 11): Уточняет, как именно вычисляется Третий Эмбеддинг при последовательном вводе.
Третий Эмбеддинг определяется на основе вычисленной проекции (determined projection) от Первого Эмбеддинга ко Второму. Третий Эмбеддинг является продолжением (continuation) этой проекции. Это математическое описание того, как система предсказывает следующий шаг пользователя в векторном пространстве, следуя тренду, заданному переходом от первого изображения ко второму.
Claim 16 (Независимый пункт): Описывает процесс уточнения поиска (Search Refinement) с использованием механизма проекции.
Изобретение затрагивает несколько этапов поисковой архитектуры, в основном фокусируясь на интерпретации сложных визуальных запросов и ранжировании.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно обработать контент (изображения) для извлечения признаков, которые используются в патенте:
Embedding model для создания векторных представлений и их сохранение в индексе (вероятно, векторном индексе для быстрого поиска ближайших соседей).QUNDERSTANDING – Понимание Запросов
Это ключевой этап применения патента. Система интерпретирует мульти-изображенческий ввод для определения истинного намерения пользователя.
shared attributes и/или вычисление Third Embedding (усредненного или проекционного). Это формирует внутреннее представление запроса.RANKING – Ранжирование
На этапе ранжирования (вероятно, L1 Retrieval или L2) система использует вычисленное представление запроса для поиска кандидатов.
shared attributes.Входные данные:
First Image Data, Second Image Data).User interaction time).Выходные данные:
Search Result(s)), релевантных комбинации входных изображений.Алгоритмы применяются при следующих условиях:
Projection prediction активируется, когда система обнаруживает последовательное взаимодействие (время T1 раньше времени T2), что указывает на эволюцию интента.Embedding average может применяться, когда изображения вводятся одновременно или когда не требуется предсказание следующего шага, а нужно найти компромиссный вариант.Описаны два основных варианта работы системы.
Вариант А: Поиск по общим атрибутам (Claim 1)
shared attributes.Вариант Б: Поиск с проекцией эмбеддингов (Claims 1, 11, 12, 16)
Embedding model для генерации Эмбеддинга 1 (E1) и Эмбеддинга 2 (E2).Патент фокусируется на обработке визуальных данных и контекста взаимодействия.
User interaction time. Время ввода или выбора каждого изображения критически важно для определения последовательности и активации механизма проекции поиска.shared attributes (например, текстовых меток).Embedding model.Projection prediction), и предсказать следующий шаг.User interaction time) используется не просто для логирования, а как прямой сигнал для выбора алгоритма обработки запроса (усреднение vs. проекция). Последовательность ввода определяет интерпретацию интента.Shared attributes могут быть как явными (одинаковая классификация объекта), так и абстрактными (общий стиль, эстетика, узор). Система стремится выявить ключевую точку интереса пользователя на основе того, что общего у выбранных изображений.Embedding space.Ensemble search) и исключение признаков (Negative search), что делает визуальный поиск гораздо более мощным инструментом.shared attributes.shared attributes. Убедитесь, что ALT-тексты, заголовки и описания точно соответствуют визуальному контенту.Embedding model.Патент подтверждает переход Google к более интуитивным и сложным методам поиска, выходящим за рамки ключевых слов и простых изображений. Стратегическое значение заключается в понимании того, что оптимизация теперь включает в себя управление тем, как ваш контент представлен в векторном пространстве. Для E-commerce SEO это означает, что необходимо думать не только о том, как пользователь найдет конкретный товар, но и о том, как он может прийти к нему через цепочку визуальных уточнений или комбинирование визуальных концепций. Построение сильного визуального бренда и обеспечение согласованности визуальных атрибутов становится фактором ранжирования.
Сценарий 1: Уточнение поиска через проекцию (Search Refinement & Projection)
Сценарий 2: Поиск по общим атрибутам (Shared Attributes)
shared attributes: Цвет (Красный), Стиль (Ретро/Элегантный).Что такое «Проекция поиска» (Projection prediction) в контексте этого патента?
Это механизм, который активируется, когда пользователь вводит изображения последовательно. Система интерпретирует переход от первого изображения ко второму как направление или тренд в векторном пространстве. Вместо того чтобы искать похожие на второе изображение, система вычисляет вектор изменения и «продолжает» движение в этом направлении, генерируя Третий Эмбеддинг. Это позволяет предсказать, что пользователь захочет увидеть дальше по мере уточнения своего визуального интента.
Как система определяет «Общие атрибуты» (Shared Attributes) между разными изображениями?
Патент описывает несколько методов. Это может включать обработку изображений с помощью ML-моделей для выявления совпадающих визуальных признаков (цвета, текстуры, узоры) или классификаций объектов. Также могут использоваться текстовые метки, полученные из метаданных изображений или с веб-страниц, на которых они размещены. Цель — найти то общее, что связывает выбранные пользователем изображения.
В чем разница между усреднением эмбеддингов и проекцией эмбеддингов?
Усреднение (Embedding average) используется для нахождения компромиссного результата, который находится «между» входными изображениями в векторном пространстве. Это полезно, когда нужно найти нечто среднее. Проекция (Projection embedding) используется, когда нужно следовать тренду или направлению, заданному последовательным вводом изображений. Проекция пытается предсказать следующий шаг пользователя, а не найти среднее значение.
Какую роль играет время взаимодействия пользователя (User interaction time)?
Время взаимодействия является критически важным сигналом для выбора стратегии обработки запроса. Если система видит, что Изображение 1 было введено раньше Изображения 2 (T1 < T2), это служит триггером для активации механизма Проекции поиска. Это позволяет системе понять, что пользователь уточняет свой запрос, а не просто вводит несколько разных изображений одновременно.
Как этот патент влияет на SEO для E-commerce сайтов?
Влияние значительно. Это подчеркивает необходимость иметь высококачественные, разнообразные и четкие изображения товаров. Чтобы товары хорошо ранжировались в таком типе поиска, они должны корректно представляться в пространстве эмбеддингов и обладать четкими визуальными атрибутами. Оптимизация под визуальный поиск становится ключевым элементом стратегии, особенно для товаров, выбираемых по стилю, цвету или дизайну.
Может ли эта система использоваться для комбинирования признаков из разных изображений?
Да, патент упоминает Ensemble search (Ансамблевый поиск). Это сценарий, когда пользователь хочет найти комбинацию деталей из разных изображений. Например, пользователь может выбрать первое изображение из-за объекта (например, форма дивана), а второе изображение из-за визуального признака (например, узор обивки), и система попытается найти диван такой формы с таким узором.
Как SEO-специалист может оптимизировать изображения, чтобы они лучше работали с этой системой?
Необходимо сосредоточиться на качестве и четкости. Используйте высокое разрешение, обеспечьте хорошее освещение, показывайте товар с разных ракурсов и делайте крупные планы важных деталей (текстура, фурнитура). Также важно следить за тем, чтобы окружающий текст и метаданные точно описывали визуальные атрибуты, так как они могут использоваться системой для подтверждения визуальных признаков.
Означает ли этот патент, что Google использует векторный поиск для всех изображений?
Патент демонстрирует, что векторный поиск (поиск на основе эмбеддингов) является ключевой технологией для реализации мульти-изображенческого поиска и сложных визуальных запросов. Хотя традиционные методы поиска по изображениям все еще могут использоваться, этот патент подтверждает стратегическую важность и активное применение моделей эмбеддингов и векторных индексов в инфраструктуре визуального поиска Google.
Может ли эта система использоваться для исключения признаков (Негативный поиск)?
Да, патент упоминает такую возможность. Пользователь может выбрать изображение и указать, что он хочет исключить результаты с определенными деталями, присутствующими на этом изображении. Система может использовать эмбеддинг этого изображения для фильтрации или понижения в ранжировании результатов, которые находятся слишком близко к нему в векторном пространстве.
Где на практике можно увидеть работу этого патента?
Наиболее вероятные места применения — это Google Lens, функции визуального поиска в Google Покупках (Shopping) и в основном Поиске по картинкам. Например, функции уточнения поиска в Lens, когда пользователь выбирает объект на фото, а затем выбирает один из результатов для дальнейшего поиска, могут использовать механизмы проекции, описанные в этом патенте.

Мультимедиа
Индексация
Семантика и интент

Семантика и интент
Мультимедиа
SERP

Мультимедиа
Индексация
Семантика и интент

Мультимедиа
Семантика и интент
SERP

Семантика и интент
Индексация
Мультимедиа

Семантика и интент
Ссылки

Local SEO
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа

Персонализация
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Local SEO

EEAT и качество
Ссылки

Ссылки
Структура сайта
Семантика и интент

Мультиязычность
Поведенческие сигналы
Персонализация

Knowledge Graph
Семантика и интент
Ссылки

Антиспам
Ссылки
Техническое SEO
