
Google использует этот механизм для повышения точности идентификации объектов при поиске по изображению. Система находит множество визуально похожих изображений, загруженных пользователями (UGC), и анализирует их текстовые метки. Метки группируются по смыслу, а затем эти группы ранжируются на основе совокупной визуальной релевантности. Это позволяет определить наиболее вероятное название объекта, опираясь на коллективное мнение.
Патент решает проблему неоднозначности и шума при идентификации объектов в системах визуального поиска, которые используют пользовательский контент (UGC). Когда пользователи загружают изображения одного и того же объекта, они часто используют разные формулировки, синонимы или допускают ошибки в текстовых метках (labels или annotations). Цель изобретения — агрегировать эти разнообразные метки, определить наиболее релевантную и достоверную идентификацию объекта и представить результаты поиска в упорядоченном виде.
Запатентована система обработки запросов по изображению (Image Query), которая определяет идентичность объекта, опираясь на механизм консенсуса меток из базы UGC. Вместо выбора метки одного наилучшего визуального совпадения, система группирует метки всех релевантных совпадений по семантической схожести. Затем эти группы ранжируются на основе агрегированных оценок визуальной релевантности, и метка лидирующей группы выбирается в качестве ответа.
Система работает следующим образом:
Image Match Score (оценку визуальной релевантности).Geo-boost).edit distance и анализ семантической близости, и объединяет похожие метки в группы (кластеры).Group Score путем агрегации (например, суммирования или усреднения) Image Match Scores всех изображений в этой группе.Group Score. Метка группы с наивысшим рейтингом (Representative Annotation) предоставляется пользователю как результат идентификации объекта.Высокая. Визуальный поиск (Google Lens) является стратегическим направлением развития Google. Идентификация объектов, товаров и мест по фотографии — ключевая функция мобильного поиска в 2025 году. Механизмы, описанные в патенте для агрегации и валидации данных на основе коллективного мнения (UGC меток), критически важны для обеспечения точности и масштабируемости таких систем.
Патент имеет высокое значение (75/100) для стратегий оптимизации под Визуальный поиск (Visual Search Optimization, VSO). Он демонстрирует, как Google определяет каноническое название для визуальных объектов, используя консенсус. Это критически важно для E-commerce и Локального SEO. Понимание этого процесса подчеркивает важность обеспечения того, чтобы визуальное представление продукта или сущности соответствовало общепринятым текстовым наименованиям, а также важность географических сигналов и качества изображений.
Image Match Score, если географическое расстояние между местом загрузки изображения и текущим местоположением пользователя, отправившего запрос, невелико.Image Match Scores изображений в группе (например, сумма или среднее значение).Group Score, которая возвращается пользователю в качестве результата поиска.Claim 1 (Независимый пункт): Описывает основной метод идентификации объекта на основе агрегации и ранжирования пользовательских меток.
query image.submitted images (загруженных другими пользователями), которые визуально похожи на query image.query relevance score (визуальное сходство) и (ii) связанная с ним annotation (метка).query relevance scores изображений, входящих в эту группу.representative annotation.representative annotation предоставляется пользователю на странице результатов поиска.Ядро изобретения — использование визуальной релевантности (Query Relevance Score) в качестве весового коэффициента для каждой аннотации. Метка, поддержанная наиболее сильными визуальными доказательствами (т.е. изображениями, которые лучше всего соответствуют запросу), побеждает в ранжировании.
Claim 2 (Зависимый): Уточняет механизм группировки. Группировка основана на определении edit distances или similar meanings между аннотациями. Это подтверждает использование как синтаксического, так и семантического анализа для кластеризации меток.
Claim 3 (Зависимый): Уточняет формат вывода. Система может предоставить ранжированный список репрезентативных аннотаций из нескольких групп, упорядоченный по агрегированным оценкам. Это позволяет показать пользователю самые популярные варианты идентификации.
Claim 4 (Зависимый): Описывает механизм обеспечения разнообразия (Diversity) и защиты от спама. Если несколько похожих изображений были загружены одним и тем же пользователем, в финальный набор включается только одно из этих изображений. Это предотвращает доминирование одного источника.
Claim 5 (Зависимый): Указывает на использование географических сигналов. Отбор похожих изображений может основываться на geographical locations, откуда эти изображения были загружены.
Claim 8 (Зависимый): Уточняет метод агрегации оценок (Нормализация). Агрегированная оценка может являться средним значением (average) оценок релевантности для всех изображений в группе. Это помогает сбалансировать влияние размера группы.
Изобретение применяется в системах визуального поиска, таких как Google Lens, где пользователь использует изображение для получения информации.
INDEXING – Индексирование и извлечение признаков
На этом этапе система обрабатывает пользовательский контент (UGC). Сохраняются изображения, текстовые метки (Labels) и метаданные (геолокация, ID пользователя). Извлекаются визуальные признаки для последующего сравнения.
RANKING – Ранжирование
При получении Image Query система выполняет поиск визуально похожих изображений в индексе. Вычисляются базовые Image Match Scores (Query Relevance Scores) для кандидатов.
RERANKING – Переранжирование
Основная логика патента реализуется здесь, компонентом Match Aggregator:
Image Match Scores могут быть скорректированы с учетом географической близости (Geo-boost).Contributor).Representative Annotation.Входные данные:
Image Query).Выходные данные:
Representative Annotations (текстовых идентификаций объекта), ранжированный по Group Score.Geo-boost повышает значимость для локального SEO.Процесс обработки запроса по изображению:
Image Query от пользователя.Content Submissions в базе UGC. Для каждого результата рассчитывается Image Match Score.Image Match Scores корректируются на основе географического расстояния между пользователем и источником изображения (применение Geo-boost factor).Image Match Score для каждого уникального автора.edit distance и/или семантический анализ (similar meanings).Group Score путем агрегации (суммирования) Image Match Scores всех результатов в группе.Group Scores могут быть нормализованы (например, расчет среднего значения) и отсортированы по убыванию.Representative Annotation и предоставляется пользователю.Патент описывает использование следующих типов данных:
Labels/Annotations), связанные с изображениями в базе UGC. Используются для группировки и идентификации объекта.Geo-boost).Contributor), загрузившего контент. Используется для обеспечения разнообразия результатов (фильтрация дубликатов от одного автора).Image Match Score. Рассчитывается как функция расстояния: чем меньше расстояние, тем выше фактор.Edit distance (например, Левенштейна) для синтаксической близости.similar meanings) для учета синонимов.Image Match Scores результатов в группе.Image Match Score является критически важной метрикой. Чем лучше изображение соответствует запросу визуально, тем больший вес имеет его текстовая метка при расчете Group Score.edit distance и анализ семантической близости (similar meanings), что позволяет объединять синонимы, опечатки и близкие формулировки в один кластер.Geo-boost) является явным фактором повышения релевантности, что критично для локального визуального поиска.Contributor (не более одного лучшего результата на автора), что повышает надежность консенсуса.Image Match Score, что является основой ранжирования в этой системе.Geo-boost дает явное преимущество результатам, находящимся поблизости от пользователя.Group Score.Contributor.Image Match Scores и снизят видимость в визуальном поиске.Патент подтверждает растущую важность визуального поиска и интеграцию различных типов сигналов (визуальных, текстовых, географических, пользовательских) для интерпретации контента. Стратегия SEO должна учитывать, как сущности (продукты, места) распознаются визуально. Понимание того, что идентификация опирается на агрегированное коллективное мнение, подчеркивает важность управления консистентностью брендинга во всех точках контакта, включая UGC и сторонние площадки.
Сценарий: Идентификация модели товара в E-commerce через Google Lens
Image Query).Image Match Score = 25.Image Match Score = 10.Group Score. Система возвращает пользователю Representative Annotation: «Nike Air Max 90 Infrared».Image Match Score) и сопровождаются точным названием модели в тексте и разметке, чтобы соответствовать доминирующей группе меток.Какое отношение этот патент имеет к Google Lens?
Патент напрямую описывает механизмы, лежащие в основе систем типа Google Lens. Он объясняет, как система обрабатывает фотографию пользователя (Image Query) и идентифицирует объект, сравнивая его с базой данных и агрегируя текстовые метки (Labels) похожих изображений для достижения консенсуса и выбора наилучшего ответа.
Означает ли это, что Google активно использует пользовательский контент (UGC) для ранжирования?
Да, в контексте визуального поиска. Патент явно описывает использование базы данных Content Submissions (изображения и метки, загруженные пользователями) для ответа на запросы. Система агрегирует метки из UGC, чтобы определить идентичность объекта, что делает пользовательский контент критически важным источником данных для VSO.
Как система определяет, какие метки объединить в одну группу, если они написаны по-разному?
Система использует два основных подхода: Edit Distance (расстояние редактирования, которое учитывает опечатки и близкие написания) и Similar Meanings (семантическая близость). Это позволяет объединять синонимы и различные формулировки (например, «автомобиль» и «машина»), относящиеся к одному и тому же объекту.
Как рассчитывается оценка группы (Group Score)? Это сумма или среднее?
Group Score рассчитывается путем агрегации Image Match Scores (оценок визуального сходства) всех изображений в группе. Патент упоминает, что это может быть сумма оценок, но также указывает на возможность использования среднего значения (Claim 8), что служит механизмом нормализации.
Что такое «Geo-boost» и как он влияет на локальное SEO?
Geo-boost — это механизм повышения оценки результата, если географическое расстояние между пользователем, отправившим запрос, и местом, где было сделано/загружено найденное изображение, невелико. Это критически важно для локального SEO, так как при визуальном поиске (например, фотографировании здания) приоритет будет отдан локально релевантным результатам.
Можно ли манипулировать выдачей, загружая много изображений с нужной меткой?
Патент предусматривает защиту от таких манипуляций (Claim 4). Описан механизм обеспечения разнообразия, который фильтрует результаты так, чтобы от каждого уникального пользователя (Contributor) учитывался только один наилучший результат. Это предотвращает доминирование одного источника в формировании консенсуса.
Что важнее для визуального поиска согласно этому патенту: качество изображения или его текстовое описание?
Оба фактора критически важны и взаимосвязаны. Качество и четкость изображения необходимы для получения высокого Image Match Score (визуального сходства). Однако финальная идентификация объекта зависит от того, насколько это изображение и похожие на него последовательно маркируются в текстовых метках (Labels).
Как этот патент влияет на оптимизацию изображений в E-commerce?
Для E-commerce это подчеркивает необходимость использования четких изображений продуктов и обеспечения консистентности наименований. Если ваши изображения продукта визуально релевантны, а ваше наименование соответствует тому, как его называют пользователи (UGC) и конкуренты, вы увеличиваете шансы на попадание в доминирующий кластер и получение трафика из визуального поиска.
Если объект имеет несколько правильных названий, какое выберет Google?
Google выберет то название, которое связано с группой изображений, набравшей наивысший итоговый Group Score. Это означает выбор варианта, который поддержан наибольшим весом визуальных доказательств (т.е. связан с наиболее визуально релевантными изображениями). Система опирается на взвешенный консенсус.
Влияет ли этот механизм на традиционный поиск по картинкам (по текстовому запросу)?
Патент сфокусирован исключительно на поиске по изображению (Query-by-Image). Он не описывает механизмы ранжирования изображений в ответ на текстовый запрос. Однако он дает ценное понимание того, как Google интерпретирует, кластеризует и классифицирует визуальный контент, связывая его с сущностями.

Семантика и интент
Мультимедиа
SERP

Индексация
Мультимедиа

Мультимедиа
SERP
Семантика и интент

Мультимедиа
SERP

Семантика и интент
Knowledge Graph
Мультимедиа

Индексация
Техническое SEO
Структура сайта

Поведенческие сигналы
Семантика и интент
EEAT и качество

Knowledge Graph
Семантика и интент
Ссылки

EEAT и качество
Свежесть контента
Семантика и интент

Local SEO
Антиспам
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа
