
Google применяет технологию компьютерного зрения для улучшения поиска изображений по именам людей. Система анализирует топ выдачи, распознает лица и группирует похожие изображения. Определив доминирующий кластер (искомого человека), система переранжирует результаты: визуально похожие изображения повышаются, а "выбросы" (фото других людей) понижаются, игнорируя противоречивые текстовые сигналы.
Патент решает проблему появления «выбросов» (outlier images) в результатах поиска изображений по запросам, содержащим имена людей. Эта проблема возникает, когда стандартные алгоритмы ранжирования слишком полагаются на внешние сигналы, такие как текстовые подписи, теги изображений или поведенческие метрики (selection rates/CTR). В результате в топе могут оказаться изображения, которые текстуально релевантны, но визуально изображают другого человека. Изобретение направлено на обеспечение визуальной консистентности выдачи.
Запатентована система корректировки ранжирования в Image Search, основанная на компьютерном зрении. Система анализирует визуальное содержание уже отобранных результатов, генерирует временные шаблоны лиц (facial templates) и кластеризует их. Определив визуальный консенсус (inlier cluster), система переранжирует выдачу, отдавая приоритет изображениям, которые соответствуют этому консенсусу, и понижая визуальные выбросы.
Механизм активируется на этапе пост-обработки результатов поиска:
facial templates.inlier cluster (предполагаемое лицо искомого человека).inlier score — степень его схожести с эталонным кластером (с учетом дедупликации).inlier score повышаются, а с низким — понижаются.Высокая. Использование компьютерного зрения для валидации и уточнения результатов поиска является стандартом в современных поисковых системах. Хотя конкретные методы распознавания лиц могли эволюционировать с момента подачи патента (например, к нейросетевым эмбеддингам), базовая концепция использования визуальной кластеризации для обеспечения релевантности в поиске по сущностям (людям) крайне актуальна.
Влияние значительно (7/10) в контексте Image Search. Патент демонстрирует механизм, при котором визуальный анализ может переопределить традиционные сигналы ранжирования (ALT-теги, подписи, CTR). Если изображение визуально не соответствует консенсусу выдачи по имени человека, оно будет понижено как outlier, независимо от качества текстовой оптимизации. Это критически важно для ORM и продвижения контента, связанного с персоналиями.
Facial Templates имеют оценку схожести, превышающую порог дублирования (duplicate threshold). Это могут быть идентичные или слегка измененные (например, кадрированные) версии одного фото.temporary) и не сохраняются в памяти (not persisted to memory).Facial Template конкретного изображения с шаблонами изображений из Inlier Cluster.Celebrity Query).Inlier Cluster.Claim 1 (Независимый пункт): Описывает основной метод корректировки результатов.
Search Scores.Facial Template (не сохраняемый в памяти).Inlier Cluster.Inlier Score (схожесть с Inlier Cluster).Inlier Scores.Ключевое уточнение в Claim 1: При определении Inlier Score, если изображения, принадлежащие к Inlier Cluster, определены как дубликаты друг друга, то для расчета используется только одно изображение из этой группы дубликатов.
Claim 5 и 6 (Зависимые): Детализируют обработку дубликатов.
Система вычисляет попарные оценки схожести (pairwise similarity scores). Пары, превышающие duplicate threshold, группируются как дубликаты; остальные считаются уникальными (Claim 5). Inlier scores рассчитываются на основе уникальных изображений и только одного представителя из каждой группы дубликатов (Claim 6).
Claim 9 (Зависимый): Уточняет расчет Inlier Score.
Inlier Score определяется как мера схожести центральной тенденции (central tendency similarity measure) — например, среднее или медианное значение схожести с изображениями из Inlier Cluster.
Claim 10 (Зависимый): Определяет область применения.
Метод применяется к изображениям, релевантным Name Query, который указывает имя человека и соответствует Popularity Threshold.
Изобретение применяется в системе поиска по изображениям (Image Search) и затрагивает финальные этапы обработки запроса.
RANKING – Ранжирование
На этом этапе генерируется исходный набор изображений с их Search Scores, основанными на стандартных сигналах (текст, теги, поведенческие факторы). Эти данные служат входом для системы корректировки.
RERANKING – Переранжирование
Основная область применения патента. Модуль Image Adjuster активируется после основного ранжирования:
Query Filter проверяет, является ли запрос подходящим (например, популярный Name Query).Feature Extractor анализирует визуальный контент и генерирует временные Facial Templates.Image Clusterer группирует результаты и определяет Inlier Cluster.Score Adjuster рассчитывает Inlier Scores и выполняет финальное переранжирование.Офлайн-процессы (Preprocessing / INDEXING)
Патент упоминает, что для популярных запросов корректировки могут быть рассчитаны заранее (pre-processed) и кэшированы для ускорения ответа. Обновление может происходить периодически (например, раз в день).
Входные данные:
Search Scores.Выходные данные:
Name Queries (запросы с именами людей).Name Query и, в некоторых реализациях, превышает Popularity Threshold (Claim 10).at query time), возможно, с ограничением на Топ-N результатов для скорости, или в режиме предварительной обработки (pre-processed).Этап 1: Инициализация и Извлечение признаков
Feature Extractor обрабатывает изображения. Для каждого обнаруживается лицо и генерируется временный Facial Template. Изображения без лиц исключаются из процесса.Этап 2: Кластеризация и Обработка дубликатов
pairwise similarity scores) между всеми шаблонами.duplicate threshold, группируются как дубликаты. Остальные помечаются как уникальные.Image Clusterer группирует изображения на основе схожести шаблонов.Этап 3: Идентификация эталона
Inlier Cluster.Этап 4: Расчет Inlier Score
Inlier Score.Inlier Cluster.Inlier Cluster.Этап 5: Переранжирование и Выдача
Score Adjuster корректирует исходные Search Scores, применяя функции повышения (Boost) или понижения (Demote) на основе Inlier Scores.Facial Templates удаляются из памяти.Facial Templates. Анализируются машиночитаемые свойства структур лица.Query Logs используются для определения популярности запроса (Popularity Threshold). Также упоминаются Selection rates (CTR) как фактор исходного ранжирования, который данный патент стремится скорректировать.Image tags и подписи (captions) также упоминаются как факторы исходного ранжирования, которые могут приводить к появлению выбросов.Inlier Cluster, рассчитываемая как central tendency similarity measure.Если IS>IST1 (Порог бустинга):
Adj_Scorej=SSj∗(B∗(ISj−IST1)+1)
Если IS<IST2 (Порог демоутинга):
Adj_Scorej=SSj∗max((D∗(ISj−IST2)+1),SD)
Где: B – фактор бустинга; D – фактор демоутинга; SD – фактор сильного демоутинга.
Inlier Score. Это повышает точность определения эталона и оценки схожести.Facial Templates являются временными и не сохраняются в памяти, что важно для обеспечения конфиденциальности при обработке биометрических данных.Facial Template и увеличивает вероятность получения высокого Inlier Score.outliers.Facial Template, исключая изображение из процесса бустинга.Патент подтверждает стратегическую важность компьютерного зрения в поиске. Google интерпретирует визуальное содержание и использует эту интерпретацию для верификации релевантности, особенно при поиске сущностей (людей). Для SEO это означает, что в Image Search фактическое визуальное содержание изображения становится важнее его метаданных. Это критично для управления репутацией (ORM) и видимости брендов/персон.
Сценарий: Очистка выдачи по имени знаменитости от фото партнера.
Name Query.Inlier Cluster.Inlier Score, так как не похожи на Кластер А, и понижаются в выдаче. Фотографии John Famous повышаются.Применяется ли этот механизм ко всем запросам в поиске по картинкам?
Нет. Патент указывает, что механизм предназначен для именных запросов (Name Queries), особенно тех, которые касаются популярных личностей и превышают определенный порог популярности (Popularity Threshold). Для общих или неодушевленных запросов этот механизм не используется.
Что такое Inlier Cluster и как он определяется?
Inlier Cluster — это самая большая группа изображений среди результатов поиска, лица на которых визуально похожи друг на друга. Система предполагает, что этот кластер представляет искомого человека, и использует его как визуальный эталон для оценки всех остальных изображений в выдаче.
Как система обрабатывает дубликаты изображений?
Дубликаты обрабатываются очень тщательно (Claims 1, 5, 6). Система идентифицирует их через попарное сравнение Facial Templates. При расчете Inlier Score используется только один представитель из группы дубликатов. Это предотвращает искажение эталонного кластера из-за множества копий одной и той же фотографии.
Что произойдет, если я оптимизирую ALT-теги и заголовки, но использую фото другого человека?
Ваше изображение может попасть в первоначальную выдачу благодаря текстовой оптимизации. Однако затем механизм переранжирования сравнит его с Inlier Cluster. Поскольку визуально оно не соответствует искомому человеку, оно получит низкий Inlier Score и будет понижено в ранжировании.
Влияет ли качество изображения на работу этого алгоритма?
Да, косвенно. Для работы алгоритма необходимо успешное детектирование лица и генерация Facial Template. Если изображение низкого качества или лицо плохо видно, система может не справиться с этой задачей. В этом случае изображение исключается из процесса корректировки и его ранг не изменяется этим алгоритмом.
Сохраняет ли Google данные о лицах (Facial Templates)?
Согласно патенту (Claim 1), система генерирует временные шаблоны лиц (temporary face templates), которые «не сохраняются в памяти» (not persisted to memory). Они используются на лету для кластеризации и расчета оценок, а затем удаляются.
Что произойдет, если в выдаче нет явного доминирующего кластера (например, 50/50)?
Патент рассматривает ситуацию равенства размеров кластеров. Предлагаются варианты решения: случайный выбор одного из кластеров; анализ базовых оценок качества (quality scores) изображений в кластерах и выбор лучшего; оценка «плотности» (tightness) кластеров; или объединение этих кластеров.
Может ли этот механизм понизить релевантное изображение искомого человека?
Да, если оно сильно отличается от большинства других его фотографий в выдаче (например, очень старое фото или необычный грим). Если оно не попадет в Inlier Cluster и сформирует отдельный маленький кластер, оно может быть классифицировано как outlier и понижено.
Работает ли система в реальном времени?
Патент описывает оба варианта. Система может работать в реальном времени (at query time), анализируя Топ-N результатов для скорости. Также для очень популярных запросов анализ может выполняться заранее (pre-processed), а результаты кэшироваться и периодически обновляться.
Каково стратегическое значение этого патента для SEO?
Стратегическое значение заключается в подтверждении того, что для Image Search визуальное содержание имеет приоритет над метаданными при поиске сущностей (людей). Это требует от SEO-специалистов фокусироваться на качестве и фактической релевантности мультимедийного контента, а не только на оптимизации тегов.

Мультимедиа
Семантика и интент
SERP

Семантика и интент
Мультимедиа
SERP

Мультимедиа
Семантика и интент
SERP

Мультимедиа
SERP

Персонализация
Мультимедиа
Поведенческие сигналы

Мультимедиа
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Антиспам
Краулинг

Персонализация
Семантика и интент
SERP

Персонализация
Поведенческие сигналы
SERP

Мультиязычность
Поведенческие сигналы
SERP

Knowledge Graph
Поведенческие сигналы
Персонализация

Ссылки
SERP
EEAT и качество

Поведенческие сигналы
