
Google использует систему компьютерного зрения для определения основного предмета на изображении, содержащем несколько объектов. Система ранжирует распознанные объекты, отдавая предпочтение тем, которые крупнее по размеру, расположены ближе к центру кадра и меньше перекрываются другими элементами. Это напрямую влияет на индексацию и ранжирование в Google Images и Google Lens.
Патент решает проблему определения основного предмета (intended subject) изображения, когда системы компьютерного зрения идентифицируют в нем несколько объектов. Например, если на фотографии есть человек, собака и здание, системе необходимо понять, какой из этих объектов является наиболее важным. Существовавшие технологии могли распознать объекты, но не определяли их относительную важность.
Запатентована система и метод для ранжирования объектов, обнаруженных на одном изображении. После того как объекты идентифицированы и определены их границы (bounded regions или bounding boxes), система вычисляет оценку ранжирования (Rank Score) для каждого объекта. Эта оценка базируется на геометрических характеристиках границ: размере, расположении относительно центра и степени перекрытия.
Система работает на этапе после распознавания объектов:
Image Processing Apparatus анализирует изображение и предоставляет список объектов, их классов и границ (bounded regions), а также, опционально, оценку уверенности распознавания (Accuracy Score).Image Ranking Apparatus анализирует геометрию этих границ по трем критериям: Centroid) ближе к центру всего изображения, считаются более важными.Accuracy Score) для получения финального Rank Score, по которому сортируются объекты для определения главного предмета.Высокая. Способность определять визуальную значимость (salience) и основной предмет изображения критически важна для современных поисковых систем, особенно с развитием Google Images, Google Lens и интеграцией мультимодальных моделей (например, MUM). Описанные геометрические принципы являются фундаментальными для анализа композиции в компьютерном зрении.
Патент имеет высокое значение для Image SEO. Он раскрывает конкретные механизмы, которые Google использует для интерпретации визуального контента. Это напрямую влияет на то, как изображение будет проиндексировано и по каким запросам оно будет ранжироваться. SEO-специалисты должны оптимизировать композицию изображений (размер, положение, видимость ключевого объекта), чтобы гарантировать правильную интерпретацию контента поисковой системой.
confidence) системы в том, что идентифицированный объект действительно принадлежит к указанному классу. Используется как модификатор для Rank Score.First bounded region — все изображение. Second bounded region — область, в которой расположен конкретный объект (например, Bounding Box).Bounded Regions.Claim 1 (Независимый пункт): Описывает основной метод ранжирования объектов с акцентом на центральное положение.
first bounded region).second bounded region).Rank Score на основе характеристик second bounded region. Конкретно в Claim 1 описан следующий процесс: first centroid).second centroid).Rank Score на основе этого расстояния.Rank Scores.Claim 2 (Зависимый от 1): Дополняет, что Rank Score также может определяться на основе площади (Area) ограничивающей области объекта.
Claim 3 (Зависимый от 1): Уточняет, что Rank Score рассчитывается в обратной пропорции (inverse proportion) к расстоянию до центра. Ближе к центру — выше ранг.
Claim 5 (Зависимый от 1): Дополняет, что Rank Score также может определяться на основе перекрытия (Overlap) с другими ограничивающими областями.
Claim 7 (Зависимый от 1): Описывает комбинированный подход. Rank Score определяется на основе оценки площади (Area Score), оценки перекрытия (Overlap Score), а также оценки расстояния до центра (как требуется в Claim 1).
Claim 10 (Зависимый от 1): Уточняет, что Rank Score также основывается на оценке точности (Accuracy Score) распознавания объекта.
Изобретение применяется в системах обработки и интерпретации визуального контента (Google Images, Google Lens).
INDEXING – Индексирование и извлечение признаков
Основное применение патента. Когда Google индексирует изображение:
Image Processing Apparatus анализирует изображение, распознает объекты, определяет их границы и рассчитывает Accuracy Score.Image Ranking Apparatus применяет описанный алгоритм для ранжирования этих объектов по важности.Rank Score определяется как основной предмет изображения. Эта информация используется для аннотирования и индексации изображения, влияя на его связь с сущностями и темами.RANKING – Ранжирование (в контексте Image Search)
Информация о главном объекте изображения, полученная на этапе индексирования, используется как сильный сигнал релевантности при ранжировании изображений в ответ на запрос пользователя.
QUNDERSTANDING (в контексте Визуального Поиска)
В Google Lens, когда изображение является запросом, этот механизм используется для определения, на каком объекте сфокусироваться для дальнейшего поиска.
Входные данные:
Object Search Results от Image Processing Apparatus, включающий: Класс объекта, Координаты Bounded Region, Accuracy Score (опционально).Выходные данные:
Rank Scores.Rank Score (т.е. является главным).Этап 1: Предварительная обработка и Распознавание
First bounded region).Image Processing Apparatus.Object Search Results: идентификация объектов, определение их границ (Second bounded region) и расчет Accuracy Score.Этап 2: Ранжирование объектов (Image Ranking)
First centroid).Second bounded region (например, высота * ширина).Second centroid).Area Score), расположенным близко к центру (высокий Centroid Score) и не должен быть перекрыт другими элементами (высокий Overlap Score).Centroid Distance), подчеркивая его фундаментальную роль. Оценка обратно пропорциональна расстоянию.Centroid Score.Area Score.Overlap Score.Accuracy Score (уверенности распознавания), что положительно влияет на финальный Rank Score.Centroid Score и может привести к тому, что Google посчитает главным другой, менее важный, но более центральный объект.Area Score и могут быть интерпретированы неоднозначно.Overlap, если эти элементы распознаются как отдельные объекты.Accuracy Score.Патент подтверждает, что оптимизация изображений для SEO — это не только alt-тексты, но и оптимизация самого визуального контента под алгоритмы компьютерного зрения. Google интерпретирует композицию, чтобы понять смысл изображения. Стратегия должна включать гайдлайны по созданию визуальных активов, которые оптимизированы для машинного восприятия, гарантируя правильную интерпретацию содержания и важности элементов на изображении. Это напрямую влияет на видимость в Google Image Search и Google Lens.
Сценарий: Оптимизация изображения товара (Кроссовки) для E-commerce
Rank Score из-за малого размера (низкий Area Score) и расположения далеко от центра (низкий Centroid Score). 'Человек' получит наивысший рейтинг. Изображение будет лучше ранжироваться по запросу 'человек в парке', чем 'купить кроссовки модель X'.Area Score и Centroid Score. Они будут идентифицированы как главный объект, что значительно улучшит ранжирование изображения по релевантным товарным запросам.Какие три основных фактора использует Google для определения главного объекта на изображении согласно этому патенту?
Google использует три ключевых геометрических характеристики: 1) Размер (Area) — чем больше объект, тем он важнее; 2) Центральность (Centroid Distance) — чем ближе объект к центру изображения, тем он важнее; и 3) Видимость (Overlap) — чем меньше объект перекрыт другими элементами, тем он важнее.
Как влияет расположение объекта на периферии изображения?
Объекты, расположенные далеко от центра изображения, получают низкую оценку центральности (Centroid Score). Патент указывает, что оценка ранжирования обратно пропорциональна расстоянию от центра объекта до центра изображения. Это значительно снижает вероятность того, что периферийный объект будет считаться основным предметом.
Что произойдет, если я размещу крупный водяной знак или логотип поверх моего продукта на фото?
Если система распознает водяной знак или логотип как отдельный объект, перекрывающий продукт, это негативно скажется на оценке видимости (Overlap Score) продукта. Рейтинг продукта будет понижен пропорционально площади перекрытия. Это может привести к потере фокуса на основном товаре.
Влияет ли качество или четкость изображения на этот алгоритм?
Да, очень сильно. Патент упоминает Accuracy Score (уверенность системы в правильности распознавания объекта). Размытые или нечеткие изображения приводят к низкому Accuracy Score. Этот показатель используется как множитель для итогового Rank Score, поэтому нечеткие объекты будут считаться менее важными.
Как этот патент влияет на SEO для E-commerce сайтов?
Он критически важен для E-commerce. Чтобы изображения товаров хорошо ранжировались, необходимо, чтобы именно товар был идентифицирован как главный объект. Это требует оптимизации фотографий: товар должен быть крупным, центральным и полностью видимым. В противном случае Google может сфокусироваться на модели, аксессуарах или фоне.
Если на фото два одинаково больших объекта, какой будет выбран главным?
Если два объекта имеют одинаковый размер (Area Score) и одинаковую уверенность распознавания (Accuracy Score), решающим фактором станет центральность. Объект, который расположен ближе к геометрическому центру изображения, получит более высокий финальный Rank Score.
Учитывает ли система "правило третей", популярное в фотографии?
Нет, патент фокусируется строго на геометрическом центре (Centroid). Согласно описанному механизму, размещение объекта по "правилу третей" менее выгодно для SEO, чем размещение точно по центру, так как расстояние до центроида будет больше.
Влияют ли Alt-тексты или окружающий текст на этот конкретный алгоритм ранжирования объектов?
Нет. Этот патент описывает исключительно визуальный анализ, основанный на геометрических характеристиках (размер, положение, перекрытие) и уверенности распознавания. Alt-тексты и окружающий контент являются отдельными сигналами, которые используются на других этапах ранжирования изображений в поиске, но не в этом алгоритме определения важности объекта.
Где происходит этот процесс: во время сканирования или в момент запроса пользователя?
Процесс определения и ранжирования объектов происходит на этапе индексирования (Indexing & Feature Extraction). Когда Google анализирует изображение, он определяет относительную важность объектов. Результаты (понимание того, что является главным) сохраняются в индексе и используются позже для ранжирования изображения в ответ на запросы.
Как этот алгоритм помогает в оптимизации под Google Lens?
Он напрямую связан с Google Lens. Когда пользователь использует изображение как запрос, система применяет этот алгоритм, чтобы понять, на каком объекте сфокусироваться. Понимание принципов ранжирования (размер, положение) помогает создавать контент, который будет правильно интерпретирован системами визуального поиска.

Мультимедиа
Семантика и интент
SERP

Мультимедиа
Индексация

Мультимедиа
Поведенческие сигналы
SERP

Мультимедиа
Ссылки

Мультимедиа
SERP

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Антиспам
Ссылки
SERP

Индексация
SERP
Персонализация

Семантика и интент
Индексация
Мультимедиа

Семантика и интент
Мультимедиа
Персонализация

Персонализация
Семантика и интент
Поведенческие сигналы

Ссылки
Мультиязычность
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
