
Google использует эту систему для определения наилучшего текстового описания (метки) для изображения. Система тестирует различные варианты меток, используя их как поисковые запросы, и проверяет, сколько результатов поиска указывают на веб-страницы, содержащие исходное изображение. Это гарантирует, что выбранная метка точно отражает то, как изображение используется и понимается в интернете.
Патент решает фундаментальную проблему визуального поиска (например, Google Lens или Поиск по картинке): как найти релевантную информацию об изображении в текстовом индексе. Для этого необходимо определить наилучшую текстовую метку (Image Label), которая точно описывает изображение и может быть использована в качестве эффективного текстового запроса. Система улучшает качество визуального поиска, обеспечивая надежный механизм выбора самой релевантной метки среди множества кандидатов.
Запатентована система и метод выбора оптимальной текстовой метки для изображения. Суть изобретения заключается в использовании результатов веб-поиска как механизма обратной связи для валидации и ранжирования кандидатов в метки. Система проверяет, насколько хорошо каждая метка коррелирует с фактическим использованием изображения в интернете.
Система работает итеративно:
Text Search Apparatus).Text Label Ranking Score). Эта оценка зависит от количества отфильтрованных результатов (docs_matched), их релевантности (median_score) и исходной позиции метки.Высокая. С ростом популярности визуального поиска и интеграции изображений в основную выдачу, способность точно интерпретировать визуальный контент в текстовые термины является критически важной для Google. Этот патент описывает базовый механизм такой интерпретации и валидации.
Патент имеет высокое значение (85/100) для Image SEO и стратегий, связанных с визуальным контентом. Он демонстрирует, что значение изображения определяется не только его визуальными характеристиками, но и тем, как оно используется и описывается на веб-страницах (контекст). Понимание этого механизма критично для оптимизации того, как Google транслирует ваши изображения в ключевые слова.
Near Duplicate Images или изображения в том же кластере).visual features) и удовлетворяющих определенному порогу сходства.search result scores), возвращенных по запросу-метке.Claim 1 (Независимый пункт): Описывает основной метод выбора метки изображения.
Text Label Ranking Score. Эта оценка основана на количестве ресурсов в результатах поиска, которые включают изображение, соответствующее (matching) первому изображению.Text Label Ranking Scores.Claim 2 (Зависимый): Уточняет, что получение текстовых меток может включать запрос меток, связанных с изображениями, идентифицированными как Near Duplicate Images первого изображения.
Claim 3 (Зависимый): Уточняет, что при присвоении оценки метке, оценка может быть увеличена для каждого случая, когда другая текстовая метка идентифицирована как почти дубликат (near duplicate text label) текущей метки (например, объединение "кот" и "коты").
Claim 4 и 5 (Зависимые): Определяют, что такое "соответствующее изображение" (image matching). Ресурсы, включающие соответствующее изображение, могут содержать либо Near Duplicate Image первого изображения (Claim 4), либо изображение, находящееся в том же кластере (Image Cluster) базы данных, что и первое изображение (Claim 5).
Claim 9 (Независимый): Описывает метод, аналогичный Claim 1, но детализирует компоненты расчета Text Label Ranking Score. Ранжирование меток включает расчет оценки для каждой метки на основе:
median search result score).original rank position) полученных текстовых меток.Claim 10 (Зависимый): Определяет конкретную формулу для расчета Text Label Ranking Score (подробно описана в разделе Метрики).
Изобретение применяется на разных этапах поисковой архитектуры, связывая визуальный анализ с текстовым поиском.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных. Image Similarity Apparatus анализирует визуальные признаки изображений, формирует Image Database и группирует похожие изображения в кластеры и идентифицирует дубликаты. Image Label Apparatus может предварительно ассоциировать изображения с метками на основе контекста.
QUNDERSTANDING – Понимание Запросов
Это основная область применения патента. Когда система получает запрос, содержащий изображение (визуальный запрос, например, в Google Lens), активируется описанный механизм. Его цель — транслировать визуальный ввод в наиболее релевантное текстовое представление (Image Label). Это форма переписывания запроса, позволяющая использовать визуальный контент для поиска в текстовом индексе.
RANKING – Ранжирование
Система взаимодействует с этапом ранжирования через Text Search Apparatus. Она отправляет множество запросов (меток-кандидатов) и анализирует полученные результаты ранжирования (в частности, median_score и состав выдачи) для принятия решения о качестве метки.
Входные данные:
Image Label Apparatus).Image Similarity Apparatus).Text Search Apparatus).Выходные данные:
Image Label) для исходного изображения.Text Label Ranking Score для этой метки.query image). Может также использоваться в офлайн-режиме для аннотирования индекса.Image Label Apparatus для получения первого набора меток-кандидатов.Image Similarity Apparatus для идентификации Near Duplicate Images. Метки, связанные с этими дубликатами, добавляются в пул кандидатов.near duplicate text labels), например, разные формы слова или наличие стоп-слов.Label Scores), например, на основе частоты их появления в объединенном наборе.original_rank_position.Text Search Apparatus. Для каждой метки выполняется отдельный поисковый запрос.Near Duplicate Image или изображение из того же Image Cluster.docs_matched: Количество отфильтрованных результатов.median_score: Медианная оценка релевантности этих результатов.Text Label Ranking Score с использованием формулы, учитывающей docs_matched, median_score и original_rank_position.Text Label Ranking Score. Метка с наивысшей оценкой выбирается как лучшая метка для исходного изображения.visual features) изображения (цвета, формы, края и т.д.). Они используются Image Similarity Apparatus для поиска дубликатов и определения принадлежности к кластерам. Также могут использоваться Image Label Apparatus для генерации меток на основе моделей релевантности (Relevance Models).Image Label Apparatus может использовать следующие данные для генерации исходных меток: anchor text) ссылок на изображение также упоминается как источник для генерации исходных меток.Ключевой метрикой является Text Label Ranking Score.
Патент предлагает конкретную формулу для ее расчета (Claim 10):
Компоненты формулы:
median_score: Отражает качество (релевантность) веб-страниц, где найдено изображение при поиске по данной метке.log(1 + max(1, docs_matched)): Отражает широту использования изображения в контексте данной метки (количество найденных документов). Логарифмическая шкала снижает влияние очень больших чисел (закон убывающей отдачи).smoothing_factor / (smoothing_factor + original_rank_position): Понижающий коэффициент, который учитывает исходную уверенность системы в метке. Чем ниже была исходная позиция (выше значение original_rank_position), тем сильнее пессимизация. smoothing_factor — это константа для настройки степени сглаживания.Эта формула балансирует между качеством контекста, широтой использования и исходной уверенностью в метке.
median_score), содержащим это изображение.Near Duplicate Images и Image Clusters позволяет агрегировать данные о значении изображения, даже если используются его разные версии (разный размер, обрезка, качество).median_score), популярность использования (docs_matched) и исходную вероятность (original_rank_position). Ни один из этих факторов не является доминирующим сам по себе.median_score при валидации.original_rank_position).Image Similarity Apparatus корректно идентифицировать дубликаты и кластеризовать ваше изображение с похожими изображениями в интернете, увеличивая объем данных для анализа (docs_matched).median_score будет низким или docs_matched будет нулевым для нужных запросов.Патент подтверждает, что Image SEO — это не изолированная дисциплина. Понимание изображения поисковой системой напрямую зависит от его интеграции в общую структуру и контент сайта, а также от его использования в интернете в целом. Стратегия должна фокусироваться на создании сильной и однозначной связи между визуальным и текстовым контентом. Это также подчеркивает растущую важность оптимизации под системы визуального поиска, такие как Google Lens, где описанный механизм является ключевым для интерпретации запроса пользователя.
Сценарий: Оптимизация изображения кроссовка в E-commerce
nike-air-max-270-black.jpg. Это обеспечит высокий original_rank_position для нужной метки.Image Similarity Apparatus свяжет его с тем же фото на сайте Nike и других ритейлеров (кластеризация).docs_matched будет высоким. Так как эти страницы релевантны запросу, median_score также будет высоким.median_score может быть ниже (так как запрос общий), а количество других изображений на этих страницах будет огромным.Text Label Ranking Score и выбирается системой для описания изображения.Как этот патент влияет на использование атрибута alt для изображений?
Патент напрямую не упоминает атрибут alt. Однако он явно указывает, что текст, расположенный рядом с изображением, анкорный текст ссылок и имена файлов используются для генерации исходных кандидатов в метки. Поскольку атрибут alt часто совпадает с этими элементами или является важной частью текстового контекста страницы, он косвенно влияет на исходный набор меток и их original_rank_position. Лучшая практика остается неизменной: используйте точные и релевантные атрибуты alt.
Что такое "Near Duplicate Image" согласно патенту?
Это изображения, которые по сути идентичны исходному, но отличаются деталями обработки. Примеры включают изображения с разным разрешением, разной яркостью или контрастностью, а также обрезанные версии (например, удаление рамок) одного и того же изображения. Система рассматривает их как одно и то же изображение при анализе контекста.
Что важнее для выбора метки: количество сайтов, где используется изображение (docs_matched), или качество этих сайтов (median_score)?
Важны оба фактора, так как они перемножаются в формуле ранжирования. Высокий median_score указывает на то, что изображение используется в релевантном контексте на авторитетных/релевантных страницах. Высокий docs_matched указывает на широкое распространение этого контекста. Идеальная ситуация – это высокий median_score и достаточно высокий docs_matched.
Как работает понижающий коэффициент, основанный на original_rank_position?
Он снижает итоговую оценку для меток, в которых система изначально была менее уверена (т.е. они были ниже в списке кандидатов). Это означает, что если метка была сгенерирована случайно или на основе слабого сигнала, ей потребуется значительно более сильное подтверждение через веб-поиск (высокие median_score и docs_matched), чтобы занять первое место.
Применяется ли этот механизм в Google Lens?
Хотя патент не упоминает конкретные продукты, он описывает фундаментальный механизм трансляции визуального ввода в текстовый запрос для поиска информации об изображении. Это именно то, что делает Google Lens и функция "Поиск по картинке". Логично предположить, что этот или подобный механизм лежит в основе этих технологий.
Что произойдет, если мое уникальное изображение используется только на моем сайте?
В этом случае docs_matched будет равен 1 (только ваш сайт). Система будет полностью полагаться на контекст вашего сайта для определения метки. Если ваш сайт предоставляет четкий и релевантный контекст, система выберет правильную метку. Однако, если контекст размыт, точность определения метки может снизиться по сравнению с изображениями, которые валидируются на множестве сайтов.
Как система обрабатывает синонимы или разные формы слов в метках?
Патент предусматривает этап консолидации (Claim 3). Система идентифицирует "почти дубликаты текстовых меток" (near duplicate text labels). Это могут быть слова, отличающиеся на несколько символов (например, множественное число) или содержащие стоп-слова ("картинки кошек" vs "кошки"). Такие метки объединяются, и их предварительные оценки суммируются, что повышает их original_rank_position.
Что такое кластер изображений и как он используется?
Кластер изображений — это группа визуально похожих изображений, собранных вместе в базе данных Google. Они не обязательно являются почти дубликатами (как разные размеры одного фото), но имеют схожие визуальные признаки. При валидации метки система учитывает не только точные совпадения изображения на веб-страницах, но и наличие любых изображений из того же кластера. Это расширяет анализ и помогает понять значение изображения более широко.
Может ли этот механизм помочь в борьбе с неправомерным использованием моих изображений (воровством контента)?
Косвенно да. Если ваше изображение используется на спамных или низкокачественных сайтах в нерелевантном контексте, это может негативно повлиять на median_score при валидации меток. Однако основная цель механизма — понять значение изображения, а не бороться с нарушением авторских прав. Если изображение используется на многих авторитетных сайтах в правильном контексте, его значение будет определено точно.
Влияет ли язык пользователя на выбор метки?
Да, патент упоминает это (Claim 7). Характеристики пользователя, такие как язык или местоположение, могут использоваться для выбора меток на соответствующем языке. Это важно для многоязычных сайтов: контекст изображения должен быть четко определен на каждом языке, чтобы система могла выбрать правильную метку для пользователей, говорящих на этом языке.

Семантика и интент
Мультимедиа
Индексация

Семантика и интент
Мультимедиа
SERP

Мультимедиа
Индексация
Семантика и интент

Мультимедиа
SERP

Мультимедиа
Семантика и интент
SERP

Поведенческие сигналы
Ссылки
SERP

SERP
EEAT и качество
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Knowledge Graph
Поведенческие сигналы
Персонализация

Персонализация
Поведенческие сигналы
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

SERP
Семантика и интент
EEAT и качество
