
Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии пользователя с этим изображением в выдаче. Система позволяет уточнять поиск на основе коллективного поведения и переносить метки между визуально похожими изображениями.
Патент решает проблему неоднозначности или неточности пользовательских запросов при поиске изображений. Часто результаты поиска могут быть слишком широкими или не соответствовать субъективному намерению пользователя. Изобретение предлагает механизм навигации и уточнения поиска без необходимости вручную вводить новые запросы, что особенно полезно для языков, не основанных на латинице (non-Roman based languages), где ввод текста может быть затруднен.
Запатентована система и метод предложения альтернативных запросов, специфичных для отдельных результатов поиска изображений. Когда пользователь взаимодействует (например, наводит курсор) с конкретным изображением в выдаче, система отображает список предлагаемых запросов (suggested second image queries). Эти предложения генерируются на основе исторических данных: это запросы, которые ранее вводили другие пользователи и которые привели к выбору (клику) именно этого изображения.
Система работает в двух режимах: офлайн и онлайн.
number of selections (количество кликов) и selection fraction (доля кликов) по каждому связанному запросу. Эти данные фильтруются и сохраняются в репозитории.hotspot), система отображает эти альтернативные запросы. Выбор альтернативного запроса запускает новый поиск.Высокая. Механизмы использования поведенческих данных для понимания контента (в данном случае, изображений) и уточнения поиска являются центральными для современных поисковых систем. Технологии, описанные в патенте, такие как генерация меток на основе кликов и перенос меток между похожими изображениями (с использованием simhash), активно используются в Google Images и системах визуального поиска.
Патент имеет высокое значение для стратегий Image SEO (85/100). Он раскрывает механизм, как Google может автоматически генерировать метки (labels) для изображений, основываясь исключительно на поведении пользователей, а не только на окружающем тексте или alt-атрибутах. Это подчеркивает критическую важность создания изображений, которые точно соответствуют интенту конкретных запросов и стимулируют клики, так как эти клики напрямую влияют на то, как система категоризирует изображение.
selection fraction) в качестве автоматических меток для индексации.near-duplicates) изображений.ВАЖНО: Патент был подан в 2008 году. В ходе рассмотрения исходные пункты (Claims 1-71 в середине документа) были отменены и заменены новыми. Анализ основан на финальных принятых утверждениях (начиная с Claim 1 в конце документа).
Claim 1 (Независимый пункт): Описывает основной процесс взаимодействия с пользователем в реальном времени.
Ядро изобретения — использование исторических данных о кликах для генерации специфичных для изображения предложений и интерфейс для их отображения при взаимодействии.
Claim 79 (Зависимый): Детализирует, как определяются альтернативные запросы, вводя метрику selection fraction.
Запрос определяется как альтернативный частично на основе selection fraction для данного изображения. Selection fraction является функцией от количества выборов этого изображения другими пользователями, когда оно было показано в ответ на этот запрос.
Claim 80 (Зависимый): Определяет формулу для selection fraction.
Selection fraction вычисляется путем расчета отношения: (Количество случаев за период времени, когда изображение было выбрано в ответ на запрос) / (Общее количество случаев за период времени, когда любой результат был выбран в ответ на этот запрос).
Дополнительные механизмы (описанные в Description):
number of selections и selection fraction и сохранения этих данных в репозитории.byte hashes или simhashes для идентификации похожих изображений и предоставления для первого изображения меток (labels), принадлежащих похожим изображениям.Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные на этапе анализа логов, и влияя на пользовательский интерфейс и индексацию.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная офлайн-обработка. Система анализирует логи пользовательских сессий (поведенческие данные), чтобы установить связи между запросами и кликами по изображениям. Рассчитываются и индексируются метрики number of selections и selection fraction. Также вычисляются byte hash и simhash для идентификации дубликатов и переноса меток между ними.
QUNDERSTANDING – Понимание Запросов
Механизм участвует в уточнении запросов. Предлагая альтернативные запросы, основанные на коллективном поведении, система помогает пользователю сформулировать более точный интент, связанный с конкретным визуальным объектом.
RANKING – Ранжирование
Патент упоминает, что альтернативные запросы могут использоваться как labels для изображений в индексной базе данных. Эти автоматически сгенерированные метки могут влиять на релевантность изображения запросам на этапе ранжирования. Также упоминается возможность ранжирования на основе number of selections.
METASEARCH / Пользовательский Интерфейс
Основное применение патента происходит на уровне представления результатов. Система изменяет UI, добавляя hotspots к изображениям и отображая диалоговые окна (dialog box) с альтернативными запросами при взаимодействии.
Входные данные:
First Image Query).Выходные данные:
Selection Fraction).labels) для изображений.time period).hotspot).Number of selections ниже порога (например, менее 50 кликов).Selection fraction ниже порога (например, менее 0.001 или 0.01).profanity), орфографические ошибки, не соответствуют языку исходного запроса или являются лексически слишком похожими (дубликатами, перестановками слов) на другие предложения.Процесс А: Офлайн-генерация альтернативных запросов (Анализ логов)
number of selections (количество кликов) для этого изображения по этому запросу.selection fraction (доля кликов) для изображения по этому запросу.selection fraction) и последовательный выбор Топ-N, применяя критерии лексической схожести: Simhash/Byte hash для поиска похожих/дублирующихся изображений и переноса сгенерированных меток между ними.Процесс Б: Обработка запроса в реальном времени
hotspots).Патент фокусируется на использовании поведенческих данных и данных о самом изображении.
image queries) и какие результаты были выбраны (selections/клики).byte hash и simhash. Эти хеши применяются для поиска точных и нечетких дубликатов.selection fraction является ключевой. Она показывает не просто популярность изображения, а его значимость как ответа на конкретный запрос относительно других результатов. Высокая доля кликов может привести к тому, что запрос станет основной меткой изображения.byte hash (для точных дубликатов) и simhash (для похожих изображений) позволяет системе переносить сгенерированные метки между визуально схожими объектами. Это значительно расширяет покрытие и улучшает понимание изображений, по которым мало данных.selection fraction (доли кликов) в Google Images. Если пользователи кликают на ваше изображение по запросу X, этот запрос станет меткой вашего изображения.simhash для поиска похожих изображений и переноса меток, создание уникальных изображений поможет им выделиться и собрать чистые сигналы кликов, не размытые контекстом других сайтов, использующих то же изображение.byte hash) или очень похожи (simhash) на тысячи других в интернете. Они будут наследовать метки друг друга, собранные со всех источников, что может привести к размыванию релевантности.Патент подтверждает стратегическую важность поведенческих факторов в поиске изображений. Он показывает, что Google активно использует "мудрость толпы" для автоматической классификации и маркировки визуального контента в масштабе. Для SEO-специалистов это означает, что оптимизация изображений — это не только техническая задача, но и задача соответствия интенту пользователя. Стратегия должна включать создание визуального контента, который пользователи активно ищут и выбирают в ответ на конкретные запросы.
Сценарий: Оптимизация изображения товара в интернет-магазине
selection fraction для этого изображения по запросу "Phone X Blue 128GB".label) для этого изображения. Когда другие пользователи будут взаимодействовать с этим изображением (даже если найдут его по более широкому запросу "Phone X"), система может предложить им уточняющий запрос "Phone X Blue 128GB".Как именно система определяет, какие альтернативные запросы предложить для изображения?
Система анализирует исторические данные поисковых сессий. Она ищет запросы, по которым данное изображение ранее показывалось в выдаче и получало клики от пользователей. Затем эти запросы фильтруются на основе метрик популярности (number of selections) и значимости (selection fraction), а также проходят лексическую и языковую проверку перед тем, как быть предложенными.
Что такое Selection Fraction и почему это важно для SEO?
Selection Fraction — это доля кликов, которую получает конкретное изображение от общего числа кликов по всем результатам для данного запроса. Это ключевой показатель релевантности и качества изображения как ответа на запрос. Высокая selection fraction указывает системе, что изображение очень релевантно запросу, и этот запрос, вероятно, будет использоваться как основная метка (label) для изображения, что критически важно для его ранжирования.
Может ли Google понять содержание изображения, если на странице нет alt-текста и окружающего текста?
Да. Согласно патенту, система может генерировать метки для изображения на основе запросов, которые привели к кликам по нему. Кроме того, патент описывает механизм переноса меток: если изображение визуально похоже (по simhash) на другое изображение, у которого уже есть метки (текстовые или сгенерированные кликами), оно может унаследовать эти метки.
Что такое simhash и как он используется в этом патенте?
Simhash — это техника для определения нечетких дубликатов (похожих, но не идентичных изображений). В патенте он используется для идентификации визуально схожих изображений в индексе. Это позволяет системе переносить альтернативные запросы и метки между ними, обогащая данные для изображений, по которым недостаточно собственной статистики кликов.
Как этот патент влияет на использование стоковых фотографий?
Использование стоковых фото усложняет дифференциацию. Поскольку одно и то же изображение используется на разных сайтах в разном контексте, система агрегирует клики со всех источников. Если другие сайты используют его в нерелевантном контексте и собирают клики по другим запросам, это может "загрязнить" набор меток для этого изображения, что повлияет и на вашу видимость.
Как система защищается от манипуляций кликами для генерации ложных меток?
Патент не описывает конкретных механизмов защиты от накруток. Однако использование метрики selection fraction (доли кликов) вместо абсолютного числа кликов частично нивелирует эффект от спам-атак, так как требует не просто много кликов на изображение, но и высокую долю относительно других результатов. Также применяются пороги (thresholds) для минимального количества кликов.
Может ли этот механизм использоваться для определения языка или перевода терминов?
Да, патент упоминает, что анализ альтернативных запросов может использоваться для машинного перевода. Если одно и то же изображение стабильно получает клики по запросу "flower" на английском и "fleur" на французском, система может использовать это как обучающие данные для связи этих терминов. Также система фильтрует предложения, если их язык отличается от языка исходного запроса.
Как система определяет жанр изображения (например, карикатура или порнография)?
Система анализирует семантику альтернативных запросов, связанных с изображением. Если значительная часть запросов содержит определенные термины (например, "funny" для карикатур), изображение может быть классифицировано соответствующим образом. Также для определения порнографии могут использоваться паттерны кликов (например, очень большое количество кликов и специфическое распределение выборов).
Применяется ли этот механизм только в Google Images?
Патент в первую очередь описывает применение в поиске изображений. Однако в тексте указано, что описанные методы могут быть использованы для предложения альтернативных запросов и в других корпусах, таких как поиск веб-страниц, продуктов, книг или видео.
Заменяет ли этот механизм необходимость прописывать alt-тексты?
Нет, не заменяет. Alt-тексты остаются важными для доступности и как базовый сигнал релевантности. Однако этот патент показывает, что Google в значительной степени полагается на поведенческие данные (клики) для валидации и обогащения понимания изображения. Можно сказать, что alt-текст помогает получить первичные показы, а клики определяют, закрепится ли изображение в выдаче по этим запросам.

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
Семантика и интент
Мультимедиа

Персонализация
Мультимедиа
Поведенческие сигналы

Семантика и интент
Мультимедиа
Персонализация

Поведенческие сигналы
Семантика и интент
Мультимедиа

Local SEO
Семантика и интент
Поведенческие сигналы

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Свежесть контента
Поведенческие сигналы
SERP

Антиспам
Ссылки
Техническое SEO

Ссылки
Антиспам
SERP

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы

Индексация
Ссылки
SERP

Ссылки
Антиспам
SERP

EEAT и качество
Ссылки
SERP
