
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
Патент решает проблему неточной классификации изображений, возникающую, когда традиционные сигналы (окружающий текст, визуальные характеристики) неоднозначны или отсутствуют. Это особенно критично для фильтрации нежелательного контента (например, порнографии) при нейтральных запросах. Традиционные методы могут ошибаться, если текст вводит в заблуждение (пример в патенте: запрос "Babe Movie" может вернуть откровенный контент). Изобретение направлено на повышение точности классификации для улучшения качества и безопасности поиска по картинкам.
Запатентована система классификации изображений, основанная на анализе поведенческих данных о совместном выборе (co-selection data). Если пользователи часто выбирают Изображение Б сразу после Изображения А (эталонного изображения с известной темой) в рамках одной сессии, система делает вывод, что Изображение Б относится к той же теме. Для масштабирования этого процесса используется взвешенный граф кликов и итеративный алгоритм распространения меток (Label Propagation).
Система функционирует следующим образом:
Reference Images) с достоверно известными темами (Reference Labels).Historical Data) для выявления последовательных кликов по изображениям.Co-selected Images), выбранные пользователем вскоре после эталонного изображения в той же сессии.Weighted Graph), где узлы — это изображения, а вес ребер отражает частоту и близость (proximity) совместного выбора.Topic Scores) от эталонных изображений по графу к связанным с ними изображениям.Высокая. Анализ поведения пользователей и графовые методы (включая распространение меток) являются фундаментальными подходами в современных поисковых системах. Точная классификация визуального контента, особенно для целей фильтрации NSFW-контента и разрешения неоднозначности запросов, остается критически важной задачей для Google Images в 2025 году.
Патент имеет значительное влияние (8/10) на Image SEO. Он демонстрирует, что классификация изображения зависит не только от его содержания или окружающего текста, но и от контекста его потребления пользователями. Если изображение часто кликают в рамках сессий, посвященных определенной теме (особенно чувствительной, как NSFW), оно будет ассоциировано с этой темой по поведенческому принципу, что может привести к его фильтрации или изменению ранжирования.
Co-selection Matrix.reference weight).reference topic). Служит отправной точкой для классификации.Topic Scores. Например, когда изменения оценок минимальны (сходимость) или достигнуто максимальное число итераций.proximity) совместного выбора с эталонными изображениями.nodes) представляют изображения, а ребра (edges) — последовательные выборы. Вес ребра (edge weight) отражает частоту таких выборов.Claim 1 (Независимый пункт): Описывает основной метод классификации на основе совместного выбора.
reference text label) для эталонного изображения (reference image), определяющую Первую тему.co-selected image). Условие: оно было показано и выбрано пользователем в той же сессии, что и эталонное изображение.topic score) для совместно выбранного изображения. Оценка основана на количестве сессий, в которых пользователь взаимодействовал с обоими изображениями.topic score соответствует порогу.Claim 2 (Зависимый): Вводит ограничение по времени (близость выбора).
В качестве co-selected images учитываются только те изображения, которые были выбраны в пределах порогового периода времени (threshold time period) после выбора эталонного изображения. Это обеспечивает учет только близких по контексту взаимодействий.
Claim 3 (Зависимый): Описывает использование взвешенного графа.
Изображения представляются как узлы во взвешенном графе. Ребра представляют последовательные выборы (sequential selections). Topic score генерируется на основе весов этих ребер.
Claim 11 и 12 (Зависимые): Определяют применение в поиске.
Сгенерированные метки используются для фильтрации (Claim 11) или изменения порядка (Claim 12) результатов поиска по запросу, относящемуся к другой теме (например, для работы SafeSearch).
Claim 13 (Зависимый): Детализирует итеративный процесс генерации Topic Score (распространение меток).
topic scores.co-selection data.topic scores на основе текущих оценок и co-selection data.stop condition).Изобретение затрагивает несколько этапов поиска, преимущественно в контексте обработки данных и улучшения качества индекса изображений.
CRAWLING & DATA ACQUISITION – Сбор данных
На этом этапе система собирает логи пользовательских сессий (Historical Data), включая идентификаторы сессий, выбранные изображения (клики) и временные метки.
INDEXING – Индексирование и извлечение признаков (Офлайн-обработка)
Основная работа алгоритма (Image Classification Subsystem) происходит здесь:
Reference Images и их меток (используя визуальный анализ, текст или ручную разметку).Co-selected Images.Weighted Graph или Co-selection Matrix.Topic Scores (распространение меток).Indexed Cache).RANKING / RERANKING – Ранжирование и Переранжирование
На этапе формирования выдачи Search System использует предварительно рассчитанные метки для:
Входные данные:
Reference Images и их Reference Labels.Выходные данные:
Topic Scores, ассоциированные с изображениями в индексе.Topic Scores.threshold time period).Патент описывает процесс построения модели взаимодействий и итеративный расчет оценок.
Процесс А: Построение взвешенного графа (Обработка сессий)
edge weight) увеличивается при каждом наблюдении А->Б. Вес может корректироваться на основе близости выбора. Патент приводит пример веса 1/(номер выбора), где первый выбор после эталона имеет вес 1, второй 1/2 и т.д. Также вес может корректироваться уверенностью в теме источника (reference weight).Процесс Б: Итеративная классификация (Распространение меток)
Topic Scores. Например, эталонные изображения темы получают 1.0, изображения заведомо другой темы — 0.0, остальные — 0.5 или оценку на основе анализа контента.Co-selection Matrix, основанной на весах ребер графа.Topic Scores как функция текущих оценок и данных о совместном выборе (например, путем умножения вектора оценок на матрицу).Stop Condition) — например, изменения оценок минимальны. Система в первую очередь полагается на поведенческие данные и данные, полученные в результате предварительного анализа.
proximity) выборов.Initial Topic Scores.reference weight.co-selection.Reference Images) в своей нише. Это достигается за счет качества, уникальности и сильных текстовых/визуальных сигналов, позволяющих Google уверенно классифицировать их изначально.Патент подтверждает, что Google активно использует сложные поведенческие модели для понимания семантики контента, особенно там, где традиционные сигналы слабы (как в Image Search). Для SEO-стратегии это означает, что оптимизация должна учитывать не только сам контент, но и контекст его потребления. Взаимодействие пользователя с сайтом и в рамках поисковой выдачи напрямую влияет на то, как Google классифицирует его элементы.
Сценарий 1: Разрешение неоднозначности ("Ягуар")
co-selection. В графе Фото 1, 2 и 3 получают сильные связи с узлами автомобильной тематики. Их Topic Score для темы "Автомобили" растет, позволяя системе уверенно ранжировать их по запросам об автомобилях, а не о животных.Сценарий 2: Негативное влияние на SafeSearch (Пляжная мода)
Topic Score для темы "Explicit" у изображений купальников превышает порог. Изображения начинают фильтроваться SafeSearch, что приводит к потере трафика.Что такое "Co-selected Image" в контексте этого патента?
Это изображение, которое пользователь выбрал (кликнул) в течение той же поисковой сессии, что и другое (эталонное) изображение, обычно сразу после него. Ключевым моментом является последовательность действий в рамках одной сессии, что указывает на тематическую связь между этими изображениями в восприятии пользователя.
Как Google определяет исходные "Reference Images" (эталонные изображения)?
Патент упоминает несколько методов. Это может быть ручная оценка (Label Feedback от асессоров), анализ визуальных характеристик (например, определение телесных тонов для выявления порнографии) или анализ связанных текстовых данных (имя файла, окружающий текст). Важно, чтобы эталонное изображение имело высокую вероятность точной классификации.
В чем суть итеративного процесса (Label Propagation), описанного в патенте?
Это процесс распространения меток по взвешенному графу взаимодействий. Начиная с известных эталонных изображений, система итеративно передает их тематические оценки (Topic Scores) связанным изображениям (тем, которые часто выбираются вместе). Это позволяет классифицировать изображения, которые напрямую не связаны с эталонами, но связаны с ними через цепочку других изображений. Процесс повторяется до стабилизации оценок.
Насколько важна близость кликов во времени (Proximity)?
Очень важна. Патент предусматривает использование временного порога (threshold time period) и взвешивание по близости. Изображение, выбранное сразу после эталонного, имеет больший вес и с большей вероятностью связано с ним тематически, чем изображение, выбранное значительно позже в той же сессии.
Как этот патент влияет на работу фильтра SafeSearch?
Он напрямую влияет на него. Патент явно указывает на использование этого механизма для идентификации порнографического контента. Если изображение часто выбирается в тех же сессиях, что и известные NSFW изображения, оно получит высокий Topic Score по этой теме и будет отфильтровано системой SafeSearch, даже если визуальные или текстовые сигналы не содержат явных признаков контента для взрослых.
Может ли этот механизм привести к неправильной классификации моих изображений?
Да, если поведение пользователей неоднозначно или подвержено влиянию плохого дизайна сайта. Например, если ваши SFW изображения часто просматриваются в одном ряду с NSFW контентом из-за вводящих в заблуждение рекомендаций, они могут унаследовать неверную классификацию. Это подчеркивает важность контроля за пользовательским опытом и тематической целостностью.
Как SEO-специалист может повлиять на данные о совместном выборе (co-selection data)?
Напрямую повлиять сложно, но можно создать условия для правильных ассоциаций. Убедитесь, что ваши изображения привлекательны и получают клики в релевантном контексте. На самом сайте обеспечьте логичную и тематически связанную навигацию или галереи, чтобы пользователи продолжали кликать на релевантные изображения, усиливая правильные поведенческие связи.
Влияет ли этот алгоритм на обычный веб-поиск (не по картинкам)?
Патент сфокусирован исключительно на классификации изображений и улучшении результатов поиска изображений (Image Search). Он не описывает прямого влияния на ранжирование веб-страниц в основном поиске, хотя точная классификация изображений на странице может косвенно влиять на общее восприятие качества и релевантности страницы.
Учитывает ли система dwell time (время просмотра) изображения?
Да, в описании патента упоминается, что dwell time может использоваться как индикатор релевантности. Изображение, которое просматривали дольше после выбора эталонного изображения, может считаться более релевантным его тематике по сравнению с изображением, которое быстро пропустили.
Что важнее для Image SEO согласно этому патенту: текст вокруг изображения или клики пользователей?
Оба важны, но этот патент подчеркивает критическую роль кликов пользователей (поведения). Текст часто используется для начальной классификации или создания эталонов, но данные о совместном выборе (co-selection data) используются для уточнения, подтверждения или даже опровержения текстовых сигналов в масштабе, особенно в неоднозначных случаях.

Поведенческие сигналы
SERP
Мультимедиа

Мультимедиа
SERP

Поведенческие сигналы
Семантика и интент
SERP

Индексация
Мультимедиа
Семантика и интент

Индексация
Поведенческие сигналы
Семантика и интент

Антиспам
SERP
Поведенческие сигналы

Семантика и интент
EEAT и качество
Индексация

Поведенческие сигналы
SERP

Ссылки
Поведенческие сигналы
SERP

SERP
EEAT и качество
Поведенческие сигналы

EEAT и качество
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP

Мультимедиа
EEAT и качество
Ссылки

Knowledge Graph
Семантика и интент
Персонализация
