
Google использует технологию распознавания объектов на изображениях для обогащения своей Базы Знаний (Knowledge Graph). Система анализирует наборы изображений, определяет, какие сущности часто появляются вместе (например, «Медведь Гризли» и «Рыба»), и выводит отношения между ними (например, «ест»). Эти извлеченные факты затем используются для ответов на поисковые запросы.
Патент решает задачу расширения и обогащения Базы Знаний (Knowledge Base), такой как Google Knowledge Graph. Традиционные методы часто полагаются на анализ текста веб-страниц. Данное изобретение предлагает метод извлечения структурированных данных (сущностей и отношений между ними) непосредственно из анализа изображений, тем самым открывая новый источник информации для наполнения Базы Знаний.
Запатентована система и метод автоматического извлечения фактов из изображений для обогащения Knowledge Base. Система использует технологии распознавания объектов для аннотирования изображений, идентифицирует главную сущность (Object Entity) и связанные с ней сущности (Attribute Entity). Затем система выводит (Infer) отношения между этими сущностями на основе анализа их совместного появления, пространственных отношений или известных фактов и сохраняет эти новые отношения в Базе Знаний.
Ключевой механизм работы системы:
Object Entity), часто основываясь на частоте появления или оценках уверенности (Confidence Scores).Object Entity. В этой группе система определяет другие часто встречающиеся сущности (Attribute Entity).Knowledge Base или контексте исходного поискового запроса, использованного для поиска изображений.Knowledge Base и используется для ответов на запросы пользователей.Высокая. Построение и обогащение Knowledge Graph является центральным элементом современной поисковой стратегии Google. Использование мультимодальных данных (текст и изображения) для понимания мира активно развивается (например, с помощью моделей типа MUM). Этот патент описывает фундаментальный механизм использования визуальной информации для извлечения структурированных фактов.
Патент имеет высокое значение для SEO, особенно в контексте оптимизации под Knowledge Graph и Поиск по картинкам. Он демонстрирует, что визуальное представление сущностей и их взаимодействий на изображениях напрямую влияет на то, какие факты Google узнает о них. Это подчеркивает важность использования четких, релевантных и качественных изображений, которые помогают поисковой системе корректно интерпретировать контекст и взаимосвязи между сущностями на сайте.
Entity), содержащуюся в нем. Присваивается с помощью технологий распознавания объектов.Object Entity. Используется для вывода отношений.template matching algorithm).Image Annotator, Inference Engine и Confidence Score Engine.Object Entity и Attribute Entity на основе косвенных факторов, таких как контекст изображения, пространственные отношения, известные факты в Knowledge Base, а не путем извлечения из явного текстового утверждения.Confidence Scores для этой сущности.Claim 1 (Независимый пункт): Описывает систему для обогащения Knowledge Base.
Object Entity.Object Entity.Attribute Entity из этого подмножества. Ключевой момент: Attribute Entity определяется как сущность (отличная от Object Entity), которая встречается наиболее часто в этом подмножестве изображений.inferred fact) между Object Entity и Attribute Entity.Knowledge Base.Claim 10 (Независимый пункт): Описывает метод, схожий с Claim 1, но добавляет использование извлеченных фактов.
Object Entity и отношение.Attribute Entity, основываясь на сохраненном отношении.Claim 21 (Независимый пункт): Описывает метод изучения фактов из изображений с фокусом на пространственный анализ.
Object Entity в аннотированных изображениях.Attribute Entity (как наиболее часто встречающейся сущности).Object Entity и Attribute Entity основывается по крайней мере на одном spatial relationship (пространственном отношении) между ними в изображениях.Knowledge Base.Изобретение применяется на этапах сбора и обработки данных для построения и обогащения Knowledge Graph.
CRAWLING – Сканирование и Сбор данных
Система может использовать краулер для сбора изображений из Интернета или использовать существующую базу данных изображений (например, индекс Google Images).
INDEXING – Индексирование и извлечение признаков
Основное применение патента происходит на этом этапе (или в аналогичном процессе построения Knowledge Graph):
Annotations) с помощью Image Annotator.Confidence Scores для аннотаций.Inference Engine анализирует аннотации, группирует изображения, идентифицирует Object Entities и Attribute Entities и выводит отношения между ними.Knowledge Base (Knowledge Graph).RANKING / QUNDERSTANDING
Хотя патент не фокусируется на ранжировании, извлеченные факты, сохраненные в Knowledge Base, затем используются системами понимания запросов и ранжирования для предоставления ответов пользователям (например, в Knowledge Panels или прямых ответах).
Входные данные:
Knowledge Base (для верификации и использования известных фактов при выводе новых).Выходные данные:
Object Entity, Отношение, Attribute Entity).Confidence Scores, привязанные к изображениям.Knowledge Base. Это может быть непрерывный процесс или запускаться периодически.Object Entity и обнаруживает статистически значимое совместное появление Attribute Entity в наборе изображений.Confidence Scores (чтобы убедиться в точности распознавания объектов) и пороги частоты совместного появления (чтобы определить значимость атрибута).Процесс А: Обогащение Базы Знаний из набора изображений
Confidence Scores для каждой аннотации (например, с помощью template matching).Object Entity, например, как сущности, которая встречается в наибольшем количестве изображений (и, опционально, имеет Overall Confidence Score выше порога).Object Entity.Attribute Entity как сущности (отличной от Object Entity), которая встречается наиболее часто в этой группе.Object Entity и Attribute Entity. Это может включать: spatial relationship) между сущностями на изображениях.Knowledge Base (например, если известно, что Объект А связан с Б, и Б связан с В, можно вывести связь А с В).Knowledge Base (например, проверка, что "рыба" является типом "еды", если выведено отношение "ест").Knowledge Base.Процесс Б: Целенаправленный поиск фактов (Альтернативный вариант)
Object Entity и предполагаемое отношение (например, "медведь гризли ест").Attribute Entities в результатах.Knowledge Base.Knowledge Base (известные сущности и факты) используются для помощи в распознавании и, что более важно, для вывода и верификации новых отношений.template matching algorithm, который сравнивает аннотированное изображение с эталонным изображением (template image), например, на основе количества совпадающих пикселей.Confidence Scores.Object Entity (наиболее частая сущность в общем наборе) и Attribute Entity (наиболее частая сопутствующая сущность в группе).Confidence Score (чтобы использовать только надежные аннотации) или порог для частоты появления (чтобы атрибут считался значимым).spatial relationships). Это позволяет выводить конкретные типы отношений (например, разницу между «стоит рядом» и «ест»).Knowledge Base для вывода и верификации новых фактов. Также новые факты могут использоваться для запуска нового поиска изображений и дальнейшего обогащения базы.Confidence Scores, чтобы отсеивать ошибки распознавания объектов и фокусироваться только на надежно идентифицированных сущностях.Confidence Scores, необходимо использовать высококачественные, недвусмысленные изображения, где ключевые сущности легко идентифицируются. Это повышает вероятность того, что Image Annotator корректно распознает объекты.Object Entity или значимого Attribute Entity.Knowledge Base.Confidence Scores и игнорированию изображения системой.Confidence Score распознавания.Патент подтверждает стратегическую важность Knowledge Graph и стремление Google использовать все доступные сигналы, включая визуальные, для его наполнения. Для SEO это означает, что оптимизация выходит за рамки текста. Стратегия должна включать управление визуальным представлением сущностей (бренда, продуктов, авторов) в интернете. То, как сущность изображена и с чем она взаимодействует на фотографиях, напрямую влияет на граф знаний о ней.
Сценарий: Оптимизация карточки товара для нового устройства
Object Entity) четко показано вместе с совместимым аксессуаром (Attribute Entity). На нескольких фото показать процесс подключения или совместного использования (визуализация spatial relationship).Image Annotator распознает устройство и аксессуар. Из-за частого совместного появления на разных изображениях Inference Engine определяет связь. Анализ пространственных отношений помогает вывести тип связи (например, "совместим с" или "использует").Сценарий: Укрепление связи автора с тематикой (E-E-A-T)
Object Entity) в контексте его работы: на конференциях (Attribute Entity - Логотип конференции), с его книгами (Attribute Entity - Книга), в лаборатории или офисе.Как именно система определяет отношения между двумя сущностями на фото? Например, как она понимает, что медведь ест рыбу, а не просто плывет рядом?
Патент указывает на несколько методов вывода отношений (Inferring). Один из ключевых — анализ пространственных отношений (spatial relationships) (Claim 21). Система оценивает расположение объектов относительно друг друга. В примере с медведем (FIG. 3D), близость рыбы ко рту медведя на значительном количестве изображений позволяет вывести отношение «ест». Также система может использовать известные факты из Knowledge Base для верификации: если известно, что рыба — это еда, вероятность отношения «ест» повышается.
Насколько важна уникальность изображений? Поможет ли публикация одного и того же фото на 100 сайтах?
Патент не уточняет, обрабатываются ли дубликаты изображений. Однако механизм полагается на агрегацию данных по набору изображений для выявления статистически значимых паттернов (Attribute Entity выбирается по частоте появления). Логично предположить, что разнообразие визуальных подтверждений факта (разные фото, демонстрирующие одно и то же взаимодействие) усилит уверенность системы в этом факте, по сравнению с одним и тем же изображением.
Что такое Confidence Score и как он влияет на извлечение фактов?
Confidence Score — это оценка вероятности того, что система правильно распознала объект на изображении. Если у аннотации низкий Confidence Score (например, фото размыто), система может её проигнорировать. Патент описывает использование пороговых значений для Confidence Scores при выборе Object Entity и Attribute Entity. Это значит, что для участия в извлечении фактов изображения должны быть достаточно четкими и качественными для надежного распознавания.
Может ли эта система извлекать факты из видео?
Патент US10534810B1 фокусируется исключительно на анализе статичных изображений (images). Хотя технически схожие принципы распознавания объектов и анализа сцен могут применяться к ключевым кадрам видео, в данном документе обработка видеоконтента не описывается.
Как система определяет, какая сущность является главной (Object), а какая — атрибутом (Attribute)?
Патент предлагает конкретный метод. Сначала анализируется большой набор изображений, и Object Entity часто выбирается как сущность, которая встречается в наибольшем количестве изображений в этом наборе. Затем изображения фильтруются, оставляя только те, где есть этот объект. В этом отфильтрованном наборе Attribute Entity определяется как любая другая сущность, которая также встречается наиболее часто.
Влияет ли текст вокруг изображения (например, alt-текст или подпись) на извлечение фактов по этому патенту?
В основном механизме, описанном в патенте (FIG. 2), анализ текста вокруг изображения не упоминается. Система полагается на визуальный анализ и распознавание объектов. Однако в альтернативном варианте (FIG. 4) упоминается использование текста поискового запроса, который привел к нахождению изображения, для помощи в выводе отношений. Традиционные SEO-атрибуты (alt, title) в этом патенте не описаны как входные данные для Inference Engine.
Как этот патент связан с оптимизацией под Knowledge Graph?
Связь прямая. Патент называется «Системы и методы для обогащения Базы Знаний». Цель описанной системы — находить новые факты (сущности и их отношения) и добавлять их в Knowledge Base (Knowledge Graph). Понимая, как Google использует изображения для изучения фактов, SEO-специалисты могут оптимизировать визуальный контент так, чтобы помочь Google корректно наполнять Knowledge Graph данными о своем бренде, продуктах или персонах.
Может ли система ошибочно связать сущности, которые случайно оказались рядом на многих фото?
Да, такая вероятность существует, так как механизм основан на частоте совместного появления. Однако патент предусматривает механизмы защиты: использование Confidence Scores для точности распознавания и возможность верификации выведенных отношений с использованием уже известных фактов из Knowledge Base. Если выведенное отношение противоречит здравому смыслу или известным фактам, оно может быть отклонено.
Что важнее для SEO в контексте этого патента: количество изображений или их качество?
Важны оба аспекта. Качество критично для того, чтобы объекты были распознаны с высоким Confidence Score и преодолели пороговые значения. Количество и разнообразие изображений необходимы для того, чтобы система могла выявить статистически значимые паттерны совместного появления сущностей и надежно вывести отношения между ними.
Применяется ли этот механизм для анализа изображений, сгенерированных ИИ?
Патент не делает различий между источниками изображений. Если изображение доступно системе (например, проиндексировано в интернете) и технология распознавания объектов может идентифицировать сущности на нем, оно будет обработано. Качество и реалистичность сгенерированного изображения будут влиять на Confidence Score распознавания.

Семантика и интент
Knowledge Graph
Мультимедиа

Поведенческие сигналы
Семантика и интент
SERP

Knowledge Graph
Мультимедиа
Семантика и интент

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
Семантика и интент
Ссылки

Семантика и интент
Ссылки

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
EEAT и качество

Поведенческие сигналы
Индексация
Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

Knowledge Graph
Семантика и интент
Ссылки

Поведенческие сигналы
SERP

Индексация
SERP
Персонализация
