
Google использует автоматизированную систему для поддержания актуальности и полноты Knowledge Graph. Когда система обнаруживает пробел (например, отсутствует свойство у сущности согласно схеме) или устаревшие данные (на основе анализа логов запросов), она генерирует точный, disambiguated поисковый запрос. Ответ, полученный от поисковой системы или QA-системы, используется для обновления Базы Знаний.
Патент решает задачу поддержания полноты и актуальности масштабной Базы Знаний (Knowledge Graph) в автоматическом режиме. Ручное обновление миллиардов сущностей не масштабируется. Система автоматизирует процесс обнаружения пробелов (отсутствующих фактов) и устаревшей информации в Knowledge Graph и находит актуальные данные во внешних источниках (например, в вебе) для их обновления.
Запатентована система, которая использует механизм обработки запросов (Query Processing Engine), такой как поисковая система или система ответов на вопросы (Question Answering), для автоматического заполнения Knowledge Graph. Система идентифицирует недостающий или устаревший элемент данных для конкретной сущности, автоматически генерирует запрос для поиска этого элемента и использует полученный ответ для обновления Базы Знаний.
Система работает по двум основным сценариям:
Schema) (например, «Небоскреб»). Если ожидаемое свойство отсутствует (например, «Архитектор»), система генерирует запрос.Query Records). Если анализ указывает на то, что данные в KG устарели (например, из-за конфликта между логами и текущими данными в KG), система инициирует обновление.В обоих случаях генерируется точный запрос (часто на естественном языке), включающий другие известные факты о сущности для устранения неоднозначности (disambiguation). Ответ, полученный от Query Processing Engine, используется для обновления KG.
Высокая. Автоматизация и масштабирование Knowledge Graph являются критически важными задачами для Google. Поскольку веб постоянно меняется, механизмы автоматического обновления фактов необходимы для поддержания качества поиска и работы всех сервисов, основанных на KG (Knowledge Panels, Featured Snippets).
Патент имеет высокое, хотя и косвенное, значение для SEO (7/10). Он не описывает алгоритмы ранжирования, но раскрывает механизм, с помощью которого Google собирает факты. Чтобы информация о сущности (компании, продукте, персоне) попала в Knowledge Graph или была своевременно обновлена, она должна быть представлена на веб-страницах в формате, который легко извлекается системами Question Answering. Это подчеркивает важность четкой структуры контента, достоверности и использования микроразметки.
Knowledge Graph, представляющий реальный объект, концепцию или персону (например, узел «Калифорния»).Data Graph.Schema), но для которого в Knowledge Graph в настоящее время не присвоено значение.Question Answering (QA).Entity Type, включающее список ожидаемых свойств (например, схема для типа «Город» включает «Население»).Патент описывает два основных метода обновления Knowledge Graph: заполнение пробелов на основе схемы (Claims 1-12) и обновление устаревших данных на основе логов запросов (Claims 13-24).
Claim 1 (Независимый пункт): Описывает процесс заполнения пробелов (Gap Filling).
Entity Reference) в Knowledge Graph, соответствующую определенному типу (Entity Type).Missing Data Element) — свойство сущности, которому в данный момент не присвоено значение.Query Processing Engine.Knowledge Graph обновляется на основе полученной информации.Claim 2 (Зависимый): Уточняет механизм идентификации пробела.
Идентификация происходит путем сравнения существующих свойств сущности с таблицей схемы (Schema Table), связанной с типом этой сущности. Если схема включает свойство, для которого у сущности нет значения, это свойство помечается как отсутствующее.
Claims 4 и 5 (Зависимые): Детализируют процесс генерации запроса и использование устранения неоднозначности.
Генерация запроса включает выбор терминов для устранения неоднозначности (Disambiguation Query Terms) из Knowledge Graph. Этими терминами могут быть другие значения свойств (Claim 4) или названия свойств (Claim 5). Итоговый запрос включает как термины, связанные с отсутствующим элементом, так и эти термины для disambiguation.
Claim 13 (Независимый пункт): Описывает процесс обновления данных на основе логов запросов (Data Refresh).
Knowledge Graph, который необходимо обновить, основываясь на логах запросов (Query Record). Элемент определяется как устаревший (outdated) на основании конфликта (conflict) между логом запросов и значением свойства в KG.Query Processing Engine.Knowledge Graph обновляется на основе полученной информации.Изобретение является частью инфраструктуры поддержания и наполнения Базы Знаний Google.
CRAWLING – Сканирование и Сбор данных
Query Processing Engine, используемый в этом патенте, полагается на данные, собранные во время сканирования веба (упоминается как Content), чтобы находить ответы на сгенерированные запросы.
INDEXING – Индексирование и извлечение признаков
Основное применение. Этот процесс отвечает за поддержание актуальности и полноты Knowledge Graph (упоминается как Data Structure). Система работает как процесс обслуживания индекса и обновления данных.
QUNDERSTANDING – Понимание Запросов
Система использует данные, генерируемые на этом этапе, а именно логи запросов (Query Records), как входной сигнал для выявления информации, которая может быть устаревшей или отсутствующей в KG.
Примечание: Сам патент не влияет на ранжирование напрямую, но его результат (обновленный Knowledge Graph) используется системами RANKING и METASEARCH для предоставления прямых ответов и формирования Knowledge Panels.
Входные данные:
Knowledge Graph (Сущности, Типы, Свойства).Schemas) для различных типов сущностей.Query Records).Query Processing Engine).Выходные данные:
Knowledge Graph.Knowledge Graph обнаруживается сущность, у которой отсутствует свойство, предусмотренное её схемой (Schema).Query Records) показывает конфликт с текущими данными в KG, указывая на устаревание информации, или когда пользователи часто ищут информацию, отсутствующую в KG.Query Records), или непрерывно в фоновом режиме для обслуживания KG.Процесс А: Заполнение пробелов на основе схемы (Gap Filling)
Entity Reference) в Knowledge Graph и определяет её тип (Entity Type).Schema Table) её типа. Идентифицируется отсутствующий элемент данных (Missing Data Element) — свойство, для которого нет значения.Disambiguation Query Terms). Это могут быть значения свойств или сами свойства.Query Processing Engine.Knowledge Graph обновляется, заполняя пробел полученной информацией.Процесс Б: Обновление на основе логов запросов (Data Refresh)
Query Records для выявления паттернов, указывающих на проблемы в KG.outdated) на основе конфликта между Query Record и текущим значением в KG.Disambiguation Query Terms для поиска актуальной информации.Query Processing Engine, получается актуальный ответ.Knowledge Graph обновляется на основе полученной информации.Система использует преимущественно структурные и поведенческие данные для инициации процесса, и контентные данные для его завершения.
Query Processing Engine для нахождения ответов на сгенерированные запросы.Патент не детализирует конкретные формулы, но описывает следующие методы и метрики:
Schema Table её типа.Disambiguation Query Terms) для создания высокоточных запросов, чтобы избежать получения данных о неправильной сущности.Knowledge Graph обновляется на основе информации, доступной в вебе. Чтобы попасть в KG, информация должна быть доступна для извлечения Query Processing Engine.Confidence Measures), такие как свежесть или популярность, для валидации ответов перед обновлением KG.Query Processing Engine идентифицировать и извлекать факты с большей уверенностью. Согласовывайте вашу разметку с типами и свойствами, которые ожидаются в схемах KG.Confidence Measure) системы при извлечении ответа.Disambiguation Query Terms; если ваш контент сам по себе неоднозначен, он не будет надежным источником для извлечения фактов.Патент подтверждает стратегию Google по структурированию мировой информации и превращению поисковой системы в «движок знаний». Для SEO это означает, что работа с сущностями (Entity-Oriented SEO) и предоставление достоверных, легко извлекаемых фактов становятся критически важными. Стратегический приоритет должен отдаваться тому, чтобы стать надежным источником, из которого Google будет извлекать информацию для Knowledge Graph, так как это напрямую влияет на видимость в Knowledge Panels, прямых ответах и других SERP-функциях.
Сценарий: Обновление информации о CEO компании
Ваша компания сменила генерального директора (CEO), но в Knowledge Panel Google отображается старая информация.
Query Records показывает, что пользователи стали чаще искать «новый CEO [Ваша Компания]» или демонстрируют поведение, указывающее на конфликт с текущими данными KG. Это сигнализирует об устаревании данных.schema.org/Organization и соответствующие свойства (например, ceo, employee, member).Query Processing Engine находит консистентный и свежий ответ в нескольких авторитетных источниках (включая ваш сайт) и обновляет Knowledge Graph.Как этот патент влияет на отображение моей компании в Knowledge Panel?
Патент описывает механизм, который Google использует для автоматического сбора и обновления фактов, отображаемых в Knowledge Panel. Если информация о вашей компании отсутствует или устарела, эта система будет пытаться найти актуальные данные в вебе. Чтобы обеспечить корректное отображение, вы должны предоставлять четкую, консистентную и легко извлекаемую информацию на своем сайте и в авторитетных источниках.
Что такое «Disambiguation Query Terms» и почему это важно?
Это дополнительные факты, которые Google добавляет в автоматически сгенерированный запрос, чтобы убедиться, что он ищет информацию о нужной сущности. Например, вместо запроса «Кто архитектор Эмпайр-стейт-билдинг?» система спросит «Кто архитектор Эмпайр-стейт-билдинг в Нью-Йорке, открытого в 1931 году?». Это помогает избежать путаницы с другими сущностями (книгами, фильмами) с таким же названием и гарантирует точность получаемых ответов.
Как система узнает, что информация устарела?
Патент описывает использование Query Records (логов запросов). Если система видит конфликт между тем, что отражено в логах запросов, и тем, что хранится в Knowledge Graph, это служит сигналом к обновлению. Поведение пользователей, указывающее на неудовлетворенность текущими данными KG (например, продолжение поиска после получения ответа), также может инициировать проверку.
Как система узнает, какая информация отсутствует?
Это определяется на основе схемы (Schema) для типа сущности. Если сущность имеет тип «Город», а схема для этого типа предусматривает свойство «Мэр», но в KG это свойство не заполнено для данного города, система идентифицирует это как пробел (Missing Data Element) и инициирует поиск информации для его заполнения.
Как я могу помочь этой системе найти информацию на моем сайте?
Предоставляйте факты в формате, удобном для извлечения системами Question Answering. Используйте четкие формулировки (например, «Население города X составляет Y человек»), структурируйте данные с помощью HTML-таблиц и списков определений (dl/dt/dd), а также внедряйте микроразметку Schema.org. Чем проще машине извлечь факт, тем выше вероятность его использования.
Использует ли Google только Википедию для заполнения Knowledge Graph?
Нет. Хотя Википедия является важным источником, этот патент показывает, что система генерирует запросы и отправляет их в Query Processing Engine (поисковую систему), который анализирует весь доступный веб-контент. Любой авторитетный и достоверный источник может быть использован для заполнения или обновления KG.
Что важнее для этой системы: авторитетность сайта или наличие микроразметки?
Важны оба аспекта. Микроразметка помогает идентифицировать и извлечь факт, делая процесс более эффективным. Однако, чтобы Google принял этот факт и обновил KG, он должен доверять источнику. Система оценивает достоверность ответа (используя Confidence Measures), что часто коррелирует с авторитетностью (E-E-A-T) сайта-источника.
Может ли эта система создать новую сущность в Knowledge Graph?
Патент фокусируется исключительно на обновлении существующих сущностей — заполнении отсутствующих свойств (Gap Filling) или обновлении устаревших значений (Data Refresh). Он не описывает механизм создания совершенно новых сущностей с нуля.
Что делать, если система заполнила Knowledge Graph неверной информацией?
Это означает, что Query Processing Engine нашел неверный ответ в источниках, которые он посчитал достоверными. Необходимо найти эти источники и исправить информацию в них, а также убедиться, что ваш официальный сайт предоставляет корректные данные в максимально четком и структурированном виде. Также следует использовать функцию обратной связи в Knowledge Panel.
Почему система генерирует запросы на естественном языке (Natural Language Queries)?
Многие современные Query Processing Engines оптимизированы для понимания и ответа на вопросы, сформулированные на естественном языке. Преобразование структурного пробела (например, Сущность: X, Свойство: Y, Значение: ?) в естественный вопрос (например, «Какое Y у X?») позволяет эффективно использовать возможности этих систем для поиска ответа в неструктурированном тексте веба.

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
EEAT и качество
Семантика и интент

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
Семантика и интент
Ссылки

Knowledge Graph
Семантика и интент
EEAT и качество

EEAT и качество
Индексация
Семантика и интент

Семантика и интент
Поведенческие сигналы
Local SEO

Индексация
Поведенческие сигналы

Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
SERP
Семантика и интент

Поведенческие сигналы
SERP
