
Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а динамически выбирает и ранжирует наиболее релевантные факты для каждого объекта, основываясь на конкретном запросе пользователя, а также метриках достоверности и важности.
Патент решает проблему неэффективности традиционных баз знаний и поисковых систем, которые возвращают целые статьи или документы в ответ на запрос. Это перекладывает на пользователя задачу анализа всего документа для поиска конкретных фактов. Система устраняет неспособность поиска динамически реорганизовывать и выделять информацию, наиболее релевантную конкретному намерению пользователя в рамках определенной темы.
Запатентована система и метод для поиска и просмотра структурированной информации в Fact Repository. Система хранит факты как дискретные единицы (Атрибут-Значение), связанные с Objects (Сущностями). Ключевое изобретение — это механизм динамического выбора и ранжирования того, какие именно факты, связанные с объектом, должны быть показаны в результатах поиска, основываясь на их релевантности конкретному запросу пользователя.
Система работает в двух режимах: офлайн и онлайн.
Офлайн (Построение базы): Компоненты Importers извлекают факты из исходных документов и связывают их с Objects. Компоненты Janitors очищают, нормализуют данные (например, стандартизируют атрибуты) и объединяют дубликаты фактов и объектов. Для каждого факта рассчитываются метрики Confidence (достоверность) и Importance (важность).
Онлайн (Обработка запроса): Service Engine получает запрос и находит релевантные объекты. Оценка объекта рассчитывается на основе агрегированной релевантности его фактов. Затем система независимо оценивает факты этих объектов, используя релевантность запросу, Confidence и Importance. В результатах поиска отображаются топовые объекты вместе с динамически выбранным набором их наиболее релевантных фактов.
Чрезвычайно высокая. Этот патент закладывает основу для перехода Google от поиска документов к поиску сущностей (Entity Search) и является фундаментальным для работы Knowledge Graph. Механизм динамического выбора фактов на основе запроса сегодня повсеместно используется в Панелях Знаний (Knowledge Panels), расширенных сниппетах и ответах на информационные запросы.
Патент имеет критическое значение (9.5/10) для современной SEO-стратегии. Он описывает базовые механизмы того, как Google организует и представляет информацию о сущностях. Понимание того, как факты извлекаются (Importers), нормализуются (Janitors) и ранжируются (на основе Confidence и Importance), жизненно важно для оптимизации видимости бренда или сущности в Knowledge Graph и связанных функциях поиска.
Object ID.Object ID.Claim 1 и Claim 14 (Независимые пункты): Описывают основной метод обеспечения возможности просмотра репозитория фактов.
Fact Repository (факты в котором предварительно извлечены из документов). Каждый объект включает множество фактов.rank-ordered by relevance to the search query).object detail page).search link), связанная с производным поисковым запросом, основанным на фактах этого объекта.Ядром изобретения является не просто хранение фактов, а динамическое ранжирование и отображение подмножества фактов, наиболее релевантных текущему запросу пользователя, что позволяет динамически формировать представление объекта.
Claim 2 (Зависимый): Уточняет, что каждый факт хранится как отдельный элемент данных (separate item of data) в репозитории.
Claim 5 (Зависимый): Уточняет природу поисковой ссылки.
Система отображает attribute search link (поисковая ссылка по атрибуту). При выборе этой ссылки выполняется запрос на поиск других объектов, у которых есть факт с таким же атрибутом (например, найти все объекты с атрибутом «Дата рождения»).
Claim 6 (Зависимый): Уточняет другой тип поисковой ссылки.
Система отображает value search link (поисковая ссылка по значению). При выборе этой ссылки выполняется запрос на поиск других объектов, у которых есть факт с таким же значением (например, найти все объекты со значением «12 мая 1907»).
Claim 7 (Зависимый): Уточняет третий тип поисковой ссылки.
Система отображает attribute-value search link. При выборе этой ссылки выполняется запрос на поиск других объектов, у которых есть факт с таким же атрибутом И таким же значением (например, найти все объекты с атрибутом «Дата рождения» и значением «12 мая 1907»).
Изобретение затрагивает практически все этапы работы поисковой системы, формируя инфраструктуру для Entity Search.
CRAWLING – Сканирование и Сбор данных
На этом этапе собираются исходные документы (Sources), которые будут использоваться для извлечения фактов.
INDEXING – Индексирование и извлечение признаков
Это ключевой этап для создания Fact Repository.
Importers анализируют документы для извлечения фактов и определения связанных с ними объектов.Janitors обрабатывают факты, стандартизируют атрибуты и значения, объединяют дублирующиеся факты и объекты (Entity Resolution).Confidence Level и Importance Level для каждого факта.Fact Repository и индексируются (Index) для быстрого поиска по терминам в атрибутах и значениях.RANKING / METASEARCH – Ранжирование и Метапоиск
Service Engine использует Fact Repository для ответа на запрос.
Object Score на основе совокупной релевантности фактов.Fact Scores) на основе их релевантности запросу и метрик.Входные данные:
Fact Repository (Объекты, Факты, Атрибуты, Значения).Confidence, Importance).Выходные данные:
Fact Repository.Процесс А: Создание Репозитория (Офлайн)
Importers обрабатывают исходные документы. Извлекаются факты (пары Атрибут-Значение) и идентифицируются связанные с ними Объекты (Object IDs).Janitors обрабатывают извлеченные данные. Происходит стандартизация форматов, объединение синонимичных атрибутов (например, «День Рождения» и «Дата Рождения» становятся «Birthdate») и значений, а также слияние дублирующихся фактов и объектов.Confidence Level (достоверность факта) и Importance Level (важность факта для понимания объекта).Процесс Б: Обработка Запроса (Реал-тайм)
Service Engine получает запрос пользователя.Confidence и Importance.attribute/value search links).Values) фактов.Importers могут использовать структуру документа (например, таблицы, списки, разметку) для идентификации Атрибутов и Значений.Source) и потенциально для расчета Confidence.Система использует несколько ключевых метрик для оценки как объектов, так и фактов:
TF-IDF (более редкие термины получают более высокие оценки).Name Fact.Confidence Level и Importance Level.Relevance Scores) его фактов.Knowledge Graph.Confidence) и важности (Importance). Это позволяет системе гибко собирать ответы.Janitors по нормализации атрибутов и значений, а также объединению дубликатов (Entity Resolution) критически важна для качества репозитория. Согласованность данных в сети напрямую влияет на качество Fact Repository.Importers могли легко извлекать факты. Используйте семантический HTML (таблицы для данных, списки определений DL/DT/DD для пар атрибут-значение) и микроразметку Schema.org для явного указания фактов о сущностях.Janitors) и повышает Confidence Level фактов.Importance не раскрыт, факты, связанные с более авторитетными сущностями и подтвержденные экспертными источниками, с большей вероятностью будут считаться важными и достоверными.Property Fact (сводная информация) и отображаться при общих запросах о сущности.Janitors, снижает Confidence Level и может привести к игнорированию фактов или ошибкам в Knowledge Panel.Importers.Fact Repository (Knowledge Graph).Confidence.Этот патент является одним из foundational-документов для стратегии Entity-First SEO. Он подтверждает, что успех в современном поиске зависит не только от контента страниц, но и от того, насколько хорошо Google понимает, извлекает и верифицирует факты о вашей сущности. Стратегия должна быть направлена на управление представлением сущности в Fact Repository (Knowledge Graph), обеспечивая точность, полноту и авторитетность связанных с ней фактов.
Сценарий: Оптимизация профиля компании для динамического отображения фактов
Importance Level (например, Property Fact (описание), Отрасль, Цена акции).Что такое Fact Repository, описанный в патенте, и как он связан с Knowledge Graph?
Fact Repository — это база данных, которая хранит информацию в виде дискретных фактов (Атрибут-Значение), связанных с конкретными объектами (сущностями). Этот патент описывает раннюю версию и фундаментальные принципы работы системы, которая эволюционировала в Google Knowledge Graph. Это способ организации мировой информации, выходящий за рамки простого индексирования веб-страниц.
В чем основное отличие этого подхода от традиционного поиска по ключевым словам?
В традиционном поиске система ищет документы, содержащие ключевые слова, и возвращает эти документы. Описанный подход ищет объекты в Fact Repository и динамически собирает ответ, выбирая наиболее релевантные факты этого объекта для конкретного запроса. Это позволяет Google отвечать на вопросы напрямую (например, в Knowledge Panel), а не просто давать ссылки на документы.
Что такое Importers и Janitors и как SEO-специалист может повлиять на их работу?
Importers извлекают факты из контента, а Janitors очищают и нормализуют их. SEO-специалист может помочь Importers, предоставляя информацию в четко структурированном виде (семантический HTML, Schema.org). Помочь Janitors можно, обеспечивая максимальную согласованность (консистентность) фактической информации о сущности на разных сайтах, что упрощает нормализацию и повышает достоверность данных.
Патент упоминает метрики Confidence и Importance. Что они означают для SEO?
Confidence (Достоверность) — это уверенность системы в корректности факта. Для SEO это означает необходимость верификации фактов через авторитетные и согласованные источники. Importance (Важность) — это то, насколько факт важен для понимания объекта в целом. Это связано с общей авторитетностью сущности. Оба показателя влияют на то, будет ли факт показан в выдаче.
Почему для одного и того же объекта (например, компании) в выдаче показываются разные факты?
Это ключевая особенность патента. Система не имеет статического набора фактов для отображения. Она динамически ранжирует все факты объекта на основе их релевантности конкретному запросу пользователя. Если вы ищете «размер компании», факты о сотрудниках будут более релевантны и показаны выше, чем факты о её CEO.
Как система рассчитывает оценку релевантности факта?
Оценка основывается на наличии терминов запроса в атрибуте или значении факта. Патент упоминает использование весов на основе TF-IDF (редкие слова важнее) и учет дополнительных сигналов, таких как последовательность слов, точное совпадение запроса, а также корректировку на основе Confidence и Importance факта.
Как этот патент влияет на стратегию создания контента?
Он подчеркивает важность создания всестороннего контента, который покрывает множество атрибутов и фактов о целевой сущности. Чем полнее вы опишете сущность в структурированном виде, тем больше вероятность, что Fact Repository будет содержать релевантные факты для широкого спектра пользовательских запросов.
Что делать, если Google показывает неверные факты о моей сущности в Knowledge Panel?
Это указывает на проблему на этапе извлечения (Importers) или нормализации (Janitors), возможно, из-за низкого Confidence. Необходимо найти источник неверной информации и исправить его. Также следует убедиться, что официальный сайт предоставляет верную информацию в легко извлекаемом формате (например, через Schema.org) для повышения достоверности правильных фактов.
Влияет ли этот механизм на локальный поиск?
Да, очень сильно. Локальные бизнесы являются объектами в Fact Repository, а их адрес, часы работы, телефон и услуги — это факты. Динамическое отображение этих фактов в ответ на локальные запросы (например, «часы работы [ресторан]») напрямую управляется механизмами, описанными в этом патенте.
Актуальны ли методы ранжирования (линейная комбинация, TF-IDF), упомянутые в патенте 2006 года?
Хотя базовые принципы релевантности (такие как TF-IDF) все еще играют роль, современные системы Google, вероятно, используют гораздо более сложные модели машинного обучения для оценки релевантности объектов и фактов. Однако концептуальная модель, описанная в патенте (независимая оценка фактов, учет Confidence/Importance), остается высоко актуальной.

Knowledge Graph
Семантика и интент
Индексация

Knowledge Graph
Семантика и интент
Ссылки

Knowledge Graph
Семантика и интент
EEAT и качество

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
Семантика и интент
SERP

Ссылки
Индексация
Техническое SEO

EEAT и качество
Антиспам
SERP

Антиспам
Ссылки
Техническое SEO

Семантика и интент
Поведенческие сигналы
SERP

Ссылки
Индексация
Мультимедиа

Персонализация
Поведенческие сигналы
Local SEO

Персонализация
Поведенческие сигналы

SERP
Семантика и интент
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Антиспам
