
Патент описывает архитектуру Google для создания и использования Репозитория Фактов. Система извлекает факты из интернета, связывает их с объектами (сущностями), очищает и нормализует данные. В ответ на запрос система находит релевантные факты и возвращает их в формате структурированного фида (например, XML/RSS). Это foundational-технология для поиска по сущностям и формирования Графа Знаний.
Патент решает задачу организации и предоставления доступа к огромному количеству фактической информации, разбросанной по интернету в различных форматах. Он предлагает способ перехода от традиционного поиска по документам (веб-страницам) к поиску по объектам (сущностям) и связанным с ними фактам. Это позволяет системе напрямую отвечать на запросы фактической информацией, а не только ссылками.
Запатентована система и метод для создания, управления и запроса к Репозиторию Фактов (Fact Repository). Система хранит факты, каждый из которых связан с определенным объектом (Object) и состоит из пары атрибут-значение. Ключевым элементом является механизм обслуживания запросов: система принимает поисковый запрос, находит соответствующие факты в репозитории и возвращает эти факты (и, опционально, другие факты того же объекта) запрашивающей стороне в формате структурированного фида (например, XML, Atom, RSS).
Система работает в двух основных режимах: Построение и Обслуживание.
Импортеры (Importers) извлекают факты из веб-документов. Дворники (Janitors) очищают, нормализуют данные и объединяют дубликаты объектов и фактов. Данные хранятся в Fact Repository, где каждый факт привязан к Object ID.Object Requester (например, поисковая система или приложение) отправляет запрос. Service Engine ищет в индексе факты, соответствующие запросу. Система оценивает релевантность фактов и объектов, используя метрики качества. Найденные факты форматируются в XML-фид и возвращаются.Критически высокая. Этот патент описывает фундаментальную архитектуру того, что впоследствии стало известно как Граф Знаний (Knowledge Graph). Поиск, основанный на сущностях (Object Search), и хранение структурированных фактов являются центральными элементами современного поиска Google. Описанные процессы извлечения и нормализации напрямую влияют на то, как информация отображается в Knowledge Panels и других структурированных результатах.
Патент имеет фундаментальное значение (95/100). Он описывает инфраструктуру, которая лежит в основе Entity-First Indexing и Графа Знаний. Понимание того, как Google извлекает, хранит, нормализует и ранжирует факты об объектах, критически важно для любой современной SEO-стратегии. Это напрямую влияет на видимость бренда/сущности в Knowledge Panels, Rich Snippets и на способность сайта быть надежным источником фактов для Google.
Fact Repository.Object ID, Fact ID, Attribute и Value. Также может включать метрики (Metrics), источники (Sources) и ссылки на другие объекты (Links).object merging) и дедупликацию фактов.Confidence level (уровень уверенности в корректности факта) и Importance level (важность факта для понимания объекта).Object ID.Fact Repository.Fact Repository. Обрабатывает запросы, оценивает (скорит) соответствующие объекты и возвращает результаты.Claim 1 (Независимый пункт): Описывает основной метод запроса к репозиторию фактов.
Fact Repository. Каждый факт связан с объектом и имеет атрибут и значение. Каждый объект имеет Name Fact.Object Requester).Claim 3 (Зависимый от 1): Уточняет механизм извлечения.
Извлечение факта из репозитория основывается на relevance score (оценке релевантности) этого факта по отношению к поисковому запросу.
Claim 6 (Зависимый от 1): Ключевой пункт, описывающий переход от поиска фактов к поиску объектов.
Object ID, связанный с извлеченным фактом (из Claim 1).Object ID.Это означает, что даже если запрос совпал только с одним фактом, система возвращает набор фактов об объекте.
Claims 7, 8, 9 (Зависимые от 1): Уточняют формат передачи данных.
Отправка атрибута и значения факта осуществляется с использованием формата фида: Atom (Claim 7), RSS (Claim 8) или OpenSearch (Claim 9).
Claims 10-14 (Зависимые от 1): Описывают параметры поискового запроса.
Запрос может содержать параметры, контролирующие выдачу: строку запроса ("q" parameter), максимальное количество возвращаемых объектов, индекс первого возвращаемого объекта, максимальное количество фактов на объект и максимальное количество источников на факт.
Claim 15 (Зависимый от 1): Описывает передачу аннотаций.
Система также отправляет annotation (аннотацию), связанную с фактом. Аннотация содержит часть значения этого факта.
Этот патент описывает инфраструктуру, которая глубоко интегрирована в процессы индексирования и ранжирования, являясь основой для хранения и использования структурированных данных.
CRAWLING – Сканирование и Сбор данных
Импортеры (Importers) работают с данными, полученными на этом этапе. Они анализируют контент документов для извлечения фактов.
INDEXING – Индексирование и извлечение признаков
Основной этап для построения Fact Repository.
Импортеры извлекают пары атрибут-значение и связывают их с объектами (присваивают Object ID).Дворники (Janitors) выполняют критически важные функции: нормализуют названия атрибутов (например, "Дата рождения" и "Родился" объединяются), нормализуют значения (например, форматы дат), объединяют дублирующиеся объекты (Object Merging) и удаляют избыточные факты.Confidence и Importance для каждого факта.Index для быстрого поиска.QUNDERSTANDING – Понимание Запросов
Service Engine должен интерпретировать входящий запрос, чтобы определить, следует ли искать информацию в Fact Repository (например, если запрос является фактическим или связан с конкретным объектом).
RANKING – Ранжирование
Service Engine использует Index для поиска фактов и объектов, соответствующих запросу. Ранжирование объектов основано на комбинации оценок релевантности (relevance scores) отдельных фактов. Оценка факта учитывает TF-IDF, совпадение фраз, появление термина в Name Fact, а также метрики Confidence и Importance.
METASEARCH – Метапоиск и Смешивание
Результаты из Fact Repository предоставляются в виде XML-фида. На практике это позволяет поисковой системе (выступающей в роли Object Requester) получать структурированные данные для формирования специальных блоков выдачи, таких как Knowledge Panels или прямые ответы.
Confidence) особенно важны.Object Requester отправляет запрос в Fact Repository. Это может быть запрос на конкретный Object ID или поисковый запрос по ключевым словам.Патент описывает два основных процесса: построение репозитория и обслуживание запросов.
Процесс А: Построение и Поддержка Репозитория (Офлайн)
Object ID и Fact ID. Сбор источников (URL) для каждого факта.Confidence и Importance для каждого факта. Создание Annotations (даты, числа, геолокации).Fact Repository и обновление индекса для поиска по атрибутам и значениям.Процесс Б: Обслуживание Запросов (Рантайм)
Object Requester.Service Engine ищет в индексе факты, соответствующие ключевым словам запроса.relevance score для каждого совпавшего факта (используя TF-IDF, совпадение фраз и т.д.).Confidence и Importance.Object ID, источников и аннотаций в запрошенный формат фида (например, XML Atom, RSS).Object Requester.Sources) для фактов.Система использует несколько ключевых метрик для оценки фактов и объектов:
Name Fact.relevance scores его фактов, скорректированных на Confidence и Importance. Также учитывается процент фактов объекта, содержащих хотя бы один термин запроса.Fact Repository – базы данных объектов и фактов, что является основой для Графа Знаний. Это подтверждает переход Google от индексирования строк к индексированию сущностей (вещей).Импортеров и особенно Дворников (Janitors) подчеркивает важность автоматической очистки, дедупликации и нормализации данных. Система стремится привести разрозненные данные из интернета к единому стандартизированному виду.Confidence (достоверность) и Importance (важность для объекта). Более важные и достоверные факты имеют приоритет.Дворников (Janitors) по нормализации и объединению объектов (Object Merging).Импортерам корректно извлекать факты (пары Атрибут-Значение) и повышает Confidence извлеченных данных.Аннотаций (например, дат, чисел, геолокаций). Подача информации в таблицах и списках также упрощает извлечение.Sources и Confidence, важно становиться авторитетным источником информации. Чем чаще ваш сайт цитируется как источник достоверного факта, тем выше вероятность его использования системой.Importance) для вашей сущности, и убедитесь, что они представлены наиболее полно и достоверно.Fact Repository или снижению Confidence в данных.Импортеров.Confidence. Если система определит расхождения с более авторитетными источниками, факты будут проигнорированы.Этот патент является одним из самых важных для понимания эволюции Google в сторону семантического поиска. Стратегическое значение заключается в осознании того, что Google строит собственную базу знаний о мире (Fact Repository) и использует ее для прямого ответа на запросы. Долгосрочная SEO-стратегия должна быть направлена на то, чтобы стать надежным поставщиком данных для этого репозитория и обеспечить корректное представление своих сущностей внутри него. Работа над E-E-A-T напрямую связана с повышением Confidence в фактах, извлеченных с вашего сайта.
Сценарий: Оптимизация карточки компании для Fact Repository
Цель: Обеспечить корректное извлечение и высокую достоверность (Confidence) фактов о компании для использования в Knowledge Panel.
Organization, указав все ключевые атрибуты (name, address, founder, foundingDate, sameAs). Для ключевых фактов использовать формат, удобный для создания Аннотаций (например, стандартизированный формат даты).Импортеры корректно извлекают факты. Дворники успешно связывают информацию из разных источников с единым Object ID компании. Факты получают высокий Confidence и используются в ответ на запросы о компании (отображаются в Knowledge Panel).Что такое "Fact Repository" в контексте этого патента и как он связан с Графом Знаний (Knowledge Graph)?
Fact Repository — это база данных, описанная в патенте, для хранения фактической информации, извлеченной из интернета. Каждый факт представлен как триплет (Объект-Атрибут-Значение). Этот репозиторий является прямым предшественником или ранней реализацией Графа Знаний Google, предоставляя инфраструктуру для хранения, управления и запроса структурированных данных о сущностях.
Какова роль "Дворников" (Janitors) и как SEO-специалист может облегчить им работу?
Janitors отвечают за очистку данных, нормализацию (приведение к единому формату) и объединение дубликатов фактов и объектов. SEO-специалисты могут помочь, предоставляя абсолютно согласованную информацию (например, NAP компании) на всех платформах и используя стандартные форматы данных (например, ISO для дат). Это повышает вероятность того, что система корректно объединит информацию о вашей сущности.
Что означают метрики "Confidence" и "Importance" для факта?
Confidence (Уверенность) — это оценка вероятности того, что факт является корректным, основанная, вероятно, на авторитетности и согласованности источников. Importance (Важность) — это оценка того, насколько данный факт важен для понимания сущности (например, "Дата рождения" важнее, чем "Любимый цвет"). Обе метрики используются при ранжировании фактов и объектов в ответ на запрос.
Патент описывает возврат результатов в виде XML-фида (RSS/Atom). Как это связано с тем, что я вижу в поисковой выдаче?
Система поиска Google сама выступает в роли Object Requester. Она запрашивает данные у Fact Repository, получает структурированный XML-фид и затем использует эти данные для рендеринга элементов поисковой выдачи. Например, Knowledge Panel формируется на основе данных, полученных из этого фида.
Что означает "Object Search" в этом патенте?
Это ключевая концепция, описанная в Claim 6. Она означает, что даже если запрос пользователя совпадает только с одним конкретным фактом, система идентифицирует объект, которому принадлежит этот факт, и возвращает также другие связанные факты об этом объекте. Это переход от поиска документов или отдельных фактов к возврату полноценного профиля сущности.
Как система ранжирует объекты и факты?
Факты ранжируются на основе Relevance Score (учитывая TF-IDF, совпадение фраз), скорректированного на Confidence и Importance. Объекты ранжируются на основе линейной комбинации оценок их отдельных фактов. Факты, в которых запрос совпадает с именем объекта (Name Fact), получают дополнительное повышение.
Какое значение имеют "Аннотации" (Annotations) и как они используются?
Аннотации позволяют системе "понимать" структуру значения факта. Например, в предложении "Он родился в 1990 году" аннотация выделит "1990" как дату. Это позволяет использовать эти данные для дальнейшей обработки, фильтрации или специфического отображения (например, построения таймлайна или карты).
Влияет ли микроразметка Schema.org на процессы, описанные в этом патенте?
Да, напрямую. Микроразметка является одним из основных способов помочь Импортерам (Importers) корректно извлекать факты и атрибуты. Предоставление данных в структурированном формате значительно повышает вероятность их попадания в Fact Repository и увеличивает метрику Confidence для этих фактов.
Как этот патент влияет на локальное SEO?
Он имеет огромное значение, так как локальные бизнесы являются объектами (сущностями) с четкими фактами (адрес, телефон, часы работы). Аннотации GeoPt (геолокация) используются для связи фактов с местоположением. Согласованность NAP критична для того, чтобы Janitors корректно объединили информацию о локальном бизнесе из разных источников.
Что делать, если в Fact Repository (Графе Знаний) содержатся неверные данные о моей компании?
Необходимо работать над повышением Confidence правильных фактов. Убедитесь, что правильная информация четко указана на вашем сайте с использованием микроразметки, обновите данные в авторитетных источниках (Google Business Profile, Википедия, отраслевые каталоги). Со временем Janitors должны обработать новую информацию и скорректировать данные в репозитории, отдав предпочтение фактам с более высоким Confidence.

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
Семантика и интент
Ссылки

Индексация
SERP

Knowledge Graph
Семантика и интент
SERP

Семантика и интент
Knowledge Graph
SERP

Персонализация
Семантика и интент
Мультимедиа

Поведенческие сигналы
SERP
Семантика и интент

Персонализация
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Ссылки
SERP

Структура сайта
SERP
Ссылки

EEAT и качество
SERP
Поведенческие сигналы

Поведенческие сигналы
Мультимедиа
Семантика и интент

Поведенческие сигналы
Local SEO

Ссылки
Индексация
Техническое SEO
