
Google использует многоэтапную систему для проверки фактов, извлеченных из интернета. Чтобы факт попал в базу знаний, он должен быть подтвержден несколькими независимыми источниками. Система оценивает распространенность атрибута и достоверность значения, учитывая авторитетность (например, PageRank) источников. Если источник доказал свою надежность, требования к другим его фактам снижаются или отменяются.
Патент решает проблему обеспечения качества и достоверности данных в автоматизированной базе фактов (Fact Repository, аналог Knowledge Graph), которая наполняется путем извлечения информации из множества веб-источников. Он устраняет риск включения в базу ошибочных, устаревших, тривиальных или намеренно ложных фактов ("gaming"). Цель — создать механизм, который подтверждает (corroborates) факты, основываясь на консенсусе и авторитетности источников.
Запатентована система и метод подтверждения фактов, представленных в виде пар атрибут-значение (A-V pairs). Система использует двухуровневую модель проверки: сначала оценивается значимость атрибута на основе его распространенности в источниках (First Corroboration Requirement), а затем определяется наиболее достоверное значение для этого атрибута (Second Corroboration Requirement), учитывая количество и авторитетность (Page Importance Metric, например, PageRank) подтверждающих источников. Также запатентован механизм "бутстрэппинга" доверия: источники, предоставившие много подтвержденных фактов, признаются надежными, и требования к другим их фактам снижаются.
Система работает в несколько этапов:
A-V pairs) извлекаются из веб-документов и группируются по общему субъекту (common subject).page importance-weighted score).predefined margin) превышает оценки конкурентных значений, обеспечивая четкий консенсус.Высокая. Описанные механизмы являются фундаментальными для построения и поддержания качества Knowledge Graph. В условиях роста объемов контента и дезинформации, системы автоматизированной проверки фактов на основе консенсуса и авторитетности источников критически важны для Google.
Патент имеет высокое значение (8/10) для SEO, особенно в области Entity SEO и управления информацией в Knowledge Panel. Он демонстрирует, что Google не полагается на один источник (даже официальный сайт), а ищет подтверждение фактов в независимых и авторитетных источниках. Это подчеркивает критическую важность последовательного распространения точной информации об организации на авторитетных сторонних ресурсах.
First Corroboration Requirement (для атрибута) и Second Corroboration Requirement (для значения).Objects.Page Importance Metrics источников, поддерживающих данное значение.First Source Count Score) или конкретное значение (Second Source Count Score).Claim 1 (Независимый пункт): Описывает основной метод подтверждения фактов.
A-V pairs).Fact Repository.First Corroboration Requirement, И что сама пара (атрибут+значение) соответствует Second Corroboration Requirement.Это определяет двухуровневую систему проверки: сначала проверяется атрибут, затем значение.
Claim 7 (Независимый пункт): Описывает метод подтверждения с акцентом на механизм оценки.
A-V pairs.first score) на основе атрибута.second score) на основе атрибута и значения.predefined margin.Fact Repository.Этот пункт детализирует, как работают требования подтверждения: через сравнение оценок с порогами и обеспечение значительного отрыва победителя.
Изобретение применяется на этапе обработки данных для наполнения базы знаний (Knowledge Graph).
CRAWLING – Сканирование и Сбор данных
На этом этапе собираются исходные документы (Sources) и вычисляются их метрики авторитетности (Page Importance Metric, например, PageRank).
INDEXING – Индексирование и извлечение признаков
Основное применение патента. Это не стандартное индексирование веб-страниц, а процесс обработки данных для Fact Repository.
Importer) извлекает A-V pairs из документов.Common Subject).Repository Manager) применяет описанный алгоритм для проверки фактов с использованием Source Count Scores и Page Importance Metrics.Accepted A-V pairs) сохраняются в Fact Repository и индексируются в Fact Index.RANKING / METASEARCH
Подтвержденные факты из Fact Repository используются на этих этапах для формирования ответов на фактические запросы и отображения Knowledge Panels.
Входные данные:
A-V pairs.Page Importance Metrics (например, PageRank) для каждого источника.Выходные данные:
Accepted A-V pairs) в Fact Repository.YMYL-тематик, где точность фактов имеет первостепенное значение.Fact Repository или при периодической переоценке уже хранящихся фактов для поддержания их актуальности и точности.Процесс подтверждения фактов можно разделить на три фазы.
Фаза 1: Первичное подтверждение (Initial Corroboration)
A-V pairs).First Source Count Score (количество независимых источников, упоминающих этот атрибут).Second Source Count Score и Page importance-weighted score (на основе PageRank источников).Second Source Count Score превышает второй порог (M).Page importance-weighted score превышает оценки конкурентов на predefined margin (например, по формуле
Source Count Score), чтобы считаться достоверным.Page Importance Metric (PageRank) используется для взвешивания голосов.predefined margin). Это защищает систему от принятия фактов в спорных или неоднозначных ситуациях.Рекомендации направлены на оптимизацию сущностей (Entity SEO) и обеспечение корректного попадания информации в Knowledge Graph.
Source Count Scores.Page Importance Metric (PageRank). Пресс-релизы в авторитетных СМИ, интервью, авторитетные отраслевые обзоры имеют больший вес в подтверждении фактов.Importer) и позиционирует ваш сайт как надежный источник данных о себе.predefined margin).Page Importance Metric (PageRank) и требует независимости источников.Патент подтверждает стратегию Google по построению семантической сети знаний, основанной на машинном анализе веба, но с сильным акцентом на авторитетность и консенсус. Для SEO это означает, что управление сущностью (Entity Management) выходит за рамки оптимизации собственного сайта. Digital PR и работа с внешними авторитетными площадками становятся не просто инструментом построения ссылок, а критически важным механизмом для валидации фактов о бизнесе в глазах Google.
Сценарий: Подтверждение даты основания компании
Компания "Ромашка" хочет, чтобы в Knowledge Panel отображалась дата основания: 1995 год.
Page importance-weighted score. Несмотря на меньшее количество источников, оценка для "2001" оказывается значительно выше из-за высокого PageRank источников.Как Google определяет, какой факт верный, если источники противоречат друг другу?
Google использует систему взвешенных оценок. Он не просто считает количество источников, поддерживающих тот или иной факт, но и учитывает их авторитетность (Page Importance Metric, например, PageRank). Факт, поддержанный меньшим количеством, но более авторитетных источников, может победить. Кроме того, для принятия факта требуется, чтобы его оценка значительно превышала оценки конкурентов (predefined margin).
Имеет ли значение PageRank в 2025 году в контексте этого патента?
Да, имеет. Патент явно указывает PageRank как пример Page Importance Metric, используемой для взвешивания голосов источников при подтверждении фактов. Хотя внутренние механизмы Google эволюционировали, базовая концепция использования метрики авторитетности источника для оценки достоверности извлеченных из него фактов остается критически важной для Knowledge Graph.
Может ли информация с моего официального сайта попасть в Knowledge Panel, если ее нет больше нигде?
Это маловероятно для большинства сайтов. Патент описывает, что для подтверждения факта требуется несколько независимых источников (преодоление порогов N и M). Исключение составляют только сайты, которые уже классифицированы как "высоконадежные источники" (Фаза 3 алгоритма), например, крупные государственные порталы или мировые базы данных, чьи факты могут приниматься автоматически.
Что такое "бутстрэппинг доверия" (Trust Bootstrapping) в этом патенте?
Это механизм повышения доверия к источнику на основе его предыдущей точности. Если система приняла много фактов из определенного источника (превышен порог P), она начинает считать этот источник высоконадежным. После этого оставшиеся факты из данного источника могут приниматься автоматически, без стандартной процедуры подтверждения.
Как этот патент влияет на локальное SEO и Google Business Profile (GBP)?
Он напрямую влияет на данные, которые Google считает достоверными для локального бизнеса. GBP является одним из источников, но не единственным. Для подтверждения NAP (Name, Address, Phone), часов работы и других атрибутов Google ищет подтверждение в каталогах, СМИ, на картах и других сайтах. Несоответствия между GBP и другими авторитетными источниками могут привести к игнорированию данных из GBP.
Что важнее: количество сайтов, упоминающих факт, или их качество?
Важны оба аспекта. Необходимо преодолеть пороговые значения по количеству источников (пороги N и M), чтобы факт вообще рассматривался. Однако при разрешении конфликтов и финальном выборе значения решающую роль играет качество (авторитетность) источников, выраженное через Page importance-weighted score.
Как бороться с неверной информацией о моем бренде в Knowledge Panel?
Необходимо определить источник, который Google использует для этого факта. Затем нужно либо исправить информацию в этом источнике (если он авторитетный), либо обеспечить публикацию корректной информации на множестве других сайтов, чей суммарный авторитет значительно превысит авторитет источника ошибки, чтобы сместить консенсус.
Что означает требование "предопределенного отрыва" (predefined margin)?
Это означает, что Google ищет явный, "однобокий" консенсус. Если оценки двух разных значений близки (например, 51% против 49%), система, скорее всего, не примет ни одно из них, так как отрыв недостаточен. Это защищает базу фактов от включения спорной или неоднозначной информации.
Учитывает ли система синонимы при подсчете фактов?
Да, патент упоминает возможность идентификации синонимичных или эквивалентных атрибутов (например, "Дата рождения" и "День рождения") и значений. При расчете Source Count Scores они могут группироваться вместе, что подчеркивает важность семантического понимания данных.
Какова роль Schema.org в контексте этого патента?
Schema.org помогает системе на этапе извлечения фактов (Importer) более точно идентифицировать пары атрибут-значение на вашем сайте. Хотя сама по себе разметка не гарантирует принятие факта (так как требуется подтверждение из нескольких источников), она повышает вероятность того, что ваш сайт будет корректно учтен в процессе оценки консенсуса.

Knowledge Graph
Семантика и интент
SERP

Семантика и интент
Ссылки
Knowledge Graph

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
EEAT и качество
Семантика и интент

EEAT и качество
Техническое SEO
Ссылки

Ссылки
SERP

Поведенческие сигналы
Семантика и интент

EEAT и качество
SERP
Поведенческие сигналы

Ссылки
EEAT и качество
Антиспам

Ссылки
Индексация
Поведенческие сигналы

Ссылки
SERP

Семантика и интент
Поведенческие сигналы
EEAT и качество

Knowledge Graph
Семантика и интент
Ссылки

Local SEO
Поведенческие сигналы

Персонализация
SERP
Ссылки
