
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
Патент решает проблему поддержания актуальных связей (гиперссылок) в динамически растущей базе знаний (Fact Repository). Традиционные фиксированные ссылки требуют ручного создания, ломаются при изменении структуры базы данных и не позволяют связать существующий контент с объектами, добавленными позже. Изобретение автоматизирует процесс идентификации упоминаний известных объектов (сущностей) в тексте и создания динамических, устойчивых связей.
Запатентован метод автоматического распознавания именованных сущностей (объектов) и их динамического связывания внутри хранилища фактов. Система создает список имен всех известных объектов, а затем анализирует текстовые значения фактов, используя статистические методы (phrase-identification metric) для выявления фраз, соответствующих этим именам. При совпадении система генерирует Search Link (поисковую ссылку), которая динамически запрашивает объект по имени, а не использует фиксированный URL.
Система работает в два основных этапа, выполняемых компонентом Janitor:
Object Names List), хранящихся в Fact Repository.Information Gain (прирост информации), для определения статистически значимых последовательностей слов. Затем эти фразы сверяются со списком имен объектов (с помощью хеш-таблицы).Search Link. Эта ссылка содержит поисковый запрос, который ищет объекты с данным именем.Весь процесс автоматически повторяется при выполнении определенных условий, обеспечивая актуальность связей.
Высокая. Патент описывает фундаментальные механизмы для построения и поддержания крупномасштабных баз знаний, таких как Google Knowledge Graph. Процессы распознавания именованных сущностей (NER) и связывания сущностей (Entity Linking), описанные здесь, являются критически важными для семантического поиска и понимания контента в 2025 году.
Патент имеет высокое стратегическое значение для SEO (85/100). Он раскрывает инфраструктурные процессы, лежащие в основе того, как Google идентифицирует и связывает сущности. Понимание этих механизмов критично для стратегий, ориентированных на сущности (Entity-Oriented Search). Патент подтверждает важность использования четких, последовательных и статистически значимых наименований для сущностей, чтобы облегчить их распознавание и связывание системами Google.
Object ID и набором связанных фактов.Attribute) и Значения (Value).search query), который ищет объекты по определенным критериям (например, имени).Claim 1 (Независимый пункт): Описывает основной метод автоматического связывания объектов в хранилище фактов.
list of object names), который хранится в виде хеш-таблицы (hash table).phrase-identification metric для разных комбинаций терминов, чтобы идентифицировать потенциальные фразы (candidate phrases).hash) фразы коллизию в хеш-таблице имен.search link для факта. Выбор этой ссылки инициирует выполнение поискового запроса (search query) к хранилищу, используя имя объекта как критерий поиска.predefined criteria), система автоматически повторяет шаги a-d (обновление связей).Claim 3, 4 и 5 (Зависимые): Уточняют процесс идентификации фраз.
Идентификация включает формирование последовательностей смежных терминов и проверку, является ли последовательность значимой фразой. Проверка (Claim 4, 5) основана на том, превышает ли Information Gain последовательности порог, или превышает ли вероятность последовательности совместную вероятность отдельных терминов.
Claim 6 и 7 (Зависимые): Описывают возможность уточнения поискового запроса в ссылке (дизамбигуация).
Система может включать в критерии поискового запроса (search criteria) в search link дополнительные атрибуты объекта (например, категорию — Claim 6, или другой атрибут — Claim 7) для повышения точности связывания.
Изобретение описывает процессы, происходящие внутри системы обработки данных Google, и затрагивает этап индексирования и структурирования данных.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Процесс происходит после того, как Importers извлекли факты из документов (CRAWLING), и выполняется компонентом Janitor.
Importers помещают факты в Fact Repository.Janitor выполняет очистку, нормализацию и процесс автоматического связывания. Это включает распознавание сущностей (NER) внутри значений фактов и их связывание (Entity Linking) с другими объектами в хранилище.Этот процесс создает структурированную, взаимосвязанную базу знаний (граф знаний) из изначально слабоструктурированных данных.
Входные данные:
Fact Repository (включая Name Facts и факты с текстовыми значениями).Information Gain.Выходные данные:
Object Names List (список имен объектов).Fact Repository, содержащие встроенные Search Links (ссылки на другие объекты).predefined criteria). Эти критерии могут включать (Claims 9-11): Процесс автоматической идентификации и связывания объектов (выполняется компонентом Janitor).
Fact Repository и извлекает все Name Facts. Создается Object Names List. Он хранится в виде хеш-таблицы для быстрого поиска. Опционально, вместе с именами сохраняются ключевые атрибуты (например, категория).Value) фактов в хранилище.candidate phrases). phrase-identification metric (например, Information Gain). Метрика определяет статистическую значимость совместного появления этих слов.Object Names List. Это делается путем хеширования фразы и проверки наличия коллизии в хеш-таблице имен.search query). Например: [attribute{name} value{"Имя Объекта"}].anchor text) для этой поисковой ссылки.Fact Repository.predefined criteria.Патент фокусируется на обработке данных, уже находящихся в хранилище фактов.
Object Names List.Name Facts и опционально для уточнения поисковых запросов (например, атрибут "Категория").Information Gain). Система определяет значимые фразы, основываясь на том, насколько часто слова появляются вместе по сравнению с их индивидуальной частотой.Object Names List). Использование Search Links вместо фиксированных ссылок делает систему гибкой и позволяет связывать упоминания с сущностями, добавленными в базу позже исходного текста.Search Link с помощью дополнительных атрибутов (например, категории объекта) для разрешения неоднозначностей, когда одно имя относится к разным сущностям.predefined criteria), что обеспечивает постоянное обогащение и актуализацию Графа Знаний.Information Gain) идентифицирует имя как значимую фразу и корректно свяжет его с объектом в Knowledge Graph.Fact Repository (через Schema.org, авторитетные источники и т.д.). Чем раньше сущность попадает в Object Names List, тем быстрее система начнет автоматически связывать упоминания о ней.Information Gain идентифицировать ее.Патент подтверждает фундаментальную роль автоматизированного извлечения знаний и построения Графа Знаний в поиске. Стратегия SEO должна быть сфокусирована на оптимизации сущностей (Entity-Oriented SEO). Важно помогать Google корректно идентифицировать ваши ключевые сущности и понимать их взаимосвязи. Понимание того, что Google использует статистический анализ фраз для распознавания сущностей, подчеркивает важность последовательности, частотности и контекста упоминаний.
Сценарий: Помощь Google в распознавании нового продукта
Компания запускает новый продукт с уникальным названием, например, "Synergix Quantum Processor". Цель — чтобы Google быстро распознал это название как значимую фразу и связал ее с сущностью продукта.
Importer извлекает эти тексты. Алгоритм Information Gain анализирует частоту совместного появления этих трех слов. Из-за высокой частоты совместного употребления система идентифицирует "Synergix Quantum Processor" как значимую фразу (candidate phrase).Search Link), если появится другой продукт с похожим названием.Что такое "Fact Repository" в контексте этого патента?
Fact Repository — это база данных, где Google хранит извлеченную фактическую информацию в формате Объект-Атрибут-Значение. Это техническая реализация того, что мы обычно называем базой знаний или Knowledge Graph. Она содержит сущности (Объекты) и факты о них.
Как система определяет, является ли фраза в тексте именем сущности?
Система использует двухэтапный процесс. Сначала она применяет статистическую метрику (например, Information Gain), чтобы определить, является ли последовательность слов статистически значимой фразой. Затем она проверяет, присутствует ли эта значимая фраза в списке уже известных имен объектов (Object Names List), используя хеш-таблицу для быстрого поиска.
Что такое "Information Gain" и как он помогает распознавать сущности?
Information Gain измеряет, насколько часто слова появляются вместе по сравнению с тем, как часто они появляются по отдельности. Если слова появляются вместе значительно чаще, чем ожидалось бы случайно (например, "Нью-Йорк Таймс"), система считает эту последовательность устойчивой фразой. Это позволяет идентифицировать имена сущностей, состоящие из нескольких слов, как единое целое.
Что означает, что ссылки являются "Search Links", а не фиксированными?
Вместо того чтобы ссылаться на конкретный адрес (URL), Search Link содержит поисковый запрос (например, "найти объект с именем X"). Это означает, что ссылка динамически ищет цель в момент активации. Это делает базу знаний гибкой: даже если целевой объект был добавлен или изменен после создания ссылки, она останется рабочей.
Как этот патент влияет на SEO-стратегию по работе с сущностями (Entity SEO)?
Он подчеркивает критическую важность последовательности и четкости в именовании сущностей. Чтобы Google корректно распознал и связал вашу сущность, необходимо использовать ее официальное имя часто и последовательно во всех источниках. Это увеличит ее статистическую значимость как фразы и облегчит работу алгоритмов распознавания.
Как система справляется с неоднозначностью имен (дизамбигуацией)?
Патент предусматривает механизм для уточнения Search Link (Claims 6, 7). Система может включать в поисковый запрос ссылки не только имя, но и дополнительные атрибуты объекта, например, его категорию (Человек, Город, Фильм). Это помогает направить ссылку на правильный объект, если в базе есть несколько объектов с одинаковым именем.
Что такое компонент "Janitor" и какова его роль?
Janitor — это компонент системы, отвечающий за постобработку извлеченных фактов. Его задачи включают очистку данных, удаление дубликатов, нормализацию форматов и, как описано в патенте, выполнение процесса автоматического распознавания и связывания сущностей в Fact Repository.
Как часто обновляется база знаний и эти связи?
Патент указывает, что генерация связей происходит автоматически при выполнении "предопределенных критериев" (Claim 1). Это подразумевает периодическое обновление (по времени) или обновление по триггеру (по количеству новых или измененных фактов) для отражения изменений в данных.
Влияет ли структура предложений на распознавание сущностей согласно патенту?
Да, косвенно. Поскольку алгоритм ищет последовательности смежных терминов (Claim 3) для формирования фраз, использование сложных предложений, разрывающих имя сущности, может затруднить ее идентификацию на этапе формирования потенциальных фраз. Рекомендуется использовать четкие и прямые упоминания.
Означает ли этот патент, что Google игнорирует разметку Schema.org?
Нет. Этот патент описывает автоматизированный механизм для построения связей на основе анализа текста. Однако Schema.org является важным источником данных, который помогает Google (компоненту Importer) извлекать факты и формировать Name Facts, что является необходимым условием для последующей работы механизма связывания, описанного в патенте.

Knowledge Graph
Семантика и интент
SERP

Ссылки
Семантика и интент
Техническое SEO

Семантика и интент
Индексация
Knowledge Graph

Knowledge Graph
Семантика и интент
Индексация

Knowledge Graph
Семантика и интент
EEAT и качество

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Local SEO

Ссылки
SERP

Персонализация
SERP
Ссылки

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Персонализация

SERP
Поведенческие сигналы
EEAT и качество

Мультиязычность
Семантика и интент
Ссылки

Индексация
Поведенческие сигналы
Семантика и интент
