
Система Google для заполнения пробелов в Графе Знаний. Если факт отсутствует (например, отношение «дедушка»), система ищет текстовые подтверждения в интернете («A — дедушка B»). Затем она анализирует существующие связи в графе (например, A — родитель C, C — родитель B) и выводит правило (Родитель + Родитель = Дедушка). Это позволяет отвечать на фактические запросы, даже если связь явно не указана в базе знаний.
Патент решает проблему неполноты данных в реляционных моделях знаний, таких как Data Graph (например, Google Knowledge Graph). Даже самые большие графы могут не содержать миллионы фактов или отношений (ребер) между сущностями (узлами). Система направлена на автоматический вывод (инференс) недостающей информации, основываясь на существующих данных в графе и анализе неструктурированного контента в интернете, чтобы улучшить ответы на прямые вопросы.
Запатентована система, которая изучает значение отношений, отсутствующих в Data Graph, путем сопоставления текстовых шаблонов из интернета с существующими путями в графе. Система генерирует алгоритм (algorithm) или правило вывода, которое представляет это новое отношение (например, определяя «дедушку» как путь «родитель родителя»). Это позволяет системе отвечать на сложные вопросы, требующие многошагового вывода, даже если факт явно не сохранен.
Система работает в двух основных режимах: Офлайн-обучение (Inference) и Онлайн-ответы (Question Answering).
template sentence), например, «X — это [АТРИБУТ] для Y». Она сканирует веб-документы в поисках этого шаблона. Если текст подтверждает отношение (например, «Зак — дедушка Карины»), система ищет существующие пути в Data Graph, соединяющие X и Y. Наилучший путь (например, через ребра «ребенок»-«ребенок») сохраняется как алгоритм для этого атрибута. Этот алгоритм проходит строгую верификацию.path) от начального узла (Карина) до конечного узла (Зак) и возвращает ответ.Высокая. Полнота и точность Knowledge Graph критически важны для современных поисковых систем, особенно для генерации прямых ответов (Featured Snippets) и Панелей Знаний. Автоматическое обучение и вывод новых фактов (Inference) без ручной разметки является ключевым направлением развития семантического поиска и ИИ.
Влияние на SEO значительное (7/10), хотя и косвенное. Патент описывает, как Google использует контент из интернета для обучения своей системы инференса и расширения Графа Знаний. Это напрямую влияет на Entity SEO и E-E-A-T. Предоставление четкой, семантически однозначной информации о сущностях и их взаимосвязях в веб-документах критически важно, чтобы система могла корректно извлечь, интерпретировать и использовать эти данные.
Data Graph, представляющий сущность реального мира (человек, место, вещь). Может иметь свойства (properties).Data Graph и генерирует вывод (инференс) для этой информации.Inference Engine. Оно представляет собой серию соединений (series of connections) или путь (path) между узлами и ребрами, которая определяет отсутствующий атрибут.Data Graph, соединяющая два узла. Используется для вывода недостающих отношений.Template Sentence.Патент описывает два основных процесса: ответ на запрос (Claim 1) и обучение/вывод фактов (Claim 6).
Claim 1 (Независимый пункт): Описывает процесс ответа на запрос в реальном времени, когда факт отсутствует в графе.
Data Graph.path) от первого узла ко второму узлу. Путь включает как минимум один промежуточный (третий) узел.property), связанное со вторым (конечным) узлом, как ответ на запрос.Это механизм использования ранее изученных путей (алгоритмов) для ответов на вопросы, требующие многошагового рассуждения в графе.
Claim 6 (Независимый пункт): Описывает офлайн-процесс обучения (генерации вывода/инференса).
Data Graph.template sentence) на основе второго факта, включающего первый узел, второй узел и строку (string). Строка представляет отсутствующий первый факт.infer) первый факт путем генерации серии соединений (series of connections) между узлами и ребрами.Data Graph от первого узла ко второму узлу.Это механизм обучения, где система ищет текстовые подтверждения в интернете и сопоставляет их со структурой графа, чтобы изучить значение нового отношения.
Claim 15 (Зависимый от 6): Описывает процесс верификации сгенерированного пути (алгоритма).
Data Graph с использованием сгенерированной серии соединений (алгоритма), чтобы проверить, приводит ли она к правильному ответу.Изобретение охватывает несколько этапов поисковой архитектуры, фокусируясь на расширении базы знаний и улучшении ответов на вопросы.
CRAWLING – Сканирование и Сбор данных
Система активно сканирует интернет (или использует корпус Crawled Documents) для поиска экземпляров Template Sentences. Это сбор данных, используемых для обучения механизма вывода.
INDEXING – Индексирование и извлечение признаков (Офлайн-обучение)
Основной этап работы Inference Engine. Происходит офлайн (pre-processing).
parse tree) для идентификации сущностей и их отношений в тексте на основе шаблонов.Data Graph между сущностями, найденными в тексте.QUNDERSTANDING – Понимание Запросов / RANKING – Ранжирование (Онлайн-ответы)
На этапе обработки запроса (processing time) система определяет, что прямой ответ отсутствует в Data Graph. Она использует предварительно вычисленный алгоритм для обхода графа в реальном времени и нахождения ответа.
Входные данные (Обучение):
Data Graph.Template Sentences.Выходные данные (Обучение):
Входные данные (Ответы):
Data Graph.Выходные данные (Ответы):
Алгоритм применяется в двух основных сценариях:
Inference Engine запускается для поиска недостающей информации, анализа веба и генерации новых алгоритмов вывода. Триггером может служить анализ логов запросов (Search Records) для выявления часто запрашиваемых, но отсутствующих фактов.Data Graph, но для которого существует предварительно сгенерированный и верифицированный алгоритм вывода.Процесс разделен на три основных потока: Генерация вывода (Обучение), Верификация и Ответ на вопрос (Применение).
Поток А: Генерация алгоритма вывода (Обучение)
Data Graph, а [АТРИБУТ] отсутствует.Crawled Documents.parse tree).Data Graph, которые соединяют узел X и узел Y.Поток Б: Ответ на вопрос (Применение)
Поток В: Верификация алгоритма
Data Graph с теми же входными данными.Патент фокусируется на использовании структурных и текстовых данных для генерации выводов.
Data Graph. Это основа для поиска путей между сущностями.Crawled Documents). Система анализирует предложения, их синтаксическую структуру (parse tree) и семантику для идентификации отношений.Search Records), чтобы определить, какие виды информации пользователи часто запрашивают, и использовать это для приоритизации генерации алгоритмов.parse trees) для определения синтаксических и семантических отношений между словами в предложении.Data Graph. Система переводит наблюдения из неструктурированного текста в структурированные правила вывода.parse tree) для анализа текста. Чем проще системе понять, что "X является Y-ом Z" (например, "Зак Джонс — дедушка Карины Джонс"), тем выше вероятность использования этой информации для обучения Inference Engine.Template Sentences, основанными на часто встречающихся структурах.Data Graph, что облегчает последующий инференс.Data Graph.Этот патент подтверждает стратегию Google на построение максимально полного и точного Графа Знаний с минимальным ручным вмешательством. Google стремится не просто собирать данные, а понимать мир, моделируя сложные отношения. Для SEO это означает, что роль веб-сайтов как источников достоверной информации возрастает. Стратегия должна фокусироваться на Entity SEO: создании семантически богатого контента, который помогает Google не только узнать о сущностях, но и понять глубинные связи между ними.
Сценарий: Обучение Google сложной корпоративной структуре
Что такое «Алгоритм» (Algorithm) в контексте этого патента?
Это не алгоритм ранжирования. В данном патенте «Алгоритм» — это правило вывода или функция, которая представляет собой изученное отношение между сущностями. Он определяется как конкретный путь (последовательность ребер и узлов) в Графе Знаний. Например, алгоритм для «дедушки» может быть: «Пройти по ребру 'родитель' → еще раз по ребру 'родитель' → проверить свойство 'пол' = мужской».
Как система определяет, какой факт отсутствует в Графе Знаний и что нужно изучить?
Патент упоминает несколько способов. Inference Engine может анализировать журналы поисковых запросов (Search Records), чтобы определить, какие факты часто запрашиваются, но отсутствуют в графе. Также система может анализировать типы сущностей и искать недостающие атрибуты, характерные для этого типа (например, искать инструменты, на которых играют музыканты в группе).
Насколько важен текст на моем сайте для этого механизма?
Текст критически важен. Офлайн-процесс обучения полностью зависит от сканирования интернета (Crawled Documents) и поиска текстовых подтверждений (Template Sentences) для недостающих фактов. Если информация о ваших сущностях представлена нечетко или двусмысленно, система не сможет обучиться этим фактам.
Как система выбирает «лучший путь» (Best Path), если между двумя сущностями много связей?
Система использует несколько критериев для выбора наилучшего пути. К ним относятся: частота, с которой этот путь повторяется для разных пар сущностей с таким же отношением, длина пути, тип проходимых узлов и общая распространенность пути. Выбирается наиболее надежный и статистически значимый путь.
Как Google защищается от изучения ложных фактов из интернета?
Патент описывает строгий процесс верификации (Claim 15, FIG. 5). Сгенерированный алгоритм тестируется на большом наборе известных пар (вопрос-ответ). Он принимается только если его точность превышает высокий порог (например, 85-95%). Это помогает отсеять ненадежные правила или правила, основанные на ложной информации.
Что означает «полуструктурированные данные» (semi structured) в названии?
Это относится к методу извлечения данных. Система анализирует обычный текст в интернете (неструктурированный), но ищет в нем предложения, соответствующие определенной семантической структуре или шаблону (Template Sentence), например, «X — это АТРИБУТ для Y». Такой подход позволяет извлекать структурированные факты из неструктурированного контента.
Как SEO-специалист может использовать это знание на практике?
Ключевая задача — обеспечить, чтобы ваш контент содержал четкие, недвусмысленные и точные утверждения о взаимосвязях между сущностями. Используйте простые синтаксические конструкции. Это помогает Inference Engine правильно парсить текст и использовать ваш контент для обучения и валидации фактов в Knowledge Graph.
Нужно ли использовать микроразметку Schema.org, если Google может извлекать факты из текста?
Да, обязательно. Schema.org предоставляет явно структурированные данные, что является более сильным сигналом. Описанный механизм используется, когда структурированные данные отсутствуют, неполны или когда системе нужно подтвердить факты. Лучшая стратегия — комбинировать качественную микроразметку с четкими текстовыми утверждениями.
Происходит ли процесс обучения в реальном времени?
Нет. Процесс обучения (генерация шаблонов, сканирование веба, поиск путей, генерация и верификация алгоритмов) описан как офлайн-процесс (pre-processing). В реальном времени происходит только процесс ответа на вопрос, который использует уже изученные и сохраненные алгоритмы для быстрого обхода графа.
Влияет ли этот патент на локальное SEO?
Да, если локальные сущности и их отношения описаны в вебе. Например, система может изучить, что определенный врач работает в конкретном отделении больницы, даже если это явно не указано в структурированных данных, найдя подтверждение в новостной статье и сопоставив это с существующими связями между врачом и больницей в графе.

Knowledge Graph
EEAT и качество
Семантика и интент

Knowledge Graph
Семантика и интент

Knowledge Graph
Семантика и интент
EEAT и качество

Knowledge Graph
EEAT и качество
Семантика и интент

Knowledge Graph
Свежесть контента
Семантика и интент

Поведенческие сигналы
Персонализация
Local SEO

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Ссылки
SERP

Ссылки
SERP
Индексация

Поведенческие сигналы
EEAT и качество

Поведенческие сигналы
SERP

Ссылки
Поведенческие сигналы
Антиспам

Поведенческие сигналы
SERP
