
Google использует систему для ответов на вопросительные запросы. Система анализирует текстовые сниппеты из результатов поиска, применяет NLP-анализ (аннотирование) для извлечения кандидатов в ответы и выбирает лучший на основе консенсуса и качества источников. Этот механизм используется как для предоставления прямых ответов пользователям (Featured Snippets), так и для автоматического поиска недостающей информации и обновления базы знаний (Entity Database).
Патент решает две ключевые задачи в работе поисковой системы:
Interrogative Query), например, "какая самая высокая точка в Луисвилле?". Это соответствует механизму Featured Snippets.Entity Database, например, Knowledge Graph). Это решает проблему масштабирования базы знаний без ручного труда.Запатентована система (Answer System), которая использует существующую поисковую инфраструктуру для извлечения ответов на вопросы. Суть изобретения заключается в методологии анализа текстовых сниппетов (Snippets) из результатов поиска с помощью продвинутого NLP-анализа (Annotator) для идентификации кандидатов в ответы. Система выбирает финальный ответ на основе различных сигналов, включая частоту упоминания факта и качество источников.
Ключевой механизм работает следующим образом:
Entity Database (например, если отсутствует объект в триплете (Субъект, Связь, ?)).Annotator обрабатывает сниппеты, выполняя разметку частей речи, синтаксический анализ, распознавание сущностей и разрешение кореференции.Candidate Answers Engine извлекает потенциальные ответы, основываясь на аннотациях и типе вопроса (например, если вопрос содержит "где", ищутся локации).Answer(s) Selection Engine оценивает кандидатов, используя скоринг, основанный на количестве подтверждающих сниппетов/ресурсов и качестве этих ресурсов.Entity Database.Высокая. Патент описывает фундаментальные механизмы, лежащие в основе двух критически важных функций современного поиска Google: предоставление прямых ответов (Featured Snippets) и автоматизированное построение и обновление Knowledge Graph. Эти технологии активно развиваются и применяются.
Патент имеет критическое значение для SEO (9/10). Он детально описывает, как именно Google извлекает структурированные факты из неструктурированного текста. Понимание этого процесса необходимо для эффективной оптимизации контента под Featured Snippets и для обеспечения того, чтобы Google корректно распознавал сущности, их атрибуты и связи на сайте, что влияет на представление сайта в Knowledge Graph и общую авторитетность.
Entity Database для хранения фактов (например, (Барт Симпсон, Сестры, Лиза Симпсон)).Part of speech tagger, Dependency parser, Entity tagger и Coreference resolver.Interrogative Query.Основной фокус патента (в частности, Claim 1) направлен на автоматическое наполнение базы знаний, хотя в описании также рассматривается ответ на запросы пользователей.
Claim 1 (Независимый пункт): Описывает метод наполнения структурированной базы данных.
sufficient association) для определенного отношения (relationship) в базе данных.interrogative query на основе этой сущности и отношения.textual snippets из результатов поиска, релевантных запросу.candidate answers на основе этих сниппетов.relationship entity, ассоциированной с выбранным ответом.Claim 3 (Зависимый): Описывает рекурсивный процесс обнаружения новых сущностей.
Если система определяет, что relationship entity (найденный ответ) ранее не была определена в базе данных, она генерирует дополнительные вопросительные запросы на основе этой новой сущности и других отношений. Затем она определяет связи для новой сущности на основе ответов на эти дополнительные запросы. Это позволяет автоматически расширять базу знаний, находя не только факты о существующих сущностях, но и открывая новые.
Claim 5 (Зависимый): Описывает процесс валидации новой сущности.
Если relationship entity не определена в базе, система генерирует дополнительные запросы для определения того, является ли она валидной сущностью (valid entity). Связь в базу данных добавляется только после подтверждения валидности.
Claim 7 (Зависимый): Описывает механизм разрешения неоднозначности (Disambiguation).
Если ответ неоднозначен, система идентифицирует известные отношения для потенциальных сущностей. Генерируется дополнительный запрос, включающий исходную сущность и потенциальную сущность из ответа. Система проверяет, подтверждают ли результаты поиска известное отношение этой потенциальной сущности. Это помогает убедиться, что извлеченная сущность является корректной в данном контексте.
Claim 12 (Зависимый): Детализирует метод извлечения кандидатов.
Кандидаты определяются на основе того, связаны ли они с грамматической характеристикой (grammatical characteristic), которая соответствует искомому отношению. Например, если ищется отношение "место рождения", система будет искать кандидатов с характеристикой "локация".
Claims 13, 14, 15 (Зависимые): Детализируют методы выбора (скоринга) ответа.
Выбор лучшего ответа может основываться на:
Изобретение применяется на нескольких этапах поиска и в офлайн-процессах.
INDEXING – Индексирование и извлечение признаков
Компонент Annotator может использоваться на этапе индексирования для глубокого NLP-анализа контента (разметка частей речи, синтаксический анализ, распознавание сущностей). Также на этом этапе (или в связанных офлайн-процессах) происходит формирование и обновление Entity Database.
QUNDERSTANDING – Понимание Запросов
Система должна определить, является ли запрос пользователя вопросительным (Interrogative Query), чтобы активировать Answer System.
RANKING – Ранжирование
Стандартная поисковая система (Search System) используется для поиска релевантных веб-ресурсов и генерации Snippets, которые затем передаются в Answer System.
METASEARCH – Метапоиск и Смешивание
Если Answer System успешно находит ответ на запрос пользователя, этот ответ может быть интегрирован в выдачу, часто на выделенной позиции (например, Featured Snippet), как показано на примере FIG. 6.
Офлайн-процессы (Наполнение Базы Знаний)
Система активно работает офлайн (как описано в FIG. 2 и FIG. 4) для итеративного поиска пробелов в Entity Database, генерации запросов и наполнения базы новыми фактами, извлеченными из веба.
Входные данные:
Interrogative Query (пользовательский или сгенерированный).Snippets из результатов поиска.Entity Database (существующие триплеты, алиасы сущностей).Выходные данные:
Entity Database.Алгоритм применяется в двух основных сценариях:
Interrogative Query.Entity Database и обнаруживает сущность, у которой отсутствует связь (lacks sufficient association) для определенного отношения (например, не указано место рождения).Описание процесса автоматического наполнения Базы Знаний (на основе FIG. 4):
Entity Database и находит сущность, для которой отсутствует объект в триплете (например, (Барт Симпсон, Сестры, ?)).Interrogative Query Engine генерирует один или несколько вопросительных запросов, используя алиасы сущности и термины, связанные с отношением (например, "кто сестры Барта Симпсона?").Snippets из топовых релевантных документов.Annotator обрабатывает сниппеты, выполняя NLP-анализ (например, идентифицирует "Лиза" и "Мэгги" как сущности типа "Персона" и определяет их синтаксическую связь со словом "сестры").Candidate Answers Engine извлекает потенциальные ответы. Отбор происходит на основе соответствия типа ответа типу отношения (например, для "сестры" ищутся "Персоны") и синтаксических связей в тексте сниппета.Answer(s) Selection Engine рассчитывает оценку уверенности (score) для каждого кандидата. Оценка базируется на количестве подтверждающих сниппетов, количестве уникальных ресурсов и качестве этих ресурсов. Выбираются ответы, превысившие порог.Entity Database. Если ответ двусмысленный или новый, могут быть сгенерированы дополнительные запросы для его уточнения (Claim 7) или валидации (Claims 3, 5).Entity Database (например, (Барт Симпсон, Сестры, {Лиза Симпсон, Мэгги Симпсон})).Snippets) из веб-ресурсов. Это основной источник для извлечения фактов.measures associated with the search result resources), из которых получены сниппеты. Используются для оценки достоверности извлеченных фактов.Система использует два основных набора метрик: NLP-метрики для анализа текста и метрики достоверности для выбора ответа.
NLP-метрики (Annotator):
Метрики выбора ответа (Answer Selection):
Entity Database). Система не полагается только на ручную модерацию или структурированные данные (например, Schema.org).Annotator. Извлечение фактов основано на глубоком лингвистическом анализе (синтаксис, грамматика, распознавание сущностей), а не просто на поиске ключевых слов. Система ищет определенные языковые паттерны.Annotator мог легко выполнить синтаксический разбор предложений и определить связи между сущностями. Используйте четкие, недвусмысленные утверждения при описании фактов (например, "[Сущность] является [Объектом]" или "[Сущность] родилась в [Локация]").Interrogative Queries. Это увеличивает шансы на попадание в Featured Snippets, так как система ищет именно такие ответы.Resource Count, Snippet Count) для выбора ответа, важно, чтобы предоставляемые вами факты были точными и соответствовали информации на других авторитетных ресурсах.Resource Quality) используется как фактор при оценке достоверности извлеченного факта (Claim 15). Авторитетные сайты имеют больший вес в формировании ответов и Knowledge Graph.Dependency Parser и Entity Tagger, снижая вероятность корректного извлечения информации.Annotator.Этот патент подтверждает стратегический приоритет Google на переход от поиска по ключевым словам к поиску, основанному на сущностях и фактах. Для SEO это означает, что оптимизация должна фокусироваться не только на релевантности запросу, но и на способности контента служить надежным источником структурированных знаний. Стратегия должна включать работу над тем, чтобы Google воспринимал сайт как источник достоверных фактов, что достигается через ясность контента и высокий уровень E-E-A-T.
Сценарий: Оптимизация страницы для извлечения фактов (Featured Snippet и Knowledge Graph)
Задача: Обеспечить извлечение факта о месте рождения известной личности.
Annotator легко идентифицирует [Город] как Локацию и определит его синтаксическую связь с [Имя] и глаголом "родился". При достаточном авторитете сайта этот факт будет использован в Featured Snippet и/или для обновления Knowledge Graph.Как этот патент связан с Featured Snippets (Блоками с ответами)?
Патент напрямую описывает технологию, лежащую в основе Featured Snippets. Когда пользователь задает Interrogative Query, система Answer System использует описанный механизм: анализирует сниппеты топовых результатов, извлекает кандидатов с помощью Annotator и выбирает лучший ответ для показа пользователю. Это буквально инструкция по работе алгоритма выбора Featured Snippets.
Какие именно NLP-процессы Google использует для понимания текста согласно патенту?
Патент упоминает четыре ключевых процесса, выполняемых компонентом Annotator: 1) Part of speech tagging (разметка частей речи); 2) Dependency parsing (синтаксический анализ зависимостей для понимания связей между словами); 3) Entity tagging (распознавание и типизация сущностей); 4) Coreference resolution (разрешение кореференции, понимание, что местоимения и разные алиасы относятся к одной сущности).
Как оптимизировать текст для лучшего извлечения фактов этой системой?
Ключ к оптимизации — максимальная ясность и простота синтаксиса. Поскольку система использует Dependency parsing, необходимо писать четкие и недвусмысленные предложения, где легко определить субъект, предикат и объект. Используйте формат "[Сущность] является [Фактом]" или явно отвечайте на вопрос в тексте. Избегайте сложных оборотов и метафор при описании фактов.
Что важнее для подтверждения факта: упоминание на моем сайте или консенсус в вебе?
Консенсус в вебе критически важен. Патент явно указывает (Claims 13-15), что выбор ответа основывается на количестве сниппетов, количестве уникальных ресурсов и качестве этих ресурсов, подтверждающих факт. Один сайт, даже авторитетный, может быть проигнорирован, если он противоречит большинству других качественных источников.
Может ли Google создать панель Knowledge Graph для моей компании полностью автоматически, используя этот механизм?
Да. Патент описывает рекурсивный процесс (Claim 3), позволяющий системе обнаруживать новые сущности (relationship entity), которые ранее не были определены в базе данных. Если система находит упоминание вашей компании, она может автоматически сгенерировать запросы для поиска ее атрибутов (основатель, дата основания, локация и т.д.) и, найдя достаточно подтверждений, добавить ее в Entity Database.
Как система определяет, какой тип ответа искать (например, дату или локацию)?
Система определяет тип ответа на основе самого вопросительного запроса или типа отношения в базе знаний. Если запрос содержит "где" или отношение "Место Рождения", система инструктирует Candidate Answers Engine искать сущности с грамматической характеристикой "Локация" (Claim 12).
Влияет ли микроразметка Schema.org на работу этого алгоритма?
Патент не упоминает Schema.org. Описанный механизм фокусируется исключительно на извлечении фактов из неструктурированного текста с помощью NLP. Однако на практике Schema.org и этот механизм дополняют друг друга: разметка предоставляет структурированные данные, которые могут использоваться для верификации фактов, извлеченных с помощью NLP, и наоборот.
Что произойдет, если система найдет противоречивые ответы на один и тот же вопрос?
В этом случае активируется Answer(s) Selection Engine. Он оценит все кандидаты и выберет тот, который имеет наибольший Score. Скоринг учитывает количество подтверждений и качество источников. Ответ, поддержанный большим числом авторитетных сайтов, будет выбран как истинный.
Как система обрабатывает неизвестные или новые сущности, найденные в тексте?
Если система идентифицирует ответ, который не соответствует ни одной известной сущности, она может инициировать процесс валидации (Claim 5) и рекурсивного исследования (Claim 3). Генерируются дополнительные запросы для поиска связей этой новой сущности. Если найдено достаточно подтверждений ее существования и связей, она добавляется в Entity Database.
Что такое "Interrogative Query" в контексте патента?
Это любой запрос, сформулированный как вопрос. Важно понимать, что это может быть как запрос, введенный пользователем (например, "кто президент США?"), так и запрос, автоматически сгенерированный самой системой Google для заполнения пробелов в базе знаний (например, Google знает сущность "Джон Смит", но не знает его жену, и генерирует запрос "кто жена Джона Смита?").

SERP
Семантика и интент

SERP
Семантика и интент
EEAT и качество

SERP
Семантика и интент

Семантика и интент
Knowledge Graph
SERP

Индексация
Семантика и интент
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Local SEO
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Индексация
Семантика и интент

Ссылки
Индексация
Поведенческие сигналы

Персонализация
Поведенческие сигналы

Персонализация
SERP
Ссылки

EEAT и качество
SERP
Ссылки

Ссылки
Антиспам
SERP

Knowledge Graph
Семантика и интент
EEAT и качество
