
Google использует этот механизм для автоматического ответа на фактологические вопросы путем анализа неструктурированного текста топовых результатов поиска. Система определяет, какая сущность (например, человек, место) чаще всего упоминается на авторитетных страницах. Эта наиболее часто упоминаемая сущность, с учетом нормализации частоты и веса источника, выбирается в качестве ответа.
Патент решает проблему масштабируемого и актуального ответа на фактологические вопросы (например, «Кто», «Что», «Где»). Вместо того чтобы полагаться на вручную курируемые базы данных, которые медленно обновляются, изобретение позволяет автоматически извлекать ответы из unstructured data (неструктурированного контента) веб-страниц, обеспечивая актуальность и широкий охват.
Запатентована система автоматического ответа на вопросы, использующая подход «коллективного согласования» (collective reconciliation). Она агрегирует и ранжирует сущности (Entity References), извлеченные из неструктурированного текста топовых результатов поиска. Система определяет, какая сущность нужного типа чаще всего упоминается на релевантных и авторитетных веб-страницах (консенсус), и выбирает ее в качестве ответа.
Система работает в два этапа: офлайн (индексирование) и онлайн (ответ на запрос).
Entity References из неструктурированного текста документов и сохраняет их как previously generated data.Weighted Sum (взвешенной суммы). Эта сумма учитывает частоту упоминаний (Frequency of Occurrence), нормализованную по длине документа, и авторитетность источника (Topicality Score). Сущность с наивысшим рейтингом выбирается как ответ.Критически высокая. Описанный механизм является фундаментальным для систем генерации ответов, таких как Featured Snippets и Direct Answers. Способность Google извлекать факты из неструктурированного текста и полагаться на консенсус авторитетных источников для верификации ответа остается центральной частью современных поисковых технологий (NLP, Information Retrieval).
Патент имеет критическое значение (9/10) для SEO, особенно для стратегий, направленных на завоевание нулевой позиции (Featured Snippets). Он раскрывает механизм, как Google выбирает ответ из контента. Для оптимизации необходимо не только ранжироваться в топе, но и гарантировать, что нужная сущность четко присутствует в неструктурированном тексте и что страница обладает достаточной авторитетностью (Topicality Score), чтобы ее «голос» был учтен при подсчете консенсуса.
Entity Reference появляется в документе или наборе документов. Является ключевым сигналом ранжирования сущностей.length of the respective previously generated data), чтобы предотвратить доминирование длинных текстов.Topicality Score).Claim 1 (Независимый пункт): Описывает основной метод ответа на вопрос путем анализа консенсуса в топовых результатах.
previously generated data, содержащие Entity References нужного типа.Weighted Sum (взвешенная сумма) частот ее встречаемости в этом подмножестве.Claim 4 (Зависимый от 1): Описывает механизм разрешения ничьих (tie-breaking).
Если ранжирование сущностей приводит к ничьей (tie), система анализирует дополнительные результаты поиска, находящиеся ниже первого порога, но выше второго порога (second predetermined threshold). Она переранжирует (reranking) сущности на основе взвешенной суммы сигналов из этих дополнительных результатов. Это итеративный процесс для повышения уверенности.
Claim 5 (Зависимый от 1): Уточняет механизм нормализации.
Нормализация частоты встречаемости основывается на длине соответствующих данных (length of the respective previously generated data). Это означает, что учитывается плотность упоминаний сущности, а не только абсолютное количество.
Claim 6 (Зависимый от 1): Уточняет один из факторов ранжирования.
Упоминается использование Topicality Score, основанного на количестве ссылок на соответствующие данные и с них (number of links to and from). Это подтверждает использование ссылочной авторитетности источника при выборе ответа.
Изобретение затрагивает несколько этапов поиска, связывая индексирование с генерацией ответа.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит ключевая предварительная обработка. Система анализирует unstructured data, идентифицирует Entity References и рассчитывает сигналы для Topicality Score (например, ссылочный анализ). Эта информация сохраняется как previously generated data.
QUNDERSTANDING – Понимание Запросов
Система должна классифицировать запрос как фактологический вопрос и определить ожидаемый Entity Type ответа (например, запрос «Кто президент Франции?» требует тип «Человек»).
RANKING – Ранжирование
Генерируется и ранжируется стандартный набор результатов поиска по запросу.
METASEARCH – Метапоиск и Смешивание (Генерация Ответа)
Основное применение патента. Специализированный модуль активируется для генерации ответа:
Entity References нужного типа для этого подмножества.Weighted Sum частот с учетом нормализации и весов.Entity Type.Entity References нужного типа для расчета консенсуса.Процесс А: Офлайн (Индексирование)
Entity References в тексте и определение их типов.Topicality Score (например, ссылочный анализ).previously generated data.Процесс Б: Онлайн (Ответ на запрос)
Entity Type.previously generated data для выбранного подмножества.Weighted Sum для каждой уникальной сущности. Веса основываются на Topicality Score документа (включая ссылки, Claim 6) и/или его ранге.Weighted Sum.Патент фокусируется на использовании данных, извлеченных из контента и связанных с авторитетностью источников.
Entity References и подсчета их частоты.number of links to and from) используется как часть Topicality Score для взвешивания упоминаний сущностей (Claim 6).Topicality Score может также включать (согласно описанию в патенте) количество выборов документа в предыдущих результатах поиска (number of selections of that document in previous search results).unstructured data) веб-страниц. Присутствие сущности в тексте критично; нельзя полагаться только на структурированные данные.Topicality Score, который явно включает ссылочные факторы (Claim 6), определяет вес «голоса» каждого сайта. Упоминание на авторитетном сайте весит больше.Weighted Sum), а не только по рангу страницы.Topicality Score, который влияет на вес упоминаний сущностей с вашей страницы.Frequency of Occurrence. Это неэффективно из-за нормализации по длине документа (Claim 5) и может негативно сказаться на общем ранжировании.unstructured data (основного текста).entity reference.Этот патент подтверждает стратегию Google по использованию веба как распределенной базы знаний. Он демонстрирует, как алгоритмы ранжирования (оценка авторитетности) напрямую интегрированы с системами ответов на вопросы. Стратегически, это подчеркивает синергию между традиционным SEO (ссылки, ранжирование в ТОП) и семантическим SEO (оптимизация под сущности). Для долгосрочного успеха необходимо строить авторитетные ресурсы, которые предоставляют четкие, основанные на консенсусе факты в легко извлекаемом формате.
Сценарий: Оптимизация статьи для получения Featured Snippet на вопрос «Какова столица Австралии?»
Topicality Score вашей страницы, упоминания на ней вносят значительный вклад в Weighted Sum для «Канберры». Система выбирает «Канберра» как ответ и может использовать вашу страницу как источник для Featured Snippet.Означает ли этот патент, что нужно чаще повторять ключевую сущность на странице?
Не совсем. Патент явно указывает (Claim 5), что частота встречаемости нормализуется по длине документа. Это означает, что система учитывает плотность упоминаний, а не их абсолютное количество. Искусственное повторение сущности (Entity Stuffing), особенно при увеличении общего объема текста, не даст преимущества. Важнее естественное и информативное присутствие сущности в контексте.
Как Google определяет авторитетность источника при выборе ответа?
Патент использует метрику Topicality Score для взвешивания упоминаний. В Claim 6 прямо указано, что эта оценка основывается на количестве ссылок на документ и с него. Также в описании патента упоминаются другие факторы, такие как свежесть и история кликов. Это означает, что стандартные SEO-сигналы авторитетности напрямую влияют на вероятность выбора ответа с вашей страницы.
Работает ли эта система только для вопросов типа «Кто»?
Нет. Хотя в примерах патента часто используются вопросы «Кто» и сущности типа «Человек», механизм универсален. Система определяет ожидаемый Entity Type на основе запроса. Это могут быть локации («Где»), даты («Когда»), определения («Что такое») или любые другие типы сущностей, которые система способна распознавать в неструктурированном тексте.
Что происходит, если топовые сайты не согласны друг с другом по поводу ответа или есть ничья?
Патент описывает механизм разрешения ничьих (Claim 4). Если среди самых топовых результатов (выше первого порога) нет явного консенсуса или несколько сущностей имеют одинаковый Weighted Sum, система расширяет анализ на большее количество результатов (ниже первого порога, но выше второго). Это позволяет найти более уверенный ответ, анализируя более широкий набор данных.
Извлекает ли система ответы из структурированных данных (Schema.org)?
Патент сфокусирован исключительно на извлечении ответов из unstructured data (основного текста страницы). Он был разработан для того, чтобы не зависеть от структурированных или курируемых баз данных. Хотя Google использует структурированные данные в других системах, этот конкретный механизм полагается на анализ обычного текста.
Как быстро обновляются ответы, если информация на сайтах изменилась?
Система полагается на данные (previously generated data), извлеченные во время индексирования (офлайн-процесс). Ответы обновятся после того, как Google переиндексирует достаточное количество авторитетных страниц в ТОПе, и новый консенсус будет рассчитан. Это обеспечивает актуальность ответов по мере обновления веба.
Как обеспечить, чтобы Google правильно идентифицировал сущность на моей странице?
Используйте канонические и полные наименования сущностей (например, «Джордж Вашингтон» вместо просто «Вашингтон»). Предоставляйте достаточный контекст вокруг упоминания сущности, чтобы помочь системам disambiguation (разрешения неоднозначности) связать ваше упоминание с правильной сущностью в Графе Знаний.
Может ли сайт с низким авторитетом стать источником ответа согласно этому патенту?
Это маловероятно. Во-первых, сайт должен попасть в ТОП выдачи (выше пороговых значений). Во-вторых, упоминания сущностей взвешиваются с помощью Topicality Score (включая ссылки). Упоминания на сайте с низким авторитетом будут иметь малый вес и вряд ли смогут повлиять на итоговый Weighted Sum по сравнению с авторитетными источниками.
Как этот патент связан с Featured Snippets?
Этот патент описывает один из вероятных механизмов, который Google использует для выбора ответа, отображаемого в Featured Snippet. Система ищет консенсус среди топовых результатов. Если ваш контент находится в топе и содержит четкое упоминание сущности, которая достигла консенсуса, он может быть выбран в качестве источника для сниппета.
Как этот патент связан с E-E-A-T?
Связь прямая и сильная. Механизм Topicality Score, используемый для взвешивания упоминаний сущностей, по сути, является алгоритмическим выражением авторитетности и надежности источника (Authority и Trustworthiness из E-E-A-T). Включение ссылочных факторов (Claim 6) в расчет этого скора подтверждает, что Google предпочитает ответы от авторитетных источников.

Knowledge Graph
EEAT и качество
Семантика и интент

Поведенческие сигналы
Семантика и интент

Knowledge Graph
Семантика и интент
Ссылки

Knowledge Graph
Семантика и интент
SERP

SERP
Семантика и интент

Knowledge Graph
Поведенческие сигналы
Персонализация

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Local SEO

EEAT и качество
Индексация
Семантика и интент

Поведенческие сигналы
Персонализация
Семантика и интент

Ссылки
SERP
Свежесть контента

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP
