
Google использует автоматизированный метод для построения базы знаний о сущностях (Entity) и их атрибутах (Attribute). Система анализирует миллионы поисковых запросов, выявляя лингвистические паттерны (например, «столица Франции»). Это позволяет понять, какие атрибуты важны для разных типов сущностей (например, «население» для города, «побочные эффекты» для лекарства), и сформировать структурированное знание об объектах реального мира.
Патент решает задачу масштабного и автоматизированного построения онтологий и баз знаний о сущностях реального мира (Entities) и их свойствах (Attributes). Ручное перечисление атрибутов для огромного количества сущностей является трудоемким и плохо масштабируемым. Изобретение позволяет автоматически выявлять эти атрибуты и их относительную важность, используя неструктурированные данные из логов поисковых запросов.
Запатентована система, которая автоматически выводит (infer) атрибуты сущностей путем анализа коллекции поисковых запросов (Search Query Logs). Система использует лингвистические паттерны (Extract Patterns) для идентификации связей между сущностями и их атрибутами в тексте запросов. Полученные данные проходят многоступенчатую очистку (Refining) для удаления шума и повышения точности, после чего атрибуты оцениваются (Scoring) и ассоциируются с соответствующими сущностями или категориями.
Система работает в несколько этапов:
Extract Patterns (например, «A of E» или «E's A») к запросам для выявления пар Сущность-Атрибут (например, из запроса «столица Франции» извлекается E=Франция, A=столица).Instances) агрегируются на уровень категорий (Categories) (например, «столица» становится атрибутом категории «Страна»).Proper Name Attributes (частей имен собственных) и Generic Attributes (слишком общих терминов). Также происходит объединение семантически связанных атрибутов (синонимов).Критически высокая. Этот патент описывает фундаментальный механизм, лежащий в основе автоматического наполнения Knowledge Graph и понимания Google структуры реального мира (Entity Understanding). Способность автоматически определять, какие атрибуты важны для различных типов сущностей, является центральной для современного семантического поиска, E-E-A-T и ответов на фактические запросы.
Патент имеет критическое значение (9/10) для понимания принципов построения SEO-стратегии на основе сущностей (Entity-Based SEO). Он демонстрирует, как Google определяет ключевые атрибуты, которые должны быть раскрыты для достижения Topical Authority. Если контент сайта не покрывает атрибуты, которые Google считает важными для целевых сущностей (основываясь на анализе поискового спроса), сайт будет испытывать трудности с ранжированием.
Claim 1 (Независимый пункт): Описывает основной метод извлечения и обработки атрибутов.
text extract patterns).refined attribute set).Claim 2, 3, 4 (Зависимые от 1): Детализируют процесс очистки (Refining).
Proper Name Attributes.Generic Attributes.Claim 9 (Независимый пункт): Описывает метод с фокусом на извлечение атрибутов для Категорий.
instance entities) и их атрибутов с использованием extract patterns.Categories), к которым принадлежат эти экземпляры.Claim 19 (Зависимый): Детализирует процесс взвешивания (Weighting).
Взвешивание атрибутов подразумевает присвоение более высокого веса тем атрибутам, которые появились в запросе, соответствующем полнотекстовому, естественно-языковому паттерну извлечения (whole sentence, natural language extract pattern). Более высокий вес увеличивает итоговую оценку (score).
Изобретение описывает офлайн-процесс построения базы знаний, который затрагивает несколько этапов поисковой архитектуры.
CRAWLING – Сканирование и Сбор данных
На этом этапе система собирает Search Query Logs — сырые данные о поведении пользователей, которые являются основным источником для анализа в данном патенте.
INDEXING – Индексирование и извлечение признаков (Построение Базы Знаний)
Основное применение патента. Это процесс создания структурированной базы знаний (аналог Knowledge Graph).
Extract Patterns для выявления пар (Entity, Attribute).Generic, Proper Names) и расчет Scores для атрибутов.QUNDERSTANDING – Понимание Запросов
Созданная база знаний используется на этом этапе для интерпретации интента. Система может идентифицировать запросы, запрашивающие фактическую информацию (keyword-based queries that request factual information), путем сравнения текста запроса с известными ассоциациями Сущность-Атрибут (например, распознать запрос "altitude Helsinki" как поиск значения атрибута "altitude" для сущности "Helsinki").
METASEARCH – Метапоиск и Смешивание
База знаний используется для обогащения поисковой выдачи. В ответ на запрос, называющий сущность, поисковая система может дополнить результаты компиляцией фактов (compilation of facts) об этой сущности, используя известные атрибуты (например, отображение Панели Знаний).
Входные данные:
Search Query Logs (текст запросов и их частота).Extract Patterns.Categories и примеры их Instances.Выходные данные:
Entities (или Categories) и ассоциированные с ними ранжированные списки Attributes.YMYL (медицина, финансы) и E-commerce, где точное понимание атрибутов сущностей (лекарств, компаний, продуктов) критически важно для качества поиска.Search Query Logs для статистически значимого анализа.Процесс: Автоматическое построение базы атрибутов сущностей
Search Query Logs), включая текст и частоту.Extract Patterns (например, "the A of E", "E's A"). Идентифицируются пары (Instance, Attribute) и подсчитывается их частота.Proper Name Attributes. Для этого используется проверка капитализации атрибутов во внешних надежных источниках (например, если атрибут капитализирован более 50% времени в определенном паттерне).Generic Attributes. Атрибут считается общим, если он ассоциирован со слишком большим количеством разных сущностей/категорий (например, более 30%).Smoothing Factor.Search Query Logs. Анализируется текст запросов и их частота (frequency of submission). Это данные о том, как пользователи формулируют свои информационные потребности.case information) терминов, чтобы отличить обычные атрибуты от имен собственных.
Generic Attributes и Proper Name Attributes, а также объединение синонимов. Это гарантирует точность (Precision) базы знаний.Extract Patterns (например, «Столицей [Страны] является...», «Население [Города] составляет...»). Используйте таблицы, списки и заголовки для структурирования фактической информации.Generic Attributes (например, «история компании», «значение термина») вместо специфичных атрибутов, которые уникальны для данной категории и имеют высокий Score в системе Google.Этот патент является одним из краеугольных камней Entity-Based SEO и семантического поиска Google. Он подчеркивает переход от анализа контента страниц к пониманию объектов реального мира, которые этот контент описывает. Стратегически важно понимать, что Google строит свою собственную карту реальности, основываясь на коллективном поведении пользователей. Долгосрочная SEO-стратегия должна заключаться в том, чтобы стать лучшим источником информации о ключевых атрибутах сущностей в своей нише, максимально соответствуя этой карте.
Сценарий: Оптимизация страницы медицинского препарата (YMYL)
E-E-A-T.Какова связь этого патента с Knowledge Graph?
Этот патент описывает один из ключевых механизмов автоматического наполнения Knowledge Graph. Knowledge Graph состоит из сущностей и связей (атрибутов) между ними. Данный патент объясняет, как Google в автоматическом режиме и в огромном масштабе определяет, какие именно атрибуты следует ассоциировать с той или иной сущностью или категорией, используя логи поисковых запросов как источник данных.
Как система определяет, какие атрибуты важны для конкретной сущности?
Важность определяется через процесс оценки (Scoring). Он учитывает, как часто пользователи спрашивают об этом атрибуте в связи с сущностью (частота в логах), и насколько четко сформулированы эти запросы. Атрибуты, которые часто встречаются в полных вопросительных предложениях (Claim 19), получают больший вес. Также используются статистические методы (формула Score), чтобы выявить атрибуты, специфичные именно для этой сущности, а не общие для всех.
Что такое Generic Attributes и почему они удаляются?
Generic Attributes — это слишком общие термины, такие как «картинка», «история», «определение». Они удаляются, потому что не несут полезной информации для характеризации конкретной сущности. Например, запрос «картинка Франции» не означает, что «картинка» является важным атрибутом сущности «Франция». Система фильтрует их, если они ассоциированы со слишком большим процентом всех сущностей (например, >30%).
Что такое Proper Name Attributes и как система их определяет?
Это термины, которые ошибочно извлечены как атрибуты, но на самом деле являются частью имени собственного (например, «Battle» из «Battle of Midway»). Чтобы их определить, система проверяет капитализацию этих терминов в надежных внешних источниках (а не в запросах, где часто бывают ошибки). Если термин часто пишется с заглавной буквы (например, >50% случаев), он считается именем собственным и удаляется из списка атрибутов.
Как SEO-специалист может использовать этот патент для улучшения Topical Authority?
Topical Authority достигается путем полного покрытия темы. Этот патент показывает, что «полное покрытие» с точки зрения Google означает раскрытие всех ключевых атрибутов связанных сущностей. SEO-специалист должен определить эти атрибуты (через анализ спроса и SERP) и гарантировать, что контент сайта подробно отвечает на вопросы, связанные с каждым из них. Это сигнализирует Google, что сайт является экспертным источником.
Влияет ли структура моего контента на извлечение атрибутов?
Да, хотя этот патент фокусируется на извлечении атрибутов из *запросов*, созданная база знаний затем используется для анализа *контента* страниц и извлечения значений этих атрибутов (Fact Extraction). Использование четкой структуры (заголовки, списки, таблицы) и ясных формулировок (например, «Население [Города] составляет...») значительно облегчает Google сопоставление вашего контента с известными атрибутами.
Отдает ли система предпочтение определенным типам запросов при извлечении атрибутов?
Да. Патент явно указывает (Claim 19), что атрибуты, извлеченные из полных, естественно-языковых запросов (whole sentence, natural language extract patterns), получают больший вес при оценке (Scoring). Это означает, что запросы вида «Какова высота Эйфелевой башни?» являются более надежным сигналом, чем «высота Эйфелева башня».
Может ли этот механизм обновляться со временем?
Да. Поскольку система работает на основе анализа свежих логов поисковых запросов, она адаптируется к изменениям в языке и интересах пользователей. Если пользователи начинают часто спрашивать о новом атрибуте сущности (например, «углеродный след» для компаний), система автоматически выявит этот атрибут, оценит его важность и добавит в базу знаний.
Описывает ли этот патент извлечение ответов (значений атрибутов)?
Нет, этот патент фокусируется на выявлении самих атрибутов (свойств), а не на поиске их значений. Например, система определяет, что "население" является важным атрибутом для "Парижа", но она не занимается поиском числа "2.1 миллиона". Извлечение значений (Fact Extraction) — это задача других систем.
Как этот патент связан с E-E-A-T?
E-E-A-T требует демонстрации опыта и авторитетности. В контексте контента это означает глубокое и всестороннее освещение темы. Этот патент предоставляет механизм, с помощью которого Google определяет, что именно означает «всестороннее освещение» для любой заданной сущности. Соответствие контента ключевым атрибутам сущности является сильным сигналом экспертности и авторитетности.

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Knowledge Graph
Индексация

Индексация
Семантика и интент
SERP

Knowledge Graph
Семантика и интент

Knowledge Graph
Семантика и интент
SERP

Мультиязычность
Семантика и интент
Ссылки

Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
SERP

Индексация
Семантика и интент
Ссылки

Персонализация
Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация
