
Патент Google описывает систему анализа веб-страницы для выявления ее главных тем («Центральных Сущностей») с помощью глобального Графа Сущностей, основанного на совместной встречаемости терминов. Система отфильтровывает периферийные и неоднозначные темы, генерирует на основе главных тем поисковые запросы и предлагает пользователю категоризированный дополнительный контент (новости, видео, товары).
Патент решает задачу улучшения пользовательского опыта путем проактивного предоставления дополнительного контента (новости, видео, изображения, товары, карты), релевантного просматриваемой веб-странице. Ключевая техническая проблема — точно идентифицировать главные темы (Central Entities) ресурса, отфильтровать периферийную информацию и устранить неоднозначность (Ambiguous Entities), чтобы гарантировать высокую релевантность предлагаемых рекомендаций.
Запатентована система (Additional Content System), которая динамически генерирует дополнительный контент на основе контекста текущей страницы. Ядром изобретения является метод идентификации Central Entities с использованием взвешенного и направленного Графа Сущностей (Entity Graph). Система генерирует запросы на основе этих сущностей, отбирает релевантные результаты и отображает их в отдельном элементе интерфейса (например, через браузерное расширение), категоризируя контент (Новости, Видео, Покупки).
Система работает следующим образом:
Entity Graph фильтруется для контекста данной страницы.Central Entities — тем, которые семантически связаны с другими темами на странице.Centrality Score. Система определяет доминирующую тему (Topical Entity) и выявляет неоднозначные сущности (Ambiguous Entities).Central Entities формируются поисковые запросы. Полученные результаты ранжируются, причем приоритет отдается результатам по Topical Entity и определенным типам контента (например, видео).Высокая. Хотя конкретная реализация интерфейса (браузерное расширение/тулбар) может быть устаревшей, лежащие в основе технологии анализа контента крайне актуальны. Методы идентификации главных тем страницы с помощью Entity Graph, анализа совместной встречаемости (PMI) и расчета Centrality Score являются фундаментальными для понимания того, как Google интерпретирует тематику и контекст документа в современном семантическом поиске и системах рекомендаций (например, Google Discover).
Патент имеет высокое стратегическое значение для SEO (8/10). Он не описывает алгоритмы ранжирования основного поиска, но предоставляет детальный взгляд на то, как Google алгоритмически определяет главные темы (Central Entities) и доминирующую тему (Topical Entity) страницы. Понимание этих механизмов критически важно для оптимизации контента, построения тематического авторитета (Topical Authority) и обеспечения правильной интерпретации фокуса страницы системами Google.
Central Entity для ресурса. Учитывает структуру графа, частоту сущности (TF-IDF), упоминания в заголовках/URL и данные из журналов запросов.Entity Graph. Измеряет, насколько часто две сущности встречаются вместе по сравнению с ожидаемой частотой при их независимости.Claim 1 (Независимый пункт): Описывает основной процесс генерации и отображения дополнительного контента.
scores).visually segregated) по категориям.Claim 3 (Зависимый от 1): Детализирует процесс классификации релевантности.
Процесс включает повышение (increasing/бустинг) оценок для ресурсов, идентифицированных в результатах поиска. Ресурсы, чьи повышенные оценки удовлетворяют определенному порогу, классифицируются как релевантные.
Claim 4 (Зависимый от 1): Добавляет условие доминирующей темы и типа контента.
Если запрос был сгенерирован для темы, которая является predominant topic (доминирующей темой / Topical Entity) исходного ресурса, то оценки полученных результатов повышаются. Затем выбираются ресурсы, удовлетворяющие порогу И являющиеся определенного типа (например, видео, новости, изображения – как указано в Claim 5).
Claim 10 (Зависимый от 1): Описывает адаптацию интерфейса.
Система определяет тип просматриваемого ресурса (например, товар, место) и модифицирует отображаемые категории и ссылки в элементе UI, чтобы они соответствовали этому типу (например, показ блока «Покупки» для страницы товара).
Изобретение затрагивает несколько этапов обработки данных, но его основное применение связано с системами рекомендаций контента и глубоким пониманием содержания страниц.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных:
PMI для определения веса связей и определение направления связей (Directed Edges).Применение в реальном времени (Recommendation/Content Generation)
Основная логика патента применяется, когда система анализирует просматриваемую страницу:
Central Entities, Topical Entity и Ambiguous Entities для текущей страницы, используя данные из Entity Graph Store.Central Entities и использует стандартную поисковую машину (Search Engine) для получения и первичного ранжирования результатов.Centrality Scores, типа контента и типа страницы, а затем категоризируются для отображения.Входные данные:
Entity Graph.Query Logs).Выходные данные:
web browser add-on).Centrality Score выше определенного порога, или если релевантность найденного дополнительного контента недостаточна.Процесс А: Идентификация Центральных Сущностей (Central Entities)
Entity Graph. Из глобального графа удаляются все узлы, которые не соответствуют сущностям-кандидатам. Сохраняются только связи между оставшимися узлами.outgoing) связей.Central Entities.Central Entity рассчитывается начальная оценка на основе весов исходящих связей (используя PMI).Query Logs), которые привели к запросу этого ресурса.Процесс Б: Уточнение Сущностей
Query Logs.Relatedness Score), сущность признается неоднозначной.Процесс В: Генерация Дополнительного Контента
Central Entities.Ranking Scores).Topical Entity.Centrality Score.Centrality Score.Centrality Score.Topical Entity и корректировки Centrality Score. Упоминается возможность использования истории браузинга пользователя для персонализации.Entity Graph и расчета PMI и IDF.Query Logs и сигналов проминенса.Entity Graph.Central Entities — это анализ их взаимосвязей в контексте страницы с использованием глобального Entity Graph. Сущность считается центральной, если у нее есть исходящие связи к другим сущностям на этой же странице.Entity Graph основано на статистическом анализе (PMI). Это подчеркивает, что Google ценит сильные, неслучайные семантические связи между концепциями в контенте.Centrality Score — комплексная метрика. Она объединяет данные из графа (веса связей), NLP-метрики (TF-IDF), сигналы проминенса (Title, URL) и поведенческие данные (Query Logs).Central Entities (главные темы) и Topical Entity (единственная доминирующая тема). Topical Entity определяет основной фокус страницы и ее тип (например, Товар или Место).Ambiguous Entities, проверяя контекст их использования в вебе. Простого упоминания сущности недостаточно; контекст должен быть ясным.Topical Entity и адаптировать предлагаемый контент, что демонстрирует глубокое понимание интента и типа контента.Central Entity за счет наличия исходящих направленных связей (outgoing directed edges) в отфильтрованном графе сущностей.Topical Entity.Query Logs являются прямым сигналом для расчета Centrality Score.Ambiguous Entity.Centrality Score корректируется с помощью IDF, понижая вес общеупотребительных терминов.Central Entities.Патент является отличной иллюстрацией перехода Google от ключевых слов к сущностям (Entities) и связям между ними. Стратегическое значение заключается в понимании того, что релевантность определяется ролью сущности в семантической структуре страницы и силой ее связей (PMI). Для SEO это означает, что построение тематического авторитета (Topical Authority) требует создания контента, который демонстрирует глубокие и статистически значимые связи между сущностями в рамках определенной ниши.
Сценарий: Оптимизация статьи о редком заболевании (устранение неоднозначности и усиление центральности)
Задача: Опубликовать статью о заболевании «Синдром XYZ», которое также является названием популярной рок-группы.
Entity Graph «Синдром XYZ» сильнее связан с музыкой, чем с медициной (выше PMI). Есть риск определения сущности как Ambiguous.Topical Entity и повышает Centrality Score.Relatedness Score) между статьей и медицинским контекстом, что позволяет избежать пометки Ambiguous Entity.Central Entity и Topical Entity в медицинском контексте.Что такое Entity Graph в контексте этого патента и как он строится?
Entity Graph — это глобальная структура данных, где узлы представляют сущности, а ребра показывают их взаимосвязь. Он строится путем анализа совместной встречаемости (co-occurrence) сущностей во всем веб-индексе. Если две сущности встречаются вместе значительно чаще, чем случайно, между ними создается связь. Вес этой связи рассчитывается с помощью PMI (Pointwise Mutual Information), а направление указывает на зависимость (например, от игрока к команде).
Как система определяет, какие сущности на странице являются главными (Central Entities)?
Это ключевой механизм. Система фильтрует глобальный Entity Graph, оставляя только сущности, присутствующие на данной странице. Затем она удаляет все узлы, у которых нет исходящих (outgoing) связей к другим узлам в этом отфильтрованном графе. Оставшиеся узлы и есть Central Entities. Это означает, что главные темы — это те, которые концептуально связаны с другими темами на этой же странице.
В чем разница между Central Entity и Topical Entity?
Central Entity — это одна из главных тем страницы (их может быть несколько). Topical Entity — это единственная преобладающая (доминирующая) тема всего ресурса. Система пытается определить Topical Entity, проверяя, ранжируется ли страница высоко по запросу, состоящему из этой сущности, или анализируя логи запросов (Query Logs).
Как рассчитывается Centrality Score и как на него можно повлиять?
Centrality Score изначально основан на весах исходящих связей в графе (PMI). Но он корректируется рядом факторов. Чтобы повысить его, нужно обеспечить присутствие сущности в Title/URL, использовать специфичные термины (высокий IDF) и убедиться, что страница получает трафик по запросам, содержащим эту сущность (так как используются Query Logs).
Что происходит, если моя главная сущность неоднозначна (Ambiguous)?
Если сущность признана Ambiguous (например, чаще используется в другом контексте), система может её отбросить или попытаться уточнить (дисамбигуировать), добавив другие термины со страницы. Для SEO это означает необходимость активного предоставления контекста с помощью связанных сущностей, чтобы избежать неверной интерпретации темы.
Что означает «направленность ребер» (Directed Edge) в графе сущностей?
Направленность указывает на иерархию или зависимость. Например, связь идет от «Омри Касспи» к «НБА», потому что Касспи подразумевает НБА, но не наоборот. Для того чтобы сущность была признана Central Entity, у нее должны быть исходящие связи к другим сущностям на странице, что указывает на ее важность в данном контексте.
Подтверждает ли патент использование TF-IDF в алгоритмах Google?
Да, патент явно упоминает использование Inverse Document Frequency (IDF) как часть метрики TF-IDF для корректировки Centrality Score. Система понижает вес сущностей, которые слишком часто встречаются в общем корпусе документов (общеупотребительные слова), подчеркивая важность специфичных терминов.
Как система обрабатывает малоизвестные или новые страницы товаров (E-commerce)?
Патент предусматривает исключение. Даже если новая страница товара ещё не ранжируется высоко, система может признать товар Topical Entity, если запрос по этой сущности вызывает специальные результаты (например, Shopping results) И название товара присутствует в Title или URL страницы.
Влияет ли этот патент на ранжирование в основном поиске Google?
Патент описывает систему генерации дополнительного контента, а не алгоритмы основного ранжирования. Однако технологии, лежащие в его основе (идентификация Central Entities, использование Entity Graph, обработка неоднозначности), являются фундаментальными для того, как Google понимает контент, что косвенно влияет на ранжирование.
Как этот патент связан с Тематическим Авторитетом (Topical Authority)?
Патент предоставляет алгоритмическую основу для оценки Тематического Авторитета. Чтобы быть авторитетом, ваш контент должен демонстрировать сильные, статистически подтвержденные (высокий PMI) связи между ключевыми сущностями вашей ниши. Создание контента, который генерирует сильные Central Entities, напрямую способствует построению авторитета.

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Knowledge Graph

Семантика и интент
Knowledge Graph

Семантика и интент
Knowledge Graph
SERP

Knowledge Graph
Семантика и интент
Поведенческие сигналы

EEAT и качество
Поведенческие сигналы
SERP

Мультимедиа
EEAT и качество
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

EEAT и качество
Индексация
Семантика и интент

Персонализация
Семантика и интент
Поведенческие сигналы
