
Google анализирует сущности на странице для определения «Topical Entity» (главной темы). Для этого используются графы сущностей, основанные на совместной встречаемости, и анализ результатов поиска. Присутствие сущности в Title/URL и активация специальных SERP features (Shopping, Maps) могут подтвердить главную тему, даже если страница ранжируется низко. Это понимание используется для генерации релевантного дополнительного контента.
Патент решает задачу точной идентификации основных тем (Central Entities) и главной, преобладающей темы (Topical Entity) веб-ресурса. Цель — отфильтровать периферийные или двусмысленные сущности, чтобы сгенерировать высокорелевантный дополнительный контент (например, похожие новости, видео, товары), который будет показан пользователю вместе с просматриваемым ресурсом. Это улучшает пользовательский опыт за счет предоставления релевантной контекстной информации.
Запатентована система для идентификации Topical Entity (главной темы) ресурса. Система использует Entity Graph, построенный на основе совместной встречаемости сущностей в коллекции документов, для определения Central Entities. Для валидации Topical Entity система анализирует результаты поиска по этим сущностям. Ключевым механизмом является использование сигналов из SERP (ранжирование ресурса или активация специальных результатов, таких как Shopping/Maps) в сочетании с наличием сущности в Title/URL для подтверждения главной темы.
Система работает в несколько этапов:
Entity Graph. Он фильтруется по сущностям, присутствующим в ресурсе. Сущности, имеющие сильные исходящие связи (определяющие контекст), считаются центральными.Topical Entity, если: (1) ресурс высоко ранжируется по этой сущности, ИЛИ (2) сущность присутствует в Title/URL И поиск по ней активирует специальные результаты (Shopping, Maps, Answer Box).Высокая. Понимание сущностей и определение главной темы документа лежат в основе современного семантического поиска и работы Knowledge Graph. Механизмы, описанные в патенте для идентификации и валидации главной сущности, особенно через анализ SERP Features, крайне актуальны для понимания того, как Google интерпретирует контент и интент.
Патент имеет высокое значение (8/10). Он описывает конкретные механизмы, которые Google использует для понимания основного предмета страницы. Это критически важно для SEO, поскольку определяет, как обеспечить выравнивание контента с целевой сущностью. Патент подчеркивает важность Title и URL для определения темы и показывает, как активация специализированных вертикалей (Shopping, Maps) используется Google для валидации природы сущности.
Патент содержит два основных независимых подхода к определению Topical Entity.
Claim 1 и Claim 4 (Независимые пункты): Определение Topical Entity через ранжирование.
Ranking Scores).Topical Entity.Ranking Score, и она назначается Topical Entity.Claim 8 (Независимый пункт): Определение Topical Entity через SERP Features и структуру документа.
Этот пункт описывает альтернативный метод, который не зависит от того, насколько высоко ранжируется сам ресурс.
particular type of search result), например, Shopping results, Map results, Answer box (Claim 9).Topical Entity.Это позволяет идентифицировать тему даже для малоизвестных страниц (например, страница товара в маленьком магазине), если Google распознает природу сущности (товар) и страница структурно фокусируется на ней (Title/URL).
Изобретение затрагивает несколько этапов поиска, а также описывает клиентское приложение для отображения результатов.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит построение глобального Entity Graph путем анализа совместной встречаемости сущностей во всем корпусе документов. Также происходит извлечение сущностей из отдельных ресурсов и, вероятно, предварительный расчет Central Entities и Topical Entity.
QUNDERSTANDING – Понимание Запросов
Система использует Entity Graph для понимания связей между концепциями. При анализе SERP для валидации Topical Entity система интерпретирует запросы, основанные на сущностях.
RANKING / METASEARCH – Ранжирование и Метапоиск
Система анализирует результаты ранжирования и состав выдачи (SERP Features). Активация вертикалей (Shopping, Maps) используется как сигнал для подтверждения природы Topical Entity (согласно Claim 8).
Клиентское приложение (Additional Content Module)
Патент описывает применение этой технологии в рамках Additional Content System, которая взаимодействует с клиентским модулем (например, расширением браузера) для отображения релевантного контента в реальном времени при просмотре пользователем ресурса.
Входные данные:
Entity Graph.Ranking Scores и типы результатов (SERP Features).Выходные данные:
Central Entities с оценками Centrality Score.Topical Entity.Topical Entity через активацию Shopping или Map результатов (Claim 8) критически важна для правильной классификации страниц товаров и локаций.Topical Entity через специальные результаты активируется, когда (1) сущность найдена в Title или URL и (2) поиск по этой сущности вызывает появление Shopping, Maps или Answer Box в выдаче.Topical Entity через ранжирование применяется, когда ресурс достигает определенного порога видимости (specified rank) в результатах поиска по запросу, основанному на сущности.Процесс состоит из нескольких ключевых этапов.
Этап А: Идентификация Central Entities (FIG. 5)
Entity Graph фильтруется, оставляя только узлы, соответствующие кандидатам из ресурса.Central Entities.Central Entity рассчитывается оценка на основе весов (PMI) её исходящих ребер. Оценка корректируется с использованием сигналов: частота в документе, IDF (Inverse Document Frequency), присутствие в Title/URL, присутствие в логах запросов, ведущих на ресурс.Этап Б: Идентификация Topical Entity (FIG. 6, Claims 1, 4, 8)
Central Entities формируются запросы, получаются результаты поиска.Ranking Score.Topical Entity.Этап В: Обработка двусмысленности (FIG. 7)
Topical Entity) получаются результаты поиска.Entity Graph (FIG. 8)).Central Entity (например, "Moscow" -> "Moscow Id.") или использования предложений из Suggestion Service.Centrality Score и как обязательное условие для идентификации Topical Entity в Claim 8.Centrality Score и как альтернативный метод определения Topical Entity.Entity Graph: Глобальные данные о совместной встречаемости сущностей.Ranking Scores документов и информация о типах активированных результатов (SERP Features).Entity Graph. Формула:
Central Entities. Важна не просто частота сущности, а то, как она связана с другими сущностями на странице. Сущности с сильными исходящими связями считаются определяющими контекст.Topical Entity не основана только на анализе контента. Она активно валидируется через анализ результатов поиска.Topical Entity. Это позволяет Google понимать тему даже малоавторитетных или новых страниц.Topical Entity) явно присутствует в Title и URL страницы. Согласно Claim 8, это критически важный сигнал для подтверждения темы страницы, особенно если страница еще не имеет высокого авторитета.Topical Entity) релевантными связанными сущностями (Central Entities). Это помогает сформировать четкий граф сущностей для ресурса и подтверждает его тематику.Central Entities) немедленно устраняет двусмысленность. При необходимости используйте уточненные термины в Title/URL (например, "Jaguar animal facts").Topical Entity.Centrality Score.Патент подтверждает фундаментальный сдвиг к семантическому поиску, ориентированному на сущности (Entity-Oriented Search). Он детально показывает, что анализ связей между сущностями (Entity Graph) и анализ результатов поиска (SERP Analysis) используются совместно для понимания контента. Стратегически важно понимать, что Google ищет подтверждение темы страницы не только в её контенте, но и в том, как эта тема отражается в глобальной выдаче (через ранжирование или SERP Features).
Сценарий 1: Оптимизация страницы товара в новом интернет-магазине
Новый магазин имеет низкий авторитет и не ранжируется высоко по запросу о товаре.
Topical Entity.Topical Entity, так как сущность есть в Title/URL и поиск по ней активирует Shopping Features.Сценарий 2: Устранение двусмысленности для информационной статьи
Central Entities, которые создают сильные исходящие связи для контекста планеты: "Солнечная система", "Красная планета", "Атмосфера", "Колонизация", "NASA".В чем разница между Central Entity и Topical Entity?
Central Entity — это одна из основных тем ресурса. На странице может быть несколько Central Entities. Они определяются как сущности, имеющие сильные связи с другими сущностями на той же странице в Entity Graph. Topical Entity — это единственная преобладающая (главная) тема всего ресурса. Она валидируется через анализ результатов поиска (ранжирование или SERP Features) и представляет собой основной фокус страницы.
Как работает Entity Graph, описанный в патенте?
Entity Graph строится на основе анализа совместной встречаемости сущностей во всем корпусе документов. Узлы графа — это сущности. Ребро между двумя узлами создается, если сущности встречаются вместе значительно чаще, чем случайно. Вес ребра рассчитывается с помощью PMI (Pointwise Mutual Information). Важной особенностью является то, что ребра направленные.
Почему важно направление ребер в Entity Graph?
Направление ребер отражает условную вероятность. Например, если встречается "Омри Касспи" (игрок NBA), то вероятно встретится и "NBA". Но если встречается "NBA", то вероятность встретить именно "Омри Касспи" мала. Поэтому ребро направлено от "Омри Касспи" к "NBA". Сущности с большим количеством сильных исходящих ребер считаются Central Entities, так как они определяют контекст для других сущностей на странице.
Как Google определяет главную тему (Topical Entity), если страница ранжируется низко?
Это ключевой механизм, описанный в Claim 8. Если страница не ранжируется высоко (например, она новая или с низким авторитетом), Google использует комбинацию двух сигналов: (1) Сущность должна присутствовать в Title или URL страницы, И (2) Поиск по этой сущности должен активировать специальные типы результатов (SERP Features).
Что такое «особые типы результатов поиска» (particular type of search results), упомянутые в патенте?
В патенте (Claim 9) явно упоминаются Shopping results (результаты покупок), Map results (карты) и Answer box (блок с ответом). Если поиск по сущности вызывает появление одного из этих блоков в выдаче, это помогает Google понять природу сущности (товар, локация, вопрос) и подтвердить её как Topical Entity.
Как система обрабатывает двусмысленность? Например, "Apple" как фрукт или компания.
Система проверяет контекст (FIG. 7). Она выполняет поиск по сущности (например, "Apple") и анализирует топовые результаты. Затем она проверяет, насколько эти топовые результаты связаны с *другими* сущностями на исходной странице. Если страница о фруктах, а топовые результаты поиска связаны с технологиями и не имеют общих сущностей со страницей о фруктах, сущность "Apple" будет признана двусмысленной в данном контексте.
Каково практическое значение механизма обнаружения двусмысленности для SEO?
Это подчеркивает необходимость создания четкого семантического контекста на странице. Если вы используете термин, который может быть истолкован неверно, вы должны окружить его достаточным количеством связанных сущностей (Central Entities), чтобы немедленно устранить двусмысленность. В противном случае Google может решить, что ваша интерпретация сущности нерелевантна общепринятому значению.
Насколько важны Title и URL согласно этому патенту?
Они критически важны. Присутствие сущности в Title или URL используется как сильный сигнал для повышения Centrality Score. Более того, в механизме Claim 8 присутствие в Title или URL является обязательным условием для идентификации Topical Entity, если страница сама по себе не ранжируется высоко.
Имеет ли этот патент отношение к Google Knowledge Graph?
Да, напрямую. Entity Graph, описанный в патенте, по сути, является реализацией или компонентом Google Knowledge Graph. Он хранит данные о сущностях и силе связей между ними, основанные на анализе всего корпуса веб-документов. Патент описывает, как эта глобальная структура данных используется для анализа отдельных документов.
Что представляет собой описанная в патенте система "Additional Content System"?
Судя по описанию и иллюстрациям (FIG. 10-12), это система для динамического предоставления контекстно-зависимого контента, вероятно, реализованная как браузерное расширение или тулбар. Она анализирует просматриваемую страницу, определяет её главные темы с помощью описанных механизмов и показывает пользователю релевантные новости, видео, товары или карты в отдельном блоке интерфейса.

Семантика и интент
Knowledge Graph
Мультимедиа

Knowledge Graph
Мультимедиа
Семантика и интент

Семантика и интент
Knowledge Graph
SERP

SERP
Семантика и интент

Семантика и интент
EEAT и качество
SERP

Ссылки
SERP
EEAT и качество

Антиспам
SERP
Ссылки

Local SEO
Поведенческие сигналы
Свежесть контента

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
EEAT и качество
SERP

Ссылки

Индексация
Поведенческие сигналы
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
