
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
Патент решает проблему неточного или неполного ранжирования в специализированных корпусах (например, Google Книги, Фильмы). Стандартные алгоритмы могут упускать релевантные Entity Realizations (конкретные воплощения сущностей, например, определенное издание книги), если система не может точно оценить значимость этой сущности в контексте запроса. Изобретение улучшает качество вертикального поиска, используя сигналы из общего веб-индекса для оценки и ранжирования этих специализированных сущностей.
Запатентована система для расчета оценки сущности (Reference Score) путем анализа того, как эта сущность упоминается в наборе веб-документов, релевантных запросу. Система использует метрики уверенности (Confidence Score) и тематичности (Topicality Score) упоминаний, а также релевантность и качество самих документов. Эти оценки сложно нормализуются с учетом контекста других сущностей на странице и используются для корректировки ранжирования сущности.
Система функционирует в два этапа: офлайн-подготовка и онлайн-обработка запроса.
Proper Subset), основываясь на их качестве (Quality Score) и том, как они ссылаются на сущности.Proper Subset), релевантные запросу.Confidence и Topicality.Reference Partial Score). Этот вклад нормализуется: если страница упоминает много сущностей, вес каждой снижается.Reference Score для сущности.Высокая. Понимание сущностей (Knowledge Graph) и использование веба для оценки их авторитетности (E-E-A-T, Topical Authority) являются фундаментом современного поиска. Этот патент описывает конкретный механизм для количественной оценки значимости сущностей на основе контекста и качества их упоминаний в интернете, что остается крайне актуальным.
Патент имеет высокое стратегическое значение для SEO (85/100). Он раскрывает механизм, как контент и упоминания на веб-страницах напрямую влияют на ранжирование сущностей (продуктов, людей, компаний). Понимание метрик Topicality (тематичность) и Confidence (уверенность), а также механизма нормализации и роли Quality Score источника, критически важно для стратегий Entity SEO, Digital PR и управления репутацией.
Expression.Work). Например, английское издание романа "Том Сойер".Confidence Score и Topicality Score для упоминания сущности в ресурсе.Proper Subset.Reference Partial Scores (Sp) со всех релевантных ресурсов.First Values (FV) для всех сущностей, упомянутых в ресурсе (p). Используется как фактор нормализации.Confidence Score и Topicality Score.Патент описывает два основных аспекта: (1) Ранжирование сущностей в ответ на запрос (Онлайн) и (2) Офлайн-процесс отбора корпуса ресурсов.
Аспект 1: Ранжирование сущностей в ответ на запрос (Claims 1-12)
Claim 1 (Независимый пункт): Описывает основной метод ранжирования.
Relevance Scores (R(p)) и Resource Reference Scores для упомянутых сущностей (e).First Partial Score (Sp(p,e)), используя эти оценки.Reference Score (S(e)) путем агрегации Sp(p,e).Claim 3 (Зависимый): Детализирует расчет Sp(p,e), вводя нормализацию.
Second Partial Score (CT(p)) для ресурса на основе оценок *всех* сущностей в нем.Если документ релевантен запросу, но упоминает много разных сущностей (высокий CT(p)), его вклад в оценку каждой отдельной сущности (Sp(p,e)) снижается. Это позволяет распределить релевантность документа между упомянутыми сущностями, отдавая предпочтение тем, которые являются фокусом документа.
Claim 4 (Зависимый): Определяет компоненты и расчет CT(p).
Resource Reference Scores включают Confidence Score (C) и Topicality Score (T).First Values (FV(p,e)), где FV пропорционально произведению C и T.Claim 6 и 7 (Зависимые): Детализируют расчет итогового S(e).
S(e) рассчитывается как сумма всех Sp(p,e), умноженная на Relevance Score ресурса, находящегося на N-й позиции в ранжировании (например, 10-й результат). Это нормализует итоговую оценку сущности относительно общего качества веб-выдачи по данному запросу.
Аспект 2: Офлайн-отбор корпуса ресурсов (Описан в патенте, FIG. 5 и 6)
Этот процесс направлен на создание Proper Subset для оптимизации Аспекта 1.
Entity Realizations.Quality Score (независимая от запроса авторитетность ресурса) и Resource Reference Scores (C и T).Proper Subset.Изобретение связывает данные из общего веб-индекса с ранжированием в специализированных (вертикальных) индексах сущностей.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые офлайн-процессы (Аспект 2):
Quality Scores для веб-ресурсов.Confidence Scores и Topicality Scores для упоминаний.Proper Subset – создание оптимизированного корпуса авторитетных ресурсов для анализа сущностей.RANKING – Ранжирование
На этом этапе (Аспект 1) система выполняет поиск по веб-корпусу (часто ограниченному Proper Subset) для получения релевантных ресурсов и их Relevance Scores (R(p)). Параллельно может выполняться поиск в вертикальном индексе.
RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента (Аспект 1). Система использует данные этапа RANKING для выполнения расчетов:
Resource Partial Scores (CT(p)) для нормализации.Reference Partial Scores (Sp(p,e)).Reference Score (S(e)).synthetic search result для сущностей с высоким S(e).Proper Subset выполняется офлайн периодически. Расчет Reference Score выполняется онлайн во время обработки запроса.Процесс А: Офлайн-генерация корпуса (Proper Subset) (Аспект 2)
Entity Realizations (e).Quality Score (Q(p)). Для ссылок получить Confidence (C(p,e)) и Topicality (T(p,e)).Proper Subset, объединив все отобранные ресурсы.Процесс Б: Обработка запроса и ранжирование сущностей (Аспект 1)
Proper Subset). Получить набор релевантных ресурсов (P) и их Relevance Scores (R(p)).Relevance Score N-го веб-ресурса).Topicality Score (насколько контент сфокусирован на сущности) и Confidence Score (насколько точно распознана сущность).Quality Score — независимая от запроса мера качества ресурса. Применяется в офлайн-процессе для отбора Proper Subset. Это связано с E-E-A-T и PageRank.Relevance Score (R(p)) — оценка релевантности ресурса запросу (IR-score), полученная от основной системы ранжирования. Используется в онлайн-процессе.Система вычисляет несколько метрик с использованием конкретных формул (k1-k4 – настраиваемые параметры).
1. First Value (FV(p,e)) – Базовая оценка значимости упоминания.
(Equation 1)
2. Resource Partial Score (CT(p)) – Общая масса всех сущностей в документе (фактор нормализации).
(для всех e в p) (Equation 2)
3. Reference Partial Score (Sp(p,e)) – Вклад конкретного упоминания в оценку сущности, с учетом релевантности и нормализации.
(Equation 3/4). Деление на CT(p) означает, что если на странице много других сущностей, вклад в Sp(p,e) уменьшается (эффект разбавления).
4. Reference Score (S(e)) – Финальная оценка сущности.
(Equation 5). Где IRw(10) – Relevance Score ресурса на 10-й позиции, используемый для нормализации относительно качества выдачи.
Topicality Score как ключевой фактор. Недостаточно просто упомянуть сущность; ресурс должен быть тематически сфокусирован на ней. Google ценит глубокое обсуждение сущности выше, чем случайные упоминания.Confidence Score гарантирует, что система корректно распознала сущность. Неоднозначные упоминания имеют низкую ценность.Quality Score (авторитетность) для отбора Proper Subset. Онлайн используется Relevance Score (релевантность запросу) для взвешивания упоминаний.Topicality Score (T(p,e)). Развивайте общую авторитетность сайта (Quality Score), чтобы увеличить шансы попадания в Proper Subset для ключевых сущностей вашей ниши.Topicality Score и минимизирует эффект нормализации (CT(p)).Confidence Score (C(p,e)) и гарантировать корректное распознавание упоминаний.Topicality Score для каждой из них.Topicality Score.Quality Score, вероятно, не входят в Proper Subset и не будут учитываться при ранжировании сущностей.Патент подтверждает стратегическую важность Entity-Based SEO и управления репутацией сущности в интернете. Он предоставляет математическую модель для оценки внешних сигналов авторитетности (часть E-E-A-T). Для долгосрочной SEO-стратегии критически важно не просто "строить ссылки", а заниматься цифровым PR: формировать присутствие сущности в релевантном тематическом контексте (высокий Topicality) на авторитетных площадках (высокий Quality Score).
Сценарий: Сравнение ценности двух разных упоминаний для продукта (Сущность)
Продукт: Робот-пылесос "CleanBot X5".
Упоминание А: Детальный обзор на TechRadar.
Статья: "Обзор CleanBot X5: лучший пылесос для шерсти животных?"
Proper Subset).Reference Score. Упоминание получает большой вес благодаря высокому T и низкому CT.Упоминание Б: Список на Wired.
Статья: "Топ-50 гаджетов 2025 года". CleanBot X5 на 25 месте.
Reference Score. Упоминание сильно ослаблено низким T и высоким CT (нормализация).Вывод для SEO: Упоминание А значительно ценнее для продвижения сущности "CleanBot X5", чем упоминание Б.
Что такое Topicality Score (T(p,e)) и почему он так важен для SEO?
Topicality Score измеряет, насколько тесно сущность связана с содержанием упоминающей ее страницы. Высокий балл означает, что сущность является центральной темой контента. Это критически важно для SEO, потому что патент использует этот показатель как прямой множитель для расчета ценности упоминания. Упоминания с низким Topicality Score (например, мимолетные упоминания вне контекста) дают минимальный вклад в ранжирование сущности.
Как механизм нормализации (CT(p)) влияет на стратегию линкбилдинга и контент-маркетинга?
Resource Partial Score (CT(p)) суммирует вес всех сущностей на странице и используется как знаменатель. Это означает, что если на странице упомянуто много разных сущностей (высокий CT(p)), ценность упоминания для каждой отдельной сущности снижается (эффект разбавления). Это делает стратегии размещения в длинных списках или каталогах менее эффективными. Приоритет следует отдавать получению подробных обзоров или статей, сфокусированных только на вашей сущности.
Что такое "Proper Subset" и как он связан с E-E-A-T?
Proper Subset – это предварительно отобранный набор высококачественных ресурсов, который Google использует для анализа сущностей. Он формируется на основе Quality Score (независимая оценка качества/авторитетности сайта) и того, насколько авторитетно сайт пишет о сущностях. Это напрямую связано с E-E-A-T: только сайты с высоким Quality Score (высоким E-E-A-T) попадают в Proper Subset и влияют на ранжирование сущностей.
Применяется ли этот алгоритм только к Google Books?
Нет. Хотя в патенте в качестве основного примера используются книги (Book Expressions), описанный механизм является общим. В патенте прямо упоминается возможность применения к фильмам, музыке, людям, телевизионным программам. С точки зрения SEO, это применимо к ранжированию любых Entity Realizations, включая бренды, продукты и авторов в Knowledge Graph.
В чем разница между Quality Score (офлайн) и Relevance Score (онлайн)?
Quality Score — это независимая от запроса оценка авторитетности ресурса (например, сигналы E-E-A-T). Он используется в офлайн-процессе для отбора лучших сайтов в Proper Subset. Relevance Score (R(p)) — это оценка того, насколько ресурс релевантен конкретному запросу пользователя в реальном времени (например, IR-score), и он используется для определения веса упоминаний на уже отобранных сайтах.
Как можно повысить Confidence Score (C(p,e)) при оптимизации сайта?
Confidence Score связан с тем, насколько уверенно система распознает упоминание. Для его повышения необходимо устранить неоднозначность: использовать консистентное и полное наименование сущности, предоставлять достаточный контекст и активно использовать структурированные данные (Schema.org) для явного указания на сущность и ее свойства.
Почему в формуле итогового Reference Score используется Relevance Score N-го результата (например, IRw(10))?
Использование Relevance Score ресурса на N-й позиции служит нормализующим и масштабирующим фактором. Это позволяет связать итоговый Reference Score сущности с общей "силой" и конкурентностью веб-выдачи по данному запросу. Это помогает калибровать оценки сущностей так, чтобы их можно было сравнивать с IR-оценками других результатов при финальном ранжировании.
Лучше ли, если сущность упоминается на странице одна или вместе с другими сущностями?
С точки зрения этого алгоритма, значительно лучше, когда сущность является основным фокусом страницы. Если упоминается много других сущностей, общий Resource Partial Score (CT(p)) увеличивается, что приводит к снижению вклада (Sp(p,e)) данной конкретной сущности из-за механизма нормализации.
Если страница не релевантна запросу, но имеет высокое качество и Topicality для моей сущности, будет ли она полезна?
Она будет полезна для укрепления авторитета сущности в целом и для формирования Proper Subset в офлайн-режиме, так как этот процесс использует Quality Score и Topicality. Однако во время выполнения конкретного запроса (онлайн-процесс), если страница имеет низкий Relevance Score (R(p)) к этому запросу, ее вклад в итоговый Reference Score будет минимальным именно для этого запроса.
Как этот патент влияет на традиционный линкбилдинг?
Патент смещает фокус с количества ссылок на качество, контекст и тематичность упоминаний (которые могут быть и без гиперссылок). Он показывает, что для ранжирования сущности критически важны не просто ссылки, а упоминания на авторитетных ресурсах (высокий Quality Score) в строго релевантном контексте (высокий Topicality Score). Это больше похоже на Digital PR, чем на традиционный линкбилдинг.

EEAT и качество
Поведенческие сигналы
SERP

Ссылки
SERP
EEAT и качество

Knowledge Graph
Семантика и интент

SERP
Семантика и интент
EEAT и качество

Семантика и интент
Knowledge Graph
SERP

EEAT и качество
Антиспам
Ссылки

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
SERP

Поведенческие сигналы
Семантика и интент
Структура сайта

EEAT и качество
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

Ссылки
Антиспам
SERP

Ссылки
Поведенческие сигналы
Антиспам

Поведенческие сигналы
Ссылки
SERP

Семантика и интент
Поведенческие сигналы
Персонализация
