
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
Патент решает проблему определения относительной важности многочисленных сущностей (например, локаций, дат, людей), упомянутых в документе, при отсутствии явных указаний на их ранг. Это необходимо для двух ключевых задач: 1) Эффективного представления информации пользователю (например, показ только самых важных локаций на карте, чтобы избежать перегруженности). 2) Улучшения качества поиска путем использования этих оценок важности сущностей в качестве сигнала для ранжирования самого документа.
Запатентована система (Entity Importance Engine), которая вычисляет независимые от запроса оценки важности (query-independent importance scores) для сущностей в корпусе документов. Определение "книги" в патенте включает веб-страницы. Система анализирует множество факторов, включая контекст упоминания сущности, точность ее определения, внешние и внутренние ссылки на разделы, упоминающие сущность, и активность пользователей. Полученные оценки используются для ранжирования документов в результатах поиска.
Система работает преимущественно в офлайн-режиме (на этапе индексирования):
Book Context: Оценка места упоминания (заголовки, начало документа, метаданные).Precision: Оценка точности определения сущности.References: Анализ внешних ссылок (цитирований) на разделы, где упомянута сущность.User Activities: Анализ частоты доступа пользователей к этим разделам.Term Weighting: Анализ частоты упоминания (например, TF-IDF).Importance Score.Search Module) использует эти предварительно рассчитанные оценки важности сущностей как один из сигналов для ранжирования самих документов в выдаче (согласно Claims 1 и 8).Высокая. Определение того, какие сущности являются центральными для документа, является фундаментальной задачей для современных алгоритмов семантического поиска (Knowledge Graph, BERT, MUM). Описанные принципы — использование структуры документа, внешних ссылок и поведения пользователей для оценки важности контента — остаются крайне актуальными для оценки релевантности и построения Topical Authority в 2025 году.
Патент имеет высокое значение для SEO (8/10). Он предоставляет детальную схему того, как Google определяет тематическую направленность и глубину документа на уровне сущностей. Критически важно, что патент прямо указывает на использование этих query-independent importance scores для ранжирования самих документов. Это подчеркивает необходимость не просто упоминать релевантные сущности, но и структурно, контекстуально и с помощью внешних сигналов демонстрировать их важность.
geopoint), дата/время, событие, человек, организация.query-independent importance scores.OCR confidence).third party references) на разделы книги. Разделы, на которые ссылаются извне, считаются более важными.Патент содержит ключевые независимые пункты, которые описывают как процесс расчета важности сущностей, так и критически важное применение этих расчетов в ранжировании.
Claim 1 (Независимый пункт): Описывает систему, фокусирующуюся на внешних ссылках и ранжировании.
query-independent importance scores сущностям.References Module для идентификации сторонних ссылок (third party references) на разделы книги.importance values) разделов, на которые ссылаются третьи стороны, повышаются.Search Module ранжирует книги в списке результатов в порядке, основанном, по крайней мере частично, на этих query-independent importance scores.Внешние ссылки на конкретные разделы документа повышают важность контента и сущностей в этих разделах. Эта оценка важности затем используется как сигнал для ранжирования всего документа.
Claim 8 (Независимый пункт): Описывает систему, фокусирующуюся на метаданных классификации и ранжировании.
query-independent importance scores.library classification module), который определяет, упоминается ли сущность в данных библиотечной классификации (метаданных) книги.Search Module ранжирует книги в списке результатов, используя эти query-independent importance scores.Упоминание сущности в формальных метаданных или классификации документа повышает ее важность. Эта оценка важности также используется как сигнал для ранжирования всего документа.
Claim 15 и Claim 22 (Независимые пункты): Детализируют методы расчета важности, подтверждая механизмы, описанные в Claim 1 (фокус на внешних ссылках) и Claim 8 (фокус на классификации) соответственно.
Изобретение применяется в основном на этапе индексирования для предварительных вычислений, результаты которых используются на этапе ранжирования.
INDEXING – Индексирование и извлечение признаков
Это основной этап работы Entity Importance Engine. Система работает асинхронно (офлайн).
Book Context), метаданные (Classification Data), данные о внешних ссылках (References) и агрегированные данные о поведении пользователей (User Activities).query-independent importance scores для всех значимых сущностей. Эти данные сохраняются в индексе как признаки (features) документа.RANKING – Ранжирование
На этом этапе используются результаты работы. Как явно указано в Claims 1 и 8, система ранжирования использует предварительно рассчитанные importance scores сущностей в качестве одного из сигналов для определения релевантности и ранжирования самого документа в ответ на запрос. Документы, где искомая сущность имеет высокую важность (является центральной темой), могут получить преимущество.
Входные данные:
third-party references).Выходные данные:
Query-independent Importance Score для каждой сущности.Процесс А: Расчет важности сущностей (Офлайн / Индексирование)
third-party references). Определение важности разделов на основе частоты их цитирования извне. Повышение оценки сущностей в высоко цитируемых разделах.Importance Score путем взвешенного суммирования (линейной комбинации) отдельных оценок. Нормализация результата.Процесс Б: Использование оценок (Ранжирование и Представление)
Importance Scores упомянутых в них сущностей как один из сигналов ранжирования (согласно Claims 1 и 8).Importance Scores.User Activities).OCR confidence scores).Term Weighting. Рассчитывается как частота сущности в документе (TF) относительно ее частоты во всем корпусе (IDF).Формула (из описания патента): Final Importance Score=AX+BY+CZ...
Где X, Y, Z — отдельные оценки (например, от Context, References, Precision), а A, B, C — весовые коэффициенты.
Book Context и Precision получают наибольшие веса.query-independent importance scores сущностей используются для ранжирования самих документов в результатах поиска. Это подтверждает важность Entity SEO.Book Context).third-party references), указывающие на определенный раздел документа, повышают важность этого раздела и всех сущностей в нем. Это аналог PageRank, применяемый к частям контента (deep linking).User Activities), система повышает важность сущностей в этом разделе.Precision).Book Context.Library Classification Data, упоминание в которых напрямую повышает важность сущности (Claim 8).Importance Score, рассчитанный модулем Precision.References Module, это значительно повышает важность сущностей в этих разделах.User Activities Module.Importance Score.Term Weighting (TF-IDF) нивелирует эффект от повторения общеупотребительных сущностей, если их частота не оправдана глубиной раскрытия темы.Precision.Этот патент подтверждает стратегическую важность перехода к оптимизации под сущности (Entity SEO) и построению Topical Authority. Он показывает, что Google стремится понять контент глубоко, определяя главные объекты и темы повествования. Для успеха в SEO необходимо не просто упомянуть релевантные сущности, но и структурно, контекстуально и с помощью внешних сигналов продемонстрировать, какие из них являются центральными для документа.
Сценарий: Оптимизация статьи "Руководство по уходу за Кофейным Деревом Арабика"
Importance Score. Благодаря этому (согласно Claim 1), статья получит преимущество в ранжировании по запросам, связанным с этими сущностями.Применим ли этот патент к веб-сайтам или только к Google Books?
Патент абсолютно применим к веб-сайтам. В нем дается широкое определение термина "книга" (Book), которое явно включает "веб-страницы и другие электронные документы". Фундаментальные принципы оценки важности контента на основе структуры, контекста, внешних ссылок и поведения пользователей универсальны и используются Google в основном поиске.
Как именно этот патент связан с ранжированием моего сайта?
В Claims 1 и 8 патента прямо указано, что рассчитанные query-independent importance scores сущностей используются для ранжирования самих документов в результатах поиска. Если Google считает, что ключевые сущности, релевантные запросу, имеют высокую важность в вашем документе (т.е. являются его центральной темой), это служит позитивным сигналом ранжирования.
Что важнее согласно патенту: частота упоминания сущности или ее расположение в документе?
Важна комбинация, но контекст и расположение (Book Context) часто играют решающую роль. Упоминание в заголовке, метаданных (классификации) или в разделе, на который много ссылаются, может дать больший вклад в Importance Score, чем многократное упоминание в основном тексте. Патент также упоминает, что Book Context и Precision могут иметь наибольший вес.
Как внешние ссылки повышают важность сущности?
Механизм References Module повышает важность раздела документа, если на него ссылаются внешние источники (third-party references). Все сущности, упомянутые в этом (теперь более важном) разделе, получают повышенный Importance Score. Это подчеркивает ценность получения глубоких ссылок (deep links) на конкретные части контента.
Как поведение пользователей (User Activities) влияет на оценку важности?
Если пользователи часто обращаются к определенному разделу документа (например, долго его изучают, переходят по анкорным ссылкам), система считает этот раздел более важным. Это повышает Importance Score сущностей, упомянутых в этом разделе, подтверждая важность работы над вовлеченностью и юзабилити контента.
Что подразумевается под "точностью" (Precision) сущности и как ее повысить?
Точность относится к степени детализации. Например, полный почтовый адрес точнее, чем просто название города; точная дата точнее, чем год. Для повышения точности следует предоставлять максимально полную и специфичную информацию о сущности и использовать микроразметку Schema.org для четкого определения ее свойств.
Как этот патент связан с Topical Authority?
Он напрямую связан. Topical Authority подразумевает глубокое раскрытие темы. Этот патент описывает механизм, позволяющий Google измерить эту глубину, определяя, какие сущности являются центральными для документа. Документ, в котором ключевые для темы сущности имеют высокий Importance Score, будет считаться более авторитетным.
Влияет ли внутренняя перелинковка на важность сущностей?
Да, влияет. Патент указывает, что разделы, на которые чаще ссылаются другие разделы того же документа (intra-book references), считаются более важными (в рамках Book Context). Соответственно, сущности в этих разделах также получают более высокий Importance Score. Это подчеркивает важность продуманной внутренней перелинковки и использования оглавлений (TOC).
Что такое "данные библиотечной классификации" и какой у них аналог в веб-поиске?
Это структурированные метаданные, такие как тема, жанр, коды классификации. В веб-поиске аналогами являются данные микроразметки (Schema.org), категории, теги, а также классификация страницы по тематике. Упоминание сущности в этих метаданных напрямую повышает ее важность (Claim 8).
Как система использует TF-IDF для сущностей?
Term Weighting Module применяет логику TF-IDF: если сущность очень часто встречается во всем корпусе (интернете), её базовый вес снижается. Чтобы она считалась важной в вашем документе, вы должны упоминать её значительно чаще, чем в среднем, или она должна быть упомянута в очень важных контекстах. Это означает необходимость фокусироваться на уникальном контексте и глубоком раскрытии темы.

Семантика и интент
EEAT и качество
SERP

Персонализация
Семантика и интент
SERP

Семантика и интент
Ссылки
Knowledge Graph

Семантика и интент
Knowledge Graph
SERP

Knowledge Graph
Семантика и интент
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Local SEO

Антиспам
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP
EEAT и качество

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

SERP
Ссылки
Структура сайта

Knowledge Graph
Ссылки
EEAT и качество

EEAT и качество
Семантика и интент
