
Google использует систему для определения того, насколько важна конкретная сущность (человек или бренд) для документа. Система анализирует количество упоминаний, их расположение (заголовок, тело) и упоминания других сущностей для расчета «Entity Score». Этот механизм используется для предложения пользователям контента о них самих для распространения в социальных сетях, а также учитывает «Traffic Spike Score» (всплески трафика) для выявления актуальных документов.
Патент решает проблему неосведомленности сущностей (людей, брендов, организаций) о контенте, который публикуется о них третьими сторонами в интернете. Зачастую такой контент сложно найти вручную. Система автоматизирует обнаружение этого контента и упрощает его распространение (dissemination) через онлайн-среды, контролируемые сущностью (например, профиль в социальной сети).
Запатентована система для автоматического предложения контента сущности для её дальнейшего распространения. Система идентифицирует документы, ссылающиеся на конкретную сущность, и вычисляет Entity Score — меру важности этой сущности для документа. На основе этого и других сигналов, таких как популярность контента (Traffic Spike Score) или авторитетность источника (Trusted Site), выбирается подмножество документов, которые предлагаются сущности.
Система функционирует следующим образом:
Entity-Document Index.Entity Score.Entity Score, если они имеют высокий Traffic Spike Score (резкий рост популярности) или опубликованы на Trusted Site.Dissemination Element.Средняя/Высокая. Хотя патент (подача 2012 г.) явно ориентирован на функционал социальных сетей (вероятно, Google+), лежащие в его основе технологии критически важны для современного поиска. Механизмы расчета значимости сущности (Entity Score), определение главной темы документа (Primary Subject), оценка авторитетности источников (Trusted Sites) и анализ трендов (Traffic Spike Score) активно используются в Google Search, Knowledge Panels и Google Discover.
Патент имеет значительное стратегическое влияние (7/10) на Entity SEO и Управление репутацией (ORM). Он не описывает ранжирование в веб-поиске, но детально раскрывает, как Google количественно оценивает взаимосвязь между документом и сущностью (Entity Score). Понимание этих механизмов позволяет оптимизировать контент так, чтобы четко сигнализировать поисковой системе, кто является главным субъектом документа.
Knowledge Graph).measure of importance) конкретной сущности для данного документа. Рассчитывается на основе количества, расположения и соотношения упоминаний сущности.Claim 1 (Независимый пункт): Описывает основной процесс предложения документов члену социальной сети, фокусируясь на взаимодействии Entity Score и Traffic Spike Score.
Entity Score (мера важности), основанная на количестве упоминаний.Entity Score превышает порог.Entity Score ниже порога.Traffic Spike Score (оценка дисперсии трафика), превышающий порог.Traffic Spike Score.Dissemination Element на странице социальной сети этого члена.Ключевой аспект — механизм включения трендового контента (Traffic Spike Score) может компенсировать низкую базовую оценку важности (Entity Score).
Claim 2 (Зависимый от 1): Уточняет расчет Entity Score.
Entity Score определяется на основе как количества упоминаний, так и их расположения (locations) в документе.
Claim 3 (Зависимый от 1): Детализирует расчет Entity Score через соотношение.
Entity Score определяется как функция от первого и второго чисел.Это подчеркивает важность эксклюзивности фокуса документа на сущности.
Claim 4 (Зависимый от 1): Описывает альтернативный критерий включения.
Документ может быть включен, если он одновременно размещен на Trusted Site (классифицированном как надежный) И система определила, что данная сущность является Primary Subject этого документа.
Claim 5 (Зависимый от 1): Описывает еще один критерий включения.
Документ может быть включен, если его заголовок (Title) содержит упоминание данной сущности.
Claim 7 (Зависимый от 1): Описывает механизм обеспечения разнообразия.
Если два документа имеют совпадающую Document Date и оба подходят для включения, система включает только один из них. Это обеспечивает темпоральное разнообразие.
Изобретение применяется в основном на уровне приложений (например, социальной сети), но критически зависит от данных, обработанных на этапе индексирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная подготовка данных:
Knowledge Graph.Entity-Document Index.Trusted Sites.Document Date).Entity Scores.Application Layer (Уровень Приложения)
Основная логика патента выполняется здесь (это не стандартный процесс RANKING для веб-поиска, а процесс генерации предложений):
Entity-Document Index для конкретной сущности.Entity Scores. Анализируются данные о трафике для расчета Traffic Spike Score.Dissemination Element встраиваются в интерфейс пользователя.Входные данные:
Entity-Document Index.Entity Scores.Trusted Sites).Traffic Spike Score).Document Dates.Выходные данные:
Dissemination Element (кнопка "Поделиться").Entity Score выше порога.Traffic Spike Score выше порога (даже при низком Entity Score).Trusted Site и Primary Subject.Процесс отбора предложенных документов для сущности (E).
Entity-Document Index).Entity Score. Учитывается количество упоминаний E, их расположение (заголовок, начало текста) и соотношение упоминаний E к другим сущностям.Entity Score превышают установленный порог.Entity Score).Traffic Spike Score. Если он превышает порог, документ добавляется.Trusted Site И сущность E является Primary Subject, он добавляется.Document Date, система может выбрать только один из них.Dissemination Element.Entity Score и отдельным критерием включения.Entity Score.Trusted Site (на основе анализа качества контента сайта).Traffic Spike Score.Document Date (дата публикации или индексации): Используется для обеспечения темпорального разнообразия.Entity Score (Оценка значимости сущности): Комплексная метрика. Рассчитывается как функция от: Traffic Spike Score: Метрика трендовости. Рассчитывается на основе дисперсии (variance) или максимального изменения количества пользовательских запросов к документу за определенный период времени (например, сравнение трафика сегодня и вчера).Trusted Site: Бинарная или пороговая классификация на уровне сайта, основанная на качестве контента.Primary Subject: Классификация, указывающая, является ли сущность главной темой документа. Определяется на основе анализа Entity Score и доминирования сущности в тексте.Entity Score) для определения фокуса документа на конкретной сущности. Это не просто подсчет упоминаний, а анализ частоты, проминентности (расположения) и эксклюзивности (соотношения).Traffic Spike Score может компенсировать низкий Entity Score, подчеркивая важность актуальности и вовлеченности.Trusted Site является важным фактором доверия. Комбинация авторитетного источника и четкого фокуса на сущности (Primary Subject) является сильным сигналом для системы.Document Date), чтобы избежать предложения однотипного контента, опубликованного в одно время.Хотя патент не о ранжировании в поиске, он раскрывает механизмы NLP для определения значимости сущностей (Entity Score). Эти механизмы, вероятно, используются и в основном поиске, Google Discover и для Knowledge Graph.
Primary Subject. Для этого необходимо упоминать сущность в ключевых местах: в заголовке (Title), в первых абзацах и естественно по всему тексту.Trusted Sites. Согласно патенту, это значительно повышает ценность публикации.Traffic Spike Score является сильным сигналом важности для Google.Primary Subject. Это снижает Entity Score для каждой отдельной сущности из-за низкого соотношения упоминаний.Entity Score, так как система придает меньший вес таким упоминаниям.Trusted Sites.Патент подтверждает критическую важность распознавания сущностей (Entity Recognition) и определения их значимости (Entity Salience) в стеке NLP Google. Понимание расчета Entity Score критически важно для Entity SEO. Стратегии должны быть направлены на то, чтобы сделать основную сущность (Primary Subject) документа максимально очевидной для поисковых систем, что улучшает ассоциацию контента с этой сущностью в Knowledge Graph и повышает видимость в релевантных системах.
Сценарий: Оптимизация пресс-релиза о запуске нового продукта (например, "Pixel 9") для максимизации Entity Score.
Задача: Обеспечить, чтобы система Google определила "Pixel 9" как Primary Subject и присвоила максимально высокий Entity Score.
Entity Score зависит от соотношения упоминаний разных сущностей (Claim 3).Trusted Site).Trusted Site и Primary Subject является критерием включения (Claim 4).Что такое Entity Score и чем он отличается от стандартной оценки релевантности (IR Score)?
Entity Score — это специфическая метрика, измеряющая, насколько важна конкретная сущность для документа (Entity Salience). Она учитывает частоту, расположение (проминентность) и эксклюзивность (соотношение с другими сущностями). В отличие от нее, Information Retrieval (IR) Score — это стандартная оценка того, насколько документ релевантен запросу (например, имени сущности), часто основанная на совпадении терминов. Документ может иметь высокий IR Score, но низкий Entity Score, если сущность упоминается вскользь.
Как повысить Entity Score для моего бренда на странице?
Для повышения Entity Score необходимо сфокусироваться на трех аспектах. Упомяните название бренда в заголовке (Title и H1) и в первых абзацах текста (проминентность). Естественно используйте название бренда в контексте (частота). Убедитесь, что ваш бренд упоминается значительно чаще, чем любые другие сущности на этой странице (эксклюзивность).
Учитывает ли Google расположение упоминаний сущности на странице?
Да, абсолютно. Патент явно указывает (Claim 2), что местоположение ссылок на сущность используется при определении Entity Score. Упоминания в заголовках и в начале документа обычно имеют больший вес, чем упоминания в конце текста или в сносках.
Что произойдет, если на странице упоминается много разных сущностей?
Это затрудняет определение основного субъекта (Primary Subject) страницы. Патент учитывает это (Claim 3): Entity Score рассчитывается с учетом упоминаний других сущностей. Если вы упоминаете 10 сущностей с одинаковой частотой, Entity Score для каждой из них будет низким из-за плохого соотношения (эксклюзивности).
Что такое Traffic Spike Score и как он влияет на видимость контента?
Traffic Spike Score измеряет резкие всплески пользовательского интереса (трафика) к документу за короткий период, указывая на трендовость или виральность. Патент показывает, что Google использует это как сильный сигнал актуальности. Документ может быть продвинут системой, даже если его Entity Score низок, при условии высокого Traffic Spike Score.
Используется ли этот патент в Google Поиске или Google Discover?
Конкретная реализация (предложение контента в социальной сети), скорее всего, нет. Однако базовые технологии — расчет Entity Score (значимости сущности) и анализ Traffic Spike Score (популярности) — являются стандартными методами NLP, которые Google применяет повсеместно, особенно в системах рекомендаций контента, таких как Google Discover.
Что в патенте подразумевается под Trusted Site?
Trusted Site — это веб-сайт, классифицированный системой как надежный источник на основе качества размещаемых им документов (упоминаются оригинальность, форматирование, ссылочный профиль). Патент указывает, что размещение на таком сайте является самостоятельным критерием для отбора контента (при условии, что сущность является Primary Subject). Это соответствует концепциям E-E-A-T.
Может ли упоминание сущности в заголовке компенсировать низкую частоту упоминаний в тексте?
Да, в значительной степени. Патент выделяет упоминание в заголовке как отдельный критерий для включения документа (Claim 5), а также как фактор, повышающий вес при расчете Entity Score (Claim 2). Наличие сущности в заголовке — один из самых сильных сигналов значимости.
Как система обеспечивает разнообразие предлагаемого контента?
Патент описывает механизм диверсификации по времени (Claim 7). Если система находит несколько документов, удовлетворяющих критериям отбора (например, высокому Entity Score), но имеющих одинаковую дату публикации (Document Date), она может выбрать только один из них. Это увеличивает вероятность того, что предложенные документы будут касаться разных событий.
Как система отличает одного человека от другого с таким же именем?
Патент исходит из того, что работает с уникальными сущностями (uniquely identified person), связанными с Knowledge Graph. Система использует контекст документа (например, профессию, связанные события или других людей), чтобы устранить неоднозначность (disambiguate) и привязать упоминание к конкретному уникальному субъекту, прежде чем рассчитывать Entity Score.

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Knowledge Graph
Мультимедиа

Knowledge Graph
Семантика и интент

Knowledge Graph
Мультимедиа
Семантика и интент

Семантика и интент
EEAT и качество
SERP

Семантика и интент
Персонализация
SERP

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Мультимедиа
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа

Мультиязычность
Семантика и интент
Ссылки

Ссылки
SERP

Структура сайта
SERP
Ссылки

Семантика и интент
Техническое SEO
EEAT и качество

Поведенческие сигналы
EEAT и качество
SERP
