
Google использует механизм для определения людей, наиболее релевантных поисковому запросу. Система анализирует контекст вокруг имен в документах, используя «термины классификации» (например, должности, локации, email), чтобы сгруппировать упоминания и различить людей с одинаковыми именами (дисамбигуация). Это позволяет точно идентифицировать сущности и организовать выдачу вокруг них.
Патент решает две фундаментальные задачи. Первая — идентификация и ранжирование людей, наиболее релевантных запросу, даже если запрос не содержит имени (например, кто важен по запросу "lakers"). Вторая — разрешение неоднозначности имен (disambiguation). Система должна различать разных людей с одинаковыми именами (например, "Michael Jordan" – баскетболист и "Michael Jordan" – ученый), основываясь на контексте их упоминаний.
Запатентована система контекстного поиска людей, которая идентифицирует, оценивает релевантность и устраняет неоднозначность имен (Person Names). Ключевым механизмом является использование Classification Terms (уникальных контекстных идентификаторов) для группировки документов в Classification Clusters. Анализируя эти кластеры, система определяет различные идентичности (Person Identities) для одного имени.
Система работает в несколько этапов:
Classification Terms (например, email, должности, локации).Person Identities.Высокая. Распознавание сущностей (Entity Recognition) и устранение неоднозначности (Disambiguation) являются фундаментом современного семантического поиска и Knowledge Graph. Способность точно идентифицировать авторов и экспертов критически важна для оценки сигналов E-E-A-T.
Патент имеет высокое стратегическое значение для SEO (8.5/10). Он описывает конкретные механизмы, которые Google использует для идентификации и различения экспертов. Если система не может корректно идентифицировать эксперта или путает его с другим человеком, сигналы E-E-A-T могут быть неверно атрибутированы. Понимание этого механизма позволяет разрабатывать стратегии для четкой и однозначной презентации ключевых фигур организации.
Classification Terms. Используется для определения контекста, связанного с именем.Classification Term появляется в непосредственной близости к любому имени человека. Используется для оценки полезности термина для дисамбигуации.Person Name. Одно имя может иметь несколько идентичностей. Идентичность определяется через ассоциацию имени с определенными Classification Clusters.Classification Term (слишком частые исключаются).Claim 1 (Независимый пункт): Описывает основной процесс идентификации и дисамбигуации людей.
Classification Terms (не являющихся именами людей) в группе ресурсов.Classification Clusters на основе этих терминов.score of a probabilistic determination) того, что набор слов является именем человека.Name Index, только если оценка вероятности превышает определенный порог.Person Identities), соответствующих одному имени. Эта идентификация основана на том, что имя связано с различными наборами Classification Clusters, которые отличаются (distinct) от кластеров другой личности.disambiguated listing) личностей с вложенными списками ресурсов.Claim 5 (Зависимый): Уточняет выбор Classification Terms.
Classification Terms выбираются на основе их относительной уникальности (relative uniqueness) в наборе ресурсов.
Claim 7 и 9 (Зависимые): Уточняют ассоциацию имен с кластерами.
Ассоциация устанавливается, если имя находится в пределах заданной близости (predetermined proximity) от Classification Term. Чем ближе термин к имени, тем выше оценка (score) этой ассоциации.
Claim 18 и 19 (Зависимые): Определяют типы Classification Terms.
Термины включают слова из предопределенных категорий: email-адрес, URL, географическое название или должность (title).
Изобретение охватывает несколько этапов, с акцентом на предварительную обработку данных для точной идентификации сущностей.
INDEXING – Индексирование и извлечение признаков
Основная работа по подготовке данных происходит на этом этапе (офлайн):
Name Index, если достоверность превышает порог.Classification Terms. Вычисляются метрики (например, TF и NF) для оценки их уникальности и полезности.Classification Clusters. Система ассоциирует имена с кластерами (учитывая близость) и определяет различные Person Identities.RANKING – Ранжирование
Система определяет набор ресурсов, релевантных запросу. Затем Scoring Module оценивает релевантность имен, найденных в этих результатах, самому запросу (на основе частоты, близости к терминам запроса и т.д.).
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
На этом этапе формируется специализированная выдача (например, вертикаль "People Search" или блок с релевантными людьми). Система извлекает предопределенные Person Identities для высокоранжированных имен и генерирует финальный список с дисамбигуацией и вложенными ресурсами.
Входные данные:
Name Index и индекс Classification Terms.Выходные данные:
Person Identities, а не просто имена).YMYL-тематик, где авторитетность автора (E-E-A-T) имеет решающее значение, а также в академических кругах и журналистике.Person Name связано с двумя или более различными, непересекающимися Classification Clusters.Classification Terms.Процесс А: Идентификация и Дисамбигуация (Офлайн/Индексирование)
Name Index.Classification Term, ресурсом и именем, находящимся вблизи термина, с учетом расстояния (proximity).Classification Clusters на основе общих или связанных Classification Terms.Person Name анализируются связанные с ним кластеры. Если существуют группы кластеров, которые связаны между собой, но не связаны (не пересекаются) с другими группами кластеров, каждая такая группа определяется как отдельная Person Identity.Процесс Б: Обработка Запроса и Ранжирование (Онлайн)
Person Identities (из Процесса А).Система использует следующие типы данных из ресурсов:
Classification Terms. Заголовки и URL также могут влиять на оценку релевантности имени запросу.proximity) между именами и терминами.Name Index и фильтрации ложных срабатываний.Classification Term. Слишком частые термины исключаются.Person Name и Classification Term в тексте. Чем ближе термин к имени, тем выше оценка ассоциации.Classification Clusters. Используется для финального определения разных Person Identities.Classification Terms), найденных рядом с его именем.Classification Term значительно усиливается, если они находятся близко друг к другу в тексте. Это напрямую влияет на структурирование контента и биографий.Person Identities определяются, когда имя ассоциируется с разными наборами Classification Clusters, которые не пересекаются между собой. Это подчеркивает необходимость последовательного и четкого контекста для каждой личности.Person Identity.Classification Terms в непосредственной близости от имени человека. Например: "John Doe, Vice Provost at XYZ University", а не разделяйте имя и должность несколькими абзацами текста.Classification Cluster для его идентичности, укрепляя E-E-A-T. Использование микроразметки Schema.org/Person поддерживает этот процесс.Classification Terms и могут быть отфильтрованы.Person Identity или привести к ее фрагментации.proximity).Этот патент подтверждает критическую важность управления сущностями (Entity Management) для SEO и E-E-A-T. Авторитет привязан к корректно идентифицированной и дисамбигуированной личности (Person Identity). Стратегия должна фокусироваться на том, чтобы сделать процесс идентификации и классификации экспертов максимально простым для поисковой системы, предоставляя четкие, последовательные и уникальные контекстные сигналы (Classification Terms).
Сценарий: Оптимизация биографии автора с распространенным именем для E-E-A-T
Задача: Убедиться, что Google корректно идентифицирует автора "James Smith", врача-кардиолога, и не путает его с другими людьми с таким же именем.
Плохая реализация (Минимум контекста):
Автор: James Smith. Джеймс – врач и эксперт по здоровью, живет в Калифорнии.
(Проблема: Термины "врач", "эксперт по здоровью", "Калифорния" слишком общие и не пройдут порог уникальности для Classification Terms).
Оптимизированная реализация (Использование уникальных Classification Terms вблизи имени):
Автор: Dr. James A. Smith, MD.
Dr. Smith является Ведущим хирургом-кардиологом (Title/Classification Term) в Cedars-Sinai Medical Center (Organization/Unique Name) в Лос-Анджелесе. Контакт: j.a.smith.md@cedars-sinai.org (Email address/Classification Term). [Далее следует биография].
(Результат: Система с высокой вероятностью использует эти уникальные термины для формирования отдельного Classification Cluster. Близость этих терминов к имени создает сильную ассоциацию и обеспечивает корректную дисамбигуацию и атрибуцию E-E-A-T).
Что такое «Classification Term» и почему он важен для SEO?
Это уникальный контекстный идентификатор (не имя человека), который система использует для понимания контекста вокруг имени. Примеры: конкретные должности, названия организаций, email адреса. Для SEO это критически важно, так как правильные Classification Terms помогают Google однозначно идентифицировать ваших авторов и экспертов (E-E-A-T) и не путать их с другими людьми с тем же именем.
Как система определяет, какие термины использовать для классификации?
Система оценивает термины по их уникальности (низкая общая частотность в вебе – TF) и полезности (высокая частота появления рядом с именами – NF). Слишком общие термины, такие как названия крупных городов или общие должности, отфильтровываются, так как они не помогают в различении личностей. Предпочтение отдается специфичным идентификаторам.
Насколько важна близость имени к контекстным идентификаторам в тексте?
Близость (Proximity) критически важна. Патент указывает, что ассоциация между именем и Classification Term усиливается, если они находятся близко друг к другу в тексте; более близкое расположение получает более высокую оценку. Это означает, что ключевые регалии должны быть расположены непосредственно рядом с именем автора, например, в первом предложении биографии.
Что такое «Classification Cluster» и как он формируется?
Это группа документов, объединенных наличием одного или нескольких связанных Classification Terms. Например, кластер может сформироваться вокруг терминов "Chicago Bulls" и "NBA". Если имя часто встречается в документах этого кластера, система ассоциирует это имя с данным контекстом.
Как именно происходит дисамбигуация (различение людей)?
Дисамбигуация происходит, когда система обнаруживает, что одно и то же имя связано с двумя или более разными наборами Classification Clusters, которые не пересекаются между собой. Например, если "Michael Jordan" связан с кластером {Chicago Bulls, NBA} и отдельно с кластером {Berkeley, Computer Science}, система определит две разные Person Identities.
Что делать, если у моего автора очень распространенное имя?
Необходимо активно использовать уникальные Classification Terms в непосредственной близости от его имени. Используйте полные имена с инициалами, указывайте конкретные и уникальные должности, аффилиации с организациями, научные степени и профессиональные контактные данные. Чем уникальнее и консистентнее контекст, тем легче системе провести дисамбигуацию.
Как этот патент связан с E-E-A-T и Knowledge Graph?
Он напрямую связан. Чтобы оценить авторитетность автора (E-E-A-T), Google должен сначала его идентифицировать. Этот патент описывает механизм идентификации и верификации людей. Этот же процесс является фундаментальным для наполнения и уточнения данных о сущностях (людях) в Knowledge Graph.
Как система определяет, что строка текста является именем человека?
Система использует вероятностные методы (probabilistic determination). Она ищет паттерны (например, капитализация, структура имя+фамилия) и оценивает вероятность. Имя сохраняется в Name Index только в том случае, если эта вероятность превышает строгий порог, что помогает избежать ложных срабатываний и ошибок.
Помогает ли структурированная разметка (Schema) в этом процессе?
Хотя патент описывает извлечение данных из текста, использование разметки Schema.org/Person идеально дополняет этот механизм. Она позволяет явно указать Person Names и связанные с ними Classification Terms (jobTitle, worksFor) в машиночитаемом формате, что значительно упрощает процесс точной идентификации и кластеризации.
Как система ранжирует людей, если запрос не является именем (например, "лучшие игроки Lakers")?
Система сначала находит релевантные документы. Затем она извлекает имена из этих документов и оценивает их релевантность запросу. Оценка учитывает, как часто имя упоминается, насколько близко оно расположено к терминам запроса в тексте, упоминается ли в заголовках, а также общую авторитетность и релевантность самого документа.

Персонализация
Семантика и интент
SERP

Семантика и интент

Индексация
Техническое SEO

Семантика и интент
Ссылки
Knowledge Graph

Knowledge Graph
Семантика и интент
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

SERP
Семантика и интент
Поведенческие сигналы

Knowledge Graph
Семантика и интент
EEAT и качество

SERP
Семантика и интент
EEAT и качество

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP
