
Google использует систему для устранения неоднозначности имен людей. Анализируя исторические данные о том, какие запросы (как включающие имя, так и нет) приводили пользователей на одни и те же ресурсы, система кластеризует различные контексты имени (например, разные люди с одним именем). Для каждого контекста выбирается лучший уточняющий термин, который затем предлагается пользователю в качестве поисковой подсказки.
Патент решает проблему неоднозначности (ambiguity) имен людей в поисковых запросах. Поскольку одно имя может относиться к разным людям (например, "Джон Смит" может быть исследователем, ботаником или спортсменом), стандартная выдача часто содержит смешанные результаты. Это затрудняет поиск, так как пользователи не всегда знают, как эффективно уточнить запрос. Изобретение автоматизирует выявление различных контекстов имени и предлагает пользователю релевантные уточнения (Query Suggestions).
Запатентована система для автоматического устранения неоднозначности имен путем генерации контекстуализированных поисковых подсказок. Система анализирует исторические логи запросов (Historical Data), чтобы определить, какие термины ассоциируются с различными контекстами имени. Эти контекстные термины (Context Terms) кластеризуются для выявления отдельных сущностей или различных аспектов (disjoint aspects) жизни одной сущности. Для каждого кластера выбирается репрезентативный термин (Representative Term), используемый для создания подсказок.
Ключевой механизм основан на анализе связи между ресурсами и историей запросов:
First Queries), так и из запросов, НЕ содержащих имя (Second Queries).Cosine Similarity). Каждый кластер представляет отдельный контекст.Authority Score), уникальность термина (IDF) и частоту использования в запросах). Лучший термин выбирается как представитель контекста.Высокая. Устранение неоднозначности сущностей (Entity Disambiguation) является фундаментальной задачей современного поиска и критически важно для работы Knowledge Graph. Описанный механизм, использующий поведение пользователей для определения контекста, активно применяется в Google Autocomplete и блоках уточнения запросов (Query Refinements) для навигации по сложным интентам.
Патент имеет высокое значение (85/100) для SEO-стратегии, особенно для Entity SEO и управления репутацией (ORM). Он раскрывает механизм того, как Google определяет основные контексты сущности, полагаясь в значительной степени на исторические данные поиска, а не только на контент. Понимание критической роли Second Queries (запросов без имени) подтверждает важность построения Topical Authority для правильной ассоциации сущности с её контекстом.
Context Terms, сгенерированный для конкретного ресурса, связанного с именем.Context Term List. Элементы вектора соответствуют терминам, а их значения — весам (например, Relevance Score). Используется для кластеризации.first relevance threshold).second relevance threshold).Cosine Similarity).Claim 1 (Независимый пункт): Описывает основной метод генерации контекстных подсказок для имени.
Context Term Lists для имени. Генерация включает строго определенный процесс для каждого связанного ресурса: First Queries (содержат имя, ресурс релевантен).Second Queries (НЕ содержат имя, ресурс релевантен).Context Term List из объединенных терминов.Representative Term для каждого кластера.Query Suggestions, комбинируя имя с репрезентативными терминами.Ядро изобретения — это использование как запросов, включающих имя, так и запросов, не включающих его, но ведущих на те же ресурсы, для определения контекста сущности.
Claim 3 (Зависимый от 1): Уточняет реализацию списков и кластеризации.
Списки представлены как Context Term Vector of Weights (веса — это Relevance Scores). Кластеризация включает расчет Similarity Scores. Пары векторов, чья схожесть превышает Similarity Threshold, объединяются.
Claim 4 (Зависимый от 3): Уточняет, что объединение векторов происходит путем их суммирования.
Claim 5 (Зависимый от 3): Указывает, что Similarity Threshold может снижаться после одной или нескольких итераций кластеризации. Это позволяет формировать более крупные кластеры вокруг доминирующих интерпретаций.
Claim 7 (Зависимый от 4): Описывает выбор Representative Term как процесс ранжирования терминов внутри кластера и выбора лучшего.
Claims 8-11 (Зависимые от 7): Детализируют критерии ранжирования терминов для выбора Representative Term:
Relevance Scores термина внутри кластера.IDF (Inverse Document Frequency). Общие термины менее полезны для уточнения.Authority Score ресурсов-источников термина.Изобретение требует значительной офлайн-обработки данных и применяется в реальном времени на этапе понимания запросов.
INDEXING & DATA ACQUISITION – Индексирование и Сбор данных
Система использует Resource Index и рассчитывает метрики авторитетности (Authority Score) ресурсов. Критически важным компонентом являются Historical Data (логи запросов), которые служат основным источником для анализа.
QUNDERSTANDING – Понимание Запросов (Офлайн-процессинг)
Основная часть работы алгоритма. Name Processing Subsystem выполняет анализ логов, генерацию Context Term Lists, их кластеризацию и выбор Representative Terms. Результаты сохраняются в базе данных Name Context Data. Это формирует глубокое понимание контекстов сущностей.
QUNDERSTANDING – Понимание Запросов (Онлайн)
В реальном времени система определяет, является ли входящий запрос именем человека и является ли он неоднозначным (т.е. не хватает ли контекста для однозначной интерпретации).
METASEARCH / RERANKING (Генерация SERP Features)
Если запрос признан неоднозначным, система извлекает сохраненные Representative Terms и генерирует Query Suggestions для отображения пользователю (например, в Autocomplete или блоках уточнений на SERP).
Входные данные:
Historical Data).Resource Index).Authority Scores).Выходные данные:
Name Context Data (кластеры и репрезентативные термины).Query Suggestions (в реальном времени).minimum authority metric) и качеству (minimum quality metric) ресурсов.Алгоритм состоит из офлайн-генерации контекстов и онлайн-генерации подсказок.
Фаза А: Офлайн-генерация контекстов и репрезентативных терминов
А1. Генерация списков контекстных терминов (для каждого имени)
Historical Data).First Queries извлекаются сопутствующие термины.Second Queries извлекаются термины.Context Term List. Список преобразуется в Context Term Vector of Weights (веса = Relevance Scores).А2. Кластеризация
Similarity Scores между векторами. Используется, например, косинусное сходство.Similarity Threshold, объединяются (суммируются).А3. Выбор репрезентативных терминов
Relevance Scores.IDF (общие термины понижаются) (Claim 9).Authority Score источников (Claim 10).Representative Term.Name Context Data.Фаза Б: Онлайн-генерация поисковых подсказок
Representative Terms и формируются Query Suggestions ([Имя + Термин]).Historical Data (логи запросов). Это основной источник данных. Анализируется, какие запросы (First и Second Queries) ведут на какие ресурсы, и какие термины совместно встречаются с именем в запросах (Claim 11).First и Second Queries (минимальный ранг или оценка релевантности ресурса по запросу).Representative Term (Claim 9).Historical Data) для понимания контекста сущностей. То, как пользователи ищут информацию, напрямую формирует кластеры ассоциаций вокруг имени.Topical Authority: ресурс должен быть релевантен теме в целом, а не только при прямом поиске по имени сущности.IDF), исходят из авторитетных источников (бустинг по Authority Score) и подтверждены поведением пользователей (бустинг за совместное использование в запросах).Authority Score имеют большее влияние на то, какие именно термины будут выбраны для описания контекста сущности в подсказках.Authority Score ваших ресурсов. Термины с авторитетных сайтов имеют преимущество при выборе Representative Term (Claim 10).IDF (Claim 9), используйте четкие, специфичные термины для описания деятельности сущности. Это повышает их шансы стать репрезентативными.First Queries) и не отвечающие на тематические запросы без имени (Second Queries), будут слабее участвовать в формировании контекстных кластеров.Патент подтверждает стратегический переход от оптимизации под ключевые слова к оптимизации под сущности (Entity-Based SEO) и контексты. Он демонстрирует, как Google использует данные о поведении пользователей для построения семантических связей и понимания мира. Долгосрочная SEO-стратегия должна фокусироваться на управлении тем, как поисковая система интерпретирует сущность, что достигается через построение Topical Authority и управление поисковым спросом.
Сценарий: Разделение контекстов для эксперта с распространенным именем
Мы продвигаем эксперта "Алекс Смит", специалиста по кибербезопасности. Существует также известный спортсмен Алекс Смит.
Цель: Сформировать четкий кластер для нашего эксперта и добиться появления подсказки "Алекс Смит кибербезопасность".
Representative Term, вытесняя или дополняя подсказки о спортсмене.Как Google определяет контекстные термины (Context Terms)? Это анализ контента страницы?
Основной механизм, описанный в патенте (Claim 1), базируется не на анализе контента, а на анализе исторических логов запросов (Historical Data). Контекстные термины — это слова, которые пользователи использовали в запросах (как с именем, так и без него), которые привели их на определенный ресурс. Контент страницы важен для обеспечения релевантности этим запросам, но сами термины берутся из поведения пользователей.
Что такое "First Queries" и "Second Queries" и почему они критически важны?
First Queries включают имя (например, "Джон Смит исследователь"). Second Queries — запросы без имени (например, "основатель Джеймстауна"), ведущие на тот же ресурс. Они критически важны, так как позволяют установить прочную семантическую связь между именем и контекстом. Использование Second Queries подтверждает Topical Authority ресурса по теме, а не только по имени.
Как авторитетность сайта (Authority Score) влияет на поисковые подсказки?
Авторитетность влияет напрямую (Claim 10). При выборе Representative Term для подсказки система повышает вес терминов, исходящих из авторитетных источников. Это означает, что информация на трастовых сайтах сильнее влияет на то, какие ассоциации Google будет предлагать пользователям для данной сущности.
Как система выбирает лучший термин для подсказки из множества вариантов?
Используется многофакторное ранжирование внутри кластера. Система предпочитает термины с высокой релевантностью, которые часто используются пользователями в запросах с именем (Claim 11) и исходят из авторитетных источников (Claim 10). При этом слишком общие термины пессимизируются с помощью IDF (Claim 9).
Как SEO-специалист может повлиять на то, какие подсказки покажет Google для имени или бренда?
Необходимо работать над укреплением желаемых контекстных кластеров. Это достигается созданием авторитетного контента, который отвечает как на First Queries, так и на Second Queries, связанные с нужным контекстом. Также важно стимулировать естественный поисковый спрос по желаемым фразам (например, через PR), так как это сильный сигнал для системы (Claim 11).
Как система разделяет информацию о разных людях с одинаковым именем?
Это достигается за счет кластеризации (Clustering). Система собирает списки контекстных терминов из разных ресурсов и группирует их на основе схожести. Ресурсы об исследователе будут иметь схожие термины (например, "экспедиция", "карта"), формируя один кластер, а ресурсы о ботанике — другие (например, "Кью Гарденс", "растения"), формируя второй кластер.
Как быстро обновляются эти контексты и подсказки?
Основная работа по анализу логов, кластеризации и выбору терминов происходит офлайн. Это означает, что изменения в поведении пользователей или появление нового контента отразятся на подсказках не мгновенно, а после очередного цикла пересчета и обновления базы данных Name Context Data.
Что такое нормализация контекстных терминов?
Нормализация (упомянутая в описании и Claim 6) — это процесс приведения похожих терминов к единой форме (например, синонимы, стемминг: "фотограф", "фотография" -> "фотограф"). Это делается перед кластеризацией для повышения её эффективности, позволяя системе понять, что разные формулировки относятся к одному контексту.
Как этот патент связан с Topical Authority?
Он напрямую подтверждает важность Topical Authority. Механизм Second Queries требует, чтобы ресурс был авторитетным источником по теме в целом. Чтобы ваш контент хорошо работал в этой системе, он должен покрывать тему настолько глубоко, чтобы отвечать на запросы, связанные с контекстом, даже без упоминания основного имени сущности.
Может ли система разделять разные аспекты жизни одного и того же человека?
Да. Патент указывает, что разные контексты могут относиться не только к разным людям, но и к разрозненным аспектам (disjoint aspects) жизни одного человека. Например, для актера могут быть сформированы отдельные кластеры, связанные с его кинокарьерой и его политической активностью, если эти аспекты достаточно различны в логах запросов.

Персонализация
Семантика и интент
SERP

Семантика и интент
Индексация
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Индексация
Поведенческие сигналы

Ссылки
Антиспам
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Knowledge Graph
Поведенческие сигналы
Персонализация

SERP
Поведенческие сигналы
Персонализация

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Ссылки
SERP

Ссылки
SERP
Техническое SEO

Ссылки
Поведенческие сигналы
EEAT и качество

Персонализация
Поведенческие сигналы
SERP
