Как Google использует авторитетные ресурсы для идентификации главной сущности запроса и показа связанных сущностей в выдаче

Google анализирует результаты поиска на предмет наличия «авторитетных ресурсов» (например, официальных сайтов или страниц Википедии), чтобы определить главную сущность, которой посвящен запрос. Если сущность точно идентифицирована, система извлекает связанные сущности (например, книги автора или фильмы актера) и отображает их в выдаче. Порядок отображения определяется поведением пользователей и частотой совместного упоминания в вебе.

Описание

Какую задачу решает

Патент решает задачу прогнозирования и удовлетворения последующих информационных потребностей пользователя после ввода запроса, направленного на конкретную сущность. Система стремится предсказать следующий шаг пользователя (например, поиск книг после поиска автора) и предоставить эту информацию проактивно, тем самым устраняя необходимость в дополнительных запросах и улучшая пользовательский опыт.

Что запатентовано

Запатентована система для определения того, направлен ли запрос на главную сущность (Principal Entity), и для включения связанных сущностей (Related Entities) в результаты поиска. Ключевым механизмом является анализ состава поисковой выдачи: если в топе присутствует достаточное количество заранее определенных Authoritative Resources (авторитетных ресурсов) для конкретной сущности, система подтверждает фокус запроса и активирует показ связанных сущностей.

Как это работает

Система функционирует с использованием двух ключевых индексов, создаваемых офлайн:

Authoritative Resources Index: Связывает сущности с их авторитетными ресурсами (например, официальный сайт).
Related Entities Index: Связывает главные сущности со связанными и определяет их порядок.

В реальном времени процесс выглядит так:

Система генерирует стандартные результаты поиска.
Анализируется топ выдачи на предмет наличия Authoritative Resources.
Если количество таких ресурсов для определенной сущности превышает порог, запрос классифицируется как направленный на эту Principal Entity.
Система извлекает упорядоченный список Related Entities из индекса.
Информация о связанных сущностях (например, в виде карусели) добавляется в поисковую выдачу.

Актуальность для SEO

Высокая. Описанный механизм является фундаментальным для современного поиска, ориентированного на сущности (Entity-based Search). Этот патент описывает технологию, лежащую в основе отображения каруселей сущностей (книги, фильмы, актеры), Панелей Знаний и блоков «Люди также ищут». Это ключевой компонент интеграции Knowledge Graph в веб-поиск.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO-стратегии. Он детально раскрывает механизмы идентификации сущностей и ранжирования связей между ними. Понимание концепции Authoritative Resource жизненно важно для управления видимостью бренда или персоны. Патент подчеркивает важность оптимизации под Граф Знаний и использования поведенческих данных для определения силы связей между сущностями.

Детальный разбор

Термины и определения

Authoritative Resource (Авторитетный ресурс): Ресурс (URL), который система заранее определила как сильный индикатор (strong indicator) того, что запрос направлен на конкретную сущность. Например, официальный сайт или страница в Википедии.
Authoritative Resources Index (Индекс авторитетных ресурсов): Индекс, который сопоставляет сущности с их Authoritative Resources. Используется для определения главной сущности запроса.
Principal Entity / First Entity (Главная сущность): Сущность, на которую, по определению системы, направлен исходный поисковый запрос.
Related Entity / Second Entity (Связанная сущность): Сущность, имеющая предопределенное отношение (Predetermined Relationship) к Главной сущности (например, книга, написанная автором).
Related Entity Index (Индекс связанных сущностей): Индекс, который сопоставляет главные сущности с упорядоченным списком связанных сущностей и определяет тип их отношений.
Entity Type (Тип сущности): Классификация сущности (например, «автор», «книга», «фильм»).
Co-occurrence (Совместное упоминание): Частота, с которой имена или ссылки на две сущности встречаются вместе в проиндексированных ресурсах.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс идентификации сущности на основе результатов поиска.

Система поддерживает Authoritative Resources Index.
Получается запрос и результаты поиска.
Определяется, что запрос относится к первой сущности, если количество результатов поиска, идентифицирующих ресурсы из Authoritative Resources Index для этой сущности, превышает первый порог (Threshold 1).
В ответ система передает информацию о связанных сущностях, имеющих предопределенное отношение к первой сущности.

Claim 5 и 6 (Зависимые): Описывают механизмы упорядочивания (ранжирования) связанных сущностей.

Claim 5 (Поведение): Упорядочивание основывается на данных о том, как часто пользователи ищут связанную сущность после отправки запроса, направленного на первую сущность (анализ последующих запросов).
Claim 6 (Контент): Упорядочивание основывается на том, как часто имя или ссылка на связанную сущность совместно встречается (co-occurs) с именем или ссылкой на первую сущность в проиндексированных ресурсах.

Claim 9 (Зависимый): Уточняет критерии определения главной сущности, делая их более строгими.

Идентификация главной сущности требует выполнения двух условий: превышение Threshold 1 (авторитетные ресурсы) И превышение второго порога (Threshold 2) — количества результатов поиска, содержащих ссылку/упоминание (reference) на первую сущность.

Claim 13 (Зависимый): Вводит механизм контекстной валидации.

Информация о связанных сущностях (второго типа) передается, только если количество результатов поиска, для которых этот второй тип сущности является релевантным, превышает третий порог (Threshold 3). Например, блок «Книги» покажется, только если в выдаче достаточно ресурсов, релевантных типу «Книга».

Claim 14 (Зависимый): Описывает исключения.

Система передает информацию, только если запрос классифицирован как НЕ являющийся: порнографическим, строго навигационным, локальным запросом или запросом, ищущим конкретный факт.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные офлайн, для модификации выдачи в реальном времени.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная офлайн-подготовка (FIG. 5 патента):

Идентификация сущностей, их типов и отношений (формирование Related Entity Index).
Идентификация Authoritative Resources для каждой сущности и создание Authoritative Resources Index.
Расчет частоты совместного упоминания (co-occurrence) сущностей.
Определение релевантных типов сущностей для проиндексированных ресурсов.

QUNDERSTANDING – Понимание Запросов
Офлайн на этом этапе (или в рамках Индексирования) анализируются логи запросов для определения паттернов поведения пользователей (частота последующих запросов), что используется для упорядочивания связанных сущностей.

RANKING – Ранжирование
Генерируется стандартный набор результатов поиска.

METASEARCH – Метапоиск и Смешивание
Основное применение патента в реальном времени (FIG. 3 и 4). Система анализирует результаты этапа RANKING:

Идентификация сущности: Проверяется наличие Authoritative Resources и упоминаний в топе выдачи.
Валидация: Проверяется выполнение всех порогов (T1, T2, T3) и отсутствие исключений.
Обогащение выдачи: Если условия выполнены, система извлекает упорядоченный список Related Entities и формирует специальный блок (например, карусель) для включения в SERP.

На что влияет

Специфические запросы: Влияет на информационные и исследовательские запросы, направленные на известные сущности (персоны, бренды, продукты, произведения). Явно исключает локальные, строго навигационные и фактоидные запросы.
Конкретные ниши: Особенно актуально для медиа (фильмы, книги, музыка), публичных персон и крупных брендов, где существует множество четко определенных связей между сущностями.

Когда применяется

Алгоритм активируется только при выполнении строгой комбинации условий для обеспечения точности:

Триггер 1 (Авторитетность): Превышен Порог 1 по количеству Authoritative Resources в топе выдачи.
Триггер 2 (Упоминания): Превышен Порог 2 по количеству ресурсов в топе, содержащих упоминания (references) этой сущности.
Триггер 3 (Контекст): Превышен Порог 3 по количеству ресурсов в топе, релевантных типу связанных сущностей, которые планируется показать.
Исключения: Запрос не попадает в список исключенных категорий (Claim 14).

Пошаговый алгоритм

Процесс А: Офлайн-генерация индексов (FIG. 5)

Сбор данных о сущностях: Получение данных о сущности и ее типе из структурированных источников (например, Freebase).
Идентификация Авторитетных Ресурсов: Определение ресурсов, которые являются авторитетными для сущности (официальные сайты, энциклопедии).
Создание Индекса Авторитетности: Сохранение связи в Authoritative Resources Index.
Идентификация Связанных Сущностей: Определение сущностей, имеющих предопределенное отношение к данной.
Упорядочивание Связанных Сущностей: Сортировка на основе:
1. Частоты совместного упоминания (co-occurrence) в веб-документах.
2. Частоты последующих запросов пользователей (анализ логов).
Создание Индекса Связей: Сохранение упорядоченного списка в Related Entity Index.

Процесс Б: Обработка запроса в реальном времени (FIG. 3 и 4)

Получение запроса и результатов: Генерация первичного SERP.
Проверка исключений: Проверка классификации запроса (Claim 14). Если исключение, процесс останавливается.
Анализ Авторитетности (FIG. 4): Проверка топовых результатов по Authoritative Resources Index.
Проверка Порога 1: Достаточно ли Authoritative Resources для конкретной сущности? Если нет, процесс останавливается.
Анализ Упоминаний (FIG. 4): Проверка, содержат ли топовые результаты упоминания (references) этой сущности (Claim 9).
Проверка Порога 2: Достаточно ли ресурсов содержат упоминания? Если нет, процесс останавливается.
Классификация Запроса: Запрос классифицируется как направленный на Principal Entity.
Извлечение Связанных Сущностей (FIG. 3): Извлечение списка Related Entities и их типа из индекса.
Контекстная Валидация (FIG. 3): Проверка, соответствует ли тип связанных сущностей релевантным типам сущностей ресурсов в выдаче (Claim 13).
Проверка Порога 3: Достаточно ли ресурсов имеют соответствующий тип? Если нет, процесс останавливается.
Передача результатов: Информация о связанных сущностях (включая имена и изображения) передается для отображения в SERP.

Какие данные и как использует

Данные на входе

Структурные данные (Базы знаний): Внешние базы знаний (упоминается Freebase) используются офлайн для построения индексов сущностей, их типов, связей и идентификации авторитетных ресурсов.
Технические факторы (URL): URL-адреса используются как идентификаторы в Authoritative Resources Index и для анализа состава SERP.
Контентные факторы (Текст): Текст ресурсов в выдаче используется для подсчета упоминаний (references) главной сущности (Порог 2). Текст всего веб-индекса используется офлайн для расчета частоты совместного упоминания (co-occurrence).
Поведенческие факторы (Логи запросов): Журналы поисковых сессий используются офлайн для анализа последующих запросов (subsequent queries) и определения порядка (ранжирования) связанных сущностей.

Какие метрики используются и как они считаются

Threshold 1 (Порог Авторитетности): Минимальное количество/доля Authoritative Resources в топе SERP.
Threshold 2 (Порог Упоминаний): Минимальное количество/доля ресурсов в SERP, содержащих упоминания сущности.
Threshold 3 (Порог Контекста): Минимальное количество ресурсов в SERP, релевантных типу связанных сущностей.
Co-occurrence Frequency (Частота совместного упоминания): Метрика, рассчитываемая офлайн на основе анализа корпуса документов. Используется для упорядочивания.
Subsequent Search Frequency (Частота последующих запросов): Поведенческая метрика, рассчитываемая офлайн на основе логов поиска. Используется для упорядочивания.

Выводы

Идентификация сущности зависит от состава SERP: Ключевой вывод — Google определяет главную тему запроса, анализируя, какие ресурсы ранжируются в топе, а не только сам текст запроса.
Критическая роль Авторитетных Ресурсов: Наличие Authoritative Resources (официальный сайт, Википедия и т.д.) в выдаче является основным триггером для уверенной идентификации сущности и активации показа связанных объектов.
Поведение пользователей определяет силу связей: Google напрямую использует данные о поисковых сессиях (что пользователи ищут дальше) для ранжирования связанных сущностей. Связи, которые чаще исследуются пользователями последовательно, считаются более важными.
Важность совместного упоминания (Co-occurrence): Частота совместного упоминания сущностей в веб-документах также используется для ранжирования связей, подчеркивая важность семантических связей в контенте.
Многоуровневая валидация и точность: Система использует несколько строгих порогов (авторитетность, упоминания, контекст SERP) и список исключений, чтобы минимизировать ложные срабатывания и гарантировать релевантность показанных данных.

Практика

Best practices (это мы делаем)

Стать Авторитетным Ресурсом (Authoritative Resource): Ключевая стратегическая задача — добиться того, чтобы официальный сайт был признан Google как Authoritative Resource для вашей сущности (бренда, персоны, продукта). Это достигается консолидацией сигналов: использование Schema.org (Organization, Person, sameAs), обеспечение ссылок с других авторитетных источников (Википедия, отраслевые каталоги) и поддержание согласованности данных (NAP).
Оптимизация под Граф Знаний (Entity Optimization): Активно работайте над представлением сущности в Knowledge Graph. Чем полнее данные о сущности и ее связях, тем точнее Google сможет построить Related Entities Index.
Явное определение отношений с помощью разметки: Используйте соответствующие типы Schema.org для определения отношений между сущностями (например, author, founder, brand, manufacturer).
Анализ и оптимизация под User Journey (Последующие запросы): Изучайте, что пользователи ищут после вашей главной сущности. Создавайте контент, охватывающий эти связанные сущности. Это позволяет синхронизировать вашу стратегию с поведенческими паттернами, которые Google использует для ранжирования связей (Claim 5).
Стимулирование ко-оккурентности (Co-occurrence): Работайте над тем, чтобы ваша главная сущность упоминалась в контексте важных связанных сущностей в качественных сторонних ресурсах (PR, контент-маркетинг). Это влияет на ранжирование связанных сущностей (Claim 6).

Worst practices (это делать не надо)

Размытие идентичности и Авторитетности: Создание множества неофициальных или противоречивых ресурсов о сущности может помешать Google определить единый Authoritative Resource, что снизит шансы на корректную идентификацию сущности.
Игнорирование структурированных данных для связей: Полагаться только на неструктурированный текст для определения отношений. Без явных сигналов система может не установить или неверно интерпретировать связи между сущностями.
Манипуляции совместной встречаемостью: Попытки искусственно завысить частоту совместного упоминания на низкокачественных сайтах. Система, вероятно, учитывает авторитетность источников и использует поведенческие данные для валидации порядка.

Стратегическое значение

Патент подтверждает стратегический переход Google к поиску, основанному на сущностях (Things, not strings). Успех в SEO требует не только оптимизации под ключевые слова, но и построения авторитета в рамках Knowledge Graph. Управление Authoritative Resources становится центральной задачей, так как именно они служат анкорем, связывающим веб-индекс и Граф Знаний, и активируют расширенные функции SERP.

Практические примеры

Сценарий: Оптимизация видимости продуктов компании в SERP

Цель: Добиться того, чтобы при поиске компании (Главная Сущность) в выдаче появлялась карусель с ее ключевыми продуктами (Связанные Сущности).

Усиление Авторитетного Ресурса Компании: Убедиться, что официальный сайт компании признан Google (отображается в Панели Знаний) и стабильно ранжируется в топе по брендовым запросам. Использовать Schema Organization и ссылки из Википедии/Wikidata. (Преодоление Порога 1).
Обеспечение Упоминаний: Убедиться, что большинство сайтов в топе (обзоры, новости) упоминают название компании. (Преодоление Порога 2).
Установление Связей и Типов: Создать целевые страницы для продуктов (с разметкой Product). Убедиться, что контент в выдаче релевантен типу «Продукт». (Преодоление Порога 3 и наполнение Related Entities Index).
Оптимизация Порядка: Для повышения приоритета флагманского продукта убедиться, что он часто упоминается вместе с названием компании в авторитетных обзорах (ко-оккурентность). Проанализировать пути пользователей, чтобы понять, какие продукты они ищут чаще после поиска бренда (поведение).
Ожидаемый результат: При запросе названия компании Google идентифицирует ее как Principal Entity (благодаря выполнению условий порогов) и отобразит карусель продуктов, упорядоченную по их значимости.

Вопросы и ответы

Что такое «Authoritative Resource» (Авторитетный ресурс) и как им стать?

Authoritative Resource — это ресурс (URL), который Google предварительно определил как надежный индикатор для конкретной сущности (например, официальный сайт или страница в Википедии). Его наличие в топе выдачи помогает системе подтвердить, о какой сущности идет речь в запросе. Чтобы стать таким ресурсом, необходимо обеспечить максимальную достоверность информации, использовать структурированные данные (sameAs) и добиться признания в экосистеме через ссылки с других авторитетных сайтов.

Как Google определяет порядок связанных сущностей (например, в карусели)?

Патент описывает два основных метода, используемых офлайн. Первый (Claim 5) основан на поведении пользователей: как часто ищут связанную сущность сразу после поиска главной сущности (анализ поисковых сессий). Второй (Claim 6) основан на контенте: как часто обе сущности совместно упоминаются (co-occurrence) в документах веб-индекса. Google комбинирует эти сигналы для определения порядка.

Могу ли я повлиять на то, какие сайты считаются авторитетными для моего бренда?

Да. Необходимо обеспечить максимальную согласованность данных о вашем бренде (NAP) и использовать структурированные данные на официальном сайте, чтобы явно указать на его связь с сущностью вашего бренда в Knowledge Graph. Укрепление сигналов E-E-A-T также помогает сайту быть признанным в качестве Authoritative Resource.

Что такое Порог 3 (контекстная валидация, Claim 13) и зачем он нужен?

Это дополнительная проверка, гарантирующая уместность показа связанных сущностей в контексте текущей выдачи. Система проверяет, содержит ли SERP достаточное количество ресурсов, релевантных типу связанных сущностей. Например, если пользователь ищет «Джордж Оруэлл биография», и выдача сфокусирована на его жизни, система может решить, что показ карусели его романов (тип «Книга») менее уместен, чем если бы запрос был просто «Джордж Оруэлл».

Почему блок связанных сущностей не показывается для локальных или навигационных запросов?

Система специально исключает эти типы запросов (Claim 14), так как интент пользователя в них очень специфичен: найти конкретный сайт (навигационный) или объект поблизости (локальный). В этих сценариях показ дополнительной исследовательской информации о связанных сущностях считается нерелевантным и отвлекающим.

Как этот патент связан с Knowledge Graph и Панелями Знаний?

Этот патент описывает базовые механизмы, используемые для отображения данных Knowledge Graph в поиске. Related Entities Index фактически является частью Knowledge Graph. Описанный процесс идентификации главной сущности и выбора связанных сущностей — это именно то, что происходит при формировании Панели Знаний и каруселей сущностей.

Что, если у сущности несколько типов (например, актер и музыкант)?

Патент предусматривает это. Система может создать отдельные записи в индексе для каждого типа и связать с ними разные Authoritative Resources и Related Entities (фильмы или альбомы). В зависимости от того, какие авторитетные ресурсы и типы контента доминируют в SERP по конкретному запросу, система выберет соответствующий тип и покажет релевантные связанные сущности.

Использует ли этот механизм данные о поведении пользователей для ранжирования веб-результатов?

Нет, для ранжирования «синих ссылок» он не используется. Поведенческие данные (анализ логов поисковых сессий) используются исключительно в офлайн-процессе для определения порядка связанных сущностей (например, порядка книг в карусели). Это определяет силу связи между сущностями, а не рейтинг веб-страниц.

Как SEO-специалисту использовать знания о Co-occurrence на практике?

Необходимо создавать качественный контент, который естественно и часто упоминает связанные сущности вместе. Например, на странице компании должны быть упомянуты ее ключевые продукты и основатели. Укрепление этих текстовых связей на вашем сайте и стимулирование их упоминания в авторитетных сторонних ресурсах (PR, обзоры) поможет Google усилить эти отношения и повысить ранжирование связанной сущности.

Где Google берет исходные данные для построения этих индексов?

Патент упоминает использование онлайн-баз структурированных данных (в качестве примера приводится FREEBASE), онлайн-энциклопедий и специализированных веб-сайтов. На практике это означает использование данных из Knowledge Graph, которые агрегируются из Википедии/Викиданных, структурированных данных (Schema.org) с сайтов и анализа неструктурированного текста в вебе.