Google использует систему для определения того, какие сущности (люди, места, объекты) подразумеваются в поисковом запросе. Система анализирует, насколько релевантны топовые документы запросу и насколько центральное место в этих документах занимает конкретная сущность. На основе этого рассчитывается оценка Entity Score, которая определяет ранжирование сущностей для запроса. Этот механизм используется для показа блоков знаний, организации поисковой выдачи и предоставления уточняющих поисковых подсказок.
Описание
Какую задачу решает
Патент решает проблему неоднозначности поисковых запросов, когда один и тот же термин может относиться к разным сущностям (например, «sting» может означать музыканта или рестлера). Цель изобретения — точно определить, какие сущности связаны с запросом, ранжировать эти сущности по релевантности и использовать эту информацию для улучшения пользовательского опыта через уточняющие подсказки и предоставление прямых сведений о сущностях в выдаче.
Что запатентовано
Запатентована система для создания и использования ассоциаций (mapping) между поисковыми запросами и сущностями. Система рассчитывает Entity Score для определения силы связи между запросом и сущностью. Эта оценка используется двумя основными способами: для генерации поисковых подсказок (Query Suggestions) с дескрипторами сущностей для устранения неоднозначности и для предоставления сводок о сущностях (Entity Summaries) непосредственно в результатах поиска.
Как это работает
Система работает в двух режимах: офлайн (создание ассоциаций) и онлайн (применение).
- Офлайн: Система анализирует запрос и его топовые результаты. Она определяет, какие сущности упоминаются в этих документах. Затем рассчитывается Entity Score, который учитывает как релевантность документа запросу (Query to Document Relevance Score), так и важность сущности внутри документа (Entity to Document Relevance Score). Сущности, удовлетворяющие критериям интерпретации и имеющие высокий Entity Score, сохраняются в базе данных ассоциаций (Query to Entity Association Database).
- Онлайн: При получении запроса система обращается к этой базе данных. Она может генерировать Query Suggestions с уточняющими дескрипторами (например, «sting музыкант») или отображать Entity Summaries (например, блок знаний) для наиболее релевантных сущностей.
Актуальность для SEO
Критически высокая. Этот патент описывает фундаментальные механизмы, лежащие в основе семантического поиска Google, Knowledge Graph, Knowledge Panels и систем понимания запросов. Связывание запросов с сущностями является центральным элементом современной поисковой архитектуры и стратегии Google по переходу от «строк к вещам» (strings to things).
Важность для SEO
Патент имеет критическое значение (95/100) для SEO. Он описывает механизм, с помощью которого Google определяет доминирующий интент запроса через призму сущностей. Понимание того, как рассчитывается Entity Score, напрямую влияет на стратегии оптимизации контента. Чтобы добиться высокой видимости, необходимо не только ранжироваться по запросу, но и гарантировать, что целевая сущность является центральной темой документа (высокий Entity to Document Relevance Score).
Детальный разбор
Термины и определения
- Document and Entity Association Database
- База данных, хранящая информацию о том, какие сущности связаны с конкретным документом, и, возможно, оценки их важности (Entity to Document Relevance Score).
- Entity (Сущность)
- Тема дискурса; человек, место, концепция или объект, который можно идентифицировать и отличить от других. Каждая сущность имеет уникальный идентификатор.
- Entity Descriptor (Дескриптор сущности)
- Информация, добавляемая к поисковой подсказке для устранения неоднозначности. Основана на свойствах сущности (например, тип, доверенное имя, изображение).
- Entity Properties Database
- База структурированных данных (например, Knowledge Graph), содержащая узлы для сущностей, их свойства (алиасы, даты, типы) и связи между ними.
- Entity Score (Оценка сущности)
- Метрика, определяющая силу связи между запросом и конкретной сущностью. Рассчитывается на основе Query to Document Relevance Score и Entity to Document Relevance Score.
- Entity Summary (Сводка о сущности)
- Блок информации о сущности, отображаемый в результатах поиска (аналог Knowledge Panel). Содержит свойства сущности.
- Entity to Document Relevance Score
- Оценка, показывающая, насколько важна данная сущность в контексте конкретного документа. Учитывает частоту, расположение и форматирование упоминаний сущности и ее свойств.
- Query Suggestion (Поисковая подсказка)
- Предлагаемый вариант запроса, предоставляемый пользователю (например, в автозаполнении или блоке связанных запросов).
- Query to Document Relevance Score
- Стандартная оценка информационного поиска (IR score), показывающая, насколько документ релевантен запросу.
- Query to Entity Association Database
- База данных, содержащая соответствия (mapping) между запросами и связанными с ними сущностями, а также их Entity Scores.
- Trusted Alias (Доверенный алиас)
- Надежное текстовое имя или псевдоним сущности.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает процесс предоставления уточняющих поисковых подсказок на основе сущностей.
- Система получает запрос.
- Идентифицируются сущности, связанные с запросом, на основе заранее созданного соответствия (query to entity mapping).
- В ответ на ввод запроса пользователем предоставляются поисковые подсказки. Каждая подсказка включает Entity Descriptor, основанный на одной из сущностей.
- Для каждой подсказки система определяет фактический поисковый запрос, который будет отправлен при ее выборе. Ключевой момент: Entity Descriptor (показываемый пользователю) может содержать термины, которые НЕ включены в фактический поисковый запрос (исполняемый системой).
- Система получает выбор пользователя.
- Система отправляет определенный на шаге 4 фактический поисковый запрос.
Это означает, что система использует дескриптор для помощи пользователю в выборе интента, но для поиска может использовать более точную или переформулированную версию запроса, связанную с выбранной сущностью, не обязательно включающую текст дескриптора.
Claim 2 (Зависимый): Уточняет ранжирование подсказок.
- Определяется ранжирование сущностей для данного запроса.
- Поисковые подсказки ранжируются на основе ранга соответствующих им сущностей.
Claim 3 (Зависимый от 2): Определяет основу ранжирования сущностей (Entity Score).
Ранжирование сущности для запроса основано на двух факторах:
- Отношении между запросом и релевантными документами, связанными с сущностью (Query to Document Relevance).
- Отношении между сущностью и этими документами (Entity to Document Relevance).
Claim 4-7 (Зависимые): Детализируют Entity Descriptor.
Дескриптор включает свойства сущности, такие как тип сущности (Claim 5), доверенное имя (Claim 6) или изображение (Claim 7).
Где и как применяется
Изобретение охватывает несколько ключевых этапов поисковой архитектуры, являясь центральным элементом понимания запросов и формирования выдачи.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит анализ документов для определения связанных с ними сущностей и расчета Entity to Document Relevance Score. Эти данные сохраняются в Document and Entity Association Database. Также поддерживается Entity Properties Database (Knowledge Graph).
QUNDERSTANDING – Понимание Запросов
Основной этап применения патента. Система работает здесь в двух режимах:
- Офлайн-процессинг: Система анализирует логи запросов, генерирует результаты, рассчитывает Entity Scores и создает Query to Entity Association Database (Mapping).
- Онлайн-обработка (Autocomplete): При вводе частичного или полного запроса система использует Mapping для генерации Query Suggestions с Entity Descriptors.
RANKING / METASEARCH / RERANKING
На финальных этапах формирования выдачи система использует Mapping для:
- Внедрения Entity Summaries: Отображение блоков знаний (Knowledge Panels) для доминирующих сущностей.
- Организации SERP: В некоторых вариантах реализации результаты поиска могут быть сгруппированы по связанным сущностям.
Входные данные:
- (Офлайн): Журналы запросов, Индекс документов.
- (Онлайн): Запрос пользователя (полный или частичный).
- (Оба режима): Entity Properties Database, Document and Entity Association Database.
Выходные данные:
- (Офлайн): Query to Entity Association Database (Mapping с Entity Scores).
- (Онлайн): Ранжированный список Query Suggestions с Entity Descriptors; Entity Summaries для отображения на SERP.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы (например, «Ягуар», «Вашингтон»), где требуется определение интента. Также сильно влияет на запросы, где сущность является основным объектом поиска (бренды, люди, места).
- Конкретные типы контента: Повышается важность контента, в котором четко определена центральная сущность (высокий Entity to Document Relevance Score), например, энциклопедические статьи, официальные страницы брендов, подробные обзоры продуктов.
Когда применяется
Алгоритм ассоциации применяется при выполнении определенных условий интерпретации запроса:
- Условия активации (Интерпретация): Система проверяет, соответствует ли запрос доверенному алиасу сущности (точно или с добавлением стоп-слов/суффиксов типа).
- Триггер (Reference Page): Если один из топовых результатов по запросу является референсной страницей (например, официальный сайт или страница в авторитетной энциклопедии) для сущности, это может активировать ассоциацию.
- Пороговые значения (Entity Score): Сущность должна иметь достаточно высокий Entity Score, чтобы быть ассоциированной с запросом и использоваться в подсказках или сводках.
Пошаговый алгоритм
Процесс А: Офлайн-генерация Query to Entity Mapping
- Идентификация запроса: Выбор запроса (например, из логов).
- Получение результатов: Идентификация топовых документов, релевантных запросу. Расчет Query to Document Relevance Score для каждого документа.
- Идентификация сущностей: Для каждого документа определяются связанные с ним сущности (используя Document and Entity Association Database). Расчет Entity to Document Relevance Score для каждой сущности в документе.
- Проверка интерпретации: Определение, является ли сущность валидной интерпретацией запроса (например, совпадение с Trusted Alias, наличие референсной страницы в топе).
- Расчет Entity Score: Для валидных сущностей рассчитывается Entity Score. Формула агрегирует произведения Query to Document Relevance Score и Entity to Document Relevance Score по всем релевантным документам.
- Ранжирование и Фильтрация: Сущности ранжируются по Entity Score. Определяется доминирующая сущность (если она значительно превосходит остальные). Сущности с низким рейтингом могут быть отфильтрованы.
- Сохранение: Ассоциация между запросом и высокорейтинговыми сущностями (вместе с их Entity Score) сохраняется в Query to Entity Association Database.
Процесс Б: Онлайн-генерация Query Suggestions
- Получение запроса: Система получает запрос (полный или частичный) от пользователя.
- Идентификация сущностей: Система обращается к Query to Entity Association Database для поиска сущностей, связанных с этим запросом (или с его автодополнением).
- Получение ранжирования: Извлекаются Entity Scores для связанных сущностей.
- Генерация дескрипторов: Для высокорейтинговых сущностей генерируются Entity Descriptors на основе их свойств (тип, имя).
- Формирование подсказок: Создаются Query Suggestions путем комбинирования исходного запроса (или его варианта) с Entity Descriptor.
- Ранжирование подсказок: Подсказки ранжируются на основе Entity Score соответствующих сущностей.
- Предоставление подсказок: Ранжированный список отображается пользователю.
- Обработка выбора: При выборе подсказки система отправляет заранее определенный фактический поисковый запрос, который может отличаться от текста подсказки.
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании метаданных о документах и сущностях, а также на анализе контента для определения важности сущности.
- Контентные факторы (для расчета Entity to Document Score): Учитывается расположение упоминаний сущности (заголовок, тело документа, URL), частота упоминаний, форматирование. Упоминания в «шаблонном контенте» (boilerplate) могут понижаться.
- Ссылочные факторы (для расчета Entity to Document Score): Частота появления алиаса сущности в анкорном тексте ссылок, ведущих на документ.
- Поведенческие факторы:
- (Для Query to Document Score): Доля кликов по документу для данного запроса.
- (Для Entity to Document Score): Частота появления алиаса сущности в запросах, которые привели к переходу на документ.
- Структурные данные (Entity Properties): Trusted Alias, тип сущности, референсные страницы, связи между сущностями (например, автор и книга, город и штат).
Какие метрики используются и как они считаются
- Entity Score: Ключевая метрика патента. Рассчитывается как сумма произведений двух других метрик по всем документам (D), содержащим сущность (E):
- Query to Document Relevance Score: Стандартная оценка релевантности документа запросу (например, на основе кликов, качества документа).
- Entity to Document Relevance Score: Оценка важности сущности в документе. Учитывает множество факторов (частота, позиция, анкоры, URL, связанные запросы, связи с другими сущностями в документе). Может нормализоваться, если в документе много разных сущностей.
- Dominant Entity Threshold: Порог, который должен превысить Entity Score самой высокорейтинговой сущности (возможно, относительно второй по рангу сущности), чтобы она была признана доминирующей для запроса.
Выводы
- Фундамент семантического понимания запросов: Патент описывает ключевой механизм, позволяющий Google переходить от ключевых слов к сущностям. Система не просто ищет совпадения текста, а определяет, какие объекты реального мира подразумеваются в запросе.
- Entity Score как мера интента: Entity Score является количественной мерой того, насколько сильно запрос связан с сущностью. Это позволяет системе ранжировать различные интерпретации запроса и определять доминирующий интент.
- Двухфакторная модель релевантности сущности: Ключевым нововведением является формула Entity Score. Сущность релевантна запросу только тогда, когда она занимает центральное место (высокий Entity to Document Score) в документах, которые сами по себе релевантны запросу (высокий Query to Document Score). Недостаточно просто упоминаться в релевантных документах.
- Практическое применение в интерфейсе: Ассоциации используются напрямую для улучшения UX через два механизма: Query Suggestions для устранения неоднозначности (помогая пользователю уточнить интент) и Entity Summaries (предоставляя прямую информацию о сущности).
- Переписывание запросов за кулисами: Система может отображать пользователю одну подсказку, но при ее выборе выполнять другой, более точный запрос, связанный с сущностью. Это подчеркивает разрыв между тем, что видит пользователь, и тем, как система интерпретирует его выбор.
Практика
Best practices (это мы делаем)
- Обеспечение центральности сущности (Entity Centrality): При создании контента фокусируйтесь на том, чтобы целевая сущность (бренд, продукт, автор) была главной темой страницы. Это повышает Entity to Document Relevance Score. Используйте алиасы сущности в ключевых местах (Title, H1, начало текста), включайте релевантные свойства и связанные сущности.
- Оптимизация референсных страниц: Активно работайте над тем, чтобы официальные страницы (главная страница сайта, страница продукта) были признаны Google как референсные страницы для ваших сущностей. Убедитесь, что эти страницы хорошо ранжируются по запросам, содержащим Trusted Alias сущности, так как это является одним из условий для ассоциации.
- Использование типизирующих суффиксов: Для сущностей с неоднозначными именами последовательно используйте суффиксы, отражающие тип или свойство (например, «Apple компания», «Jaguar автомобиль»). Это соответствует описанным в патенте условиям интерпретации запроса.
- Укрепление Trusted Alias: Убедитесь, что основное имя бренда или продукта последовательно используется на сайте, в анкорных текстах внешних ссылок и в поисковых запросах пользователей, ведущих на ваш сайт. Все эти сигналы учитываются при расчете Entity to Document Relevance Score.
- Мониторинг автозаполнения и Entity Summaries: Анализируйте, какие Entity Descriptors Google показывает в подсказках для ваших запросов и какие Entity Summaries появляются в выдаче. Это дает прямое представление о том, как система рассчитывает Entity Score и определяет доминирующий интент.
Worst practices (это делать не надо)
- Поверхностное упоминание сущностей (Entity Stuffing): Простое добавление названий сущностей в контент без их детального раскрытия неэффективно. Если сущность не является центральной темой, Entity to Document Relevance Score будет низким.
- Игнорирование структуры документа: Размещение ключевой информации о сущности в футере, сайдбаре или шаблонных блоках (boilerplate) может привести к понижению веса этих упоминаний при расчете Entity to Document Relevance Score.
- Фокус только на ключевых словах без учета сущностей: Оптимизация под текстовые совпадения без понимания того, с какими сущностями Google ассоциирует запрос, приведет к потере релевантности, так как система стремится удовлетворить интент, связанный с доминирующей сущностью.
Стратегическое значение
Этот патент подтверждает стратегическую важность оптимизации на уровне сущностей (Entity-First Indexing). Для долгосрочного успеха в SEO необходимо не просто создавать контент под запросы, а строить авторитет вокруг сущностей. Стратегия должна быть направлена на максимизацию Entity Score для целевых сущностей по релевантным запросам. Это достигается через комбинацию традиционного SEO (повышение Query to Document Score) и семантической оптимизации контента (повышение Entity to Document Score).
Практические примеры
Сценарий: Оптимизация страницы продукта для повышения Entity Score
Задача: Повысить Entity Score для сущности «iPhone 16 Pro Max» по запросу «лучший камерофон».
- Анализ текущей выдачи (Query to Document): Определить, какие документы сейчас ранжируются по запросу «лучший камерофон» и насколько они авторитетны.
- Создание высокорелевантного контента: Создать подробный обзор/сравнение, который имеет потенциал высоко ранжироваться по этому запросу (работа над Query to Document Score).
- Максимизация Entity to Document Score для iPhone 16:
- Убедиться, что «iPhone 16 Pro Max» явно указан в Title, H1 и URL.
- Детально описать свойства сущности, релевантные запросу (характеристики камеры, примеры фото).
- Включить связанные сущности (Apple, iOS, конкуренты).
- Обеспечить, чтобы внешние ссылки на эту страницу использовали анкоры, включающие название продукта.
- Ожидаемый результат: Документ начинает высоко ранжироваться (высокий Query to Document Score). Благодаря центральности продукта в контенте (высокий Entity to Document Score), общий Entity Score для «iPhone 16 Pro Max» по этому запросу растет, что может привести к появлению Entity Summary или уточнению в Query Suggestions.
Вопросы и ответы
Что такое Entity Score и почему он важен для SEO?
Entity Score — это метрика, которая определяет, насколько сильно поисковый запрос связан с конкретной сущностью. Она рассчитывается путем комбинации того, насколько релевантны топовые документы запросу, и того, насколько важна сущность внутри этих документов. Для SEO это критически важно, так как Entity Score определяет доминирующий интент запроса, влияет на показ Knowledge Panels и ранжирование поисковых подсказок.
Как повысить Entity to Document Relevance Score для моего контента?
Эта оценка показывает важность сущности на странице. Для ее повышения необходимо сделать сущность центральной темой документа. Используйте доверенные алиасы сущности в важных зонах (Title, H1, URL, основной текст), минимизируйте упоминания в шаблонных блоках. Также важно, чтобы внешние ссылки и поисковые запросы пользователей, ведущие на страницу, содержали упоминание этой сущности.
Что такое «Референсная страница» (Reference Page) в контексте этого патента?
Это страница, которая идентифицирована системой как авторитетный источник информации о сущности (например, официальный сайт бренда или страница в Wikipedia). Если такая страница попадает в топ выдачи по запросу, содержащему имя сущности, это является сильным сигналом для ассоциации запроса с этой сущностью. SEO-специалистам важно оптимизировать такие страницы.
Как патент влияет на работу с неоднозначными запросами?
Патент напрямую решает эту проблему. Система рассчитывает Entity Score для каждой возможной интерпретации (например, Jaguar автомобиль vs животное). Доминирующая сущность определяется по наивысшему баллу. Система использует Query Suggestions с Entity Descriptors (например, «Jaguar — автомобиль»), чтобы помочь пользователю уточнить интент.
Если я выберу подсказку в автозаполнении, Google выполнит именно этот запрос?
Не обязательно. Патент подчеркивает, что отображаемая подсказка (с Entity Descriptor) может отличаться от фактического запроса, который система выполняет. Например, выбрав «Стинг (музыкант)», система может выполнить внутренний запрос «Gordon Sumner дискография». Система использует ваш выбор для понимания интента, но может переформулировать запрос для лучшего результата.
Влияет ли количество сущностей на странице на расчет оценок?
Да. В патенте упоминается, что Entity to Document Relevance Scores могут быть нормализованы (понижены), если в документе упоминается слишком много разных сущностей. Это подчеркивает важность создания сфокусированного контента, где одна или несколько ключевых сущностей являются центральными.
Как использовать этот патент для оптимизации бренда?
Необходимо убедиться, что ваш бренд четко распознается как сущность и имеет сильный Trusted Alias. Создавайте контент, где ваш бренд является центральной темой (высокий Entity to Document Score), и продвигайте этот контент по релевантным запросам (высокий Query to Document Score). Это максимизирует общий Entity Score бренда.
Где система берет данные о свойствах сущностей, например, для Entity Summaries?
Система использует Entity Properties Database, которая представляет собой базу структурированных данных, аналогичную Knowledge Graph. Она содержит информацию об алиасах, типах, датах, связанных объектах и других свойствах сущностей. Эти данные извлекаются для формирования сводок и дескрипторов.
Может ли этот механизм использоваться для группировки результатов на SERP?
Да, в патенте описан вариант реализации (FIG. 2C), где результаты поиска группируются под соответствующими Entity Summaries. Например, по запросу «Вашингтон» часть результатов может быть сгруппирована под заголовком «Штат Вашингтон», а другая часть — под «Вашингтон, округ Колумбия». Это помогает структурировать выдачу по интентам.
Применяется ли этот механизм только к известным сущностям (знаменитости, крупные бренды)?
Хотя примеры часто используют известные сущности, механизм универсален и применяется к любой сущности, которая может быть идентифицирована системой и имеет достаточно данных в Entity Properties Database и индексе документов. Это включает нишевые продукты, локальные бизнесы и экспертов, если они достаточно представлены в вебе.