Google использует системы для двустороннего связывания запросов и сущностей. Алгоритмы анализируют релевантность документов запросу и значимость сущности внутри этих документов, чтобы определить главную (Primary) и второстепенные (Secondary) сущности для запроса. На основе этого статуса система формирует и отображает Панели Знаний (Entity Summaries) в выдаче, а также определяет наилучший канонический запрос (Entity Search Query) для поиска информации о конкретной сущности.
Описание
Какую задачу решает
Патент решает две взаимосвязанные проблемы в семантическом поиске:
- Неоднозначность (Query to Entity): Определение того, какая сущность является наиболее релевантной или доминирующей интерпретацией для данного запроса (например, «Вашингтон» – штат, город или человек). Это необходимо для отображения корректных Панелей Знаний (Entity Summaries).
- Канонизация (Entity to Query): Определение оптимальной текстовой формулировки запроса (Entity Search Query) для поиска информации о конкретной сущности. Это улучшает навигацию, когда пользователь уточняет свой поиск, кликая на сущность.
Что запатентовано
Запатентована система для создания и использования двунаправленных ассоциаций между запросами и сущностями. Ключевыми элементами являются механизмы ранжирования сущностей для запроса (определение Primary Entity) и ранжирования запросов для сущности (определение Entity Search Query). Также защищены конкретные методы отображения Панелей Знаний в интерфейсе поиска на основе этих ассоциаций, включая их расположение и интерактивность.
Как это работает
Система функционирует в двух основных режимах:
- Query to Entity (Q2E): Анализируются результаты поиска по запросу. Система агрегирует оценки релевантности документов запросу (Query to Document Relevance Score) и оценки важности сущности внутри этих документов (Entity to Document Relevance Score). Это позволяет рассчитать общий Entity Score и определить Primary Entity.
- Entity to Query (E2Q): Для конкретной сущности система оценивает связанные с ней запросы по критериям популярности, однозначности (Entity Ambiguity) и качества результатов. Лучший запрос выбирается как канонический Entity Search Query.
В реальном времени система использует эти данные для отображения Entity Summary для Primary Entity справа от результатов и использует Entity Search Query при навигации пользователя по сущностям.
Актуальность для SEO
Критически высокая. Описанные механизмы являются фундаментом семантического поиска Google и основой для работы Knowledge Graph и отображения Панелей Знаний (Knowledge Panels). Патент описывает актуальную реализацию интеграции структурированных данных в поисковую выдачу.
Важность для SEO
Патент имеет критическое значение (95/100). Он раскрывает механизмы, по которым Google переходит от ранжирования документов к представлению ответов на основе сущностей. Понимание того, как рассчитывается Entity to Document Relevance Score и как определяется Primary Entity, необходимо для стратегий по оптимизации под Knowledge Graph, управлению видимостью бренда в Панелях Знаний и реализации стратегий Entity-Based SEO.
Детальный разбор
Термины и определения
- Entity (Сущность)
- Тема дискурса (человек, место, концепция, объект), которая может быть однозначно идентифицирована и отличается от других. Хранится с уникальным идентификатором.
- Entity Properties Database
- База структурированных данных (аналог Knowledge Graph), содержащая узлы (сущности), их свойства, типы и связи.
- Primary Entity (Главная сущность)
- Сущность, идентифицированная как наиболее релевантная или доминирующая для данного запроса (имеющая наивысший Entity Score).
- Secondary Entity (Второстепенная сущность)
- Сущность, релевантная запросу, но менее значимая, чем Primary Entity.
- Entity Summary (Сводка по сущности)
- Блок информации о сущности, отображаемый в ответ на запрос (Панель Знаний / Knowledge Panel). Включает свойства и опции для дополнительного поиска.
- Entity Search Query (Канонический запрос сущности)
- Запрос, идентифицированный системой как наилучший для получения желаемых результатов поиска о конкретной сущности.
- Query to Entity Association (Q2E) System/Database
- Система и БД, хранящая соответствия между запросами и связанными сущностями, а также их ранжирование (Entity Scores).
- Entity to Query Association (E2Q) System/Database
- Система и БД, хранящая соответствия между сущностями и их оптимальными Entity Search Queries.
- Document and Entity Association Database
- Индекс, хранящий связи между документами и сущностями, включая оценки значимости сущности внутри документа (Entity to Document Relevance Score).
- Entity Score
- Оценка в процессе Q2E для определения релевантности сущности запросу. Вычисляется на основе релевантности документов.
- Query Score
- Оценка в процессе E2Q для определения наилучшего запроса для сущности. Учитывает Entity Ambiguity, популярность и качество результатов.
- Query to Document Relevance Score
- Стандартная оценка релевантности документа запросу.
- Entity to Document Relevance Score
- Оценка важности или значимости данной сущности внутри конкретного документа.
- Trusted Alias (Доверенный псевдоним)
- Имя или фраза, надежно связанная с сущностью в Entity Properties Database.
Ключевые утверждения (Анализ Claims)
Анализ основан на формуле изобретения патента US11294970B1.
Claim 1 (Независимый пункт): Описывает метод отображения Панели Знаний (Entity Summary) для главной сущности.
- Система получает запрос от клиентского устройства.
- Идентифицируются результаты поиска (включающие документы о первой и второй сущностях).
- На основе сохраненного соответствия (stored mapping) в базе данных, первая сущность идентифицируется как Primary Entity для запроса.
- Система предоставляет данные клиентскому устройству, которые вызывают:
- Графическое отображение результатов поиска.
- Графическое отображение начальной сводки по первой сущности (initial first entity summary), визуально смещенной (visually offset) от результатов поиска. Смещение определено как позиционно справа (positionally to the right).
- Отображение этой сводки основано на идентификации сущности как Primary Entity.
- Сводка включает изображение, имя и дополнительные свойства сущности.
- Сводка является интерактивной: выбор сводки приводит к ее расширению (expanding) в более детальную сводку.
Claim 5 (Зависимый): Уточняет процесс определения Primary Entity (который происходит до получения запроса).
Определение Primary Entity включает идентификацию документов, релевантных запросу, выделение тех из них, которые ассоциированы с первой сущностью, и определение статуса Primary Entity на основе этого подмножества документов.
Claim 6 (Зависимый от 5): Уточняет механизм определения Primary Entity на основе оценок.
Для каждого документа, связанного с сущностью, определяется оценка (score), основанная на релевантности запросу. Статус Primary Entity определяется на основе этих агрегированных оценок.
Claim 12 (Независимый пункт): Описывает отображение нескольких Панелей Знаний и взаимодействие с второстепенной сущностью.
- Система получает запрос и идентифицирует результаты.
- Идентифицируется первая сущность как Primary Entity и вторая сущность как Secondary Entity на основе сохраненных соответствий.
- Система предоставляет данные, вызывающие отображение:
- Результатов поиска.
- Сводки для первой сущности (справа от результатов).
- Сводки для второй сущности (справа от результатов и ниже первой сводки).
- Сводка второй сущности (на основании ее статуса Secondary Entity) является интерактивной, и ее выбор вызывает дополнительный поиск на основе нового запроса, сфокусированного на второй сущности (т.е. используется ее Entity Search Query).
Где и как применяется
Изобретение охватывает практически все этапы поиска, формируя основу для семантического понимания и представления результатов.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит анализ документов и формируется Document and Entity Association Database. Ключевой задачей является расчет Entity to Document Relevance Score для сущностей внутри каждого документа.
QUNDERSTANDING – Понимание Запросов (Офлайн-процессы)
Система выполняет два ключевых офлайн-процесса для построения баз данных ассоциаций:
- Query to Entity (Q2E): Анализ запросов и результатов поиска для определения Primary и Secondary Entities и расчета Entity Scores. Результаты сохраняются в Query to Entity Association Database.
- Entity to Query (E2Q): Определение наилучшего Entity Search Query для каждой сущности. Результаты сохраняются в Entity to Query Association Database.
RANKING – Ранжирование
На этом этапе рассчитываются стандартные Query to Document Relevance Scores, которые затем используются в офлайн-процессах Q2E для расчета Entity Scores.
METASEARCH – Метапоиск и Смешивание (Рантайм)
Основное применение патента (как описано в Claims 1 и 12). Система проверяет Query to Entity Association Database. Если найдены Primary/Secondary Entities, система формирует Entity Summaries (Панели Знаний), определяет их расположение (справа) и интерактивное поведение (расширение или запуск нового поиска с использованием Entity Search Query).
На что влияет
- Специфические запросы: Наибольшее влияние на неоднозначные запросы (например, «Ягуар», «Вашингтон») и запросы, которые могут быть интерпретированы как сущности (имена людей, бренды, места).
- Форматы контента: Напрямую влияет на генерацию и содержание SERP Features, в частности Панелей Знаний (Entity Summaries) и автодополнения (Query Suggestions).
- Конкретные типы контента: Повышает значимость авторитетных справочных страниц (reference pages), так как их присутствие в топе может быть условием для ассоциации сущности с запросом.
Когда применяется
- Триггеры активации (Q2E): Алгоритм активируется, когда система определяет, что запрос может быть интерпретирован как сущность. Это происходит при выполнении условий, таких как:
- Запрос точно соответствует Trusted Alias сущности.
- Запрос содержит псевдоним и суффикс, указывающий на тип (например, «Стинг музыкант»).
- Запрос содержит псевдоним, и одна из топовых страниц в выдаче является reference page для этой сущности.
- Условия отображения Панели Знаний: Панель отображается, когда для запроса определена Primary Entity с достаточной уверенностью (Claim 1).
Пошаговый алгоритм
Патент описывает три ключевых процесса.
Процесс А: Ассоциация Запроса с Сущностями (Q2E) (Офлайн)
- Идентификация запроса (например, из логов).
- Получение документов: Идентификация релевантных документов и их Query to Document Relevance Scores.
- Идентификация сущностей в документах: Для каждого документа определяются присутствующие сущности и их Entity to Document Relevance Scores.
- Фильтрация сущностей (Интерпретация): Определение, является ли сущность валидной интерпретацией запроса (например, совпадение с Trusted Alias).
- Расчет Entity Score: Для каждой валидной сущности рассчитывается Entity Score. Метод расчета: Сумма произведений (Query to Document Relevance Score * Entity to Document Relevance Score) по всем документам, содержащим эту сущность.
- Ранжирование и Определение Статуса: Сущности ранжируются. Определяются Primary Entity и Secondary Entities.
- Сохранение: Связи и ранги сохраняются в Query to Entity Association Database.
Процесс Б: Ассоциация Сущности с Запросом (E2Q) (Офлайн)
- Идентификация сущности.
- Идентификация связанных запросов: Поиск всех запросов, связанных с этой сущностью (инвертирование данных Процесса А).
- Расчет Query Score: Для каждого запроса определяется Query Score на основе взвешенной комбинации факторов:
- Entity Ambiguity (однозначность).
- Популярность запроса (частота в логах).
- Качество результатов поиска (Search Result Document Quality).
- Текстовая схожесть запроса с Trusted Alias.
- Выбор канонического запроса: Запрос с наивысшим Query Score определяется как Entity Search Query. Веса факторов могут меняться в зависимости от предполагаемого применения (Intended Application).
- Сохранение: Соответствие сохраняется в Entity to Query Association Database.
Процесс В: Применение в Поиске (Рантайм)
- Получение запроса от пользователя.
- Поиск ассоциаций: Запрос к Query to Entity Association Database для идентификации Primary и Secondary Entities.
- Формирование SERP и Entity Summaries: Генерация стандартных результатов. Если Primary Entity найдена, формируется сводка (Knowledge Panel).
- Определение интерактивности (Claims 1, 12): Для Primary Entity назначается действие «Расширить сводку». Для Secondary Entity или связанных сущностей назначается действие «Запустить новый поиск», используя соответствующий Entity Search Query.
- Отображение: SERP отображается с визуально смещенными (справа) сводками.
Какие данные и как использует
Данные на входе
- Контентные факторы: Текст документа, заголовки, форматирование. Используются для расчета Entity to Document Relevance Score (частота, расположение упоминаний сущности/свойств). Упоминается анализ «boilerplate content» (повторяющегося контента) для снижения веса таких упоминаний.
- Ссылочные факторы: Анкорный текст входящих ссылок. Используется как источник псевдонимов сущности при расчете Entity to Document Relevance Score.
- Поведенческие факторы: Журналы запросов (search logs) используются для определения популярности запросов (при расчете Query Score). Данные о кликах (например, доля кликов по документу для данного запроса) используются как сигнал для Query to Document Relevance Score. Запросы, которые привели пользователя к документу, также используются для расчета Entity to Document Relevance Score.
- Технические факторы: URL документа используется как место, где могут встречаться псевдонимы сущности.
- Структурные данные (Entity Data): Entity Properties Database предоставляет Trusted Aliases, типы, свойства, связи между сущностями (connectedness), справочные страницы (reference pages).
Какие метрики используются и как они считаются
- Entity to Document Relevance Score: Оценка важности сущности в документе. Рассчитывается на основе частоты, расположения (URL, заголовок, тело, анкоры, запросы, ведущие на документ) и форматирования упоминаний сущности. Может учитывать связанность (connectedness) с другими сущностями в документе. Нормализуется по всем сущностям в документе.
- Query to Document Relevance Score: Стандартная оценка релевантности документа запросу (например, на основе IR-сигналов, кликов).
- Entity Score (для Q2E): Агрегированная оценка релевантности сущности запросу. Формула: Сумма по всем документам D (Query to Document Relevance Score(D) * Entity to Document Relevance Score(D)).
- Query Score (для E2Q): Оценка качества запроса для поиска сущности. Комбинация метрик:
- Entity ambiguity: Насколько сильно запрос связан с этой сущностью по сравнению с другими.
- Popularity: Частота запроса в логах.
- Search result document quality: Качество документов в выдаче по этому запросу, связанных с сущностью.
- Similarity measure: Текстовая близость запроса к Trusted Alias (например, edit distance).
Выводы
- Двунаправленная связь Сущность-Запрос: Google активно поддерживает и использует два типа индексов: один определяет, какие сущности релевантны запросу (Q2E), а другой определяет, какой запрос лучше всего использовать для поиска сущности (E2Q).
- Определение Primary Entity — это задача ранжирования: Статус Primary Entity не определяется только по тексту запроса. Он вычисляется путем анализа результатов поиска, комбинируя релевантность документа запросу и важность сущности в документе (Entity Score). Изменения в ранжировании документов могут изменить Primary Entity для запроса.
- Entity to Document Relevance критичен: Чтобы сущность хорошо ранжировалась для запроса, необходимо, чтобы она была центральной темой релевантных документов (высокий Entity to Document Relevance Score).
- Условия интерпретации запроса как сущности: Патент определяет условия для ассоциации запроса с сущностью. Ключевые факторы — использование Trusted Aliases и присутствие авторитетных reference pages в топе выдачи.
- Entity Search Query и поведение пользователя: Когда пользователь взаимодействует с Панелью Знаний, Google использует заранее рассчитанный Entity Search Query — оптимальный запрос для поиска информации об этой сущности, а не просто текст, по которому кликнул пользователь.
- Патент описывает интерфейс Knowledge Panel: Claims патента детально описывают логику отображения Панелей Знаний — их расположение справа, иерархию (Primary выше Secondary) и интерактивность (расширение для Primary vs новый поиск для Secondary).
Практика
Best practices (это мы делаем)
- Усиление связи Сущность-Документ (Entity to Document Relevance): Убедитесь, что страницы, оптимизированные под конкретную сущность (продукт, персона, бренд), делают эту сущность центральной темой. Используйте Trusted Aliases в ключевых зонах (H1, Title, URL, тело контента) и подкрепляйте контекст связанными сущностями. Это повышает Entity to Document Relevance Score.
- Оптимизация Справочных Страниц (Reference Pages): Если ваш сайт является авторитетным источником, работайте над тем, чтобы ваши страницы рассматривались как reference pages для сущностей. Высокое ранжирование таких страниц по запросу является прямым сигналом для ассоциации Q2E.
- Согласование с Доверенными Псевдонимами (Trusted Aliases): Убедитесь, что вы используете те же названия и формулировки для сущностей, которые используются в авторитетных источниках (например, Wikipedia, официальные реестры). Это увеличивает вероятность распознавания упоминаний системой.
- Оптимизация под Entity Search Query: Определите, какой запрос Google считает оптимальным (Entity Search Query) для вашей брендовой сущности (часто это «Имя + Тип»). Убедитесь, что ваш контент высоко ранжируется по этому конкретному запросу, так как он будет использоваться при взаимодействии пользователей с Панелями Знаний и автокомплитом.
- Использование структурированных данных: Используйте Schema.org для явного указания сущностей на странице и их свойств. Это помогает системам Google точнее определять связи и рассчитывать Entity to Document Relevance Score.
Worst practices (это делать не надо)
- Создание размытого контента (Entity Dilution): Создание страниц, которые упоминают множество сущностей без явного фокуса на одной главной теме. Это снижает Entity to Document Relevance Score для всех упомянутых сущностей.
- Игнорирование Knowledge Graph: Работа над SEO без учета того, как ваша организация или контент представлены в базе данных сущностей Google (Entity Properties Database), приведет к потере видимости в Entity Summaries.
- Манипуляция упоминаниями: Искусственное перенасыщение текста упоминаниями сущности, особенно в сквозных блоках (boilerplate content), неэффективно, так как патент предусматривает пессимизацию таких упоминаний при расчете релевантности.
Стратегическое значение
Этот патент подтверждает, что Google окончательно перешел к гибридной модели поиска, где традиционное ранжирование сосуществует с системой, основанной на сущностях. Стратегическое значение для SEO заключается в необходимости управления сущностями (Entity Management) как активом. Необходимо не просто создавать контент, но и выстраивать четкие, авторитетные связи между документами, запросами и сущностями в Knowledge Graph. Видимость в поиске все больше зависит от способности сайта подтвердить свою авторитетность в контексте конкретных сущностей.
Практические примеры
Сценарий: Оптимизация для получения статуса Primary Entity для неоднозначного запроса
Компания разрабатывает новый продукт под названием «Horizon» (SaaS-платформа). Запрос «Horizon» неоднозначен (есть также популярная игра).
- Анализ (Entity Score): SEO-команда анализирует выдачу по запросу «Horizon». Они оценивают, какие документы ранжируются (Query to Document Score) и насколько сильно они сфокусированы на игре или на SaaS (Entity to Document Score).
- Усиление Entity to Document Relevance: Команда создает центральную страницу продукта, делая сущность «Horizon (SaaS)» максимально важной. Используются структурированные данные, четкие определения и связанные сущности (управление проектами, SaaS, agile).
- Усиление Query to Document Relevance: Проводится стандартная SEO-оптимизация и линкбилдинг для повышения ранжирования этой страницы по запросу «Horizon».
- Мониторинг Reference Pages: Команда работает с отраслевыми СМИ и каталогами (например, G2), чтобы убедиться, что справочные страницы о продукте «Horizon» также начинают ранжироваться.
- Результат: По мере роста авторитетности и релевантности страниц о SaaS-платформе, ее общий Entity Score для запроса «Horizon» увеличивается. Она может достичь статуса Primary Entity или Secondary Entity, получив свою Панель Знаний в выдаче.
Вопросы и ответы
Что такое Entity Score и почему он важен для SEO?
Entity Score — это метрика, определяющая релевантность сущности конкретному запросу. Он рассчитывается как комбинация релевантности документов запросу (Query to Document Score) и важности сущности внутри этих документов (Entity to Document Score). Это критически важно для SEO, так как сущность с наивысшим Entity Score получает статус Primary Entity и, соответственно, Панель Знаний (Knowledge Panel) в выдаче.
Как рассчитывается Entity to Document Relevance Score?
Эта оценка показывает, насколько важна сущность внутри документа. Она учитывает частоту, расположение (URL, заголовок, тело, анкоры входящих ссылок, запросы, ведущие на документ) и форматирование упоминаний сущности и ее псевдонимов. Также может учитываться связанность (connectedness) этой сущности с другими сущностями в документе. Упоминания в «boilerplate» контенте пессимизируются.
Что такое Entity Search Query и как его использовать?
Entity Search Query — это запрос, который система считает оптимальным (каноническим) для поиска информации о конкретной сущности. Он определяется офлайн путем анализа популярности, качества результатов и неоднозначности. Google использует этот запрос, когда пользователь кликает на сущность в Панели Знаний или выбирает подсказку автокомплита. SEO-специалистам важно оптимизировать контент под этот канонический запрос.
Может ли изменение ранжирования документов повлиять на то, какая сущность будет Primary Entity?
Да, абсолютно. Поскольку Entity Score напрямую зависит от Query to Document Relevance Scores топовых документов, изменение позиций этих документов в выдаче приводит к пересчету Entity Scores. Это может привести к смене Primary Entity для запроса, даже если информация о самих сущностях не изменилась.
Что такое «Справочная страница» (Reference Page) в контексте этого патента?
Reference Page — это авторитетная страница, посвященная сущности (например, страница в Википедии или официальном справочнике), которая может быть указана в Entity Properties Database. Если такая страница высоко ранжируется по запросу, это является сильным сигналом для ассоциации этого запроса с сущностью (Q2E).
Как этот патент связан с E-E-A-T?
Патент предоставляет инфраструктуру, которая использует сигналы E-E-A-T. Авторитетность (Authority) и Доверие (Trust) влияют на то, будет ли страница считаться Reference Page и какие псевдонимы будут считаться Trusted Aliases. Кроме того, общее качество сайта влияет на Query to Document Relevance Score, что напрямую влияет на итоговый Entity Score.
Как оптимизировать контент, чтобы повысить Entity to Document Relevance Score?
Необходимо сделать сущность центральной темой страницы. Явно указывайте сущность с помощью структурированных данных. Используйте ее Trusted Aliases в ключевых элементах (H1, Title, URL). Окружайте ее контекстом, используя связанные сущности и свойства, чтобы повысить ее «connectedness» в документе. Избегайте размытия фокуса на несколько равнозначных сущностей.
Почему Панель Знаний отображается справа от результатов?
Патент (Claim 1) явно определяет это расположение как часть изобретения. Entity Summary для Primary Entity отображается «визуально смещенной» (visually offset) и «позиционно справа» (positionally to the right) от основных результатов поиска.
Что происходит, когда я кликаю на Панель Знаний?
Согласно патенту (Claims 1 и 12), поведение зависит от статуса сущности. Клик на Primary Entity Summary приводит к ее расширению (expanding) в более детальную версию. Клик на Secondary Entity Summary или на связанную сущность запускает новый поиск, используя соответствующий Entity Search Query.
Как бороться с неоднозначностью запросов с помощью этого механизма?
Для неоднозначных запросов Google определяет Primary и Secondary Entities. Если ваша сущность является Secondary, вам нужно работать над повышением ее Entity Score, чтобы обойти текущую Primary Entity. Это достигается за счет улучшения ранжирования ваших документов по этому запросу (Q2D Score) и усиления фокуса на вашей сущности внутри этих документов (E2D Score).