
Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и идентифицирует наиболее релевантные сущности. Для этого анализируется частота упоминания сущностей в результатах поиска по исходному запросу или используются специально сгенерированные комбинированные запросы.
Патент решает задачу интерпретации поисковых запросов, которые перечисляют признаки (attributes) или особенности, но не называют явно целевую сущность (entity). Пользователи часто вводят запросы такого типа, подразумевая вопрос: "Какая сущность соответствует этим признакам?". Классический пример, описанный в патенте, — это запрос, перечисляющий медицинские симптомы, где пользователь хочет найти соответствующие медицинские состояния (болезни, расстройства).
Запатентована система для идентификации сущностей, соответствующих атрибутам, указанным в запросе, с использованием результатов поиска. Изобретение описывает несколько вариантов реализации (embodiments). Ключевая идея — определить тип искомой сущности (entity type) на основе атрибутов в запросе, а затем использовать различные методы анализа поисковой выдачи (по исходному запросу, модифицированному запросу или комбинированным запросам) для оценки и выбора наиболее подходящих сущностей этого типа.
Система сначала определяет, содержит ли запрос ссылки на предопределенные атрибуты, связанные с определенным типом сущности. Это может делаться путем проверки терминов запроса по базе данных атрибутов (attribute data store). Если да, активируется механизм идентификации сущностей. Патент описывает несколько методов:
final scores) на основе этих упоминаний и ранга ресурсов.summary score) на основе качества результатов поиска по соответствующему комбинированному запросу.Выбранные сущности могут быть представлены пользователю отдельно от стандартных результатов поиска. Также система может предлагать дополнительные атрибуты (attribute suggestions) для уточнения запроса.
Высокая. Патент напрямую связан с тем, как Google обрабатывает запросы, особенно в YMYL-тематиках (в частности, здоровье), предоставляя прямые ответы и информацию о сущностях (Knowledge Panels, Featured Snippets). Механизмы распознавания интента через атрибуты и связи между сущностями являются фундаментом современного семантического поиска.
Патент имеет высокое значение для SEO (85/100), особенно для информационных сайтов и контента, сфокусированного на сущностях (YMYL, обзоры продуктов, медиа). Он подчеркивает переход от ключевых слов к пониманию связей между сущностями и их атрибутами. Для ранжирования критически важно, чтобы контент четко устанавливал связь между сущностью и ее признаками, так как Google использует эту информацию для ответа на неявные вопросы пользователей.
Initial Scores. Используется для выбора сущностей в ответ на запрос.Attribute Data Store.Патент содержит несколько независимых пунктов (Claims 1, 46, 76, 121), описывающих разные методы достижения цели.
Claim 1 (Независимый пункт): Описывает метод идентификации сущностей путем анализа упоминаний в результатах исходного запроса.
Attribute Data Store, который заполняется Query Classifier на основе анализа прошлых запросов.Initial Score для множества сущностей. Эта оценка основана на упоминаниях (occurrences) имен сущностей в ресурсе.Final Score для каждой сущности на основе Initial Scores.Final Scores.Claim 46 (Независимый пункт): Описывает метод генерации выдачи с использованием комбинированных запросов.
Combined Query (исходный запрос + имя сущности).Combined Search Results (объединенной выдачи) в ответ на исходный запрос. Это может включать ранжирование ресурсов на основе Combined Scores (Claim 52).Claim 76 (Независимый пункт): Описывает метод идентификации сущностей путем модификации запроса.
Claim 121 (Независимый пункт): Описывает метод идентификации сущностей с использованием предварительных знаний о связи ресурсов и сущностей.
Изобретение затрагивает несколько этапов поиска, от индексирования до понимания запросов и формирования выдачи.
CRAWLING & INDEXING – Сканирование и Индексирование
В некоторых вариантах реализации система требует предварительной обработки ресурсов:
Named Entity Recognition, NER, для разрешения неоднозначностей).QUNDERSTANDING – Понимание Запросов
На этом этапе происходит ключевая активация механизма:
Query Classifier анализирует логи запросов и заполняет Attribute Data Store терминами и запросами, которые соответствуют паттерну "список атрибутов".Attribute Data Store или другим критериям, чтобы определить, следует ли возвращать имена сущностей определенного типа.RANKING, METASEARCH & RERANKING – Ранжирование, Метапоиск и Переранжирование
Применение зависит от выбранного метода:
Final Scores сущностей. Это этап пост-обработки или метапоиска.Summary Scores или для генерации объединенной выдачи (Combined Search Results).В конечном итоге, система либо предоставляет выбранные имена сущностей как отдельный блок (METASEARCH), либо модифицирует основную выдачу, заменяя ее объединенными результатами или продвигая результаты, связанные с выбранными сущностями (RERANKING).
Алгоритм применяется при выполнении условий, указывающих на интент поиска сущности по ее атрибутам:
Attribute Data Store.blacklist) фраз, для которых не следует возвращать сущности, даже если они содержат атрибуты (пример: "you give me fever"). Также механизм может не активироваться, если запрос уже содержит имя сущности того же типа.Патент описывает несколько различных алгоритмов. Ниже приведен разбор двух ключевых подходов.
Алгоритм А: Идентификация сущностей через комбинированные запросы
Summary Score. Это функция от оценок (scores) результатов поиска, полученных для соответствующего комбинированного запроса (например, сумма оценок топовых результатов).Summary Score может быть скорректирован на основе Inverse Document Frequency имени сущности.Summary Scores (например, Топ-N или превысившие порог).Алгоритм Б: Идентификация сущностей через анализ исходной выдачи
Named Entity Recognition для разрешения неоднозначностей.Initial Score. Он зависит от количества упоминаний сущности в ресурсе и ранга (или оценки) этого результата поиска.Final Score (или Combined Score) путем объединения ее Initial Scores (например, суммированием).Final Score может быть скорректирован на основе IDF.Final Scores.Система использует следующие типы данных:
Query Classifier) для обучения и заполнения Attribute Data Store.Initial Scores или от оценок результатов поиска для комбинированного запроса. Также упоминается сумма логарифмов оценок.Summary Score или Final Score.Attribute Data Store и Query Classifier указывает на масштабные усилия по классификации терминов и прошлых запросов для распознавания таких интентов.Initial Scores и Summary Scores напрямую зависят от ранга или оценки (score) ресурсов, возвращаемых поисковой системой. Это означает, что авторитетные документы, хорошо ранжирующиеся по запросам, имеют больший вес в определении связи между атрибутами и сущностями.Inverse Document Frequency (IDF) для нормализации оценок сущностей показывает, что система стремится находить наиболее релевантные, а не просто самые часто упоминаемые сущности.Attribute Suggestions с критерием "maximally refine" указывает на стремление к диалоговому поиску, помогая пользователю быстро сузить область поиска.Entity Data Store и распознает различные атрибуты в Attribute Data Store. Полнота описания увеличивает вероятность корректной идентификации.Summary Score в одном из методов.Этот патент является важной частью перехода Google к семантическому поиску и подтверждает стратегию, ориентированную на сущности (Entity-Oriented Search). Он демонстрирует, как Google стремится отвечать на сложные, неявно сформулированные запросы пользователей. Для SEO это означает, что стратегия должна быть направлена на построение тематического авторитета и создание контента, который не просто отвечает на запросы, но и помогает поисковой системе строить и верифицировать связи в Графе Знаний (Knowledge Graph). Особенно это критично в YMYL-сферах.
Сценарий: Оптимизация статьи о медицинском состоянии (на примере Алгоритма Б)
Initial Score. Это приведет к высокому Final Score для сущности "Целиакия", и она будет предложена пользователю как возможный ответ.Сценарий: Создание контента для охвата комбинированных запросов (на примере Алгоритма А)
Summary Score для сущности "Начало", и фильм будет предложен пользователю.Что такое Attribute Data Store и как он формируется?
Это хранилище терминов и фраз, которые система идентифицирует как атрибуты (признаки) определенных типов сущностей (например, симптомы для болезней). Он формируется офлайн с помощью Query Classifier — системы машинного обучения, которая анализирует логи прошлых запросов и определяет, какие из них похожи на перечисление атрибутов. Также он может пополняться терминами, которые часто встречаются в ресурсах, связанных с определенным типом сущности.
Патент описывает несколько разных методов. Google использует их все одновременно?
Патент защищает все описанные методы (анализ исходной выдачи, комбинированные запросы, модификация запроса, анализ аннотаций). Google может использовать один из них, комбинацию нескольких или выбирать метод динамически в зависимости от типа запроса, доступных данных и необходимой скорости ответа. Важно понимать принципы работы каждого из них, так как они могут влиять на выдачу в разных ситуациях.
Что важнее для идентификации сущности: качество моего сайта или частота упоминания атрибутов?
Оба фактора критичны и взаимосвязаны. Система использует результаты поиска для оценки связи между атрибутами и сущностями. Если ваш сайт не считается качественным и не попадает в топ выдачи (по исходному или комбинированному запросу), информация из него не будет учтена или получит низкий вес (Initial Score или Summary Score). Качество сайта (E-E-A-T) первично для попадания в выборку, а четкая связь атрибутов и сущностей в контенте необходима для получения высокой итоговой оценки.
Как нормализация по IDF влияет на выбор сущностей?
Использование Inverse Document Frequency (IDF) призвано снизить оценки для очень распространенных сущностей, которые часто упоминаются в интернете. Если не использовать IDF, такие сущности могут получать завышенные оценки просто из-за своей популярности, вытесняя более релевантные, но менее известные сущности. Это помогает Google находить более точные ответы на запрос пользователя.
Что такое аннотации в индексе и как они используются?
В некоторых вариантах реализации система на этапе индексации анализирует документы и добавляет к ним метаданные (аннотации). Эти аннотации могут указывать, что документ связан с определенным типом сущности (например, "медицина") или с конкретной сущностью (например, "диабет"). При обработке запроса система может быстро проверить эти аннотации у топовых результатов, чтобы определить, какие сущности чаще всего связаны с темой запроса.
Как система обрабатывает неоднозначные названия сущностей?
Патент упоминает использование методов распознавания именованных сущностей (Named Entity Recognition, NER). Если имя сущности может использоваться в разных контекстах, система анализирует окружающий текст, чтобы определить, действительно ли данное упоминание относится к искомой сущности. Упоминания, не относящиеся к нужному контексту, игнорируются при подсчете оценок.
Применяется ли этот патент только к медицинской тематике?
Нет. Хотя большинство примеров в патенте относятся к медицине (симптомы и болезни), описанные механизмы универсальны и применяются к любым четко определенным типам сущностей и их атрибутам. В патенте также упоминаются фильмы (атрибуты: актеры, режиссеры) и книги (атрибуты: темы, авторы). Это может применяться к продуктам, рецептам, персонам и так далее.
Что значит "максимально уточнить выбранные сущности" (maximally refine the selected entities) при генерации подсказок?
Система может предлагать дополнительные атрибуты (подсказки), чтобы помочь пользователю сузить поиск. "Максимальное уточнение" означает выбор таких атрибутов, которые, если их выберет пользователь, приведут к наибольшему изменению в списке предложенных сущностей. Это помогает быстрее найти правильный ответ, предлагая наиболее дифференцирующие признаки.
Как SEO-специалисту использовать знание о методе комбинированных запросов?
Метод комбинированных запросов оценивает сущность по качеству выдачи для запроса [исходный запрос] + [имя сущности]. Это означает, что страницы, посвященные сущности, должны быть хорошо оптимизированы не только под название сущности, но и под сочетание ее названия с ключевыми атрибутами. Необходимо убедиться, что такая страница авторитетна и релевантна обоим компонентам запроса.
Может ли система изменить стандартную выдачу на основе этих механизмов?
Да. Патент описывает несколько вариантов вывода результата. Система может показать блок с идентифицированными сущностями отдельно от стандартных результатов. Она также может продвигать в ранжировании (promote) те результаты исходного запроса, которые связаны с выбранными сущностями. В одном из вариантов система может полностью заменить стандартную выдачу результатами, собранными из комбинированных запросов (Combined Search Results).

Индексация
Семантика и интент
SERP

Семантика и интент
SERP

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Knowledge Graph
SERP

Knowledge Graph
Семантика и интент

Local SEO
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Ссылки
SERP
Свежесть контента

SERP
EEAT и качество
Персонализация

Local SEO
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Мультимедиа

Персонализация
Поведенческие сигналы
Семантика и интент

SERP
Семантика и интент
EEAT и качество

SERP
Поведенческие сигналы
Персонализация
