
Google использует систему для ответа на запросы, которые перечисляют атрибуты (например, симптомы), но ищут сущность (например, болезнь). Система определяет связь между ними, используя несколько методов: предварительное аннотирование индекса связями сущностей, анализ частоты упоминания сущностей в топе выдачи или генерацию комбинированных запросов. Также система предлагает дополнительные атрибуты для уточнения.
Патент решает проблему обработки поисковых запросов, которые неявно задают вопрос о сущности (Entity) путем перечисления ее атрибутов (Attributes). Пользователи часто вводят признаки (например, симптомы, характеристики товара, актеров) и ожидают получить названия соответствующих сущностей (например, болезней, моделей товара, фильмов). Например, запрос «болит ступня» неявно спрашивает: «Какое медицинское состояние связано с этим симптомом?». Система призвана идентифицировать эти сущности и представить их пользователю.
Запатентована система и несколько методов для идентификации сущностей на основе атрибутов, указанных в запросе, с использованием результатов поиска. Основная идея заключается в использовании поискового индекса и сигналов ранжирования для установления связи между атрибутами в запросе и сущностями-кандидатами. Патент описывает различные подходы, включая предварительное аннотирование документов в индексе, анализ совместной встречаемости в результатах поиска и активную проверку гипотез путем генерации Combined Queries.
Система использует несколько подходов (embodiments) для решения этой задачи:
Attribute Data Store).score) на основе частоты их упоминания в этих ресурсах и ранга самих ресурсов.Combined Queries (Исходный Запрос + Имя Сущности). Для каждой сущности вычисляется сводная оценка (Summary Score) на основе качества результатов ее комбинированного запроса.Attribute Suggestions) для интерактивного уточнения списка сущностей.Высокая. Понимание сущностей и их атрибутов является фундаментом современного семантического поиска и Knowledge Graph. Механизмы, описанные в патенте, особенно актуальны для YMYL-запросов (в частности, медицинских, которые используются как основной пример), где Google активно пытается связать симптомы с авторитетной информацией о состояниях. Это напрямую связано с E-E-A-T и предоставлением точных ответов на сложные запросы.
Патент имеет высокое значение (85/100). Он описывает механизмы, с помощью которых Google устанавливает связь между контентом, сущностями и их атрибутами. Понимание этих методов критически важно для SEO в YMYL-нишах и для любой стратегии, ориентированной на семантический охват и Topical Authority. Это влияет на то, как контент должен быть структурирован, чтобы помочь Google корректно распознавать и аннотировать основные сущности на странице (Entity Association).
Index Database), которые указывают, что ресурс связан с конкретными сущностями. Создаются на этапе индексирования.scores) результатов поиска, полученных в ответ на комбинированный запрос для этой сущности.Патент содержит несколько наборов Claims, описывающих разные методы. Проанализируем ключевые независимые пункты.
Claim 1 (Независимый пункт): Описывает метод, основанный на предварительном аннотировании индекса (соответствует FIG. 8). Это основной защищаемый метод.
threshold number of occurrences).Index Database с указанием идентифицированных связанных сущностей.Ядро изобретения здесь — использование порогового значения упоминаний сущности для создания устойчивой аннотации в индексе и последующее использование этой аннотации для идентификации сущностей во время поиска.
Claim 3 (Зависимый от 1): Уточняет процесс идентификации вхождений.
Идентификация вхождений имени сущности включает определение того, что одно или несколько вхождений имени в контенте не относятся к данной сущности (процесс разрешения неоднозначности или Named Entity Recognition).
Claim 5 (Зависимый от 1): Уточняет процесс выбора сущностей.
Выбор имен включает ранжирование каждой идентифицированной сущности на основе количества ресурсов из результатов поиска, с которыми она связана, и выбор имен на основе этого ранжирования.
Claim 9 (Зависимый от 8): Уточняет выбор предложений атрибутов (Attribute Suggestions).
Генерация предложений включает идентификацию связанных атрибутов для выбранных сущностей и выбор тех атрибутов, которые максимально сужают (maximally refine) список выбранных сущностей.
Изобретение затрагивает несколько этапов поиска, в зависимости от конкретного метода (embodiment).
INDEXING – Индексирование и извлечение признаков
Критически важен для методов, основанных на аннотировании (Claim 1).
Named Entity Recognition). Она должна разрешать неоднозначности (Claim 3).Index Database), связывающую ресурс с сущностью.Attribute Data Store терминами из логов запросов и анализа ресурсов.QUNDERSTANDING – Понимание Запросов
Attribute Data Store. Это определяет дальнейшую логику обработки запроса (активировать идентификацию сущностей или обработать стандартно).RANKING – Ранжирование
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Summary Scores.Attribute Suggestions.promoting) в ранжировании те результаты исходного поиска, которые связаны с выбранными сущностями.YMYL-тематики, особенно медицину (все примеры в патенте медицинские: симптомы и состояния). Также может применяться в других вертикалях, где есть четкие связи атрибут-сущность (кино, книги, продукты, E-commerce).Attribute Data Store.Патент описывает несколько методов. Опишем два основных.
Алгоритм А: Идентификация сущностей через аннотирование индекса (Claim 1, FIG. 8)
Этап 1: Индексирование (Офлайн)
threshold number of occurrences), сущность считается связанной с ресурсом.Index Database метаданными, указывающими на связанные с ним сущности.Этап 2: Обработка запроса (Онлайн)
Attribute Data Store), что он содержит атрибуты и следует вернуть имена сущностей.Алгоритм Б: Идентификация сущностей через комбинированные запросы (Описано в патенте, FIG. 4-6)
Combined Query (Q+E).Summary Score). Это функция (например, сумма, среднее) от оценок ранжирования (scores) результатов, полученных для ее комбинированного запроса.Summary Score может быть нормализован с учетом обратной частоты документа (Inverse Document Frequency, IDF) имени сущности, чтобы снизить влияние общеупотребимых сущностей.Summary Scores.Attribute Data Store: Список известных атрибутов.Entity Data Store: Список известных сущностей и их синонимов.Index Database: Индекс ресурсов, включающий аннотации о связанных сущностях.Ranking Scores: Оценки ранжирования, присвоенные поисковой системой результатам поиска.query log) могут использоваться офлайн-классификатором (Query Classifier) для наполнения Attribute Data Store.Для метода аннотаций (Алгоритм А, Claim 1):
Для метода комбинированных запросов (Алгоритм Б):
Combined Query. Может быть суммой, средним арифметическим, геометрическим средним или гармоническим средним оценок ранжирования Топ-N результатов.Общие метрики:
Attribute Suggestions. Выбираются атрибуты, которые обеспечивают наибольшее изменение (сужение) в списке результатов при их добавлении к запросу.threshold number of occurrences).Named Entity Recognition (NER), чтобы убедиться, что упоминание действительно относится к нужной сущности (Claim 3), прежде чем учитывать его при аннотировании или подсчете оценок. Контекст упоминания критичен.IDF для нормализации оценок, чтобы обеспечить релевантность, а не только популярность.E-E-A-T), чтобы участвовать в процессе идентификации сущностей.MedicalCondition и signOrSymptom, или Product и его свойства). Это помогает системам индексирования однозначно интерпретировать контент и улучшает качество аннотаций.NER и проигнорировать упоминания, которые она не смогла однозначно связать с нужной сущностью (Claim 3).Этот патент подтверждает стратегический курс Google на переход от ключевых слов к сущностям и их взаимосвязям (основа Knowledge Graph). Он описывает конкретные механизмы, лежащие в основе семантического понимания контента и запросов. Для SEO это означает, что стратегия должна быть сосредоточена на построении тематического авторитета (Topical Authority) и превращении сайта в надежный источник информации о конкретных сущностях и их атрибутах. В YMYL-тематиках это напрямую связано с демонстрацией E-E-A-T.
Сценарий: Оптимизация страницы о заболевании (Сущность) для ранжирования по симптомам (Атрибутам)
Задача: Продвинуть страницу о "Плантарном фасциите" по запросу [жгучая боль в пятке утром].
E-E-A-T, ссылки, технические факторы), чтобы она попала в Топ-N результатов по запросу [жгучая боль в пятке утром].Как Google определяет, является ли термин в запросе "атрибутом" сущности?
Система использует Attribute Data Store — базу данных терминов, предварительно идентифицированных как атрибуты определенного типа сущностей (например, симптомы). Эта база может пополняться автоматически с помощью классификатора (Query Classifier), который анализирует логи запросов и корпус документов, выявляя термины, часто встречающиеся в контексте определенного типа сущностей.
Патент описывает несколько разных методов. Какой из них основной?
Метод, основанный на аннотировании индекса (описан в Claim 1 и FIG. 8), является основным защищаемым механизмом в этом патенте. Он более масштабируем, так как основная работа выполняется офлайн на этапе индексирования. Однако Google может использовать и другие методы, такие как Комбинированные запросы, выборочно или в комбинации для повышения точности.
Как система определяет, что страница действительно связана с сущностью, а не просто упоминает её?
Патент предлагает конкретный механизм в Claim 1: использование порогового числа вхождений (threshold number of occurrences). Если имя сущности упоминается на странице достаточно часто, система считает страницу связанной с этой сущностью и аннотирует её соответствующим образом в индексе. При этом используется NER для подтверждения контекста.
Что делать, если имя сущности неоднозначно (например, "Apple")?
Патент явно указывает на использование технологий распознавания именованных сущностей (NER) (Claim 3). Система анализирует контекст упоминания, чтобы определить, относится ли оно к нужной сущности. Для SEO критически важно предоставлять четкий контекст вокруг упоминаний сущностей, использовать связанные термины и определения, чтобы помочь системе правильно их интерпретировать.
Что такое Attribute Suggestions и как они выбираются?
Это предложения дополнительных атрибутов для уточнения запроса (например, предложение других симптомов). Патент указывает, что выбираются атрибуты, которые «максимально сужают» (maximally refine) список идентифицированных сущностей (Claim 9). Это означает, что предлагаются наиболее диагностически значимые атрибуты, которые помогут быстрее отсеять нерелевантные сущности.
Влияет ли этот патент на ранжирование обычных «синих ссылок»?
Да, может влиять. В одном из вариантов реализации (Claim 7) упоминается повышение (promoting) результатов поиска, которые идентифицируют ресурсы, связанные с выбранными именами сущностей. Если ваша страница четко связана с сущностью, которую система идентифицировала как ответ на запрос, она может получить бустинг в ранжировании.
Влияет ли популярность сущности на её выбор системой?
Да, но система пытается это контролировать. Более популярные сущности чаще упоминаются в документах и могут получать завышенные оценки. Патент предлагает использовать нормализацию на основе обратной частоты документа (IDF) имени сущности (в описании альтернативных методов), чтобы снизить влияние общеупотребительных сущностей и повысить релевантность.
Какое значение этот патент имеет для E-commerce сайтов?
Значение очень высокое. Хотя примеры медицинские, механизм универсален. Продукты (сущности) ищут по их характеристикам (атрибутам). Для эффективного ранжирования по запросам типа [ноутбук с экраном 14 дюймов и SSD 1TB], страницы продуктов должны быть четко связаны с сущностью (модель ноутбука) и содержать все релевантные атрибуты.
Если мой сайт является авторитетным источником (высокий E-E-A-T), поможет ли это мне в контексте этого патента?
Да, безусловно. Авторитетность и высокое ранжирование вашего контента играют ключевую роль во всех описанных методах. В методах, основанных на анализе SERP (включая Алгоритм А), система анализирует только топовые результаты. Если ваш авторитетный сайт находится в топе по исходному запросу, его аннотации или контент будут иметь решающее значение при идентификации сущностей.
Как этот патент связан с Knowledge Graph?
Этот патент описывает конкретные механизмы для наполнения и использования данных, которые лежат в основе Knowledge Graph. Он предоставляет алгоритмы для установления связей между атрибутами и сущностями на основе анализа веб-документов, что является фундаментальной задачей для построения графа знаний.

Семантика и интент
SERP

Семантика и интент
Knowledge Graph
Индексация

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Knowledge Graph
SERP

Knowledge Graph
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

SERP
Семантика и интент
EEAT и качество

Персонализация
Ссылки

Поведенческие сигналы
Ссылки

Поведенческие сигналы
SERP

Антиспам
SERP
Ссылки

Поведенческие сигналы
Мультимедиа
Семантика и интент

Поведенческие сигналы
Индексация
Техническое SEO

SERP
Поведенческие сигналы

EEAT и качество
Антиспам
Ссылки
