
Google использует несколько методов для ответа на запросы, которые описывают атрибуты (например, симптомы) и подразумевают поиск соответствующей сущности (например, болезни). Система может генерировать множество комбинированных запросов (Атрибут + Сущность), изменять исходный запрос (Атрибут + Тип Сущности) или анализировать выдачу по исходному запросу для выявления часто упоминаемых сущностей. Это позволяет предоставлять список релевантных сущностей и предлагать дополнительные атрибуты для уточнения поиска.
Патент решает задачу интерпретации поисковых запросов, которые содержат описание атрибутов (attributes) или признаков, но не называют саму сущность (entity). Цель — ответить на подразумеваемый вопрос пользователя: "Какая сущность соответствует этим атрибутам?". В патенте в качестве основного примера рассматривается медицинский поиск: пользователь вводит симптомы (атрибуты), а система должна идентифицировать соответствующие заболевания (сущности).
Запатентована система для идентификации сущностей на основе анализа результатов поиска. Когда система определяет, что запрос содержит атрибуты определенного типа сущности (например, симптомы для типа "медицинское состояние"), она использует один или несколько методов для определения конкретных сущностей. Эти методы включают анализ результатов поиска по исходному запросу, по модифицированным запросам (добавление типа сущности) или по серии комбинированных запросов (исходный запрос + название конкретной сущности).
Система работает по нескольким сценариям (embodiments):
Attribute Data Store) и что пользователь, вероятно, ищет сущности определенного типа.Summary Score).Attribute Suggestions) для уточнения поиска.Высокая. Идентификация сущностей и понимание их связей с атрибутами являются фундаментом современного поиска (Knowledge Graph, MUM). Описанные механизмы напрямую связаны с тем, как Google обрабатывает запросы, особенно в YMYL-тематиках (медицина), стремясь предоставить структурированные ответы и возможности для уточнения интента.
Влияние на SEO значительно (8/10). Патент раскрывает конкретные механизмы, с помощью которых Google связывает атрибуты и сущности. Для ранжирования в таких сценариях критически важно, чтобы контент четко ассоциировал сущность с ее атрибутами и был оптимизирован не только под общие запросы (атрибуты), но и под комбинированные запросы (атрибут + сущность). Это особенно важно для сайтов, фокусирующихся на продуктах, заболеваниях, фильмах, книгах и т.д.
Патент US8473489B1 является частью семейства патентов, описывающих разные методы идентификации сущностей. Конкретно этот патент фокусируется в своих Claims на методе модификации запроса путем добавления типа сущности.
Claim 1 (Независимый пункт): Описывает метод идентификации сущностей путем модификации запроса.
Claim 5 (Зависимый): Уточняет, что система может предварительно идентифицировать ресурсы, содержащие ссылки на сущности данного типа, и аннотировать (annotating) их в индексной базе данных.
Claim 6 (Зависимый от 5): Выбор названий сущностей включает выбор тех, которые наиболее часто (most frequently) встречаются в одном и том же ресурсе (с атрибутами из запроса).
Claim 9 (Зависимый): Описывает генерацию предложений атрибутов (Attribute Suggestions).
Claim 10 (Зависимый от 9): Предложения атрибутов выбираются так, чтобы они максимально уточняли (maximally refine) выбранные сущности.
Claims 14 и 15 (Зависимые от 9): Описывают реакцию на выбор пользователя: если пользователь подтверждает атрибут, генерируется новый запрос с его добавлением (AND); если отрицает — генерируется запрос с его исключением (NOT).
Изобретение затрагивает несколько этапов поиска.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных. Система анализирует ресурсы для идентификации сущностей и их атрибутов. Ресурсы могут быть аннотированы (annotated) в индексе для указания того, какие сущности или типы сущностей в них упоминаются. Также офлайн генерируются Entity Data Store и Attribute Data Store.
QUNDERSTANDING – Понимание Запросов
Основной этап активации. Система анализирует запрос, чтобы определить, содержит ли он атрибуты из Attribute Data Store и следует ли активировать механизм идентификации сущностей. Также на этом этапе могут генерироваться Attribute Suggestions.
RANKING – Ранжирование
Система выполняет поисковые запросы. В зависимости от реализации это может быть исходный запрос, модифицированный запрос (Атрибут + Тип Сущности) или множество комбинированных запросов (Атрибут + Сущность). Система получает стандартные оценки ранжирования (scores) для результатов.
RERANKING / METASEARCH – Переранжирование и Смешивание
На этом этапе происходит оценка результатов поиска для идентификации сущностей. Вычисляются Summary Scores для сущностей или анализируется совместная встречаемость. Финальный список сущностей формируется и предоставляется пользователю, часто отдельно от стандартных синих ссылок.
Входные данные:
Attribute Data Store (список атрибутов).Entity Data Store (список сущностей и их синонимов).Выходные данные:
Attribute Suggestions для уточнения.YMYL). Другие возможные применения: выбор продуктов по характеристикам, идентификация фильмов по актерам/сюжету, книг по темам.predetermined attributes). Это может определяться исключительно по тексту запроса.Attribute Data Store. Также может использоваться проверка на отсутствие терминов из "черного списка" (blacklist) или проверка того, что в запросе нет названия самой сущности.Патент описывает несколько альтернативных методов (embodiments) для идентификации сущностей. Ниже представлены три основных метода, детализированных в описании патента.
Общий этап: Активация
Attribute Data Store.Метод 1: Комбинированные запросы (Query + Entity Name) (Описан в FIG. 4, 5)
Entity Data Store) генерируется комбинированный запрос: Исходный запрос + Название сущности.scores) полученных результатов (например, сумма или среднее).Summary Score с использованием Inverse Document Frequency (IDF) названия сущности для снижения веса общеизвестных сущностей.Summary Score и выбор Топ-N или тех, что превышают порог.Метод 2: Модифицированный запрос (Query + Entity Type) (Описан в FIG. 7 и Claim 1)
Метод 3: Анализ результатов исходного запроса (Описан в FIG. 8, 9)
Патент фокусируется на использовании структуры данных и анализе результатов поиска.
Summary Score (Метод 1) или для взвешивания вхождений сущностей (Метод 3).Attribute Data Store может пополняться путем анализа ранее отправленных запросов (previously submitted queries) с помощью классификатора запросов (query classifier).Attribute Suggestions. Выбираются атрибуты, которые приведут к наибольшему изменению в списке отображаемых сущностей, если пользователь их выберет.IDF), чтобы предотвратить доминирование общеизвестных сущностей над более редкими, но потенциально более релевантными сущностями.maximally refine), что указывает на сложный анализ взаимосвязей между атрибутами.Attribute Data Store и аннотирование ресурсов в индексе для идентификации упоминаемых в них сущностей.Summary Score в Методе 1.Attribute Suggestions и будет релевантна уточненным запросам пользователя.Entity Data Store содержит оба варианта.Патент подтверждает стратегию Google по переходу от поиска по ключевым словам к пониманию сущностей и ответу на подразумеваемые вопросы. Он демонстрирует технические методы, используемые для построения связей в Knowledge Graph на лету, основываясь на контенте веба. Для SEO это подчеркивает необходимость фокусироваться на построении семантически богатого контента, который точно и полно описывает сущности и их взаимосвязи с атрибутами.
Сценарий: Оптимизация страницы медицинского сайта о "Тендините"
Какие основные методы идентификации сущностей описаны в патенте?
Патент описывает три основных метода. Первый (Комбинированные запросы) включает генерацию множества запросов вида [Атрибут + Конкретная Сущность] и оценку результатов. Второй (Модифицированный запрос, основной для Claims этого патента) включает генерацию запроса [Атрибут + Тип Сущности] и анализ совместной встречаемости атрибутов и сущностей в результатах. Третий метод анализирует результаты по исходному запросу [Атрибут] и подсчитывает упоминания сущностей в топовых документах.
Что такое Attribute Data Store и как он используется?
Это база данных, содержащая термины, которые система идентифицировала как атрибуты для определенного типа сущности (например, список симптомов). Она используется как триггер: если термины из запроса пользователя найдены в этом хранилище, система понимает, что пользователь ищет сущность по ее признакам, и запускает описанные в патенте механизмы идентификации.
Как система определяет, какие атрибуты предложить пользователю для уточнения (Attribute Suggestions)?
Система выбирает атрибуты, которые "максимально уточняют" (maximally refine) список уже идентифицированных сущностей. Это означает, что выбираются те атрибуты, подтверждение или отрицание которых пользователем приведет к наибольшему изменению в списке результатов. Это помогает быстрее сузить круг поиска до наиболее релевантной сущности.
Что такое Summary Score и почему он нормализуется?
Summary Score — это сводная оценка релевантности сущности, обычно вычисляемая в Методе 1 как агрегация оценок ранжирования документов, полученных по комбинированному запросу. Он нормализуется (например, с помощью IDF), чтобы снизить влияние очень популярных или часто упоминаемых сущностей, которые могут иметь завышенные оценки просто из-за своей известности, а не из-за релевантности конкретным атрибутам в запросе.
Как этот патент влияет на SEO-стратегию для контентных сайтов?
Он подчеркивает критическую важность четкой и явной связи между сущностями и их атрибутами в контенте. SEO-специалистам необходимо убедиться, что страницы оптимизированы не только под названия сущностей, но и под комбинации "сущность + атрибут". Контент должен быть структурирован так, чтобы поисковые системы могли легко извлечь эти связи для использования в любом из трех описанных методов.
Упоминается ли в патенте аннотирование ресурсов в индексе?
Да, патент явно упоминает возможность анализа ресурсов (например, во время индексации или офлайн) и их аннотирования (annotating) в индексной базе данных. Эти аннотации указывают, какие сущности или типы сущностей упоминаются в ресурсе. Это позволяет системе быстрее находить релевантный контент, особенно при использовании Метода 2 (Модифицированный запрос).
Как обрабатываются неоднозначные названия сущностей?
Патент признает проблему неоднозначности (ambiguity), когда название сущности может использоваться в разных контекстах. Для решения этой проблемы упоминается использование методов распознавания именованных сущностей (Named Entity Recognition, NER). Система стремится учитывать только те вхождения названия, которые действительно относятся к искомой сущности, а не к unrelated context.
Влияет ли авторитетность сайта на эти механизмы?
Патент напрямую не упоминает Site Quality или авторитетность как фактор. Однако все методы полагаются на стандартные оценки ранжирования (scores) поисковой системы. Если авторитетность влияет на эти базовые оценки (что обычно так), то она косвенно влияет и на результат идентификации сущностей. Например, в Методе 3 учитываются только сущности, найденные в топовых результатах поиска.
Применяется ли этот патент только к медицинской тематике?
Хотя все основные примеры в патенте относятся к медицине (симптомы и состояния), описанные технологии сформулированы обобщенно ("Identifying Entities"). Они применимы к любому типу сущностей, имеющему четкий набор атрибутов, например, к идентификации продуктов по характеристикам, фильмов по актерам или сюжетам, книг по темам и т.д.
Как система реагирует, если пользователь выбирает предложенный атрибут?
Патент описывает интерактивный процесс. Если пользователь подтверждает предложенный атрибут (например, нажимает "Да" напротив симптома), система генерирует новый запрос, включающий исходный запрос И этот атрибут. Если пользователь отрицает атрибут (нажимает "Нет"), система генерирует новый запрос с исключением этого атрибута (например, используя оператор NOT или "-").

Индексация
Семантика и интент
SERP

Семантика и интент
Knowledge Graph
Индексация

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Knowledge Graph
SERP

Knowledge Graph
Семантика и интент
SERP

EEAT и качество
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
EEAT и качество

Семантика и интент
Персонализация
SERP

Индексация
Техническое SEO
Структура сайта

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

SERP
Семантика и интент
EEAT и качество

EEAT и качество
Поведенческие сигналы
SERP

Ссылки
Антиспам
Краулинг

Мультиязычность
Поведенческие сигналы
