
Google использует механизм для уточнения поисковых подсказок, заменяя общие термины (Классы) на конкретные примеры (Сущности). Система автоматически извлекает связи «Класс-Сущность» из веб-документов и оценивает их надежность. Например, подсказка «свойства муравьиной кислоты» может быть специализирована до «плотность муравьиной кислоты», помогая пользователю сфокусировать интент.
Патент решает проблему ограниченности стандартных поисковых подсказок, которые обычно предлагают только завершение введенного текста (Query Completions). Это ограничивает разнообразие и не всегда помогает пользователю сузить свой интент. Цель изобретения — генерировать Query Specializations (специализированные запросы), которые направляют пользователя от общего класса сущностей к конкретному экземпляру этого класса.
Запатентована система для автоматической генерации специализированных поисковых подсказок на основе отношений Class-Instance (Класс-Сущность). Система извлекает эти отношения из веб-документов, оценивает их надежность (Weight) и заранее вычисляет потенциальные специализации для кандидатных запросов. Во время ввода запроса система предлагает не только стандартные завершения, но и специализации, где общий класс заменен конкретной сущностью.
Система работает в двух основных режимах: офлайн и онлайн.
Class-Instance (например, Класс="свойство", Сущность="плотность") из документов, используя лингвистические шаблоны (Extraction Patterns). Каждой паре присваивается вес на основе частоты (Frequency Score) и разнообразия шаблонов (Diversity Score). Затем система анализирует кандидатные запросы и генерирует базу данных специализаций, заменяя классы на сущности в общем контексте.Partial Query), система находит его возможные завершения (Query Completions). Для этих завершений система ищет заранее вычисленные специализации и предлагает их пользователю наряду со стандартными подсказками.Высокая. Понимание сущностей, их классов и иерархических отношений является фундаментальной задачей для современных поисковых систем (например, для Knowledge Graph). Хотя конкретные методы извлечения на основе паттернов, описанные в патенте, могли быть дополнены нейросетевыми моделями, сама концепция использования отношений Класс-Сущность для улучшения понимания запросов и активного управления интентом пользователя остается крайне актуальной.
Патент имеет высокое стратегическое значение для SEO (70/100). Он не описывает алгоритмы ранжирования, но напрямую влияет на то, что именно ищут пользователи, направляя их от общих запросов к специфическим. Он раскрывает механизмы, с помощью которых Google извлекает и структурирует знания из контента (особенно роль Diversity Score). Это критически важно для Entity SEO и построения эффективной контент-стратегии, охватывающей как классы, так и экземпляры.
Class Text) и конкретным экземпляром этого класса (Entity Text). Пример: (еда, пицца).noun phrase).Prefix Context (до) и Suffix Context (после). Используется для обеспечения релевантности замены класса на сущность.Extraction Patterns, с помощью которых была извлечена пара Класс-Сущность. Ключевой компонент расчета веса.Claim 1 (Независимый пункт): Описывает офлайн-процесс генерации и хранения специализаций запросов.
Class-Instance, извлеченных из документов с помощью Extraction Patterns.Weight (веса) для каждой пары. Ключевой момент: вес рассчитывается на основе Frequency Score (частота извлечения) и Diversity Score (количество уникальных паттернов, которые извлекли пару).Candidate Text Queries.Query Specializations путем модификации исходного запроса: замена n-граммы (совпадающей с Class Text) на соответствующий Entity Text.Context (префикс и суффикс) из запроса.Class Text.Entity Text и исходного Context.Claim 8 (Независимый пункт): Описывает онлайн-процесс использования сохраненных данных для предоставления подсказок.
Specialization Data (сгенерированные и взвешенные, как описано выше).Partial Query от пользователя.Candidate Queries, которые являются Completions (завершениями) частичного запроса.Query Specializations, связанных с этими завершениями, в сохраненных данных.Claim 31 (Независимый пункт): Описывает конкретную техническую реализацию процесса генерации специализаций, оптимизированную для масштабирования (например, MapReduce).
Процесс извлечения и генерации включает:
Изобретение охватывает несколько этапов поисковой архитектуры, фокусируясь на извлечении знаний и понимании запросов.
INDEXING – Индексирование и извлечение признаков
На этом этапе система анализирует корпус документов. Extraction Patterns применяются к тексту для извлечения сырых данных Class-Instance Pairs. Это фундаментальный процесс извлечения семантических отношений из неструктурированного текста (построение базы знаний/Knowledge Graph).
QUNDERSTANDING – Понимание Запросов
Основная часть изобретения реализуется здесь в двух режимах:
Frequency Score, Diversity Score и итогового Weight.Candidate Text Queries.Query Specializations. Сохранение в Specialization Data Store.Query Suggestion Module (Autocomplete) работает при вводе запроса пользователем. Он ищет стандартные Query Completions и запрашивает Specialization Data Store для поиска связанных специализаций. Затем происходит ранжирование и смешивание подсказок.Входные данные:
Extraction Patterns, Логи запросов.Partial Query пользователя.Выходные данные:
Specialization Data.Query Suggestions).Query Whitelist).Фаза А: Офлайн - Извлечение и Взвешивание пар Класс-Сущность
Extraction Patterns (например, "C, такие как I") к корпусу документов.Frequency Score (Freq(C, I)) — частота извлечения.Diversity Score (Size({Pattern(C, I)})) — количество уникальных паттернов.Фаза Б: Офлайн - Генерация Специализаций Запросов
Candidate Text Queries и взвешенные пары Класс-Сущность.Query Whitelist.Фаза В: Онлайн - Обслуживание Подсказок
Query Completions (Q).Query Specializations из Specialization Data Store.Extraction Patterns) для анализа структуры предложений.parts-of-speech tags) для идентификации Class Text как именной группы (noun phrase).Query log data используется для определения Candidate Text Queries и для формирования Query Whitelist.Ключевые метрики связаны с оценкой качества пар Класс-Сущность и ранжированием подсказок.
Оценка пар Класс-Сущность (C, I):
Ранжирование подсказок (Онлайн):
Weight) сильно зависит от Diversity Score (в примере формулы — квадратичная зависимость). Система больше доверяет связям, которые подтверждаются разнообразными лингвистическими конструкциями, а не только частым повторением одной и той же фразы.Context запроса, и может фильтровать результаты по Query Whitelist (реальные запросы пользователей).Diversity), а не только частоту (Frequency).Патент подтверждает стратегическую важность Entity SEO и четких семантических отношений. Это не просто о включении ключевых слов, а о том, как концепции связаны между собой (иерархии, таксономии). SEO-стратегии должны быть направлены на то, чтобы контент четко определял эти отношения, помогая поисковой системе строить свой граф знаний и максимизируя видимость сайта на этапе формирования запроса пользователем.
Сценарий: Оптимизация сайта по ремонту техники для улучшения извлечения отношений
Diversity Score) пары получают высокий Weight. Система с большей вероятностью будет использовать их для генерации специализаций в подсказках по запросу "проблемы iPhone".Что такое «Специализация запроса» (Query Specialization) в контексте этого патента?
Это автоматически сгенерированная поисковая подсказка, которая заменяет общий термин (Класс) в запросе на более конкретный пример (Сущность). Например, если пользователь вводит запрос, который может быть завершен как "свойства древесины" (Класс), система может предложить специализацию "плотность древесины" (Сущность). Цель — помочь пользователю быстрее перейти к более сфокусированному поиску.
Как Google определяет, что является Классом, а что — Сущностью?
Система использует автоматизированный подход, основанный на анализе веб-документов. Она применяет предопределенные лингвистические шаблоны (Extraction Patterns), такие как "[C] such as [I]" или "[C] including [I]". Например, из фразы "Еда, такая как пицца" система извлекает пару (Еда: Класс, Пицца: Сущность) на основе их позиции относительно ключевых фраз ("такие как", "включая", "например").
Как Google оценивает надежность связи между Классом и Сущностью?
Надежность оценивается с помощью Weight (веса), который рассчитывается на основе двух метрик: Frequency Score (насколько часто эта пара была извлечена) и Diversity Score (сколько различных лингвистических паттернов подтвердили эту связь). Высокий Diversity Score особенно важен, так как он указывает на консистентность связи в разных контекстах.
Что означает, что Diversity Score возводится в квадрат в формуле веса?
В примере формулы из патента () возведение Diversity Score в квадрат экспоненциально увеличивает важность разнообразия. Это означает, что связь, подтвержденная 5 разными способами, будет значительно весомее связи, подтвержденной только одним способом. Это критически важно для SEO: используйте разнообразный язык.
Могу ли я повлиять на то, какие специализации Google предлагает для моих запросов?
Да, косвенно. Поскольку система извлекает отношения Класс-Сущность из веб-контента, вы можете оптимизировать свой контент для улучшения этого процесса. Используйте четкие и последовательные формулировки, которые явно связывают общие категории с конкретными примерами, используя естественные лингвистические паттерны. Укрепление этих связей с высоким Diversity Score может увеличить итоговый Weight пар.
Как ранжируются специализации в списке подсказок?
Патент предлагает методы ранжирования, которые комбинируют два фактора: популярность исходного завершения запроса (Query Completion Weight) и силу связи Класс-Сущность (Weight(C,I)). Система использует формулы (например, линейную интерполяцию или Reciprocal Rank Fusion) для комбинирования этих оценок и определения итогового порядка.
Что такое Context (Контекст) и почему он важен для генерации специализаций?
Контекст — это слова, окружающие термин Класса в запросе (префикс и суффикс). Он критически важен для обеспечения релевантности. Система ищет ситуации, где Класс и Сущность взаимозаменяемы в одном и том же контексте. Например, в запросе "лучшие рестораны Москвы", контекст для "рестораны" — ("лучшие", "Москвы"). Система может заменить его на "пиццерии", только если он подходит под этот контекст.
Актуальны ли методы извлечения на основе паттернов в эпоху нейронных сетей (BERT/MUM)?
Хотя современные NLP-модели значительно превосходят простые паттерны в понимании языка, паттерны остаются эффективным методом для извлечения явных семантических отношений. Вероятно, Google использует гибридный подход. В любом случае, базовая концепция извлечения иерархий, описанная в патенте, и важность четкого выражения этих иерархий в контенте остаются актуальными для SEO.
Что такое Query Whitelist и как он влияет на показ специализаций?
Query Whitelist — это список допустимых или известных запросов (часто основанный на логах поиска). Патент упоминает, что сгенерированные специализации могут фильтроваться по этому списку. Это означает, что если специализация семантически верна, но такой запрос никто не использует (он неестественен), она может быть не показана пользователю.
Какова стратегическая роль этого патента в Entity SEO?
Этот патент является одним из фундаментальных для Entity SEO. Он демонстрирует, как Google переходит от сопоставления строк к пониманию отношений между концепциями и как он оценивает надежность этих отношений (через Weight). Для SEO это подчеркивает необходимость фокусироваться на построении четкой информационной архитектуры, таксономии и ясных семантических связей в контенте.

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Семантика и интент
Knowledge Graph
SERP


Семантика и интент
Knowledge Graph
SERP

Персонализация
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Ссылки
SERP

EEAT и качество
SERP
Ссылки

Knowledge Graph
Семантика и интент
Ссылки

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
Антиспам
SERP

SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP
