
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
Патент решает задачу автоматизации процесса уточнения поисковых запросов. Он направлен на сокращение усилий пользователя, необходимых для поиска альтернативных формулировок и изучения смежных тем. Система призвана повысить точность и охват поиска, предлагая релевантные альтернативы (Refined Search Queries), которые помогают пользователям лучше понять контекст исходного запроса и разрешить возможные двусмысленности.
Запатентована система автоматической генерации уточненных поисковых запросов. Механизм основан на анализе документов, ранжирующихся по исходному запросу, и извлечении связанных с ними сущностей (entities). Ключевой особенностью является метод комбинирования этих сущностей с терминами исходного запроса (или их синонимами), при котором сохраняется относительный порядок исходных терминов для генерации естественных и релевантных предложений.
Система (Refinement Server) работает после получения результатов поиска по исходному запросу:
IDF) и фиксируется их порядок.Search Logs) и поведенческим метрикам (CTR, long clicks), и лучшие выбираются для показа пользователю.Высокая. Генерация связанных запросов («Related Searches», «People Also Ask») является стандартной и критически важной функцией современных поисковых систем. Описанные механизмы, такие как использование сущностей из топовых документов, анализ логов запросов и учет структуры языка для определения релевантных уточнений, остаются фундаментальными для понимания того, как Google направляет поисковые сессии пользователей и определяет смежные интенты.
Патент имеет высокое значение для SEO (8/10). Он раскрывает механизм, лежащий в основе генерации связанных запросов, и подчеркивает, что контент топовых страниц напрямую влияет на то, как Google понимает тематическое пространство вокруг запроса. Для SEO-специалистов это подтверждает необходимость интеграции релевантных сущностей в контент и улучшения поведенческих факторов для достижения тематического авторитета и влияния на предлагаемые поисковой системой уточнения.
previously-submitted search query) превышает пороговое значение.Term Score) и для ранжирования сущностей.IDF), используемая для определения важности отдельных терминов в исходном запросе.dwell time) на документе после клика. Используются для оценки релевантности документа и могут влиять на оценку связанных с ним сущностей.Claim 1 (Независимый пункт): Описывает основной метод генерации уточненных запросов с акцентом на сохранение структуры исходного запроса.
entity text strings (текстовых строк сущностей), связанных с документом. Этот процесс включает: term score) удовлетворяет порогу.particular order) в запросе.particular order), что и в исходном запросе.Примечание: Основной запатентованный механизм фокусируется на уточнении более длинных запросов (3+ важных термина), гарантируя сохранение их структуры.
Claim 2 (Зависимый): Уточняет процесс генерации кандидатов, позволяя заменять идентифицированный термин его синонимом при комбинировании с сущностью.
Claim 3 (Зависимый): Указывает, что выбор документа может основываться на его ранжировании (т.е. используются топовые документы).
Claim 4 (Зависимый): Описывает метод выбора сущностей. Сущности ранжируются на основе их частоты использования в качестве ранее поданных поисковых запросов. Используются только сущности с рангом выше порогового.
Claim 5 (Зависимый): Описывает альтернативный метод выбора сущностей. Сущности ранжируются на основе меры их частоты встречаемости в группе документов (результатах поиска).
Claim 7 (Зависимый): Указывает, что term scores (используемые в Claim 1 для идентификации важных терминов) могут быть значениями IDF.
Изобретение затрагивает несколько этапов поиска, связывая данные индекса с процессом понимания запросов и формированием финальной выдачи.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит идентификация и индексация сущностей, связанных с документами. Рассчитываются и сохраняются оценки (scores) для сущностей, такие как IDF, частота использования в качестве запросов, данные о кликах (Long Clicks).
QUNDERSTANDING – Понимание Запросов
Система анализирует исходный запрос для выявления важных терминов (используя IDF) и использует Search Log(s) для валидации кандидатов.
RANKING – Ранжирование
Генерируется первичный набор результатов поиска, который определяет, какие документы будут использованы для извлечения сущностей.
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента. После этапа RANKING, Refinement Server анализирует топовые документы и их сущности. Затем он генерирует блок уточненных запросов (например, «Related Searches»), который смешивается с основными результатами для формирования итоговой SERP.
Входные данные:
IDF, click data).Search Log(s): логи предыдущих запросов, CTR.Выходные данные:
Refined Search Queries).IDF выше порога) и когда в топовых документах можно идентифицировать значимые сущности (с оценкой выше порога).Процесс генерации уточненных поисковых запросов:
Entity Score (см. раздел Метрики) и выбирается подмножество лучших.IDF выше порога). Проверяется наличие трех или более таких терминов и фиксируется их порядок.Search Log(s), CTR, суммы IDF терминов и других критериев.Патент описывает использование следующих типов данных:
entities), извлеченные из содержания документов. Оценка сущности может быть повышена, если она найдена в заголовке (title) документа.Search Log(s) для определения популярности сущностей и валидации кандидатов. Также используются данные о кликах (click data), включая CTR и время пребывания на документе (dwell time), для различения Long Clicks и Short Clicks.Система вычисляет несколько ключевых метрик для ранжирования:
IDF.IDF каждого слова в сущности.Long Click. Оценка увеличивается с ростом отношения Long Clicks к общему числу кликов.Search Log(s), CTR, и сумме IDF терминов в кандидате.entities, которые часто сами являются популярными поисковыми запросами (подтверждено Search Log(s)). Это связывает контентную оптимизацию с реальным поисковым поведением.IDF используется для оценки важности как отдельных терминов в запросе, так и целых сущностей. Это подчеркивает важность использования в контенте терминов, которые являются отличительными и значимыми в рамках тематики.Long Clicks. Сущности, связанные с контентом, который хорошо удовлетворяет интент пользователя, получают более высокий приоритет при генерации уточнений.Long Clicks повышают оценку связанных сущностей (Entity Score), критически важно создавать контент, который полностью удовлетворяет интент пользователя, удерживает его внимание и предоставляет исчерпывающую информацию.IDF). Пишите естественно, так как система учитывает порядок слов для генерации корректных предложений.Short Clicks), будет снижать Entity Score связанных с ним сущностей.Этот патент подчеркивает переход от простого сопоставления ключевых слов к более сложному механизму, объединяющему анализ контента (сущности), анализ поведения пользователей (логи запросов, Long Clicks) и лингвистический анализ (сохранение порядка слов, синонимы). Стратегическое значение для SEO заключается в необходимости построения семантически богатого, авторитетного контента, который соответствует реальным поисковым паттернам пользователей. Влияние на «Related Searches» — это не только источник трафика, но и индикатор того, насколько хорошо Google понимает ваш контент в контексте общей темы.
Сценарий 1: Сохранение порядка слов (Пример из патента)
Сценарий 2: Использование синонимов (Пример из патента)
SEO-действие: При оптимизации контента необходимо убедиться, что ключевые сущности естественно интегрированы в текст и связаны с основными интентами, а также использовать релевантные синонимы для расширения охвата.
Что такое «сущность» (Entity) в контексте этого патента?
Сущность определяется как значимая, самодостаточная концепция (слово или фраза), найденная в документе. Важно, что патент часто определяет сущность как строку символов, которая часто используется в качестве реального поискового запроса пользователями (т.е. популярна в Search Log(s)). Это не просто ключевое слово, а концепция, связанная с поисковым поведением.
Как Google определяет, какие сущности использовать для генерации связанных запросов?
Система выбирает сущности из документов, которые ранжируются в топе по исходному запросу. Затем эти сущности ранжируются на основе Entity Score. Эта оценка учитывает множество факторов: IDF сущности, как часто она встречается в логах запросов, присутствует ли она в заголовках документов, и связана ли она с Long Clicks (удовлетворенностью пользователей).
Что означает правило «сохранения порядка слов» и почему оно важно?
Это правило гарантирует, что при комбинировании сущности с терминами из исходного запроса относительный порядок этих терминов сохраняется. Например, если запрос "ремонт iphone после воды", а сущность "цена", Google может сгенерировать "ремонт iphone после воды цена", но не "ремонт после воды iphone цена". Это критично для создания естественных и логичных предложений.
Как этот патент связан с Topical Authority (Тематическим авторитетом)?
Он напрямую связан. Чтобы влиять на генерацию связанных запросов, ваш сайт должен ранжироваться в топе и содержать релевантные сущности, которые Google высоко оценивает. Сайт с высоким тематическим авторитетом естественным образом покрывает множество сущностей в рамках темы и удовлетворяет интент пользователя (Long Clicks), тем самым определяя, как Google видит взаимосвязи в этой тематике.
Какую роль играет IDF в этом патенте?
IDF (Обратная частота документа) играет центральную роль. Она используется для трех целей: 1) Идентификация важных терминов в исходном запросе (Term Score). 2) Оценка важности сущности (Entity Score). 3) Оценка качества финальных кандидатов (Candidate Score). Это подчеркивает важность использования значимых и отличительных терминов в контенте.
Может ли Google использовать синонимы при генерации связанных запросов?
Да, патент явно предусматривает (Claim 2) возможность замены термина из исходного запроса его синонимом при комбинировании с сущностью. Это позволяет системе генерировать семантически близкие, но текстуально отличающиеся варианты уточненных запросов.
Как поведенческие факторы (клики) влияют на этот процесс?
Поведенческие факторы критичны для оценки сущностей. Патент упоминает использование Long Clicks (длительное пребывание на странице) как индикатора релевантности. Сущности, связанные с контентом, который генерирует Long Clicks, получают более высокий Entity Score и с большей вероятностью будут использованы для генерации уточнений.
Влияет ли этот механизм на все типы запросов?
Хотя базовый принцип использования сущностей применим широко, основной механизм, описанный в Claim 1 (сохранение порядка слов), специфически нацелен на запросы, содержащие три или более важных термина. Для более коротких запросов могут применяться другие методы.
Как использовать знания из этого патента для улучшения SEO-стратегии?
Необходимо сместить фокус с отдельных ключевых слов на комплексное покрытие сущностей в рамках темы. Анализируйте топовых конкурентов на предмет используемых ими сущностей, интегрируйте эти сущности в свой контент (особенно в заголовки) и убедитесь, что контент максимально полно отвечает на запрос пользователя, чтобы стимулировать Long Clicks.
Откуда Google берет данные для этого алгоритма?
Google использует три основных источника: Индексные файлы, где хранятся связи между документами и сущностями, а также их оценки (например, IDF); Search Log(s), которые содержат информацию о реальных запросах пользователей и их частоте; и данные о поведении пользователей (клики и время пребывания на сайте).

Семантика и интент
SERP
Поведенческие сигналы

SERP
Поведенческие сигналы
EEAT и качество

Поведенческие сигналы
SERP

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
Local SEO
Персонализация

EEAT и качество
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

EEAT и качество
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Ссылки
Knowledge Graph

Семантика и интент
Персонализация
Поведенческие сигналы

Ссылки
Индексация
Поведенческие сигналы

Семантика и интент
EEAT и качество
SERP

Персонализация
Поведенческие сигналы
SERP
