
Google идентифицирует многословные фразы (Concepts) в запросе и рассматривает их как единое целое. Это позволяет системе понять точный контекст остальных слов в запросе и сгенерировать высокоточные синонимы (замены) на основе анализа поведения пользователей в логах запросов, минуя вычислительные ограничения стандартного N-граммного анализа.
Патент решает проблему вычислительной сложности при определении контекста запроса для генерации замен (синонимов). Традиционно системы ограничиваются анализом одного или двух соседних слов (unigram, bigram), так как сложность растет экспоненциально с увеличением числа слов (N-gram). Это ограничивает точность, так как реальный контекст часто требует анализа более длинных фраз. Изобретение позволяет учитывать богатый контекст (триграммы и более) без критического увеличения вычислительной нагрузки.
Запатентована система генерации контекстно-зависимых правил замены терминов (Substitution Rules). Суть изобретения заключается в идентификации «Концептов» (Concepts) — последовательности слов, имеющих коллективное значение (например, «New York Times»). Система обрабатывает Концепт как единый элемент (one term) при определении контекста для соседних слов. Это позволяет эффективно анализировать логи запросов и выявлять точные замены, специфичные для данного Концепта.
Механизм работает в несколько этапов:
Collection of Concepts, идентифицируя известные фразы ("New York Times").Query Log, отслеживая, как пользователи переформулируют запросы, содержащие этот Концепт. Например, часто ли за запросом "New York Times Puzzle" следует "New York Times Crossword".Высокая. Понимание контекста и точная интерпретация запросов являются ядром современных поисковых систем. Использование сущностей (которые являются формой Concepts) для определения контекста — это фундаментальный принцип, который получил развитие в алгоритмах, основанных на трансформерах (BERT, MUM). Этот патент описывает эффективный механизм интеграции сущностей в процесс генерации синонимов.
Патент имеет высокое значение (85/100). Он объясняет, как Google генерирует высокоточные, контекстно-зависимые синонимы. Это напрямую влияет на то, как система интерпретирует запрос и какие документы считает релевантными. SEO-специалистам необходимо понимать, что значение ключевого слова может радикально меняться в зависимости от окружающих его Concepts. Стратегии, основанные на общих синонимах, будут неэффективны в нишах с четко определенными Концептами.
collective meaning), отличное от значения отдельных слов (например, "New York Times"). Система обрабатывает Концепт как единый элемент для определения контекста.Concepts в запросе, часто в определенной позиции относительно заменяемого термина.query term substitution data).revised) запросы на основе исходного запроса путем добавления, замены или удаления терминов, используя правила замены.Query Reviser Engine.Concepts.Claim 1 (Независимый пункт): Описывает метод сбора данных и принятия решения о замене на основе Концептов.
collective meaning), отличное от значений отдельных терминов. (Это определение Концепта).number of times), когда за этим исходным запросом следовал пересмотренный запрос, содержащий (i) ту же фразу (Концепт) и (ii) дополнительный пересмотренный термин (отличный от исходного).Ядром изобретения является использование факта наличия Концепта (фразы с коллективным значением) как триггера для анализа логов запросов и последующего принятия решения о генерации контекстно-зависимой замены на основе наблюдаемого поведения пользователей (частоты переформулировок).
Claim 2 (Зависимый от 1): Уточняет, что на основе частоты (number of times) и коллективного значения фразы (Концепта) принимается решение о генерации Substitution Rule, которое затем сохраняется.
Claim 3 (Зависимый от 2): Уточняет, что правило генерируется, если частота (number of times) удовлетворяет пороговому значению (frequency threshold).
Изобретение применяется в основном на этапе понимания запросов и влияет на этап ранжирования через механизм переписывания запросов.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Он включает два процесса:
Substitution Engine анализирует Query Logs для выявления паттернов переформулирования запросов.Collection of Concepts (аналог Knowledge Graph или базы сущностей) для идентификации Концептов в логах.Substitution Rules.Query Reviser Engine проверяет наличие соответствующих Substitution Rules для данного контекста.Revised Queries).RANKING – Ранжирование
Search Engine получает как исходный запрос, так и пересмотренные запросы и использует их для поиска и ранжирования результатов в Index Database. Наличие точных контекстных замен улучшает релевантность найденных документов.
Входные данные:
Query Logs (для офлайн-анализа).Collection of Concepts (база знаний о Концептах).Collection of Substitution Rules (для онлайн-применения).Выходные данные:
Substitution Rules (офлайн).Revised Queries) (онлайн).Concepts).Concepts.substitution data collection) для соседних терминов.frequency) переформулирования запроса (с Термина А на Термин Б в контексте Концепта) превышает определенный порог.Процесс разделен на две части: офлайн-генерация правил и онлайн-обработка запроса.
Процесс А: Офлайн-генерация правил замены
Query Log.Collection of Concepts. Проверяется, имеют ли эти последовательности коллективное значение (collective meaning).query term substitution data для последующих запросов в логе, которые включают идентифицированный Концепт(ы). Отслеживается, как часто пользователи меняют исходный термин на другой (пересмотренный) термин в этом контексте.number of times (частота) замен.frequency threshold, система генерирует Substitution Rule (Термин А -> Термин Б в Контексте X) и сохраняет его в Collection of Substitution Rules.Процесс Б: Онлайн-обработка запроса
Substitution Engine идентифицирует Концепты в запросе.Substitution Rules в базе данных, соответствующие идентифицированному контексту.Query Reviser Engine генерирует один или несколько Revised Queries, добавляя или заменяя термины согласно правилам.Search Engine.Патент фокусируется на использовании данных о поведении пользователей и предопределенных знаний о языке.
usage data) могут включать взаимодействие с результатами, что может использоваться для определения оценки уверенности (confidence score) для правил замены.Frequency, необходимое для генерации Substitution Rule.Query Logs. Google учится тому, как пользователи уточняют и переформулируют запросы в специфических контекстах.Collection of Concepts. Чем лучше Google распознает сущности и фразы, тем точнее будет контекст.Concepts в вашей тематике. Это основа для понимания контекста, в котором ранжируется ваш контент.Concepts. Это позволит Google точнее определять контекст запросов, связанных с вами, и генерировать релевантные замены.Concepts в запросе, страница не будет ранжироваться.collective meaning). Необходимо анализировать запрос через призму Концептов.Этот патент подтверждает стратегическую важность Entity-Oriented Search. Понимание запроса строится вокруг распознанных сущностей (Concepts). Для SEO это означает, что построение авторитетности в рамках определенного набора Концептов (Topical Authority) и четкое позиционирование контента относительно этих Концептов является ключом к релевантности. Система генерации синонимов Google — это не просто лингвистический инструмент, а механизм, управляемый данными о поведении пользователей и знаниями о мире (Collection of Concepts).
Сценарий: Оптимизация страницы под запрос с изменяющимся контекстом
Рассмотрим термин "Rate".
В чем ключевое отличие «Концепта» (Concept) от Сущности (Entity) в контексте этого патента?
В данном патенте термин Concept используется шире, чем современное понимание именованных сущностей (Named Entities). Concept определяется как любая последовательность слов, имеющая коллективное значение (collective meaning), отличное от суммы значений отдельных слов. Это могут быть как именованные сущности ("New York Times"), так и устоявшиеся фразы или технические термины. Главная функция Концепта здесь — служить единым элементом для эффективного определения контекста.
Как этот патент влияет на исследование ключевых слов (Keyword Research)?
Он радикально меняет подход к подбору синонимов. Недостаточно использовать общие инструменты типа Thesaurus. Необходимо анализировать контекст, в котором используется ключевое слово, и идентифицировать окружающие его Concepts. Исследование должно фокусироваться на выявлении тех специфических замен, которые пользователи реально используют в данном контексте, как это делает Google, анализируя Query Logs.
Как система определяет, является ли фраза Концептом?
Патент указывает на использование предопределенной базы данных (Collection of Concepts). Эта коллекция может формироваться различными способами, которые также упоминаются в патенте: автоматический парсинг справочников, словарей, индексов книг, или анализ логов запросов (например, выявление фраз, которые пользователи часто заключают в кавычки или объединяют оператором AND). На практике это соответствует данным из Knowledge Graph и другим базам знаний Google.
Почему Google просто не анализирует все соседние слова (N-граммы) для контекста?
Патент прямо указывает причину: вычислительная сложность (computation complexity). Анализ всех возможных комбинаций N-грамм (особенно при N>2) требует огромных ресурсов. Обработка многословного Concept как единого элемента позволяет учитывать богатый контекст без экспоненциального роста сложности вычислений.
Может ли система использовать несколько Концептов для определения контекста?
Да, патент явно описывает такие сценарии. Система может использовать два раздельных Концепта для определения контекста слова между ними (например, "New York" [Yankees] "Stadium"). Также она может объединять два смежных Концепта (например, "Social Security" + "Tax") для формирования единого, более точного контекста для последующих слов.
Откуда Google берет варианты для замен (синонимы)?
Основной источник, описанный в патенте, — это поведение пользователей, зафиксированное в Query Logs. Система отслеживает, как пользователи переформулируют свои запросы в рамках одной сессии. Если многие пользователи меняют Термин А на Термин Б в присутствии Концепта X, система учится, что Б является хорошей заменой для А в данном контексте.
Как я могу узнать, какие контекстные замены Google использует в моей нише?
Патент не предоставляет инструментов для внешнего анализа. Однако можно использовать косвенные методы: анализировать выдачу по запросам, содержащим ключевые Концепты, изучать блоки "Related Searches" и "People Also Ask". Также полезно анализировать собственный Search Console на предмет запросов, по которым показывается сайт, но которые не содержат прямых вхождений целевых ключей.
Влияет ли этот механизм на ранжирование напрямую?
Сам механизм напрямую не рассчитывает факторы ранжирования. Он работает на этапе Query Understanding и отвечает за генерацию пересмотренных запросов (Revised Queries). Однако эти пересмотренные запросы затем используются Search Engine для поиска и ранжирования. Более точные замены приводят к нахождению более релевантных документов, что косвенно значительно улучшает качество ранжирования.
Связан ли этот патент с алгоритмами типа BERT или MUM?
Патент был подан до появления BERT. Он описывает более ранний, но очень эффективный метод учета контекста, основанный на дискретных Concepts и анализе логов. Современные модели, такие как BERT и MUM, учитывают контекст на более глубоком уровне, используя механизмы внимания (attention) для всего предложения. Однако фундаментальная идея — что контекст критически важен для определения значения слова — остается общей, и данные, собранные механизмом из патента, могут использоваться для обучения или валидации нейронных сетей.
Что делать, чтобы мой бренд или продукт стал «Концептом»?
Чтобы фраза стала Concept, она должна быть узнаваемой и иметь устоявшееся коллективное значение. Для этого необходимо работать над узнаваемостью бренда, использовать консистентное написание названий продуктов, получать упоминания в авторитетных источниках (Википедия, СМИ), использовать микроразметку Schema.org для сущностей. Это поможет Google включить вашу фразу в Collection of Concepts.

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
EEAT и качество

Индексация
Семантика и интент

Семантика и интент
Индексация
Knowledge Graph

Мультиязычность
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Local SEO

Ссылки
EEAT и качество
Антиспам

Структура сайта
Техническое SEO
Индексация

Персонализация
SERP
Семантика и интент

EEAT и качество
Антиспам
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент
