
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
Патент решает проблему деградации качества поиска, вызванную использованием некорректных или нерелевантных Substitution Rules (правил подстановки, например, синонимов) при автоматическом переписывании или расширении запросов. Если система подставляет термины, которые не соответствуют интенту пользователя, это ухудшает выдачу. Изобретение предлагает автоматизированный механизм обратной связи для валидации и удаления таких неэффективных правил на основе реальных данных о поведении пользователей.
Запатентована система автоматической оценки и управления правилами подстановки (Substitution Rules). Система анализирует агрегированные данные о взаимодействии пользователей (клики и пропуски) с результатами поиска, полученными по переписанным запросам (Revised Search Queries). Для каждого правила рассчитывается метрика качества (Quality Metric). Если метрика не удовлетворяет пороговому значению, правило автоматически удаляется из использования.
Система работает в два этапа:
Query Reviser Engine применяет существующее правило подстановки (например, A->B) для переписывания запроса. Пользователю показываются результаты, а его взаимодействия (клики и пропуски) записываются в Query Logs.Substitution Engine агрегирует данные логов для этого правила. Система анализирует, выбирали ли пользователи результаты, содержащие подставленный термин (B), или пропускали их, уделяя особое внимание "чистым" сигналам (Crucial Clicks/Skips). На основе этого рассчитывается Quality Metric (по сути, частота неудач). Если метрика указывает на низкую эффективность, правило удаляется. Оценка также учитывает контекст запроса.Высокая. Понимание запросов (Query Understanding) и корректная обработка синонимов являются центральными задачами современного поиска. Использование машинного обучения и поведенческих данных для валидации лингвистических моделей (NLP) — стандартная практика Google. Этот механизм обеспечивает самокоррекцию и поддержание релевантности системы синонимов.
Патент имеет значительное влияние на SEO (7.5/10). Он демонстрирует, как Google валидирует свое понимание языка и контекста через поведение пользователей. Поведенческие факторы напрямую влияют на слой Понимания Запросов. Для SEO это означает, что использование предполагаемых синонимов в контенте не гарантирует релевантности; только контент, который удовлетворяет интент пользователя и привлекает клики (подтверждая гипотезу Google о синонимичности), будет эффективным в долгосрочной перспективе.
Substitute Query Term) может быть использован для ревизии запросов, содержащих термин A (Original Query Term). Может зависеть от контекста.General Context) или специфическим (Specific Context), например, требующим наличия других слов в запросе.Claim 1 (Независимый пункт): Описывает базовый метод удаления правил подстановки.
Revised Search Queries), сгенерированных с использованием определенного правила подстановки.Query Log Data для этих запросов, идентифицируя (i) показанные результаты и (ii) выбранный пользователем результат.Quality Metric для правила на основе этих данных.Quality Metric не удовлетворяет пороговому значению (Threshold).Claim 4 (Зависимый от 1): Уточняет важность контекста.
Процесс включает идентификацию контекста (Context), связанного с правилом. Контекст определяет другие термины, которые должны присутствовать в запросе для применения правила. Оценка и удаление происходят в рамках этого контекста.
Claim 7 (Зависимый от 1): Определяет формулу для Quality Metric и используемые данные.
Метрика основана на взвешенных подсчетах: click count, skip count, both click count, both skip count, crucial click count, crucial skip count. W1-W6 — весовые коэффициенты.
Формула расчета Quality Metric:
Формула представляет собой: 1 - (Взвешенные Клики / (Взвешенные Клики + Взвешенные Пропуски)). Это означает, что Quality Metric измеряет частоту неудач (Failure Rate) правила. Высокое значение метрики указывает на плохое качество.
Изобретение является механизмом контроля качества и обратной связи для системы понимания запросов.
INDEXING – Индексирование
На этом этапе система анализирует контент документов. Эти данные необходимы для последующей классификации взаимодействий (чтобы определить, содержал ли результат исходный термин, подставленный термин или оба).
QUNDERSTANDING – Понимание Запросов
Основной этап применения.
Query Reviser Engine использует активные Substitution Rules для переписывания запроса пользователя в реальном времени.Substitution Engine выполняет процесс, описанный в патенте, — анализирует эффективность правил на основе логов и обновляет базу данных правил. Это петля обратной связи, улучшающая качество Query Understanding.RANKING / RERANKING
Взаимодействия пользователя с SERP, сформированной на этих этапах, собираются в Query Logs. Эти поведенческие сигналы служат входными данными для Substitution Engine.
Входные данные:
Query Log Data (переписанные запросы, показанные результаты, клики, пропуски).Substitution Rules и их контексты.Выходные данные:
Substitution Rules (удаление неэффективных правил или изменение их контекста).Query Log Data) для оценки конкретного правила.Quality Metric не удовлетворяет заданному порогу (например, превышает порог неудач в 40%).Офлайн-процесс оценки правила подстановки (A -> B)
Query Log Data для этих запросов в данном контексте (показанные результаты и действия пользователя).Crucial Click/Skip (Есть только B, нет A и других замен).Click/Skip (Есть B, нет A).Both Click/Skip (Есть A и B).Quality Metric (Failure Rate) по формуле.Quality Metric с пороговым значением (Threshold).Query Logs о кликах (Clicks) и пропусках (Skips) результатов поиска. Ранжирование результатов в момент показа.Context) применения правила.Система использует следующие метрики:
crucial_click_count, click_count, both_click_count, crucial_skip_count, skip_count, both_skip_count.Crucial, 1 для Normal, 0 для Both. Это подчеркивает важность чистых сигналов.Quality Metric. Пример в патенте: 40%. Если Quality Metric (частота неудач) превышает порог, правило удаляется.Both Clicks/Skips) имеют меньший вес.Query Understanding.Skips).Clicks.Skips и Crucial Skips.Патент подтверждает, что семантическое понимание Google — это динамическая система, которая постоянно обучается и корректируется на основе поведения пользователей. Это демонстрирует тесную связь между этапами RERANKING (где собираются поведенческие сигналы) и QUNDERSTANDING. Для долгосрочной SEO-стратегии это означает, что невозможно полагаться только на лингвистическую близость; необходимо ориентироваться на реальное поведение, язык и ожидания пользователей в нише.
Сценарий: Валидация синонима в E-commerce с учетом контекста
Quality Metric в норме.Crucial Skip) и кликают ниже на результаты о "беговых кроссовках".Crucial Skips. Quality Metric для правила "Кроссовки -> Сникеры" в контексте "беговые" не удовлетворяет порогу.Что такое "Substitution Rule" (Правило подстановки) в контексте этого патента?
Это инструкция для поисковой системы, указывающая, что один термин является синонимом или релевантной заменой для другого (например, "автомобиль" -> "машина"). Система использует эти правила для расширения или переписывания исходного запроса пользователя с целью улучшения результатов поиска. Этот патент описывает, как Google проверяет качество этих правил.
Что такое "Crucial Click" (Критический клик) и почему он так важен?
Crucial Click происходит, когда пользователь кликает на результат, который содержит ТОЛЬКО подставленный термин (синоним), и НЕ содержит исходный термин (и никакие другие синонимы). Это самый чистый и сильный сигнал, подтверждающий, что именно этот синоним был полезен и релевантен пользователю. В формуле расчета качества этим кликам придается наибольший вес.
Что такое "Crucial Skip" (Критический пропуск)?
Это сильный отрицательный сигнал. Он происходит, когда пользователь пропускает результат, удовлетворяющий критериям Crucial Click (содержит только синоним), и кликает на результат ниже. Это говорит Google, что данный синоним нерелевантен для пользователя в этом контексте, и правило подстановки, вероятно, следует удалить.
Почему взаимодействия типа "Both Click/Skip" менее важны?
Both Click/Skip происходит, когда результат содержит и исходный термин, и термин-заменитель. В этом случае невозможно точно определить, какой именно термин привел к клику или пропуску. Из-за этой неоднозначности патент предлагает присваивать таким взаимодействиям меньший вес (вплоть до нуля), чтобы не искажать оценку качества правила подстановки.
Как система учитывает контекст при оценке правил?
Система анализирует правила гранулярно. Quality Metric рассчитывается отдельно для каждого контекста (например, когда в запросе присутствуют другие определенные слова). Это позволяет сохранить правило для контекста, где оно полезно (много кликов), но удалить его для общего использования или других контекстов, где оно снижает качество выдачи (много пропусков).
Как рассчитывается Quality Metric и что означает её высокое значение?
Она рассчитывается по формуле: 1 минус (Взвешенные Клики / (Взвешенные Клики + Взвешенные Пропуски)). Эта формула измеряет частоту неудач (Failure Rate). Высокое значение Quality Metric (близкое к 1) означает ПЛОХОЕ качество правила (много пропусков). Если эта частота неудач превышает определенный порог (например, 40%), правило удаляется.
Означает ли этот патент, что CTR является фактором ранжирования?
Патент не описывает использование CTR для прямого ранжирования документов. Однако он четко показывает, что агрегированные поведенческие данные (клики и пропуски) используются для обучения и валидации систем понимания запросов (Query Understanding). Это косвенно влияет на ранжирование, определяя, какие синонимы будут использоваться при поиске.
Как SEO-специалисту использовать знания из этого патента на практике?
Необходимо сосредоточиться на удовлетворении интента и оптимизации вовлеченности. Используйте естественный язык и контекстуально уместные синонимы. Убедитесь, что пользователи активно взаимодействуют с вашим контентом (высокий CTR, низкий Bounce Rate), так как это помогает Google валидировать семантические связи между запросами и вашим контентом.
Происходит ли оценка правил в реальном времени?
Нет. Применение правил происходит в реальном времени при обработке запроса. Однако оценка эффективности правил (расчет Quality Metric) и их удаление — это офлайн-процесс, который анализирует агрегированные исторические данные (Query Log Data) в пакетном режиме.
Может ли мой сайт перестать ранжироваться по синонимам, если Google удалит правило подстановки?
Да. Если ваш контент оптимизирован под синоним (Термин B), а пользователи ищут Термин A, и Google ранее связывал их через правило A->B. Если это правило будет удалено из-за низкой эффективности, ваш контент может перестать считаться релевантным запросу A (если связь не установлена другими механизмами, например, векторными моделями).

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
SERP

Поведенческие сигналы
Семантика и интент
SERP

Мультимедиа
EEAT и качество
Семантика и интент

EEAT и качество
SERP
Ссылки

Индексация
Техническое SEO
Структура сайта

Поведенческие сигналы
SERP
Антиспам

Семантика и интент
SERP
Поведенческие сигналы

EEAT и качество
Ссылки
SERP

EEAT и качество
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Local SEO

Антиспам
Ссылки
Семантика и интент

Поведенческие сигналы
Индексация
Техническое SEO
