
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
Патент решает проблему нехватки данных о поведении пользователей (User Behavior Data, например, кликов и времени пребывания на странице) для точного ранжирования результатов по новым, редким или длиннохвостым запросам. Стандартные алгоритмы ранжирования, опирающиеся на поведенческие сигналы для оценки релевантности, неэффективны при отсутствии этих данных (Insufficient User Behavior Data). Изобретение позволяет улучшить качество выдачи для таких запросов, используя данные из семантически близких запросов с богатой историей.
Запатентована система, которая при недостаточности поведенческих данных для исходного запроса идентифицирует и оценивает схожесть исторических запросов. Система использует сложный механизм взвешивания терминов (учитывая их важность, синонимы, порядок и целостность составных фраз) для расчета оценки схожести (Match Score). Затем она агрегирует User Behavior Data из наиболее похожих запросов и использует эти данные для генерации статистик качества результатов (Quality of Result Statistic), которые влияют на ранжирование исходного запроса.
Система работает следующим образом:
User Behavior Data для исходного запроса.Regular/Variant), опциональные (Optional) или стоп-слова (Stopword).Match Score (используя аддитивные и мультипликативные оценки), учитывая веса терминов и применяя штрафы за отсутствие терминов, нарушение порядка слов или «разрыв» составных фраз (Broken Compound Terms).User Behavior Data комбинируются (например, через взвешенное среднее или ограниченное агрегирование).Quality of Result Statistic для документов, которые затем используются для корректировки их позиций в выдаче.Высокая. По мере роста голосового поиска и появления уникальных запросов, проблема нехватки исторических данных остается крайне актуальной. Способность Google использовать поведенческие сигналы из смежных запросов для оценки релевантности является ключевым компонентом современных систем ранжирования, особенно для обеспечения качества в «длинном хвосте».
Патент имеет высокое стратегическое значение (8/10). Он показывает, что эффективность сайта по популярным и смежным запросам может напрямую влиять на его ранжирование по редким или новым запросам в той же тематике. Это подчеркивает важность построения тематического авторитета (Topical Authority) и комплексного удовлетворения интента пользователей в рамках всего кластера запросов, а не только оптимизации под конкретные ключевые слова.
click data (клики) и время пребывания (dwell time) на документе (long clicks, short clicks).User Behavior Data.User Behavior Data, указывающая на релевантность документа конкретному запросу. Используется как входной сигнал для процесса ранжирования.Input Query и Historical Query.Regular или Variant), который должен присутствовать (точно или в виде варианта) в историческом запросе, чтобы он считался похожим.Compound Term из входного запроса присутствует в историческом запросе, но его концепция нарушена (например, изменен порядок слов или вставлены другие слова).Claim 1 (Независимый пункт): Описывает основной метод использования схожих запросов для ранжирования, включая строгие условия фильтрации.
user-submitted query), система оценивает (scoring) один или несколько других запросов на основе их схожести с исходным.required term) термина. Если нет – запрос удаляется из рассмотрения.match score) для оставшихся запросов путем корректировки оценки на вес каждого совпавшего термина. Все корректировки выполняются одной и той же операцией (либо сложение, либо умножение).quality of result statistic) для документа на основе данных о поведении пользователей, связанных с выбранными запросами.Ключевой момент интерпретации: Система жестко фильтрует кандидатов — если обязательный термин отсутствует, запрос не рассматривается. Это гарантирует сохранение основного интента.
Claim 9 (Зависимый от 1): Детализирует расчет оценки схожести с использованием двух метрик.
multiplicative match score) на основе умножения весов и Абсолютной (absolute match score) на основе сложения весов.Claim 11 (Зависимый от 1): Добавляет концепцию вариативных терминов.
Система также получает вариативные термины (variant terms) и их варианты (variants) с соответствующими весами. Расчет оценки схожести включает добавление веса вариативного термина, если он присутствует в другом запросе.
Изобретение применяется на стыке понимания запросов и ранжирования, используя предварительно обработанные данные о поведении пользователей.
INDEXING – Индексирование и извлечение признаков
На этом этапе (или в смежных офлайн-процессах) происходит сбор и агрегация User Behavior Data (клики, dwell time) для исторических запросов. Эти данные сохраняются в репозитории.
QUNDERSTANDING – Понимание Запросов
Система анализирует входной запрос для определения типов его терминов (Regular, Variant, Optional, Stopword) и генерации вариантов (синонимов, стемминга). Также на этом этапе могут идентифицироваться составные термины (Compound Terms) с помощью Compound Term Identification Engine.
RANKING – Ранжирование / RERANKING – Переранжирование
Основное место применения патента. Query Results Rank Modifier (или Rank Modifier Engine) вмешивается в процесс ранжирования.
User Behavior Data для входного запроса. Если данных недостаточно, активируется механизм поиска похожих запросов.Query Scoring Engine рассчитывает Match Scores между входным запросом и кандидатами исторических запросов, используя детальный алгоритм взвешивания и штрафов.User Behavior Data, используя один из методов агрегации (например, взвешенное среднее).Quality of Result Statistics для документов. Эти статистики передаются в Ranking Engine как дополнительный сигнал для определения финального порядка результатов.Входные данные:
User Behavior Data.Compound Terms.Выходные данные:
Quality of Result Statistics для документов, основанные на комбинированных данных похожих запросов.diacritical variants), и адаптирует расчет схожести в зависимости от строгости их использования в конкретном регионе (locale).insufficiency) данных о поведении пользователей для исторического запроса, идентичного входному запросу.Этап 1: Инициализация и Проверка Данных
User Behavior Data для идентичного исторического запроса. Quality of Result Statistics и перейти к Этапу 5.Этап 2: Взвешивание Терминов Входного Запроса
Regular, Variant, Optional или Stopword.Variant Terms генерируются варианты (синонимы, стемминг) с весами, основанными на степени схожести, с учетом локали (для диакритических вариантов).Этап 3: Расчет Сходства Запросов
Required Term) не найден (ни точно, ни как вариант) в историческом запросе, этот исторический запрос исключается из рассмотрения.AMS (сложение) и MMS (умножение).Out of Order Penalty) или если Compound Terms из входного запроса «разбиты» (Broken Compound Penalty).AMS, MMS или их линейная аппроксимация, часто в зависимости от разницы в длине запросов.Этап 4: Выбор и Комбинирование Данных
Match Scores.Этап 5: Финализация и Ранжирование
Quality of Result Statistics отправляются в систему ранжирования.click data), время пребывания на документе (dwell time, long/short clicks). Также может использоваться информация о сессии, местоположении пользователя, языке.variants) терминов.Compound Terms).Основной фокус патента — расчет схожести запросов и комбинирование данных.
Метрики схожести запросов:
Regular/Variant=1.0; Optional=0.4-0.6; Stopword=0.1-0.2. Веса вариантов зависят от степени схожести.User Behavior Data для ранжирования. Если прямых данных нет, система готова использовать данные из похожих запросов, считая их достаточно надежным индикатором релевантности.Regular, Optional, Stopword), учитывает синонимы и стемминг (Variants), а также строго наказывает за нарушение порядка слов и разрыв концепций (Broken Compound Terms).required/regular) термин отсутствует в историческом запросе, такой запрос может быть полностью исключен из рассмотрения. Это защитный механизм против заимствования данных из нерелевантных источников.Variant Terms (синонимы, стемминг) для поиска похожих запросов, важно включать релевантные синонимы и различные формы ключевых слов в контент. Это увеличивает вероятность того, что ваш контент будет признан релевантным для широкого спектра формулировок.Broken Compound Terms) при поиске похожих запросов. Это подтверждает важность оптимизации под сущности и их взаимосвязи.Required Terms) целевых запросов. Поскольку отсутствие этих терминов в похожих запросах приводит к их исключению, это подчеркивает их критичность для определения основного интента.Out of Order Penalty, Broken Compound Penalty) при оценке схожести, что снижает вероятность использования данных из таких неестественных запросов.Confidence Level).Патент подтверждает стратегию Google по масштабированию оценки релевантности с помощью поведенческих данных. Для SEO это означает, что невозможно рассматривать запросы изолированно. Ранжирование становится функцией от общего качества взаимодействия пользователей с сайтом в рамках всей тематики. Стратегия должна быть направлена на построение авторитета в теме, где каждая страница усиливает другую, генерируя положительные сигналы, которые Google может использовать для ранжирования смежных запросов, даже если они появляются впервые.
Сценарий: Ранжирование нового запроса о продукте
Required Terms: iPhone, 17, Pro, Max, титановый, корпус, отзывы.Compound Terms: "iPhone 17 Pro Max", "титановый корпус".Quality of Result Statistic для входного запроса и ранжируется высоко, несмотря на отсутствие прямых исторических данных по точному запросу "iPhone 17 Pro Max титановый корпус отзывы".Что произойдет, если в моем запросе есть обязательный термин, которого нет в историческом запросе?
Согласно патенту (в частности, Claim 1), если обязательный термин (required term, к которым относятся regular и variant terms) из входного запроса отсутствует в историческом запросе, такой исторический запрос полностью исключается из рассмотрения. Это означает, что его поведенческие данные не будут использоваться для ранжирования входного запроса. Это критически важный механизм для сохранения релевантности и предотвращения заимствования данных из запросов с другим интентом.
Как система определяет, является ли термин обязательным, опциональным или стоп-словом?
Патент не детализирует механизм классификации терминов, но подразумевает, что это происходит на этапе понимания запроса (Query Understanding). На практике это определяется с помощью NLP-моделей, которые анализируют контекст запроса, частотность терминов, их роль в языке и связь с сущностями. Ключевые слова, определяющие основную тему или сущность, обычно классифицируются как обязательные, тогда как модификаторы или общие слова могут быть опциональными.
Насколько сильно штрафуется изменение порядка слов в похожем запросе?
Система применяет штраф (Out of Order Penalty), если термины исторического запроса переставлены относительно входного запроса. Патент предполагает, что штраф может зависеть от степени нарушения порядка. Более того, если изменение порядка слов разрывает составной термин (Compound Term), применяется отдельный, потенциально более строгий штраф (Broken Compound Penalty). Это подчеркивает важность естественного порядка слов и целостности фраз.
Что такое AMS и MMS и почему используются обе метрики?
AMS (Absolute Match Score) — это аддитивная метрика (сумма весов совпавших терминов), а MMS (Multiplicative Match Score) — мультипликативная (произведение весов и штрафов). MMS гораздо сильнее наказывает за отсутствие опциональных терминов или наличие штрафов, так как умножение на число меньше 1.0 быстро уменьшает общую оценку. Система может использовать AMS, MMS или их комбинацию (линейную аппроксимацию) для финальной оценки схожести, часто выбирая метод в зависимости от разницы в длине сравниваемых запросов.
Может ли этот механизм привести к тому, что результаты по широкому запросу будут ранжироваться по моему узкому запросу?
Да, если широкий запрос признан достаточно похожим на узкий, и по широкому запросу накоплено много положительных поведенческих данных. Однако система использует механизмы защиты: требование наличия обязательных терминов и штрафы за отсутствие опциональных терминов (через MMS) призваны минимизировать риск подмешивания слишком общих или нерелевантных результатов.
Как комбинируются данные из нескольких похожих запросов?
Патент описывает несколько методов. Наиболее распространенный — взвешенное среднее (weighted average), где вклад данных каждого запроса пропорционален его оценке схожести (Match Score). Также описаны методы ограниченного агрегирования, где вклад каждого запроса (кроме лучшего) ограничен порогом, и агрегирование до достижения необходимого уровня уверенности (Confidence Level).
Влияет ли этот патент на стратегию построения ссылок?
Прямого влияния нет, так как патент сфокусирован на поведенческих данных (кликах, времени пребывания), а не на ссылочных сигналах. Однако он усиливает важность получения качественного трафика, который генерирует положительные поведенческие сигналы. Если ссылки приводят релевантный трафик, который хорошо взаимодействует с контентом, это косвенно усиливает базу User Behavior Data, которую система может использовать.
Как этот патент связан с Topical Authority?
Связь очень сильная. Если сайт постоянно удовлетворяет интент пользователей по множеству запросов в определенной тематике, он накапливает большой объем положительных поведенческих данных по этим историческим запросам. Когда появляется новый или редкий запрос в этой же теме, система с высокой вероятностью найдет похожие исторические запросы, ведущие на этот авторитетный сайт, и использует его данные для повышения ранжирования.
Что такое Capping и Squashing оценок?
Это механизмы финальной корректировки рассчитанных статистик качества (Quality of Result Statistics). Capping (ограничение сверху) используется для снижения риска переоценки документа из-за потенциально ложных совпадений запросов. Squashing (сжатие/корректировка) может понизить оценку, если контент документа слабо соответствует некоторым терминам входного запроса, даже если заимствованные поведенческие данные высоки.
Учитывает ли система языковые и региональные особенности при поиске похожих запросов?
Да, патент явно упоминает учет региональных особенностей (locale), особенно в контексте использования диакритических знаков (diacritical variants). Система может разрешать или запрещать диакритические варианты, или изменять их вес в зависимости от того, насколько строго они используются в данном регионе. Это позволяет более точно определять схожесть запросов в разных языках.

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
Мультиязычность
Персонализация

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Поведенческие сигналы
Мультимедиа
Семантика и интент

Мультимедиа
EEAT и качество
Семантика и интент

Local SEO
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
Мультимедиа
SERP

Поведенческие сигналы
Персонализация
EEAT и качество

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Персонализация
Поведенческие сигналы

EEAT и качество
Поведенческие сигналы
SERP
