
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
Патент решает проблему контекстно-независимой оценки синонимов (substitute terms) в поиске. Традиционные системы часто присваивают синонимам фиксированный вес, игнорируя контекст документа. Это может привести к неточному ранжированию, когда документ получает незаслуженное повышение из-за наличия синонима, который используется в ином значении (например, повышение страницы о мюзикле "Cats" по запросу "Felines" (кошачьи)). Изобретение улучшает точность поиска (precision), гарантируя, что синонимы увеличивают релевантность только тогда, когда контекст документа, подтвержденный поведением пользователей, соответствует исходному запросу.
Запатентована система контекстно-зависимой оценки замещающих терминов (синонимов). Система использует сигнал релевантности (Relevance Signal), основанный на поведении пользователей, который связывает исходный термин запроса (Original Query Term) с конкретным документом. Этот сигнал определяет, какой вес (Increment Value) присвоить синониму, найденному в этом документе. Если исходный термин высоко релевантен документу, синоним получает больший вес; если низко релевантен — меньший.
Ключевой механизм заключается в динамическом выборе модели оценки (Scoring Model) для каждого документа:
Relevance Signal, показывающий, насколько исходный термин релевантен этому документу (на основе кликов, времени просмотра и т.д.).Predetermined Threshold).First Scoring Model), где синоним получает высокий вес (First Increment Value).Second Scoring Model), где синоним получает низкий вес (Second Increment Value).Высокая. Понимание контекста запроса и использование сигналов пользовательского взаимодействия (User Engagement Signals) являются центральными элементами современного поиска. Этот патент описывает конкретный механизм интеграции поведенческих данных (таких как CTR и Dwell Time) непосредственно в расчет релевантности контента, что соответствует принципам работы систем машинного обучения в поиске.
Патент имеет значительное влияние на SEO (7/10). Он демонстрирует, что простое наличие синонимов на странице недостаточно для повышения релевантности. Ключевое значение приобретают поведенческие факторы по основным ключевым словам. Если пользователи не взаимодействуют с документом по основному запросу (низкий CTR, короткое время просмотра), система считает исходный термин низкорелевантным этому документу, и вес любых синонимов на странице будет минимальным.
Relevance Signal.Relevance Signal.Scoring Model.Click Count, Skip Count, Impression Duration).Scoring Models.Increment Values) для расчета оценки документа. Патент описывает как минимум две модели: для высокой и низкой релевантности исходного термина.Relevance Signal.Claim 1 (Независимый пункт): Описывает основной метод динамической оценки синонимов.
Value), соответствующее релевантности запроса этому документу.Predetermined Threshold).First Scoring Model). Эта модель включает Первое значение приращения (First Increment Value) для синонима.Second Scoring Model), которая используется для документов, чьи значения релевантности НЕ удовлетворяют порогу. Вторая модель имеет Второе значение приращения (Second Increment Value) для синонима, отличное от Первого.Claims 2, 3, 4 (Зависимые): Детализируют природу Значения релевантности (Value).
Значение релевантности может быть основано на:
aggregate number of clicks) пользователей, выбравших документ при использовании исходного термина.aggregate duration of users' views) документа пользователями при использовании исходного термина.average duration of users' views) документа пользователями при использовании исходного термина.Claim 6 (Зависимый от 1): Уточняет соотношение весов.
Первое значение приращения (высокая релевантность) больше, чем Второе значение приращения (низкая релевантность). Это означает, что синонимы получают больший вес в документах, которые сильно связаны с исходным запросом.
Claim 7 (Зависимый от 6): Уточняет вес синонима относительно исходного термина.
В Первой модели оценки (высокая релевантность) Первое значение приращения для синонима меньше или равно значению приращения для исходного термина запроса. Синоним обычно не может быть важнее исходного термина.
Изобретение применяется на нескольких этапах поиска, интегрируя данные о поведении пользователей в процесс оценки релевантности.
INDEXING – Индексирование и извлечение признаков (Обработка данных)
На этом этапе (или в рамках отдельного офлайн/nearline процесса) система должна собирать, обрабатывать и индексировать данные о поведении пользователей. Click Counts, Skip Counts и Impression Durations, связывающие запросы с документами, используются для расчета Relevance Signals. Эти сигналы сохраняются (например, в Index Database или отдельном хранилище) для последующего доступа Search Engine и Scoring Engine.
QUNDERSTANDING – Понимание Запросов
Synonym Engine идентифицирует синонимы (Substitute Terms) для исходных терминов запроса. Query Reviser Engine использует их для создания пересмотренных запросов (Revised Queries).
RANKING – Ранжирование
Это основной этап применения патента. Search Engine идентифицирует документы, содержащие исходные термины или синонимы. Затем Scoring Engine выполняет оценку:
Relevance Signal для пары (Исходный термин, Документ).Scoring Model и определения веса (Increment Value) для синонимов, присутствующих в документе.Входные данные:
Relevance Signals для каждого документа, связанные с исходными терминами запроса.Выходные данные:
Relevance Signal между исходным термином и конкретным документом.Процесс оценки документа с динамическим весом синонимов.
Scoring Engine получает пересмотренный запрос (включая Исходный термин и Синоним) и набор документов.Relevance Signal, который количественно определяет релевантность Исходного термина этому документу (на основе исторических поведенческих данных).Relevance Signal может быть нормализован (например, от 0.0 до 1.0).Relevance Signal с предопределенным порогом (Predetermined Threshold, например, 0.5).First Scoring Model). Синониму присваивается Высокий вес (First Increment Value, например, 0.9).Second Scoring Model). Синониму присваивается Низкий вес (Second Increment Value, например, 0.1).Scoring Engine подсчитывает количество вхождений Исходного термина и Синонима в документе. Оценка рассчитывается путем суммирования вхождений, умноженных на соответствующие веса. (Например, в Сценарии А: (Кол-во Исходных терминов * Вес Исходного термина) + (Кол-во Синонимов * 0.9)).Патент явно указывает на использование следующих типов данных:
Original Query Term) и замещающего термина (Substitute Term/Синоним) в тексте документа.Relevance Signal: Relevance Signal, используемое для разделения высокой и низкой релевантности. Может определяться эмпирически или с помощью статистического моделирования (например, 0.5, 0.8).Second Increment Value. Меньше или равен весу исходного термина.Relevance Signal для определения веса синонима, вместо использования жесткого порога и двух фиксированных моделей. Например, вес синонима может быть прямо пропорционален сигналу релевантности.Relevance Signal, основанный на кликах и времени просмотра (Dwell Time), определяет, будет ли синоним учитываться при ранжировании документа.Increment Value) в разных документах для одного и того же запроса, в зависимости от Relevance Signal каждого документа.Impression Duration) для целевых запросов. Сильное взаимодействие подтверждает релевантность исходного термина (высокий Relevance Signal), что позволяет синонимам, используемым на странице, получить максимальный вес (First Increment Value).Second Increment Value).Click Count), короткое время просмотра (низкий Impression Duration) или возврат в выдачу приведет к снижению Relevance Signal, что в итоге понизит вес синонимов.Патент подтверждает стратегическую важность интеграции поведенческих данных в ядро алгоритмов расчета релевантности. Он демонстрирует переход Google от статического анализа текста к более сложным моделям, где пользователи выступают валидаторами семантического значения терминов на странице. Для SEO это означает, что стратегии, направленные на удовлетворение интента пользователя и улучшение взаимодействия с контентом, напрямую влияют на то, как поисковая система интерпретирует и оценивает текст страницы.
Сценарий: Оценка релевантности для запроса "Felines" (Кошачьи)
Исходный термин: "Felines". Синоним: "Cats".
Порог релевантности (Threshold): 0.5.
Модель 1 (Высокая релевантность): Вес "Felines"=1.0, Вес "Cats"=0.9.
Модель 2 (Низкая релевантность): Вес "Felines"=1.0, Вес "Cats"=0.1.
Результат: Документ А ранжируется значительно выше Документа Б по запросу "Felines", несмотря на то, что в Документе Б больше вхождений синонима "Cats". Поведение пользователей позволило системе корректно интерпретировать контекст и снизить вес синонима для нерелевантного документа.
Что такое "Relevance Signal" и как он рассчитывается?
Relevance Signal (или Value) — это метрика, которая количественно определяет релевантность исходного термина запроса конкретному документу. Патент явно указывает, что он рассчитывается на основе поведенческих данных: количества кликов (Click Count), количества пропусков (Skip Count) и продолжительности просмотра (Impression Duration, аналог Dwell Time) этого документа пользователями, которые ввели исходный запрос.
Означает ли этот патент, что синонимы стали менее важны для SEO?
Не обязательно. Важность синонимов стала контекстно-зависимой и валидируемой пользователями. Если исходный термин высоко релевантен документу (высокий Relevance Signal), синонимы получают значительный вес (например, 0.9 от веса исходного термина). Однако если релевантность низкая, их вес минимален (например, 0.1). Важно использовать их в правильном контексте.
Как этот механизм влияет на страницы с низким трафиком или новые страницы?
Для новых страниц или страниц с низким трафиком может не хватать поведенческих данных для надежного расчета Relevance Signal. В патенте не уточняется, как система действует в этом случае. Вероятно, Google может использовать стандартную модель оценки синонимов или опираться на другие сигналы релевантности (контентные, ссылочные), пока не накопится достаточно данных о поведении пользователей.
Как я могу улучшить "Relevance Signal" для моих страниц?
Необходимо сосредоточиться на улучшении показателей вовлеченности пользователей для ваших основных ключевых запросов. Это включает оптимизацию сниппетов для повышения CTR (Click Count) и, что более важно, создание качественного контента, который удерживает пользователя на странице и удовлетворяет его интент (высокий Impression Duration, низкий Bounce Rate).
Использует ли Google фиксированный порог для определения высокой и низкой релевантности?
Патент описывает использование предопределенного порога (Predetermined Threshold) для выбора между двумя моделями оценки. Однако также упоминается возможность использования более гибкого подхода, где вес синонима определяется линейной или нелинейной функцией от Relevance Signal, что позволяет более плавно регулировать вес.
Влияет ли этот механизм на вес исходного термина запроса?
В основном описанном варианте реализации механизм изменяет только вес синонима (Substitute Term). Вес исходного термина (Original Query Term) остается неизменным в обеих моделях (например, 1.0). Однако в патенте кратко упоминается возможность того, что исходный термин также может получать более низкий балл во второй модели (низкая релевантность).
Что произойдет, если я попытаюсь манипулировать кликами или временем просмотра?
Попытки искусственно завысить Click Count или Impression Duration рискованны. Google имеет сложные системы для обнаружения недействительного трафика и манипуляций поведенческими факторами. Если манипуляции будут обнаружены, это может привести к пессимизации сайта, а не к улучшению Relevance Signal.
Как этот патент связан с RankBrain или другими ML-алгоритмами?
Этот патент хорошо согласуется с общей философией использования машинного обучения и анализа поведения пользователей для интерпретации запросов и оценки контента, которую продвигает RankBrain. Описанный механизм предоставляет конкретный способ использования данных о взаимодействии для уточнения семантической релевантности на уровне отдельных терминов и их синонимов.
Влияет ли этот механизм на ранжирование по длиннохвостым (long-tail) запросам?
Влияние на long-tail запросы может быть ограничено из-за нехватки данных. Поскольку Relevance Signal требует накопления статистики по конкретной паре (Запрос, Документ), для редких или уникальных запросов система, скорее всего, не сможет применить этот механизм и будет использовать стандартные методы оценки синонимов.
Стоит ли удалять синонимы со страницы, если основной запрос имеет низкую релевантность?
Нет, удалять синонимы не стоит, если они используются естественно и улучшают качество текста. Даже при низкой релевантности основного запроса синонимы получают небольшой вес (Second Increment Value, например, 0.1). Основной фокус должен быть на улучшении контента и поведенческих сигналов, чтобы повысить Relevance Signal и тем самым увеличить вес этих синонимов.

Индексация
Семантика и интент

SERP

Семантика и интент
SERP

EEAT и качество
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

EEAT и качество
SERP
Ссылки

Ссылки
Индексация
Краулинг

Поведенческие сигналы
Антиспам
SERP

SERP
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
Безопасный поиск
Поведенческие сигналы

SERP
EEAT и качество
Персонализация

Поведенческие сигналы
Семантика и интент
Мультимедиа

Ссылки
Индексация
Техническое SEO

EEAT и качество
Семантика и интент
