
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
Патент решает проблему «холодного старта» (cold start problem) при использовании поведенческих факторов (например, CTR) в ранжировании. Новые, недавно опубликованные или редко посещаемые ресурсы («длинный хвост») не имеют достаточной истории взаимодействий (search and selection data), чтобы система могла надежно оценить их эффективность. Изобретение позволяет применять поведенческие корректировки ранжирования даже при отсутствии индивидуальной статистики у ресурса.
Запатентована система, которая переносит оценку поведенческих сигналов с уровня конкретного ресурса (URL) на уровень Сущностей (Entities). Система вычисляет метрику Search Term-Entity Selection Value (STESV), которая отражает, насколько часто ресурсы, содержащие определенную сущность, выбирались пользователями в ответ на определенный поисковый термин. Это позволяет корректировать ранжирование нового ресурса на основе исторической эффективности его составных сущностей.
Система работает в два этапа:
Selection Value (кликабельность) для пар [Термин + Ресурс]. Затем эти данные агрегируются для вычисления Search Term-Entity Selection Value для каждой пары [Термин + Сущность], объединяя данные всех ресурсов, упоминающих данную сущность.STESV для этих сущностей в контексте текущего запроса. Эти значения агрегируются (с учетом нормализации) и используются для корректировки (повышения или понижения) итогового рейтинга ресурса.Высокая. Понимание сущностей (Entity understanding) и использование поведенческих сигналов являются центральными элементами современного поиска. Решение проблемы ранжирования свежего и низкочастотного контента остается критически важным. Этот патент описывает механизм, который связывает семантическое понимание контента с поведенческими данными для быстрой оценки новых документов.
Патент имеет высокое значение для SEO (8.5/10). Он демонстрирует механизм, позволяющий новому контенту быстро занимать высокие позиции, если он посвящен сущностям, которые исторически удовлетворяют пользователей по релевантным запросам. Это подчеркивает критическую важность четкой ассоциации контента с конкретными сущностями (Entity Optimization) и создания сфокусированного контента для минимизации эффекта размытия.
impression fraction или CTR) для конкретного ресурса по конкретному поисковому термину.Selection Values всех ресурсов, которые ссылаются на определенную Сущность, в ответ на запрос с определенным Поисковым Термином. Отражает историческую эффективность Сущности для данного Термина.STESV в единую оценку для ресурса.significance) сущности внутри ресурsa. Может использоваться при расчете STESV.Selection Value, основанная на объеме данных (количестве показов).Claim 1 (Независимый пункт): Описывает основной офлайн-процесс вычисления Search Term-Entity Selection Values (STESV).
Selection Value для каждого ресурса по каждому термину.Selection Value точно определяется как соотношение (ratio): (A) количества кликов на ресурс по термину, к (B) количеству показов ресурса по термину (т.е. CTR).STESV для каждой пары [Термин + Сущность] путем агрегации (aggregating) Selection Values всех ресурсов, которые ссылаются на эту сущность и были показаны по этому термину.Claim 2 (Зависимый от 1): Описывает онлайн-процесс применения STESV для ранжирования.
first order).STESV для этой пары [Термин + Сущность].second order (итоговая выдача).Claim 4 (Зависимый от 1): Описывает обработку ресурсов с множеством сущностей и механизм размытия (dilution).
set of entities).STESV для всех сущностей в наборе.in inverse proportion to a cardinality of the set of entities).Если ресурс содержит много сущностей, влияние исторической оценки каждой отдельной сущности уменьшается.
Claim 6 (Зависимый от 5): Описывает агрегацию скорректированных значений.
central tendency) скорректированных STESV (например, среднее значение).Изобретение связывает индексирование, офлайн-анализ данных и ранжирование.
INDEXING – Индексирование и извлечение признаков
На этом этапе система идентифицирует сущности в каждом ресурсе и аннотирует ресурс соответствующими идентификаторами сущностей (entity identifiers). Эти данные сохраняются в индексе.
Офлайн-обработка данных (Data Analysis / Log Processing)
Компонент Search Term-Entity Selection Evaluator работает в офлайн-режиме. Он обрабатывает Query Logs и Selection Logs (поведенческие данные) совместно с данными Индекса для вычисления Selection Values и агрегированных STESV. Результаты сохраняются в базе данных (Search Term-Entity Selection Data).
RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение. Во время обработки запроса компонент Search Score Adjuster использует предварительно вычисленные STESV для корректировки оценок ресурсов. Это применяется как дополнительный сигнал ранжирования, особенно для ресурсов с недостаточной индивидуальной историей.
Входные данные (Онлайн):
first order).Search Term-Entity Selection Data (STESV).Выходные данные (Онлайн):
second order).QDF-запросы) и тематиках, богатых сущностями (биографии, обзоры продуктов, ecommerce).selection data) для надежного вывода о его эффективности (проблема «холодного старта»). Он может применяться ко всем ресурсам, но наиболее заметен при нехватке данных.Процесс А: Офлайн-вычисление STESV
Selection Value (CTR). Опционально вычисляются Confidence Scores.Selection Values всех ресурсов, содержащих эту сущность.Weight Scores (значимость сущности в ресурсе) и Confidence Scores.STESV сохраняются в базе данных.Процесс Б: Онлайн-корректировка ранжирования
first order).STESV для каждой сущности в контексте поискового термина.cardinality).Central Tendency) скорректированных значений (например, среднее).second order).Query Logs и Selection Logs для извлечения данных о показах (impressions) и кликах (selections).Entities упоминаются в каком Resource.CTR) может быть перенесена с одних ресурсов на другие, если они разделяют общие сущности.inverse proportion to a cardinality, Claim 4) критически важен. Он указывает, что влияние одной положительной сущности будет уменьшено, если ресурс охватывает слишком много тем. Сфокусированные ресурсы получают преимущество.STESV. Это подчеркивает важность глубокого раскрытия темы, а не простого упоминания.about, mentions) и оптимизируйте контент так, чтобы NLP-алгоритмы могли точно определить ключевые сущности и их значимость (salience/Weight Score). Это поможет корректно ассоциировать контент с историческими данными STESV.inverse proportionality, Claim 4), создавайте страницы, сфокусированные на ограниченном наборе тесно связанных сущностей. Это максимизирует эффект от этого механизма ранжирования.STESV для этих сущностей в экосистеме Google, что помогает всему вашему контенту по теме.cardinality (Claim 4), специально разработан для снижения эффективности этой тактики.STESV), новый контент может быть пессимизирован с момента публикации, наследуя негативные сигналы.Патент подтверждает стратегический переход Google к пониманию сущностей и демонстрирует, как семантическое понимание (Entities) интегрируется с поведенческим анализом (Selection Data). Для SEO это означает, что контент должен быть осмысленным описанием сущностей, релевантных интенту пользователя. Этот механизм позволяет Google обеспечивать качество ранжирования в условиях постоянного появления огромного количества нового контента, минуя необходимость ждать накопления индивидуальной статистики.
Сценарий: Иллюстрация размывания (Dilution Effect)
Используем пример из патента. Запрос: "восхождение на Фудзи" (climb Fuji).
Предположим, у Google есть следующие STESV для этого запроса:
Сайт А (Сфокусированный): Публикует новую статью только о восхождении.
Сайт Б (Несфокусированный): Публикует новую статью, где упоминается и восхождение, и биография певицы.
Что такое Search Term-Entity Selection Value (STESV) простыми словами?
Это исторический показатель CTR для конкретной Сущности в контексте конкретного Поискового Термина. Он рассчитывается путем агрегации CTR всех документов в интернете, которые содержат эту сущность и показывались по этому термину. Высокий STESV означает, что пользователи, ищущие этот термин, часто заинтересованы в контенте об этой сущности.
Заменяет ли этот механизм традиционное использование CTR для ранжирования?
Нет, он дополняет его. Традиционные механизмы, основанные на прямых кликах по конкретному URL, по-прежнему используются. Описанный механизм предназначен в первую очередь для ситуаций, когда прямых данных недостаточно (проблема «холодного старта») — для новых или редко посещаемых страниц. Он позволяет сделать предположение об эффективности ресурса на основе эффективности его сущностей.
Как работает механизм «размывания» (dilution), если на странице много сущностей?
В патенте указано (Claim 4), что оценка каждой сущности корректируется обратно пропорционально общему количеству сущностей на странице (cardinality). Если на странице 10 сущностей, влияние исторической оценки каждой из них будет значительно меньше (например, разделено на 10), чем если бы сущность была одна. Это стимулирует создание сфокусированного контента и предотвращает манипуляции.
Как система определяет, какие сущности содержит ресурс и какова их значимость?
Это происходит на этапе индексирования с помощью NLP-моделей и сверки с Knowledge Graph. Патент также упоминает возможность использования Weight Score — веса, пропорционального значимости (significance) сущности в ресурсе. SEO-специалисты могут влиять на это, используя четкую структуру текста, делая ключевые сущности центральной темой и применяя микроразметку Schema.org.
Может ли этот механизм навредить моему сайту?
Да. Если ваш контент посвящен сущностям, которые исторически показывают низкую удовлетворенность пользователей по целевым запросам (низкий STESV), ваша страница может быть понижена в рейтинге сразу после публикации. Она наследует негативные поведенческие сигналы этой сущности для данного контекста запроса.
Что такое «Мера центральной тенденции» (Central Tendency) в этом патенте?
Когда ресурс содержит несколько сущностей, система получает несколько скорректированных STESV (по одному для каждой). Чтобы определить итоговую корректировку для всего ресурса, система вычисляет обобщенное значение. Патент упоминает, что это может быть среднее арифметическое, медиана, максимум или минимум этих значений.
Влияет ли этот патент на ранжирование старых, авторитетных страниц?
В меньшей степени. Старые страницы обычно имеют достаточно собственных прямых поведенческих данных, которые являются более надежным индикатором. Однако механизм, основанный на сущностях, все равно может применяться как один из сигналов, но его влияние будет менее заметным по сравнению с новыми страницами.
Как система обрабатывает неоднозначные термины (например, "Ягуар" – животное или машина)?
Система рассчитывает отдельные STESV для каждой уникальной сущности. Для термина "Ягуар" будут разные оценки для сущности [Ягуар (Животное)] и [Jaguar (Автомобиль)]. При ранжировании конкретного ресурса система использует оценки только тех сущностей, которые распознаны в этом ресурсе, что помогает учитывать контекст.
Что важнее: чтобы сущность часто кликали в целом или по конкретному запросу?
Важно второе. Метрика STESV рассчитывается строго для пары [Поисковый Термин + Сущность]. Сущность может быть очень популярна по одним запросам, но совершенно неэффективна по другим. Система учитывает этот контекст при корректировке ранжирования.
Как использовать этот патент для улучшения позиций нового сайта?
Для нового сайта критически важно с самого начала четко определять тематику и основные сущности. Создавайте высококачественный, сфокусированный контент, который явно нацелен на удовлетворение интента. Обеспечьте техническую возможность для Google распознать эти сущности (структура, разметка). Если вы выберете сущности, по которым уже есть положительная история вовлеченности, ваш новый контент сможет ранжироваться быстрее.

Поведенческие сигналы
Семантика и интент
SERP

EEAT и качество
Свежесть контента
Индексация

EEAT и качество
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Ссылки
Knowledge Graph

Семантика и интент
Техническое SEO
EEAT и качество

Семантика и интент
Индексация
Мультимедиа

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
EEAT и качество
SERP

Персонализация
Поведенческие сигналы
Local SEO

Поведенческие сигналы
Индексация
Техническое SEO

Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы

Антиспам
Ссылки
SERP
