Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.
Описание
Какую задачу решает
Патент решает проблему справедливого и эффективного ранжирования разнообразных критериев распространения (Distribution Criteria) для элемента контента (Content Item). В контексте патента речь идет о рекламной системе (например, Google Ads), где Content Item — это объявление, а Distribution Criteria — это варианты таргетинга (ключевые слова, веб-страницы, вертикали).
Сложность заключается в объединении разнородных сигналов (например, CTR, количество показов, релевантность), которые имеют разные шкалы и распределения. Патент устраняет две ключевые проблемы:
- Асимметрия данных (Skewness): Предотвращает доминирование критериев с экстремально высокими показателями (например, ключевых слов с миллиардами показов).
- Отсутствие данных (Sparsity): Гарантирует, что критерий не будет пессимизирован, если для него отсутствуют данные по какому-либо вспомогательному сигналу.
Что запатентовано
Запатентован метод оценки и ранжирования критериев распространения рекламы. Он основан на использовании Primary Ranking Signal (основного сигнала) и набора Auxiliary Ranking Signals (вспомогательных сигналов). Вспомогательные сигналы корректируются для уменьшения асимметрии (Skewness) с помощью функций трансформации (например, логарифмических). Затем сигналы объединяются с использованием функции, которая гарантирует, что низкие или отсутствующие вспомогательные оценки не снижают итоговый Ranking Score (пессимизация отсутствует), но высокие оценки обеспечивают повышение (boost).
Как это работает
Система работает в рамках Content Management System (рекламной платформы):
- Идентификация сигналов: Определяется основной сигнал (например, семантическая релевантность объявления ключевому слову) и вспомогательные (например, исторический CTR, показы).
- Корректировка вспомогательных сигналов: Применяются методы Data Science для стандартизации данных:
- Transformation: Использование функций (например, ) для снижения Skewness.
- Capping: Ограничение максимальных значений для устранения выбросов.
- Normalization: Приведение к единой шкале (например, 0-1).
- Расчет рейтинга (Boost-Only Logic): Итоговый Ranking Score рассчитывается по формуле, предотвращающей пессимизацию. Например, (где P — основная оценка, A — вспомогательная). Если A=0, штрафа нет. Если A>0, есть повышение.
Актуальность для SEO
Высокая (для AdTech и Data Science). Описанные методы нормализации, трансформации и ограничения данных являются стандартными и актуальными практиками в Data Science для обработки разнородных и искаженных сигналов в системах машинного обучения и рекламных платформах.
Важность для SEO
Влияние на SEO минимальное (1/10). Патент является чисто техническим и описывает внутренние процессы Content Management System, что в контексте патента явно указывает на рекламную платформу (Google Ads), а не на систему органического поиска. Он описывает, как ранжировать критерии таргетинга для рекламы, а не как ранжировать веб-страницы в ответ на запрос пользователя. Патент не содержит практических рекомендаций для SEO-специалистов.
Детальный разбор
Термины и определения
- Auxiliary Ranking Signal (Вспомогательный сигнал ранжирования)
- Дополнительный сигнал, используемый для корректировки основного рейтинга. Примеры: CTR, количество показов, конверсии, user reach.
- Capping (Ограничение)
- Процесс установки максимального значения для оценки сигнала с целью устранения экстремальных выбросов (outliers), которые могут исказить нормализацию и ранжирование.
- Content Item (Элемент контента)
- Единица контента, которая распространяется через систему. В контексте патента это рекламное объявление (advertisement).
- Content Management System (Система управления контентом)
- Платформа, управляющая распространением Content Items. В контексте патента это рекламная сеть (например, Google Ads).
- Distribution Criteria (Критерии распространения)
- Условия, при которых Content Item может быть показан (критерии таргетинга). Примеры: ключевые слова, веб-страницы (placements), вертикали.
- Normalization (Нормализация)
- Процесс приведения оценок различных сигналов к единой шкале (например, от 0 до 1) для обеспечения их сопоставимости.
- Primary Ranking Signal (Основной сигнал ранжирования)
- Главный сигнал, используемый для ранжирования критериев. Например, семантическая релевантность между объявлением и критерием, или сигнал, выбранный рекламодателем.
- Skewness (Асимметрия, Перекос)
- Мера асимметрии распределения данных. Высокая асимметрия означает наличие экстремальных значений (например, распределение количества показов по ключевым словам).
- Transformation Function (Функция трансформации)
- Математическая функция (например, , ), применяемая к оценкам для уменьшения их асимметрии (Skewness).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод ранжирования критериев для элемента контента (рекламы).
- Система идентифицирует основной (Primary) и набор вспомогательных (Auxiliary) сигналов ранжирования.
- Для каждого критерия (например, ключевого слова) вспомогательные оценки корректируются. Корректировка включает применение Transformation Function для уменьшения Skewness.
- Определяется итоговый Ranking Score на основе функции от основной оценки и скорректированных вспомогательных оценок.
- Ключевая характеристика функции: она подавляет (suppressing effects) влияние вспомогательных оценок, которые ниже определенного значения, и повышает (boosting) рейтинг с помощью оценок, которые выше этого значения.
- Система выбирает критерии на основе Ranking Score и предоставляет элемент контента.
Claim 4 (Зависимый от 2 и 1): Детализирует математический механизм комбинирования оценок без штрафов (Boost-Only Logic).
- Комбинированная вспомогательная оценка складывается с константой (constant value, например, 1).
- Вычисляется произведение этой суммы и основной оценки (Primary Score).
Это реализация формулы вида . Если константа равна 1, а вспомогательная оценка равна 0, множитель равен 1 (пессимизации нет).
Claim 6 (Зависимый от 1): Описывает механизм ограничения (Capping).
- Для вспомогательного сигнала определяется максимальное значение (maximum value). Оно устанавливается ниже, чем абсолютное наивысшее значение в наборе данных (для устранения выбросов).
- Оценки, превышающие это максимальное значение, снижаются до него.
Где и как применяется
Важно понимать, что этот патент не применяется в стандартной архитектуре органического поиска Google (CRAWLING, INDEXING, QUNDERSTANDING, RANKING, METASEARCH, RERANKING).
Он применяется исключительно внутри Content Management System, который, судя по описанию (Campaign Data, Publisher Websites), является рекламной платформой (например, Google Ads).
Система: Рекламная платформа (Ad Platform Infrastructure).
Компонент: Criteria Ranking Engine.
Цель: Оценка качества и потенциальной эффективности различных вариантов таргетинга (ключевых слов, площадок) для конкретного рекламного объявления. Это может использоваться для рекомендации критериев рекламодателю или для внутренней оптимизации.
Входные данные:
- Элемент контента (Рекламное объявление).
- Набор потенциальных критериев распространения.
- Данные об эффективности (Criteria Data, Performance Data): CTR, показы, конверсии, релевантность.
Выходные данные:
- Ранжированный список критериев таргетинга с итоговыми Ranking Scores.
На что влияет
Алгоритм влияет исключительно на процессы внутри рекламной системы:
- Типы критериев: Влияет на ранжирование всех типов критериев таргетинга — ключевых слов, веб-страниц (placements), вертикалей, каналов.
- Цели кампаний: Позволяет системе адаптировать ранжирование под цели рекламодателя, если тот выбирает разные Primary Signals или устанавливает разные веса для Auxiliary Signals.
На органический поиск (SEO) влияния нет.
Когда применяется
Алгоритм применяется в следующих сценариях внутри рекламной платформы:
- Когда система рекомендует рекламодателю новые критерии таргетинга (например, в Keyword Planner).
- Когда система оценивает существующие критерии таргетинга для оптимизации эффективности кампании.
- Когда необходимо сравнить потенциальную эффективность разных типов критериев (ключевое слово vs. сайт размещения) для одного объявления.
Пошаговый алгоритм
Процесс ранжирования критериев таргетинга для элемента контента.
- Инициализация: Определение набора критериев для ранжирования. Определение Primary Ranking Signal (P) и Auxiliary Ranking Signals (A1, A2…).
- Сбор данных: Получение оценок P и A для каждого критерия.
- Корректировка вспомогательных оценок (Adjustment Phase):
- Трансформация (Transformation): Анализ распределения оценок для сигнала A. Если Skewness высока, применяется Transformation Function (например, ) для ее снижения.
- Ограничение (Capping): Экстремально высокие значения снижаются до установленного порога (например, до уровня 90-го перцентиля).
- Нормализация (Normalization): Оценки приводятся к единой шкале (например, 0-1).
- Взвешивание (Weighting): Применение весовых коэффициентов, отражающих важность сигнала.
- Агрегация (Опционально): Скорректированные вспомогательные оценки могут быть объединены в комбинированные оценки (Combined Auxiliary Score — CAS), возможно, с группировкой по типу (например, сигналы эффективности vs. сигналы авторитетности).
- Расчет итогового рейтинга (Ranking Score): Итоговая оценка рассчитывается по функции, которая не штрафует за низкие вспомогательные оценки. Например (Relationship 1 в патенте):
- Выбор критериев: Критерии ранжируются по итоговому Ranking Score.
Какие данные и как использует
Данные на входе
Патент описывает использование данных, характерных для рекламных систем:
- Поведенческие / Performance факторы:
- Click-through rates (CTR) и Click counts.
- Impression counts (Количество показов).
- Conversion rates и Conversion counts.
- Контентные / Релевантностные факторы:
- Semantic scores: Оценка семантической релевантности между критерием и рекламой.
- Факторы авторитетности/качества (для мест размещения):
- Authority scores или Page rank scores (упоминается в тексте как пример вспомогательного сигнала для веб-страниц).
- Page view counts и Unique user counts.
- Brand scores.
- Факторы охвата:
- User reach.
Какие метрики используются и как они считаются
Патент фокусируется на методах обработки и комбинирования метрик.
- Измерение асимметрии (Skewness): Используется для определения необходимости применения Transformation Function.
- Функции трансформации: Упоминаются конкретные примеры:
- (Квадратный корень)
- Capping (Ограничение): Максимальное значение может определяться на основе перцентилей (например, 90-й перцентиль).
- Нормализация: Приведение к диапазону (например, от 0 до 1).
- Формулы комбинирования:
- Relationship (1) (Простое комбинирование):
Выводы
- Патент относится к инфраструктуре рекламы (AdTech), а не к органическому поиску (SEO): Это ключевой вывод. Патент описывает работу Content Management System (рекламной платформы) для ранжирования Distribution Criteria (критериев таргетинга). Он не описывает алгоритмы ранжирования веб-страниц в Google Search.
- Сложная обработка данных для борьбы с искажениями: Патент детально описывает применение техник Data Science (Трансформация, Capping, Нормализация) для борьбы с асимметрией данных (Skewness) и выбросами. Это необходимо для предотвращения доминирования экстремальных значений (например, сверхвысоких показов).
- Принцип комбинирования без штрафов (Boost-Only Logic): Ключевая особенность — использование формулы вида . Это гарантирует, что критерии с отсутствующими или низкими вспомогательными оценками не будут пессимизированы, но получат повышение при высоких оценках.
- Отсутствие практической ценности для SEO: Так как патент инфраструктурный и относится к рекламным системам, он не дает никаких практических выводов или рекомендаций для SEO-специалистов, работающих над органическим продвижением сайтов.
Практика
Best practices (это мы делаем)
Патент является инфраструктурным, относится к рекламным системам (Google Ads) и не дает практических выводов для органического SEO. Практических рекомендаций по оптимизации сайтов для органического поиска на основе этого патента нет.
Worst practices (это делать не надо)
Патент является инфраструктурным и не дает практических выводов для органического SEO. Нельзя делать выводы о работе органического поиска на основе механизмов, описанных для рекламных систем.
Стратегическое значение
Стратегическое значение для SEO отсутствует. Патент интересен с академической точки зрения, так как демонстрирует применение стандартных методов Data Science (нормализация, трансформация данных) для решения задачи ранжирования в экосистеме Google. Однако эти знания нельзя напрямую перенести на понимание алгоритмов органического ранжирования.
Практические примеры
Практических примеров для SEO нет. Ниже приведен пример, иллюстрирующий работу алгоритма в контексте рекламной системы (PPC).
Сценарий (PPC): Ранжирование ключевых слов для рекламы
Сигналы: Primary (P) = Релевантность (0-1). Auxiliary (A) = Показы (Impressions).
Критерии:
- Ключевое слово 1 (К1): P=0.8. Показы=1,000,000.
- Ключевое слово 2 (К2): P=0.8. Показы=1000.
Процесс:
- Трансформация (Показы): Система применяет Log10 для уменьшения Skewness.
Log10(1,000,000) = 6.
Log10(1000) = 3. - Нормализация (Показы): Предположим, что после трансформации максимум равен 6. Нормализуем к шкале 0-1.
К1: 6/6 = 1.0 (A1).
К2: 3/6 = 0.5 (A2). - Расчет Ranking Score: Используем формулу .
R(K1) = 0.8 * (1 + 1.0) = 1.6.
R(K2) = 0.8 * (1 + 0.5) = 1.2.
Результат: К1 ранжируется выше, но разница в итоговом рейтинге (1.6 vs 1.2) значительно меньше, чем разница в исходных показах (1,000,000 vs 1000), благодаря трансформации и нормализации.
Вопросы и ответы
Описывает ли этот патент, как Google ранжирует сайты в органической выдаче?
Нет. Этот патент не имеет отношения к органическому поиску. Он описывает работу Content Management System (рекламной платформы, например, Google Ads) и то, как эта система ранжирует Distribution Criteria (критерии таргетинга, такие как ключевые слова или сайты для размещения рекламы) для конкретного Content Item (рекламного объявления).
В чем основная задача, которую решает этот патент?
Основная задача — справедливо объединить разнородные сигналы ранжирования (например, релевантность, CTR, показы), которые имеют разные шкалы и распределения. Патент предлагает методы для снижения влияния экстремально высоких значений (асимметрии данных, Skewness) и гарантирует, что отсутствие данных по какому-либо сигналу не приведет к штрафу (пессимизации) критерия.
Как система избегает штрафов за отсутствие данных по вспомогательному сигналу?
Система использует специфическую формулу комбинирования, например, , где P — основная оценка, A — вспомогательная. Если данные отсутствуют, A=0. В этом случае множитель равен (1+0)=1. Таким образом, итоговый рейтинг не снижается (штрафа нет), что критично для новых ключевых слов.
Что такое «Transformation Function» и зачем она нужна?
Это математическая функция, такая как или . Она используется для уменьшения асимметрии (Skewness) данных. Например, количество показов по разным ключевым словам может отличаться на порядки (1000 vs 1,000,000). Трансформация сглаживает эти различия, предотвращая доминирование экстремально высоких значений.
Что такое Capping и как он работает?
Capping (Ограничение) — это процесс принудительного снижения экстремально высоких значений (выбросов). Система определяет максимальный порог (например, на уровне 90-го перцентиля), и все значения выше этого порога снижает до него. Это еще один метод борьбы с искажениями, который применяется перед нормализацией данных.
Что такое Primary и Auxiliary Ranking Signals?
Primary Ranking Signal — это основной сигнал, определяющий базовый рейтинг критерия (например, семантическая релевантность объявления ключевому слову). Auxiliary Ranking Signals — это вспомогательные сигналы (например, CTR, охват, авторитетность площадки), которые используются для корректировки (повышения) базового рейтинга, если они имеют достаточно высокие значения.
Могу ли я использовать инсайты из этого патента для улучшения SEO моего сайта?
Нет. Механизмы, описанные в этом патенте, предназначены для оптимизации выбора критериев таргетинга в рекламных кампаниях. Они не описывают факторы, влияющие на ранжирование сайтов в органической выдаче Google Search, и не дают рекомендаций по улучшению E-E-A-T или других SEO-метрик.
К каким этапам поиска относится этот патент согласно 6-этапной архитектуре?
Этот патент не относится ни к одному из этапов органического поиска (CRAWLING, INDEXING, QUNDERSTANDING, RANKING, METASEARCH, RERANKING). Он описывает инфраструктуру рекламной платформы (AdTech), которая работает параллельно с органическим поиском.
В патенте упоминаются Page Rank и Authority Scores. Значит ли это, что он связан с SEO?
Нет. Page Rank scores и Authority scores упоминаются в патенте как примеры вспомогательных сигналов (Auxiliary Ranking Signals) для оценки качества веб-страниц, выступающих в роли площадок для размещения рекламы (Distribution Criteria). Речь идет об оценке ценности площадки для рекламодателя, а не о ее ранжировании в органическом поиске.
Какова ценность этого патента для Senior SEO специалиста?
Ценность минимальна и носит чисто образовательный характер. Патент полезен для понимания общих принципов обработки и нормализации данных, используемых в экосистеме Google (в данном случае, в Google Ads). Однако он не применим к разработке стратегии органического продвижения и не дает практических инструментов для SEO.