
Google использует метод статистической нормализации для сравнения популярности контента из разнородных групп (популяций), например, бесплатных и платных приложений. Поскольку бесплатный контент имеет на порядки больше просмотров, система вычисляет средние показатели (Геометрическое среднее) для каждой популяции и применяет смещение (Offset). Это позволяет популярному платному контенту конкурировать с популярным бесплатным контентом в едином смешанном списке.
Патент решает проблему справедливого ранжирования элементов контента из разнородных популяций (dissimilar populations) в едином смешанном списке. Проблема возникает, когда метрики, используемые для ранжирования (например, количество просмотров, загрузок, кликов), имеют принципиально разные распределения и масштабы для разных типов контента. Например, бесплатные приложения всегда собирают на порядки больше загрузок, чем платные. Прямое ранжирование по абсолютным показателям привело бы к полному доминированию бесплатного контента и вытеснению платного, даже если он более качественный или предпочтительный для пользователя.
Запатентована система и метод смешанного ранжирования (Blended Ranking), использующая технику нормализации для сравнения элементов из разнородных популяций. Суть изобретения — в анализе статистического распределения метрик популярности внутри каждой отдельной популяции и вычислении корректирующего смещения (Offset или Boost). Это смещение компенсирует системные различия в популярности между популяциями, позволяя объединять результаты в единый ранжированный список на основе нормализованных оценок.
Система использует статистический подход для нормализации:
view counts). Данные группируются в диапазоны (buckets), определяется самый частотный диапазон.Geometric Mean, GM) для самого частотного диапазона. Это служит эталоном популярности для данной популяции.Offset), которое получает популяция с меньшим GM.Высокая. Смешивание результатов (Blending) и Универсальный поиск (Universal Search) являются основой современной выдачи Google. Задача справедливого сравнения контента из разных вертикалей (Новости, Видео, Картинки, Товары) или с разными моделями монетизации остается критически важной. Описанный механизм нормализации необходим для корректного функционирования смешанной выдачи.
Влияние на SEO значительное (8/10), особенно для стратегий в вертикальном поиске (Google Shopping, Video, News) и маркетплейсах (Google Play). Патент демонстрирует, что Google оценивает популярность не в абсолютных цифрах, а относительно конкретной категории (популяции). Это означает, что для успеха в смешанной выдаче критически важно стать лидером внутри своей ниши или типа контента, а не пытаться конкурировать по абсолютным метрикам с контентом принципиально другого типа.
Most Common Bucket.Claim 1 (Независимый пункт): Описывает систему смешанного ранжирования с конкретным механизмом нормализации.
user browsing information и social network tags для определения интереса пользователя.scores) элементам, используя следующий процесс нормализации: view counts).buckets) по степеням десяти.Geometric Mean, GM) этой корзины для каждой популяции.offsets) на основе разницы между GM совокупностей.Ядро изобретения — это детально описанный процесс нормализации (шаги 2a-2f). Он защищает конкретный метод, основанный на сравнении Geometric Means наиболее заполненных диапазонов популярности для вычисления корректирующих смещений.
Claim 8 и Claim 11 (Зависимые): Упоминают использование медианы (median value или median distribution) для смешивания.
Обработка Неопределенности (GM vs Median): В патенте присутствует вариативность в описании статистической меры. Claim 1 и детальное описание алгоритма (Description) фокусируются на Geometric Mean (GM) самой распространенной корзины. Однако Abstract, Claim 8 и Claim 11 упоминают медиану. Это указывает на то, что система может использовать разные статистические меры для определения центра распределения, но основная защищенная реализация в Claim 1 использует GM.
Изобретение применяется на финальных этапах формирования выдачи для объединения результатов из разных индексов или категорий.
INDEXING – Индексирование и извлечение признаков
На этом этапе собираются необходимые данные: метрики популярности (view counts) и классификация контента по родительским популяциям (Parent Populations).
METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Это основная область применения патента. Алгоритм используется для смешивания (Blending) результатов из разных популяций (например, разных вертикалей или разных типов контента внутри маркетплейса).
Offsets) на основе GM.Входные данные:
Parent Populations.View counts).User browsing information и social network tags.Выходные данные:
Blended List) с нормализованными оценками ранжирования.large disparity) в значениях метрик ранжирования между этими популяциями.Процесс нормализации и ранжирования на примере двух популяций: Бесплатной (F) и Платной (P).
Buckets) по степеням десятки (1-10, 10-100, 100-1000 и т.д.).Most Common Bucket).Most Common Bucket каждой популяции.View counts (количество просмотров), кликов, загрузок (downloads), установок (installation).User browsing information (история поиска, история загрузок). User preference и user demographics также упоминаются как возможные факторы ранжирования.social network generated tags, связанных с контентом.Parent Population (например, цена, тип контента).Recency (свежесть) упоминается как возможный дополнительный фактор ранжирования (Claim 9).Critical rating (оценки) и number of critical reviews (количество обзоров) упоминаются как дополнительные факторы (Claim 9).Most Common Bucket. Используется как эталон типичной популярности для группы.Parent Population). Система нормализует оценки относительно этой категории.Geometric Means) наиболее типичных диапазонов популярности, для вычисления "буста" (Offset) для менее популярных категорий контента.Parent Population контента критично, так как от этого зависит применение правильного коэффициента нормализации (Offset).Parent Population. Для товаров указывайте цену (Product/Offer), для контента — тип (VideoObject, Article). Это гарантирует применение корректного Offset.Boost) при нормализации.Патент подтверждает, что Google рассматривает поиск как набор разнородных популяций данных, а не как единый индекс. Это фундаментальный механизм для работы Универсального Поиска (Universal Search). Стратегия SEO должна строиться на принципе относительного лидерства: лучше доминировать в нишевой популяции, чем быть середняком в общей популяции, так как нормализация повышает значимость лидеров ниш при смешивании результатов.
Сценарий: Ранжирование приложений в Google Play
Most Common Bucket для F — 100k-1M загрузок. Для P — 1k-10k загрузок.Что такое "Популяция" (Population) в контексте этого патента?
Это группа элементов контента, объединенных общими свойствами, которые влияют на их статистическое распределение метрик. Классические примеры — это "бесплатный контент" и "платный контент". Также это могут быть результаты из разных вертикалей (видео, картинки, веб-страницы) или разные ценовые категории товаров.
Означает ли этот патент, что поведенческие факторы и трафик больше не важны?
Нет, они критически важны. Ранжирование по-прежнему основано на показателях популярности (просмотры, загрузки, клики). Однако патент показывает, что эти показатели нормализуются относительно вашей категории (популяции). Ваша цель — максимизировать эти показатели и обойти конкурентов внутри вашей группы, а не достичь абсолютных показателей другой, более популярной группы.
Как работает нормализация простыми словами?
Система определяет, насколько в среднем одна группа популярнее другой (например, бесплатные приложения в 100 раз популярнее платных). Затем она дает "фору" (Boost или Offset) менее популярной группе (платным приложениям), чтобы выровнять их оценки. Это позволяет лидерам из обеих групп конкурировать на равных в смешанной выдаче.
Что такое "Most Common Bucket" и зачем он нужен?
Это наиболее типичный диапазон популярности для данной категории (например, большинство платных игр имеют от 1000 до 10000 загрузок). Система использует этот диапазон как эталон для расчета средней популярности (Geometric Mean). Это позволяет понять типичное поведение в группе, игнорируя выбросы (супер-хиты или полные провалы).
Как этот патент влияет на SEO для обычных веб-сайтов (не приложений и не товаров)?
Принцип нормализации сигналов критически важен для понимания Universal Search (Метапоиска). Веб-страницы, Видео, Картинки, Новости — это тоже разные популяции с разными распределениями CTR и трафика. Чтобы ваш контент попал в смешанную выдачу, он должен быть конкурентоспособным внутри своей вертикали, а система нормализует его оценку для сравнения с другими вертикалями.
Как я могу определить, к какой популяции Google относит мой контент?
Патент не описывает механизм классификации, но на практике это определяется через тип контента, модель монетизации (цена в structured data), тематику и интент запроса. Необходимо обеспечить максимально четкое сигнализирование о типе и назначении вашего контента через разметку (Schema.org) и структуру сайта.
Получает ли менее популярная популяция всегда буст?
Да, согласно описанному алгоритму. Система вычисляет разницу между средними показателями популярности (Geometric Means). Эта разница становится повышающим коэффициентом (Offset или Boost) для менее популярной группы. Более популярная группа получает нулевое смещение.
Зачем используется логарифм популярности (log(x)) в финальной формуле?
Использование логарифма (log(count(x))) сглаживает влияние больших чисел. В логарифмической шкале разница между 10 и 100 просмотрами гораздо важнее, чем разница между 1,000,000 и 1,000,100. Это позволяет сосредоточиться на порядке величины, а не на абсолютной разнице.
В патенте упоминается и Geometric Mean (Claim 1), и Median (Claim 8). Что именно используется?
Патент описывает вариативность. Основной и детально описанный механизм в Claim 1 использует Geometric Mean (GM) самой распространенной корзины. Однако упоминание медианы (Median) в других пунктах предполагает, что система может использовать разные статистические меры для определения центра распределения и последующей нормализации.
Как этот патент влияет на стратегию в E-commerce и Google Shopping?
Он имеет прямое влияние. Товары разных ценовых категорий или разных брендов могут рассматриваться как разные популяции. Чтобы дорогой нишевый товар ранжировался рядом с дешевым массовым товаром, он должен демонстрировать сильные сигналы качества и популярности именно в своей категории. Нормализация компенсирует разницу в общем объеме продаж.

Поведенческие сигналы
SERP

SERP

Персонализация
Поведенческие сигналы

Мультимедиа
Поведенческие сигналы

SERP
Мультимедиа

Local SEO
Поведенческие сигналы

Семантика и интент
EEAT и качество
SERP

Ссылки
Краулинг
Техническое SEO

Семантика и интент
Техническое SEO
EEAT и качество

Local SEO
Поведенческие сигналы

Ссылки
Поведенческие сигналы
Мультимедиа

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Антиспам
Ссылки
Техническое SEO

Семантика и интент
Ссылки
SERP
