Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google нормализует популярность для смешивания результатов из разных источников в единой выдаче (Universal Search)

    BLENDED RANKING OF DISSIMILAR POPULATIONS USING AN N-FURCATED NORMALIZATION TECHNIQUE (Смешанное ранжирование разнородных совокупностей с использованием техники N-фуркационной нормализации)
    • US9558222B1
    • Google LLC
    • 2017-01-31
    • 2012-12-28
    2012 SERP Индексация Патенты Google Поведенческие сигналы

    Google использует технику нормализации для объединения разнородных результатов поиска (например, бесплатных и платных приложений, или разных вертикалей поиска) в единый список. Система анализирует распределение популярности внутри каждой группы, вычисляет «типичную популярность» (используя Геометрическое Среднее наиболее частого диапазона) и применяет повышающий коэффициент (Ranking Boost) к группам с низкими абсолютными показателями. Это позволяет справедливо ранжировать элементы в смешанной выдаче.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему несбалансированного ранжирования при объединении элементов из разнородных совокупностей (Parent Populations), чьи базовые метрики популярности (например, клики, просмотры, загрузки) имеют принципиально разный масштаб. Если ранжировать напрямую по абсолютным показателям, элементы из более популярных совокупностей (например, бесплатный контент) полностью вытеснят элементы из менее популярных (например, платный контент). Это снижает разнообразие выдачи и искажает представление о качестве доступного контента.

    Что запатентовано

    Запатентована система для смешанного ранжирования (Blended Ranking) путем нормализации оценок разнородных совокупностей. Суть изобретения заключается в статистическом анализе распределения метрик популярности (View Count) внутри каждой совокупности. Система определяет «центр масс» распределения и вычисляет повышающие коэффициенты (Ranking Boosts), чтобы компенсировать разницу в абсолютных значениях. Это позволяет элементам из разных совокупностей конкурировать на основе нормализованных оценок.

    Как это работает

    Ключевой механизм – это статистическая нормализация:

    • Идентификация совокупностей: Определяются различные группы контента (например, Бесплатные, Платные, или Видео, Новости).
    • Группировка (Bucketing): Метрики популярности внутри каждой группы распределяются по диапазонам (Buckets), например, по степеням 10.
    • Определение центра масс: Находится диапазон с наибольшим количеством элементов (Most Common Bucket).
    • Расчет Типичной Популярности: Вычисляется Геометрическое Среднее (Geometric Mean, GM) метрик только для элементов в этом диапазоне.
    • Расчет Буста: Сравниваются GM разных совокупностей. Совокупности с меньшим GM получают Ranking Boost, основанный на разнице между GM.
    • Смешивание: Элементы объединяются и ранжируются по нормализованным оценкам (например, log(View Count) + Boost).

    Актуальность для SEO

    Высокая. Смешивание различных типов результатов (Universal Search / Blending) является фундаментальной частью современных поисковых систем. Эта технология критически важна для маркетплейсов (Google Play, Google Shopping) и для балансировки вертикалей в основной выдаче (Новости, Видео, Картинки), где абсолютные показатели популярности сильно различаются.

    Важность для SEO

    Патент имеет высокое стратегическое значение (7/10), особенно для понимания работы Универсального Поиска и ранжирования на платформах Google. Он описывает механизм, позволяющий Google сравнивать «яблоки с апельсинами». Для SEO-специалиста это означает, что абсолютные показатели вовлеченности могут быть нормализованы. Ключевая задача — достижение лидерства и высокой популярности *внутри* своей категории или вертикали (Parent Population), а не попытка конкурировать по абсолютным метрикам с принципиально другими типами контента.

    Детальный разбор

    Термины и определения

    Average View Count (Среднее количество просмотров)
    Статистический показатель, характеризующий центр распределения популярности. В патенте реализуется как Geometric Mean.
    Blended Ranking (Смешанное ранжирование)
    Процесс объединения элементов из разных совокупностей в единый упорядоченный список.
    Buckets / Groups (Группы / Диапазоны)
    Сегменты, на которые разбивается шкала метрик популярности (например, 10-100 просмотров) для анализа распределения.
    Dissimilar Populations (Разнородные совокупности)
    Группы контента, чьи метрики ранжирования имеют существенно разный масштаб или распределение.
    Geometric Mean (GM) (Геометрическое среднее)
    Метод усреднения, используемый для расчета Average View Count. Устойчив к выбросам и хорошо подходит для данных с экспоненциальным распределением (как у метрик популярности).
    Most Common Bucket (Наиболее частый диапазон)
    Диапазон (Bucket), в который попало наибольшее количество элементов из данной совокупности. Используется как «центр масс» распределения.
    Parent Population (Родительская совокупность)
    Набор элементов контента, обладающих общим свойством (например, ценовая модель, вертикаль поиска, тип контента).
    Ranking Boost / Offset (Повышающий коэффициент / Смещение)
    Значение, добавляемое к исходной оценке элемента для нормализации. Рассчитывается на основе разницы между Geometric Mean разных совокупностей.
    View Count / Popularity Count (Количество просмотров / Метрика популярности)
    Исходная метрика, используемая для ранжирования (скачивания, просмотры, покупки, клики).

    Ключевые утверждения (Анализ Claims)

    Патент сосредоточен на методе нормализации оценок при смешивании.

    Claim 1 (Независимый пункт): Описывает систему и основной алгоритм смешивания двух разнородных совокупностей.

    1. Система идентифицирует первую и вторую коллекции элементов, принадлежащих к разным Parent Populations.
    2. Определяется показатель популярности (View Count) для каждого элемента.
    3. Элементы внутри каждой совокупности сортируются по группам (Buckets) на основе их View Count.
    4. Для каждой совокупности идентифицируется группа с наибольшим количеством элементов (Most Common Bucket).
    5. Вычисляется Average View Count для элементов *в этой самой многочисленной группе*.
    6. На основе этих средних значений вычисляются повышающие коэффициенты (Ranking Boosts). Утверждается, что один буст больше порога, а другой меньше (это означает, что одна совокупность повышается относительно другой для выравнивания).
    7. Каждому элементу присваивается оценка (Score) на основе его View Count И соответствующего Ranking Boost.
    8. Элементы из обеих совокупностей ранжируются вместе на основе этих новых оценок.
    9. Элементы агрегируются в единый упорядоченный список.

    Claim 2 (Зависимый от 1): Уточняет реализацию ключевых метрик.

    Average View Count реализуется как Geometric Mean (GM) количества просмотров элементов в Most Common Bucket. Ranking Boosts рассчитываются на основе разницы между GM первой и второй совокупностей. Это подтверждает, что цель алгоритма — выровнять статистические центры распределений популярности.

    Где и как применяется

    Изобретение применяется на финальных этапах формирования поисковой выдачи, когда необходимо объединить результаты из разных источников или корпусов данных.

    METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
    Это основная область применения патента. Когда система метапоиска получает списки результатов из разных вертикалей или разных категорий внутри вертикали (например, платные и бесплатные приложения), она использует этот механизм нормализации. Он позволяет рассчитать финальные оценки (Blended Ranking Scores), чтобы результаты из разнородных совокупностей могли быть корректно сопоставлены и объединены в единую выдачу (SERP).

    RANKING – Ранжирование (Специализированное)
    Алгоритм может применяться внутри одной вертикали, если она содержит разнородные типы контента (например, в Google Play или YouTube).

    INDEXING – Индексирование (Косвенно)
    На этом этапе собираются сырые данные, используемые в алгоритме: View Counts и классификация элементов по Parent Populations.

    Входные данные:

    • Коллекции элементов для ранжирования.
    • Принадлежность каждого элемента к Parent Population.
    • Показатель популярности (View Count) для каждого элемента.

    Выходные данные:

    • Единый упорядоченный список элементов из всех совокупностей.
    • Нормализованные оценки ранжирования (Scores) для каждого элемента.

    На что влияет

    • Конкретные платформы: Наибольшее влияние на маркетплейсы и агрегаторы (Google Play, YouTube, Google Shopping), где смешиваются элементы с разными моделями монетизации (бесплатные, платные) или форматами.
    • Универсальный поиск (Universal Search): Влияет на баланс результатов из вертикалей (Картинки, Новости, Видео) и основного веб-индекса. Нормализация позволяет компенсировать разницу в объеме трафика и кликабельности между вертикалями.

    Когда применяется

    • Условия активации: Алгоритм применяется, когда система должна сгенерировать единый список ранжирования из элементов, принадлежащих к двум или более Parent Populations, и когда эти совокупности имеют сильно различающиеся (dissimilar) распределения основного показателя ранжирования (популярности).

    Пошаговый алгоритм

    Детальный процесс нормализации и смешивания (на примере двух совокупностей: Популяция 1 и Популяция 2).

    1. Идентификация и Сбор данных: Получение элементов и их View Counts для Популяции 1 и Популяции 2.
    2. Группировка (Bucketing): Элементы внутри каждой популяции группируются по диапазонам View Counts (например, по степеням 10: 0-10, 10-100, 100-1000 и т.д.).
    3. Определение самой многочисленной группы: Для каждой Популяции определяется группа (Bucket) с максимальным количеством элементов (Most Common Bucket).
    4. Расчет Среднего Геометрического (GM): Вычисляется GM показателей View Counts только для элементов, попавших в Most Common Bucket (GM1 и GM2). Это минимизирует влияние выбросов («хвоста» распределения).
    5. Расчет разницы: Вычисляется разница между средними геометрическими: Diff = GM1 — GM2.
    6. Расчет Повышающих Коэффициентов (Boosts): Вычисляются бусты. Популяция с меньшим GM получает буст, чтобы «подтянуть» ее центр к другой популяции.
      Пример: Если Diff > 0 (Поп. 1 популярнее), то Boost1 = 0, а Boost2 = Diff.
      Если Diff < 0 (Поп. 2 популярнее), то Boost1 = |Diff|, а Boost2 = 0.
    7. Расчет Нормализованных Оценок: Для каждого элемента рассчитывается финальная оценка ранжирования путем применения соответствующего буста к его исходному показателю популярности. Пример формулы из патента: Score = log(View Count) + Boost.
    8. Смешивание и Упорядочивание: Все элементы объединяются и сортируются по их новым нормализованным оценкам для формирования финального списка.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании метрик популярности и классификации контента.

    • Поведенческие факторы: Основные данные — это показатели популярности (View Counts). Патент определяет это широко как потребление контента: клики, загрузки, установки, просмотры.
    • Системные факторы (Классификация): Данные о принадлежности элемента к определенной Parent Population (например, тип монетизации, вертикаль поиска, источник контента).

    Какие метрики используются и как они считаются

    • Buckets (Группы): Диапазоны показателей популярности.
    • Most Common Bucket: Группа с максимальным количеством элементов.
    • Geometric Mean (GM): Среднее геометрическое. Рассчитывается для показателей популярности элементов, попавших в Most Common Bucket.
    • Diff (Разница GM): Разница между GM разных совокупностей.
    • Ranking Boost (Offset): Повышающий коэффициент. Рассчитывается на основе Diff. Применяется к той совокупности, у которой GM ниже.
    • Нормализованная Оценка (Score): Финальная оценка для ранжирования. Рассчитывается как функция от исходного View Count и Ranking Boost.

    Выводы

    1. Нормализация для Смешивания (Blending): Патент подтверждает, что Google не сравнивает абсолютные значения показателей (например, клики или просмотры) напрямую при смешивании результатов из разных источников (Parent Populations). Вместо этого используется механизм нормализации.
    2. Статистический Центр как Анкорь: Нормализация базируется на «типичной популярности» совокупности, определяемой как Geometric Mean самой многочисленной группы (Most Common Bucket). Это позволяет игнорировать «длинный хвост» и выбросы.
    3. Компенсация Непопулярности: Система активно компенсирует разницу в популярности между совокупностями. Менее популярные категории (например, платный контент) получают Ranking Boost, чтобы их лучшие представители могли конкурировать с лучшими представителями более популярных категорий (например, бесплатный контент).
    4. Применение в Универсальном Поиске: Этот механизм критически важен для работы METASEARCH. Он позволяет сбалансировать выдачу, гарантируя, что результаты из разных вертикалей (Картинки, Новости, Видео) могут появляться на высоких позициях, даже если их общие метрики отличаются от веб-результатов.
    5. Баланс Популярности и Разнообразия: Изобретение направлено на повышение разнообразия (Diversity) в финальной выдаче, предотвращая доминирование одного типа контента только за счет его большего объема трафика.

    Практика

    Best practices (это мы делаем)

    Хотя патент описывает внутренние механизмы смешивания, можно сделать стратегические выводы:

    • Фокус на лидерстве внутри своей категории (Population): Основная стратегия — быть лучшим в своей категории. Поскольку система нормализует общую популярность между совокупностями, критически важно иметь высокие показатели относительно прямых конкурентов в вашей собственной Parent Population. Лидерство в узкой или менее популярной категории может обеспечить высокую позицию в смешанной выдаче благодаря Ranking Boost.
    • Присутствие и оптимизация в разных вертикалях: Важно обеспечивать присутствие бренда в разных вертикалях (Web, Video, Images, News). Понимание нормализации подчеркивает возможность получения видимости через менее популярные вертикали, результаты которых могут быть повышены при смешивании.
    • Обеспечение корректной классификации: Убедитесь, что ваш контент четко классифицирован (через разметку, фиды данных, структуру). Это гарантирует, что Google отнесет его к правильной Parent Population и применит корректную модель нормализации.

    Worst practices (это делать не надо)

    • Игнорирование вертикального поиска: Фокусировка только на основном веб-индексе является устаревшей стратегией. Механизмы смешивания активно интегрируют результаты из других вертикалей.
    • Сравнение абсолютных показателей между разными типами контента: Нельзя напрямую сравнивать трафик на веб-страницу и количество просмотров видео на YouTube для оценки их шансов в смешанной выдаче, так как система применяет нормализацию и Ranking Boosts.
    • Опора только на массовый трафик: Предположение, что высокий общий трафик гарантирует высокие позиции в смешанной выдаче, ошибочно, если этот трафик обусловлен принадлежностью к естественно более популярной категории.

    Стратегическое значение

    Патент раскрывает техническую реализацию того, как Google обеспечивает разнообразие выдачи и управляет Универсальным поиском. Он демонстрирует, что процесс смешивания — это математически обоснованная нормализация оценок между разными корпусами данных. Это позволяет Google показывать пользователю наиболее подходящий тип контента, а не только самый «популярный» в абсолютном выражении. Для SEO это означает, что стратегия должна быть комплексной, охватывающей все релевантные вертикали и типы контента.

    Практические примеры

    Сценарий 1: Ранжирование приложений в Google Play (Смешивание Бесплатных и Платных)

    1. Совокупности: P1=»Бесплатные приложения», P2=»Платные приложения».
    2. Анализ популярности: Бесплатные приложения имеют на порядки больше загрузок (View Counts).
    3. Расчет GM:
      • Для P1 (Бесплатные): Самая многочисленная группа — 100k-1M загрузок. GM_1 = 400,000.
      • Для P2 (Платные): Самая многочисленная группа — 1k-10k загрузок. GM_2 = 3,000.
    4. Расчет Буста: Система вычисляет разницу и применяет Ranking Boost к P2 (Платные), чтобы выровнять GM_2 с GM_1.
    5. Результат: Лучшие платные приложения (которые имеют высокие показатели внутри P2) получают значительное повышение и отображаются наряду с лучшими бесплатными приложениями в финальном списке.

    Сценарий 2: Смешивание Видео из разных источников (YouTube vs Vimeo)

    1. Совокупности: P1=»YouTube», P2=»Vimeo».
    2. Анализ: YouTube имеет значительно больший охват и, как следствие, более высокие показатели просмотров.
    3. Нормализация: Система рассчитывает GM для обеих платформ. GM_YouTube значительно выше GM_Vimeo. К совокупности Vimeo применяется Ranking Boost.
    4. Результат: Видео с Vimeo, которое очень популярно в контексте Vimeo, может конкурировать за место в смешанном блоке Видео с результатами YouTube, имеющими гораздо больше абсолютных просмотров.

    Вопросы и ответы

    Что такое «Parent Populations» в контексте этого патента?

    Parent Populations — это наборы элементов, которые имеют схожие характеристики и распределение показателей ранжирования. Классические примеры из патента — это «Бесплатный контент» и «Платный контент». В SEO это могут быть разные вертикали поиска: Веб-индекс, Картинки, Новости, Видео. Каждая вертикаль имеет свой корпус данных и свои особенности распределения кликов и популярности.

    Почему Google не может просто ранжировать все результаты по абсолютной популярности (View Count)?

    Если ранжировать напрямую по абсолютным показателям, результаты будут сильно искажены в пользу совокупностей с большим объемом трафика или низким барьером потребления. Например, бесплатные приложения всегда будут доминировать над платными. Это приведет к тому, что менее популярные (но потенциально более качественные) типы контента никогда не попадут в топ. Нормализация решает эту проблему.

    Что такое «Geometric Mean» (GM) и почему он используется вместо обычного среднего?

    Geometric Mean (Среднее геометрическое) используется, потому что показатели популярности (клики, просмотры) обычно имеют экспоненциальное распределение с «длинным хвостом». GM менее чувствителен к экстремально высоким значениям (выбросам) по сравнению со средним арифметическим, что делает его более надежным показателем «центра» распределения популярности.

    Что такое «Bucketing» и «Most Common Bucket»?

    Bucketing — это процесс группировки элементов по диапазонам значений популярности (например, 1-10, 10-100 просмотров). Most Common Bucket — это та группа, в которую попало наибольшее количество элементов. Google использует эту группу как основу для расчета GM, чтобы определить «типичную» популярность для данной совокупности, игнорируя при этом выбросы.

    Как работает Ranking Boost?

    Ranking Boost рассчитывается как разница между Geometric Mean (GM) сравниваемых совокупностей. Буст применяется к той совокупности, у которой GM ниже. Цель состоит в том, чтобы искусственно «подтянуть» центр распределения менее популярной совокупности до уровня более популярной, позволяя их лучшим элементам конкурировать на равных.

    Как этот патент влияет на стратегию Универсального Поиска (Universal Search)?

    Он показывает, что Google активно управляет балансом между вертикалями. Если система считает, что определенная вертикаль важна для запроса, она может применить Ranking Boost, чтобы гарантировать видимость результатов из этой вертикали в топе, даже если их исходные оценки ниже, чем у веб-результатов. Это подчеркивает необходимость комплексной SEO-стратегии.

    Может ли этот механизм понизить мой сайт в выдаче?

    Да, косвенно. Если ваш сайт находится в высококонкурентной совокупности (например, веб-индекс) и Google решает подмешать результаты из другой совокупности (например, Видео), применяя к ним Ranking Boost, эти нормализованные результаты могут занять высокие позиции, сместив ваш сайт вниз в финальной смешанной выдаче (SERP).

    Что важнее: быть популярным в своей категории или иметь высокую общую популярность?

    В контексте этого патента критически важно быть популярным относительно конкурентов в своей собственной Parent Population. Система нормализует общую популярность между совокупностями. После применения буста ранжирование определяется тем, насколько элемент популярен внутри своей группы.

    Использует ли система Медиану или Геометрическое Среднее для нормализации?

    Патент упоминает оба варианта. В абстракте и некоторых пунктах формулы изобретения говорится о медианном значении (median value). Однако основной алгоритм, детально описанный в патенте (и защищенный Claim 2), использует Геометрическое Среднее (Geometric Mean) наиболее частого диапазона. Это пример вариативности реализации.

    Является ли этот патент инфраструктурным или он дает прямые рекомендации для SEO?

    Этот патент преимущественно инфраструктурный. Он описывает внутренние механизмы Google на этапе METASEARCH (Смешивание). Он не дает прямых рекомендаций по оптимизации страниц, но дает критически важное понимание того, как Google формирует финальную выдачу из разных источников, что необходимо для построения эффективной долгосрочной SEO-стратегии.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.