SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google нормализует и объединяет разнородные сигналы для ранжирования критериев таргетинга в рекламных системах

SCORING CRITERIA FOR A CONTENT ITEM (Оценка критериев для элемента контента)
  • US9501549B1
  • Google LLC
  • 2014-04-28
  • 2016-11-22
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.

Описание

Какую проблему решает

Патент решает проблему справедливого и эффективного ранжирования разнообразных критериев распространения (Distribution Criteria) для элемента контента (Content Item). В контексте патента речь идет о рекламной системе (например, Google Ads), где Content Item — это объявление, а Distribution Criteria — это варианты таргетинга (ключевые слова, веб-страницы, вертикали).

Сложность заключается в объединении разнородных сигналов (например, CTR, количество показов, релевантность), которые имеют разные шкалы и распределения. Патент устраняет две ключевые проблемы:

  • Асимметрия данных (Skewness): Предотвращает доминирование критериев с экстремально высокими показателями (например, ключевых слов с миллиардами показов).
  • Отсутствие данных (Sparsity): Гарантирует, что критерий не будет пессимизирован, если для него отсутствуют данные по какому-либо вспомогательному сигналу.

Что запатентовано

Запатентован метод оценки и ранжирования критериев распространения рекламы. Он основан на использовании Primary Ranking Signal (основного сигнала) и набора Auxiliary Ranking Signals (вспомогательных сигналов). Вспомогательные сигналы корректируются для уменьшения асимметрии (Skewness) с помощью функций трансформации (например, логарифмических). Затем сигналы объединяются с использованием функции, которая гарантирует, что низкие или отсутствующие вспомогательные оценки не снижают итоговый Ranking Score (пессимизация отсутствует), но высокие оценки обеспечивают повышение (boost).

Как это работает

Система работает в рамках Content Management System (рекламной платформы):

  1. Идентификация сигналов: Определяется основной сигнал (например, семантическая релевантность объявления ключевому слову) и вспомогательные (например, исторический CTR, показы).
  2. Корректировка вспомогательных сигналов: Применяются методы Data Science для стандартизации данных:
    • Transformation: Использование функций (например, Log(x)Log(x)Log(x)) для снижения Skewness.
    • Capping: Ограничение максимальных значений для устранения выбросов.
    • Normalization: Приведение к единой шкале (например, 0-1).
  3. Расчет рейтинга (Boost-Only Logic): Итоговый Ranking Score рассчитывается по формуле, предотвращающей пессимизацию. Например, R=P∗(1+A)R = P * (1+A)R=P∗(1+A) (где P — основная оценка, A — вспомогательная). Если A=0, штрафа нет. Если A>0, есть повышение.

Актуальность для SEO

Высокая (для AdTech и Data Science). Описанные методы нормализации, трансформации и ограничения данных являются стандартными и актуальными практиками в Data Science для обработки разнородных и искаженных сигналов в системах машинного обучения и рекламных платформах.

Важность для SEO

Влияние на SEO минимальное (1/10). Патент является чисто техническим и описывает внутренние процессы Content Management System, что в контексте патента явно указывает на рекламную платформу (Google Ads), а не на систему органического поиска. Он описывает, как ранжировать критерии таргетинга для рекламы, а не как ранжировать веб-страницы в ответ на запрос пользователя. Патент не содержит практических рекомендаций для SEO-специалистов.

Детальный разбор

Термины и определения

Auxiliary Ranking Signal (Вспомогательный сигнал ранжирования)
Дополнительный сигнал, используемый для корректировки основного рейтинга. Примеры: CTR, количество показов, конверсии, user reach.
Capping (Ограничение)
Процесс установки максимального значения для оценки сигнала с целью устранения экстремальных выбросов (outliers), которые могут исказить нормализацию и ранжирование.
Content Item (Элемент контента)
Единица контента, которая распространяется через систему. В контексте патента это рекламное объявление (advertisement).
Content Management System (Система управления контентом)
Платформа, управляющая распространением Content Items. В контексте патента это рекламная сеть (например, Google Ads).
Distribution Criteria (Критерии распространения)
Условия, при которых Content Item может быть показан (критерии таргетинга). Примеры: ключевые слова, веб-страницы (placements), вертикали.
Normalization (Нормализация)
Процесс приведения оценок различных сигналов к единой шкале (например, от 0 до 1) для обеспечения их сопоставимости.
Primary Ranking Signal (Основной сигнал ранжирования)
Главный сигнал, используемый для ранжирования критериев. Например, семантическая релевантность между объявлением и критерием, или сигнал, выбранный рекламодателем.
Skewness (Асимметрия, Перекос)
Мера асимметрии распределения данных. Высокая асимметрия означает наличие экстремальных значений (например, распределение количества показов по ключевым словам).
Transformation Function (Функция трансформации)
Математическая функция (например, Log(x)Log(x)Log(x), Sqrt(x)Sqrt(x)Sqrt(x)), применяемая к оценкам для уменьшения их асимметрии (Skewness).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования критериев для элемента контента (рекламы).

  1. Система идентифицирует основной (Primary) и набор вспомогательных (Auxiliary) сигналов ранжирования.
  2. Для каждого критерия (например, ключевого слова) вспомогательные оценки корректируются. Корректировка включает применение Transformation Function для уменьшения Skewness.
  3. Определяется итоговый Ranking Score на основе функции от основной оценки и скорректированных вспомогательных оценок.
  4. Ключевая характеристика функции: она подавляет (suppressing effects) влияние вспомогательных оценок, которые ниже определенного значения, и повышает (boosting) рейтинг с помощью оценок, которые выше этого значения.
  5. Система выбирает критерии на основе Ranking Score и предоставляет элемент контента.

Claim 4 (Зависимый от 2 и 1): Детализирует математический механизм комбинирования оценок без штрафов (Boost-Only Logic).

  1. Комбинированная вспомогательная оценка складывается с константой (constant value, например, 1).
  2. Вычисляется произведение этой суммы и основной оценки (Primary Score).

Это реализация формулы вида R=P∗(Constant+AuxiliaryScore)R = P * (Constant + AuxiliaryScore)R=P∗(Constant+AuxiliaryScore). Если константа равна 1, а вспомогательная оценка равна 0, множитель равен 1 (пессимизации нет).

Claim 6 (Зависимый от 1): Описывает механизм ограничения (Capping).

  1. Для вспомогательного сигнала определяется максимальное значение (maximum value). Оно устанавливается ниже, чем абсолютное наивысшее значение в наборе данных (для устранения выбросов).
  2. Оценки, превышающие это максимальное значение, снижаются до него.

Где и как применяется

Важно понимать, что этот патент не применяется в стандартной архитектуре органического поиска Google (CRAWLING, INDEXING, QUNDERSTANDING, RANKING, METASEARCH, RERANKING).

Он применяется исключительно внутри Content Management System, который, судя по описанию (Campaign Data, Publisher Websites), является рекламной платформой (например, Google Ads).

Система: Рекламная платформа (Ad Platform Infrastructure).

Компонент: Criteria Ranking Engine.

Цель: Оценка качества и потенциальной эффективности различных вариантов таргетинга (ключевых слов, площадок) для конкретного рекламного объявления. Это может использоваться для рекомендации критериев рекламодателю или для внутренней оптимизации.

Входные данные:

  • Элемент контента (Рекламное объявление).
  • Набор потенциальных критериев распространения.
  • Данные об эффективности (Criteria Data, Performance Data): CTR, показы, конверсии, релевантность.

Выходные данные:

  • Ранжированный список критериев таргетинга с итоговыми Ranking Scores.

На что влияет

Алгоритм влияет исключительно на процессы внутри рекламной системы:

  • Типы критериев: Влияет на ранжирование всех типов критериев таргетинга — ключевых слов, веб-страниц (placements), вертикалей, каналов.
  • Цели кампаний: Позволяет системе адаптировать ранжирование под цели рекламодателя, если тот выбирает разные Primary Signals или устанавливает разные веса для Auxiliary Signals.

На органический поиск (SEO) влияния нет.

Когда применяется

Алгоритм применяется в следующих сценариях внутри рекламной платформы:

  • Когда система рекомендует рекламодателю новые критерии таргетинга (например, в Keyword Planner).
  • Когда система оценивает существующие критерии таргетинга для оптимизации эффективности кампании.
  • Когда необходимо сравнить потенциальную эффективность разных типов критериев (ключевое слово vs. сайт размещения) для одного объявления.

Пошаговый алгоритм

Процесс ранжирования критериев таргетинга для элемента контента.

  1. Инициализация: Определение набора критериев для ранжирования. Определение Primary Ranking Signal (P) и Auxiliary Ranking Signals (A1, A2...).
  2. Сбор данных: Получение оценок P и A для каждого критерия.
  3. Корректировка вспомогательных оценок (Adjustment Phase):
    • Трансформация (Transformation): Анализ распределения оценок для сигнала A. Если Skewness высока, применяется Transformation Function (например, Log(x)Log(x)Log(x)) для ее снижения.
    • Ограничение (Capping): Экстремально высокие значения снижаются до установленного порога (например, до уровня 90-го перцентиля).
    • Нормализация (Normalization): Оценки приводятся к единой шкале (например, 0-1).
    • Взвешивание (Weighting): Применение весовых коэффициентов, отражающих важность сигнала.
  4. Агрегация (Опционально): Скорректированные вспомогательные оценки могут быть объединены в комбинированные оценки (Combined Auxiliary Score - CAS), возможно, с группировкой по типу (например, сигналы эффективности vs. сигналы авторитетности).
  5. Расчет итогового рейтинга (Ranking Score): Итоговая оценка рассчитывается по функции, которая не штрафует за низкие вспомогательные оценки. Например (Relationship 1 в патенте):
    Ri=Pi∗(1+Ai1)∗(1+Ai2)...R_{i}=P_{i}*(1+A_{i1})*(1+A_{i2})...Ri​=Pi​∗(1+Ai1​)∗(1+Ai2​)...
  6. Выбор критериев: Критерии ранжируются по итоговому Ranking Score.

Какие данные и как использует

Данные на входе

Патент описывает использование данных, характерных для рекламных систем:

  • Поведенческие / Performance факторы:
    • Click-through rates (CTR) и Click counts.
    • Impression counts (Количество показов).
    • Conversion rates и Conversion counts.
  • Контентные / Релевантностные факторы:
    • Semantic scores: Оценка семантической релевантности между критерием и рекламой.
  • Факторы авторитетности/качества (для мест размещения):
    • Authority scores или Page rank scores (упоминается в тексте как пример вспомогательного сигнала для веб-страниц).
    • Page view counts и Unique user counts.
    • Brand scores.
  • Факторы охвата:
    • User reach.

Какие метрики используются и как они считаются

Патент фокусируется на методах обработки и комбинирования метрик.

  • Измерение асимметрии (Skewness): Используется для определения необходимости применения Transformation Function.
  • Функции трансформации: Упоминаются конкретные примеры:
    • Log(X)Log(X)Log(X)
    • Sqrt(x)Sqrt(x)Sqrt(x) (Квадратный корень)
    • (1−1/(x−a))(1-1/(x-a))(1−1/(x−a))
  • Capping (Ограничение): Максимальное значение может определяться на основе перцентилей (например, 90-й перцентиль).
  • Нормализация: Приведение к диапазону (например, от 0 до 1).
  • Формулы комбинирования:
    • Relationship (1) (Простое комбинирование): Ri=Pi∗(1+Ai1)∗(1+Ai2)...R_{i}=P_{i}*(1+A_{i1})*(1+A_{i2})...Ri​=Pi​∗(1+Ai1​)∗(1+Ai2​)...

Выводы

  1. Патент относится к инфраструктуре рекламы (AdTech), а не к органическому поиску (SEO): Это ключевой вывод. Патент описывает работу Content Management System (рекламной платформы) для ранжирования Distribution Criteria (критериев таргетинга). Он не описывает алгоритмы ранжирования веб-страниц в Google Search.
  2. Сложная обработка данных для борьбы с искажениями: Патент детально описывает применение техник Data Science (Трансформация, Capping, Нормализация) для борьбы с асимметрией данных (Skewness) и выбросами. Это необходимо для предотвращения доминирования экстремальных значений (например, сверхвысоких показов).
  3. Принцип комбинирования без штрафов (Boost-Only Logic): Ключевая особенность — использование формулы вида P∗(1+A)P*(1+A)P∗(1+A). Это гарантирует, что критерии с отсутствующими или низкими вспомогательными оценками не будут пессимизированы, но получат повышение при высоких оценках.
  4. Отсутствие практической ценности для SEO: Так как патент инфраструктурный и относится к рекламным системам, он не дает никаких практических выводов или рекомендаций для SEO-специалистов, работающих над органическим продвижением сайтов.

Практика

Best practices (это мы делаем)

Патент является инфраструктурным, относится к рекламным системам (Google Ads) и не дает практических выводов для органического SEO. Практических рекомендаций по оптимизации сайтов для органического поиска на основе этого патента нет.

Worst practices (это делать не надо)

Патент является инфраструктурным и не дает практических выводов для органического SEO. Нельзя делать выводы о работе органического поиска на основе механизмов, описанных для рекламных систем.

Стратегическое значение

Стратегическое значение для SEO отсутствует. Патент интересен с академической точки зрения, так как демонстрирует применение стандартных методов Data Science (нормализация, трансформация данных) для решения задачи ранжирования в экосистеме Google. Однако эти знания нельзя напрямую перенести на понимание алгоритмов органического ранжирования.

Практические примеры

Практических примеров для SEO нет. Ниже приведен пример, иллюстрирующий работу алгоритма в контексте рекламной системы (PPC).

Сценарий (PPC): Ранжирование ключевых слов для рекламы

Сигналы: Primary (P) = Релевантность (0-1). Auxiliary (A) = Показы (Impressions).

Критерии:

  • Ключевое слово 1 (К1): P=0.8. Показы=1,000,000.
  • Ключевое слово 2 (К2): P=0.8. Показы=1000.

Процесс:

  1. Трансформация (Показы): Система применяет Log10 для уменьшения Skewness.
    Log10(1,000,000) = 6.
    Log10(1000) = 3.
  2. Нормализация (Показы): Предположим, что после трансформации максимум равен 6. Нормализуем к шкале 0-1.
    К1: 6/6 = 1.0 (A1).
    К2: 3/6 = 0.5 (A2).
  3. Расчет Ranking Score: Используем формулу R=P∗(1+A)R = P * (1+A)R=P∗(1+A).
    R(K1) = 0.8 * (1 + 1.0) = 1.6.
    R(K2) = 0.8 * (1 + 0.5) = 1.2.

Результат: К1 ранжируется выше, но разница в итоговом рейтинге (1.6 vs 1.2) значительно меньше, чем разница в исходных показах (1,000,000 vs 1000), благодаря трансформации и нормализации.

Вопросы и ответы

Описывает ли этот патент, как Google ранжирует сайты в органической выдаче?

Нет. Этот патент не имеет отношения к органическому поиску. Он описывает работу Content Management System (рекламной платформы, например, Google Ads) и то, как эта система ранжирует Distribution Criteria (критерии таргетинга, такие как ключевые слова или сайты для размещения рекламы) для конкретного Content Item (рекламного объявления).

В чем основная задача, которую решает этот патент?

Основная задача — справедливо объединить разнородные сигналы ранжирования (например, релевантность, CTR, показы), которые имеют разные шкалы и распределения. Патент предлагает методы для снижения влияния экстремально высоких значений (асимметрии данных, Skewness) и гарантирует, что отсутствие данных по какому-либо сигналу не приведет к штрафу (пессимизации) критерия.

Как система избегает штрафов за отсутствие данных по вспомогательному сигналу?

Система использует специфическую формулу комбинирования, например, R=P∗(1+A)R = P * (1+A)R=P∗(1+A), где P — основная оценка, A — вспомогательная. Если данные отсутствуют, A=0. В этом случае множитель равен (1+0)=1. Таким образом, итоговый рейтинг не снижается (штрафа нет), что критично для новых ключевых слов.

Что такое "Transformation Function" и зачем она нужна?

Это математическая функция, такая как Log(x)Log(x)Log(x) или Sqrt(x)Sqrt(x)Sqrt(x). Она используется для уменьшения асимметрии (Skewness) данных. Например, количество показов по разным ключевым словам может отличаться на порядки (1000 vs 1,000,000). Трансформация сглаживает эти различия, предотвращая доминирование экстремально высоких значений.

Что такое Capping и как он работает?

Capping (Ограничение) — это процесс принудительного снижения экстремально высоких значений (выбросов). Система определяет максимальный порог (например, на уровне 90-го перцентиля), и все значения выше этого порога снижает до него. Это еще один метод борьбы с искажениями, который применяется перед нормализацией данных.

Что такое Primary и Auxiliary Ranking Signals?

Primary Ranking Signal — это основной сигнал, определяющий базовый рейтинг критерия (например, семантическая релевантность объявления ключевому слову). Auxiliary Ranking Signals — это вспомогательные сигналы (например, CTR, охват, авторитетность площадки), которые используются для корректировки (повышения) базового рейтинга, если они имеют достаточно высокие значения.

Могу ли я использовать инсайты из этого патента для улучшения SEO моего сайта?

Нет. Механизмы, описанные в этом патенте, предназначены для оптимизации выбора критериев таргетинга в рекламных кампаниях. Они не описывают факторы, влияющие на ранжирование сайтов в органической выдаче Google Search, и не дают рекомендаций по улучшению E-E-A-T или других SEO-метрик.

К каким этапам поиска относится этот патент согласно 6-этапной архитектуре?

Этот патент не относится ни к одному из этапов органического поиска (CRAWLING, INDEXING, QUNDERSTANDING, RANKING, METASEARCH, RERANKING). Он описывает инфраструктуру рекламной платформы (AdTech), которая работает параллельно с органическим поиском.

В патенте упоминаются Page Rank и Authority Scores. Значит ли это, что он связан с SEO?

Нет. Page Rank scores и Authority scores упоминаются в патенте как примеры вспомогательных сигналов (Auxiliary Ranking Signals) для оценки качества веб-страниц, выступающих в роли площадок для размещения рекламы (Distribution Criteria). Речь идет об оценке ценности площадки для рекламодателя, а не о её ранжировании в органическом поиске.

Какова ценность этого патента для Senior SEO специалиста?

Ценность минимальна и носит чисто образовательный характер. Патент полезен для понимания общих принципов обработки и нормализации данных, используемых в экосистеме Google (в данном случае, в Google Ads). Однако он не применим к разработке стратегии органического продвижения и не дает практических инструментов для SEO.

Похожие патенты

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google повышает ранжирование каналов на основе позиций их контента в результатах поиска
Google использует механизм для улучшения видимости «Каналов» (например, каналов YouTube) в поиске на контент-платформах. Система гарантирует присутствие определенного числа каналов в выдаче, а затем агрессивно повышает ранжирование канала, если его отдельные единицы контента (например, видео) уже занимают высокие позиции по данному запросу. Это достигается путем расчета совокупной оценки канала на основе позиций его контента.
  • US9348922B2
  • 2016-05-24
  • SERP

  • Мультимедиа

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
  • US20210125108A1
  • 2021-04-29
  • Поведенческие сигналы

  • SERP

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования
Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.
  • US7933890B2
  • 2011-04-26
  • Структура сайта

  • Техническое SEO

  • Индексация

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации
Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.
  • US7565358B2
  • 2009-07-21
  • EEAT и качество

  • Ссылки

seohardcore