SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google нормализует оценки релевантности из разных индексов для создания Универсальной поисковой выдачи (Universal Search)

BLENDING CONTENT IN AN OUTPUT (Смешивание контента в выходных данных)
  • US8930340B1
  • Google LLC
  • 2012-09-13
  • 2015-01-06
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм статистической нормализации для смешивания результатов из разных корпусов (Веб, Новости, Видео). Поскольку каждый индекс использует свою шкалу оценок релевантности, система анализирует их распределения и применяет квантильную нормализацию, приводя все оценки к единой шкале (например, 0-1). Это позволяет справедливо сравнивать релевантность разных типов контента и формировать смешанную поисковую выдачу.

Описание

Какую проблему решает

Патент решает фундаментальную проблему Универсального Поиска (Universal Search): как объективно сравнивать и ранжировать результаты, полученные из разных коллекций контента (корпусов или индексов), когда каждый корпус использует собственную, несовместимую с другими, шкалу оценок релевантности (Content Relevance Scores). Например, оценка 2000 может быть максимальной в Веб-индексе, а оценка 2 – максимальной в Новостном индексе. Изобретение позволяет привести эти разнородные оценки к единому стандарту для корректного смешивания (blending) результатов в финальной выдаче.

Что запатентовано

Запатентована система и метод нормализации оценок релевантности контента из различных корпусов (Claims 1-19). Суть заключается в анализе диапазонов (ranges) и статистических распределений (distributions, например, гистограмм) оценок для каждого корпуса. Система использует метод, основанный на квантильной нормализации: распределения разбиваются на части (квантили или процентили), и эти части сопоставляются с соответствующими частями в едином нормализованном диапазоне (normalized range), например, 0-1.

Как это работает

Система работает в два основных этапа: калибровка и применение.

  • Калибровка (Офлайн/Периодически): Normalization Engine выполняет выборочные запросы к разным корпусам (Веб, Новости и т.д.). Для каждого корпуса анализируются полученные Content Relevance Scores, определяются их диапазоны и строится распределение (гистограмма). Это распределение делится на квантили.
  • Создание Маппинга: Квантили из распределения каждого корпуса сопоставляются (mapping) с соответствующими квантилями в едином нормализованном диапазоне (0-1).
  • Применение (Рантайм): При поиске исходные оценки из разных корпусов конвертируются в normalized scores с использованием созданного маппинга. Затем система ранжирует весь контент на основе этих универсальных оценок, позволяя смешивать результаты в единой выдаче.

Актуальность для SEO

Высокая. Универсальный поиск и смешивание результатов из разных вертикалей (Новости, Видео, Картинки, Веб) являются основой современной выдачи Google. Механизм, позволяющий сравнивать релевантность между разными типами контента (Cross-Corpus Relevance), критически важен для функционирования поиска. Описанный метод статистической нормализации остается актуальным подходом для решения этой задачи.

Важность для SEO

Патент имеет высокое стратегическое значение (7/10) для понимания архитектуры поиска, но предлагает ограниченные возможности для прямого тактического применения. Он описывает инфраструктурный механизм, который позволяет Google формировать смешанную выдачу. Для SEO-специалистов это подчеркивает важность оптимизации не только в основном веб-индексе, но и в релевантных вертикалях, так как система способна сравнивать и предпочитать контент из разных источников на основе нормализованной релевантности (процентиля внутри корпуса).

Детальный разбор

Термины и определения

Blending (Смешивание)
Процесс объединения контента из разных коллекций (корпусов) в единый выходной набор данных (например, SERP).
Collections of content / Corpora (Коллекции контента / Корпуса)
Различные наборы данных или индексы. Примеры: News Feed (Новости), Web (Веб-контент), Blog (Блоги). Также могут включать контент по странам, языкам или демографии.
Content Relevance Scores (Оценки релевантности контента)
Метрики, указывающие на релевантность элемента контента запросу. Эти оценки генерируются специфично для каждого корпуса и могут иметь разные диапазоны.
Distribution / Histogram (Распределение / Гистограмма)
Статистическое представление частоты встречаемости различных Content Relevance Scores внутри одного корпуса.
Normalization Engine (Механизм нормализации)
Компонент поисковой системы, отвечающий за приведение оценок релевантности из разных корпусов к единой шкале.
Normalized Range / Normalized Scores (Нормализованный диапазон / Нормализованные оценки)
Единая шкала (в примере патента – от 0 до 1), к которой приводятся все оценки релевантности.
Quantiles / Subsets (Квантили / Подмножества)
Части, на которые делится распределение оценок (например, процентили). Используются как основа для маппинга исходных оценок в нормализованный диапазон (Квантильная нормализация).
Ranges (Диапазоны)
Верхние и нижние границы Content Relevance Scores, наблюдаемые для конкретного корпуса.

Ключевые утверждения (Анализ Claims)

Примечание: Формула изобретения (Claims 1-19) этого патента фокусируется исключительно на механизме нормализации. Хотя в основном описании (Description) патента подробно обсуждаются примеры применения, такие как смешивание социального контента и использование модели Затрат/Выгод (Cost/Gain Model), они не являются частью защищенного изобретения, описанного в Claims.

Claim 1 (Независимый пункт): Описывает полный процесс квантильной нормализации и ее использования для ранжирования смешанных результатов.

  1. Система получает диапазоны (ranges) оценок релевантности для разных коллекций контента.
  2. Генерируется нормализованный диапазон (normalized range) нормализованных значений.
  3. Выполняется нормализация диапазона конкретной коллекции:
    1. Генерируется распределение (distribution) оценок для этой коллекции.
    2. Распределение делится на первые подмножества (first subsets – квантили/процентили).
    3. Нормализованный диапазон делится на вторые подмножества (second subsets).
    4. Генерируется маппинг (mapping) первых подмножеств ко вторым.
    5. Для конкретной оценки релевантности определяется, в какое первое подмножество она попадает, и ей присваивается нормализованное значение из соответствующего второго подмножества.
  4. Выполняются поиски по разным коллекциям.
  5. Определяется, куда в нормализованном диапазоне попадают оценки релевантности найденного контента (используя нормализацию из шага 3).
  6. Контент ранжируется на основе того, куда его оценки попадают в нормализованном диапазоне.
  7. Выводятся результаты на основе этого ранжирования.

Ядро изобретения – это применение статистического метода (квантильной нормализации) для обеспечения возможности сравнения метрик релевантности между разными корпусами. Это означает, что результат, находящийся в 90-м процентиле релевантности для Корпуса А, получит нормализованную оценку, эквивалентную результату в 90-м процентиле Корпуса Б, независимо от их исходных числовых значений.

Claim 2 (Зависимый от 1): Уточняет метод получения исходных диапазонов (Шаг 1 Claim 1). Это делается офлайн путем выполнения выборочных поисковых запросов (sample search queries) и идентификации верхних и нижних границ полученных оценок релевантности для каждой коллекции.

Claims 3 и 4 (Зависимые от 1): Уточняют, что процесс динамический. Диапазоны оценок обновляются (либо через предопределенные интервалы времени (Claim 3), либо на основе изменений в коллекциях контента (Claim 4)), и маппинг пересчитывается.

Где и как применяется

Изобретение является ключевым компонентом, обеспечивающим работу Универсального Поиска.

Офлайн Анализ (Связано с INDEXING/RANKING)
Система требует периодической калибровки. Normalization Engine анализирует данные, полученные путем выполнения выборочных запросов, для построения распределений (distributions) и генерации маппингов (mappings) для каждого корпуса (Веб, Новости, Видео и т.д.).

RANKING – Ранжирование (Рантайм)
На этом этапе для пользовательского запроса генерируются результаты из различных корпусов. Каждый результат имеет исходную (нативную) оценку релевантности, специфичную для его корпуса.

METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Это основной этап применения патента. Normalization Engine используется для конвертации нативных оценок релевантности в Normalized Scores с использованием предварительно рассчитанных маппингов. Затем система смешивания (Blending Algorithm) сравнивает эти нормализованные оценки, чтобы определить финальный порядок результатов из разных корпусов в единой выдаче.

Входные данные:

  • Нативные Content Relevance Scores результатов поиска из разных корпусов.
  • Предварительно рассчитанные маппинги (данные о распределениях и квантилях).

Выходные данные:

  • Normalized Scores (например, в диапазоне 0-1) для всех результатов.
  • Смешанный (Blended) список результатов, отсортированный по Normalized Scores.

На что влияет

  • Типы контента и Вертикали: Влияет на весь контент, который участвует в Универсальной выдаче: веб-страницы, новости, видео, изображения, товары. Определяет, какой тип контента займет более высокие позиции при смешивании.
  • Специфические запросы: Наибольшее влияние на запросы, где интент пользователя может быть удовлетворен разными типами контента, что требует сравнения релевантности между вертикалями.
  • Языковые и географические ограничения: Патент упоминает (Claims 6, 15), что корпуса могут быть разделены по странам или языкам. Механизм нормализации применим и для смешивания таких результатов.

Когда применяется

  • Триггеры активации (Калибровка): Активируется периодически (офлайн) или когда обнаруживаются значительные изменения в корпусе контента или алгоритмах ранжирования, которые могут изменить распределение оценок.
  • Триггеры активации (Рантайм): Активируется в реальном времени, когда поисковая система решает объединить результаты из более чем одного корпуса в ответ на запрос пользователя (активация Universal Search).

Пошаговый алгоритм

Процесс состоит из двух основных фаз: Офлайн-калибровка и Рантайм-смешивание.

Фаза А: Офлайн-калибровка и Генерация Маппинга

  1. Сбор данных: Система выполняет набор выборочных поисковых запросов (sample search queries) к различным корпусам (например, Веб, Новости).
  2. Определение диапазонов: Для каждого корпуса идентифицируются верхние и нижние границы полученных оценок релевантности.
  3. Генерация распределений: Для каждого корпуса строится распределение (например, гистограмма) частоты встречаемости оценок релевантности.
  4. Определение Нормализованного Диапазона: Устанавливается единая шкала (например, 0-1).
  5. Квантизация: Распределение каждого корпуса делится на подмножества (квантили/процентили). Нормализованный диапазон также делится на соответствующие подмножества.
  6. Генерация маппинга: Создается соответствие (маппинг) между квантилями корпуса и квантилями нормализованного диапазона. (Например, 95-й процентиль Веб-оценок сопоставляется со значением 0.95).
  7. Обновление: Маппинги сохраняются и периодически обновляются.

Фаза Б: Рантайм-смешивание (Blending)

  1. Выполнение поиска: В ответ на запрос пользователя система выполняет поиск по релевантным корпусам.
  2. Получение исходных оценок: Система получает наборы результатов с нативными Content Relevance Scores.
  3. Конвертация оценок (Нормализация): Используя сохраненные маппинги (из Фазы А), система конвертирует нативные оценки в Normalized Scores. Для каждой оценки определяется, в какой квантиль корпуса она попадает, и ей присваивается соответствующее значение из нормализованного диапазона.
  4. Ранжирование и смешивание: Все результаты из разных корпусов объединяются и ранжируются на основе их Normalized Scores.
  5. Вывод результатов: Смешанный список результатов предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на обработке уже существующих оценок релевантности и не описывает, какие конкретные факторы (контентные, ссылочные, поведенческие и т.д.) используются для их генерации.

  • Системные данные: Content Relevance Scores. Это основные входные данные для Normalization Engine. Эти оценки генерируются отдельными системами ранжирования для каждого корпуса.
  • Данные о запросах: Sample search queries. Используются в офлайн-процессе для калибровки системы путем генерации выборки оценок релевантности.

Какие метрики используются и как они считаются

Система вычисляет и использует следующие метрики для нормализации:

  • Верхние и нижние границы (Upper and lower bounds): Минимальные и максимальные значения Content Relevance Scores для корпуса.
  • Распределение (Distribution/Histogram): Статистическая модель, описывающая частоту оценок в диапазоне.
  • Квантили/Процентили (Quantiles/Percentiles): Метрики, разделяющие диапазон распределения на интервалы с равными вероятностями.
  • Нормализованная оценка (Normalized Score): Итоговая метрика, рассчитанная путем применения квантильной нормализации. Если исходная оценка находится в X-м процентиле своего корпуса, ей присваивается значение, соответствующее X-му процентилю в нормализованном диапазоне.

Методы вычислений: Применение статистического метода – Квантильной Нормализации (Quantile Normalization).

Выводы

  1. Фундамент Универсального Поиска: Патент описывает критически важный инфраструктурный механизм, который решает проблему сравнения оценок релевантности из индексов, работающих по разным алгоритмам и шкалам, делая возможным Универсальный Поиск (Blended Search).
  2. Квантильная нормализация как стандарт: Google использует сложный статистический подход (квантильную нормализацию), а не простое линейное масштабирование (min/max). Это позволяет более точно сравнивать оценки, учитывая форму их распределения.
  3. Релевантность относительна корпуса: Ключевой вывод – позиция результата в смешанной выдаче определяется его положением в распределении оценок своего корпуса (процентилем), а не его абсолютным значением оценки релевантности.
  4. Динамическая калибровка: Система не статична. Она периодически перекалибровывается офлайн (путем анализа выборочных запросов), чтобы адаптироваться к изменениям в индексах или обновлениям алгоритмов ранжирования вертикалей.
  5. Инфраструктурный характер: Патент не раскрывает факторов ранжирования. Он описывает, что происходит с оценками после того, как они были сгенерированы.

Практика

Best practices (это мы делаем)

Хотя патент носит инфраструктурный характер, он имеет важные стратегические последствия для SEO:

  • Максимизация релевантности внутри корпуса: Это ключевая стратегия. Цель SEO – достичь наивысшего возможного процентиля релевантности внутри целевого корпуса. Если ваш контент находится в 99-м процентиле в Google News, он получит максимальную Normalized Score (например, 0.99) и будет иметь высокие шансы конкурировать с лучшими результатами из Веб-индекса в смешанной выдаче.
  • Оптимизация под вертикальные индексы: Необходимо рассматривать оптимизацию не только для веб-поиска, но и для релевантных вертикалей (Images, Video, News, Local). Поскольку релевантность нормализуется, высококачественный результат из вертикали может вытеснить стандартный веб-результат.
  • Мониторинг смешанной выдачи (SERP Features): Анализируйте, какие типы контента (вертикали) Google предпочитает для целевых запросов. Это дает понимание того, какие Normalized Scores из каких корпусов выигрывают в процессе смешивания, и позволяет скорректировать контент-стратегию в пользу наиболее выигрышных форматов.

Worst practices (это делать не надо)

  • Игнорирование вертикалей: Фокусироваться исключительно на оптимизации для основного веб-индекса – проигрышная стратегия в эпоху Универсального Поиска. Если конкуренты создают высокорелевантный контент в других форматах (например, видео), их Normalized Scores могут оказаться выше.
  • Попытки манипулировать нормализацией: SEO-специалисты не могут напрямую влиять на процесс нормализации или калибровки диапазонов. Усилия должны быть направлены на повышение релевантности контента в рамках стандартных факторов ранжирования для каждого корпуса.

Стратегическое значение

Патент подтверждает, что Google рассматривает поиск как экосистему, состоящую из множества специализированных индексов (корпусов). Стратегическое значение заключается в понимании механизма, который позволяет этим индексам конкурировать за место на SERP. Долгосрочная SEO-стратегия должна быть мультиформатной и направленной на достижение максимальной релевантности (высшего процентиля) в наиболее подходящем для конкретного интента корпусе контента.

Практические примеры

Сценарий: Ранжирование в смешанной выдаче по запросу [обзор нового смартфона]

Система получает результаты из трех корпусов. Предположим, офлайн-калибровка определила следующие распределения:

  1. Веб-индекс: Лучший результат – детальный текстовый обзор на сайте TechRadar. Исходная оценка 1500. Анализ распределения Веб-индекса показывает, что это 98-й процентиль. Normalized Score = 0.98.
  2. Видео-индекс (YouTube): Лучший результат – видеообзор от MKBHD. Исходная оценка 50. Анализ распределения Видео-индекса показывает, что это 99-й процентиль. Normalized Score = 0.99.
  3. Новостной индекс: Лучший результат – короткая заметка о старте продаж. Исходная оценка 1.8. Анализ распределения Новостного индекса показывает, что это 90-й процентиль. Normalized Score = 0.90.

Результат смешивания:

Система сравнивает Normalized Scores. Видео от MKBHD (0.99) будет ранжироваться выше, чем обзор TechRadar (0.98), несмотря на то, что абсолютное значение исходной оценки (50 против 1500) сильно различается. Это происходит потому, что видео является более сильным результатом в контексте своего корпуса, чем веб-страница в своем.

Вопросы и ответы

Что такое квантильная нормализация и почему Google ее использует вместо простого масштабирования?

Квантильная нормализация – это статистический метод приведения различных распределений данных к общему виду путем сопоставления их квантилей (процентилей). Google использует ее, потому что она учитывает реальное распределение оценок в корпусе, которое часто нелинейно. Простое масштабирование (Min-Max) предполагает линейное распределение, что менее точно. Квантильная нормализация гарантирует, что только топ-1% результатов корпуса получит нормализованную оценку выше 0.99.

Означает ли этот патент, что абсолютные значения оценок релевантности не важны?

Да, при сравнении результатов между разными корпусами (например, Веб против Новостей) абсолютные значения не имеют значения. Важно только относительное положение результата (процентиль) в распределении оценок своего корпуса. Однако эти оценки по-прежнему определяют ранжирование внутри одного корпуса до этапа смешивания.

Как SEO-специалист может повлиять на Normalized Score своего контента?

Напрямую повлиять на процесс нормализации нельзя. Единственный способ повысить Normalized Score – это улучшать релевантность и качество контента, чтобы максимизировать исходную оценку релевантности внутри целевого корпуса (Веб, Видео или Новости). Чем выше процентиль вашего контента в его корпусе, тем выше будет итоговая нормализованная оценка.

Как система определяет, какие корпуса использовать для смешивания?

Этот патент не описывает процесс выбора корпусов (Triggering). Он описывает только то, как смешивать результаты, если система уже решила использовать несколько корпусов. Выбор корпусов обычно происходит на этапе Понимания Запросов (Query Understanding), где определяется интент пользователя и активируются релевантные вертикали поиска.

Насколько часто происходит перекалибровка диапазонов релевантности?

Патент (Claims 3 и 4) указывает, что обновление может происходить через «предопределенные временные интервалы» или «на основе изменений в различных коллекциях контента». Это предполагает регулярный автоматический процесс, гарантирующий актуальность маппингов, особенно после значительных обновлений алгоритмов ранжирования в одном из корпусов.

Применяется ли этот механизм для сравнения веб-страниц внутри одного веб-индекса?

Нет. Этот механизм предназначен исключительно для сравнения и смешивания (blending) контента из разных коллекций (корпусов). Для ранжирования результатов внутри одного корпуса используются стандартные алгоритмы ранжирования этого корпуса и их исходные (нативные) оценки релевантности.

Патент подробно описывает смешивание социального контента и модель затрат/выгод (Cost/Gain Model). Является ли это частью изобретения?

Эти концепции подробно описаны в основном тексте патента (Description) как примеры реализации смешивания, но они не включены в Формулу изобретения (Claims 1-19). Ядром защищенного изобретения является именно процесс статистической нормализации оценок. Социальное смешивание и модель затрат показывают, как Google предполагал использовать эту технологию для персонализации и управления разнообразием выдачи.

Как описание социальной приоритизации в патенте связано с E-E-A-T?

В описании (Description) патента упоминается категоризация источников: (1) Социальные контакты, (2) Эксперты/Знаменитости (много связей), (3) Публичный контент, с приоритетом 1 > 2 > 3. Хотя это не часть Claims, это демонстрирует раннюю реализацию приоритизации авторитетных сущностей (Категория 2) над общим контентом (Категория 3), что напрямую коррелирует с современными концепциями оценки Экспертизы и Авторитетности (E-E-A-T).

Как этот патент влияет на стратегию создания контента?

Он подчеркивает необходимость мультиформатной контент-стратегии. Если по запросу доминирует определенная вертикаль (например, Видео), это означает, что Normalized Scores из этого корпуса систематически выше. В таком случае для конкуренции необходимо создавать контент именно в этом формате и оптимизировать его для соответствующего вертикального индекса, стремясь попасть в высший процентиль.

Если я вижу, что новость ранжируется выше моей детальной статьи, значит ли это, что ее Normalized Score выше?

Да, в контексте смешанной выдачи это именно так. Это означает, что система определила, что новостной результат находится в более высоком процентиле релевантности внутри Новостного индекса, чем ваша статья внутри Веб-индекса, по крайней мере, для данного конкретного запроса. Это может быть связано с факторами свежести (QDF) или специфическими сигналами авторитетности в новостном контексте.

Похожие патенты

Как Google нормализует оценки мобильных приложений и ранжирует их вместе с веб-сайтами в единой выдаче
Google использует механизм для сравнения и совместного ранжирования веб-страниц и нативных мобильных приложений. Поскольку оценки для веба и приложений рассчитываются по разным шкалам, система нормализует оценки приложений, приводя их к единой шкале с веб-результатами. Это позволяет Google формировать унифицированную поисковую выдачу (Universal Search), включающую как ссылки на сайты, так и контент из приложений (Deep Links).
  • US8996520B2
  • 2015-03-31
  • SERP

Как Google использует статистику поиска и кликов по разным вертикалям (Web, Картинки, Видео) для определения предпочтительного типа контента и ранжирования в Универсальном Поиске
Google анализирует, в каких вертикалях (корпусах) пользователи чаще ищут определенный запрос и на какие типы результатов они кликают в смешанной выдаче. Система вычисляет "Меру относительной релевантности" для каждого корпуса и использует её для повышения результатов из наиболее предпочтительного корпуса, учитывая язык, страну пользователя и актуальные тренды.
  • US8359309B1
  • 2013-01-22
  • SERP

  • Поведенческие сигналы

  • Мультимедиа

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google объединяет и нормализует результаты из разных индексов (веб и мобильного) для пользователей мобильных устройств
Google использует систему смешивания (Results Mixer) для объединения выдачи из разных поисковых движков (например, основного веба и мобильного веба). Поскольку движки используют разные формулы ранжирования, система нормализует оценки, используя классификацию запросов, свойства контента и калибровку на основе человеческих оценок. Также описан механизм дедупликации, отдающий приоритет мобильной версии контента.
  • US7962477B2
  • 2011-06-14
  • SERP

  • Семантика и интент

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Популярные патенты

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео
Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.
  • US8903812B1
  • 2014-12-02
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google использует историю уточнений запросов для выявления и повышения авторитетных сайтов по широким запросам
Google анализирует последовательности запросов пользователей, чтобы понять, как они уточняют свои поисковые намерения. Если пользователи часто переходят от широкого или неточного запроса к более конкретному, который ведет на авторитетный ресурс, Google связывает этот ресурс с исходным широким запросом. Это позволяет показывать авторитетный сайт выше в выдаче, даже если пользователь сформулировал запрос неточно.
  • US8326826B1
  • 2012-12-04
  • Семантика и интент

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов
Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.
  • US8682892B1
  • 2014-03-25
  • Ссылки

  • EEAT и качество

  • SERP

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

seohardcore