SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google повышает официальные видео в поиске выше их заявленных копий на контент-платформах (например, YouTube)

PROMOTING PREFERRED CONTENT IN A SEARCH QUERY (Продвижение предпочтительного контента в поисковом запросе)
  • US9852224B2
  • Google LLC
  • 2014-07-03
  • 2017-12-26
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Механизм для контент-платформ (например, YouTube), который корректирует результаты поиска, чтобы продвигать контент, загруженный непосредственно владельцем («Предпочтительный контент»), выше копий этого же контента, загруженных другими пользователями, но заявленных владельцем («Заявленный контент»). Система использует различные эвристики, включая смену позиций, бустинг или оптимизацию полезности для владельца, чтобы гарантировать приоритет официальных версий.

Описание

Какую проблему решает

Патент решает проблему ранжирования на контент-платформах (например, YouTube), когда контент, загруженный сторонним пользователем (UGC), но заявленный правообладателем (Claimed Content), ранжируется выше, чем официальная версия этого же контента, загруженная самим правообладателем на свой канал (Preferred Content). Это не оптимально, так как правообладатели (Preferred Users или Partners) ценят просмотры на своих официальных каналах выше, чем просмотры на заявленных копиях (даже при одинаковой монетизации), а пользователи часто предпочитают авторитетные версии.

Что запатентовано

Запатентована система для корректировки поисковой выдачи на Content Sharing Platform. Система идентифицирует в результатах поиска как Preferred Content, так и Claimed Content, принадлежащие одному владельцу. Затем она применяет одну или несколько эвристик для повышения позиции Preferred Content относительно Claimed Content. Ключевым элементом является обеспечение того, что такое повышение происходит с учетом сохранения качества поиска, часто путем проверки разницы в исходных оценках релевантности.

Как это работает

Система работает на этапе переранжирования результатов поиска:

  • Идентификация: Для каждого результата система определяет, является ли он Preferred Content или Claimed Content для конкретного правообладателя, используя базу данных загрузок и заявок.
  • Применение эвристик: Система применяет одну или несколько эвристик для корректировки рейтинга:
    • Смена позиций (Swapping): Если Claimed Content находится выше Preferred Content и их Relevancy Scores близки (разница ниже порога), система меняет их местами.
    • Бустинг (Boosting): Relevancy Score для Preferred Content увеличивается на коэффициент (Boost Factor).
    • Понижение (Demoting): Relevancy Score для Claimed Content уменьшается (умножается на коэффициент < 1).
    • Оптимизация полезности (Utility Optimization): Ранжирование корректируется для максимизации общей ценности (Utility) для правообладателя, исходя из предположения, что просмотр Preferred Content ценится выше (значение Vp).
  • Переранжирование: Результаты сортируются с учетом скорректированных оценок.

Актуальность для SEO

Высокая. Патент напрямую касается механизмов ранжирования на крупнейших контент-платформах, таких как YouTube. Приоритезация официальных, авторитетных источников и управление правами (например, через Content ID) являются центральными элементами работы таких платформ. Описанные механизмы критически важны для баланса интересов правообладателей, создателей UGC и зрителей.

Важность для SEO

Патент имеет критическое значение (10/10) для стратегий Video SEO на платформах, использующих подобные механизмы (в первую очередь YouTube), но минимальное значение (1/10) для традиционного веб-поиска. Он описывает конкретный механизм, который активно продвигает контент официальных каналов (Preferred Content) в ущерб перезаливам и копиям (Claimed Content). Это подчеркивает необходимость централизованной стратегии публикации и оптимизации контента на официальных каналах.

Детальный разбор

Термины и определения

Claimed Content Item (Заявленный контент)
Контент, загруженный одним пользователем, но на который заявлены права другим пользователем (Preferred User), например, для отслеживания или монетизации. Владелец разрешает использование, но предпочитает просмотр оригинала.
Content Sharing Platform (Платформа обмена контентом)
Онлайн-сервис (например, YouTube), позволяющий пользователям загружать, просматривать и делиться контентом.
Preferred Content Item (Предпочтительный контент)
Контент, загруженный непосредственно правообладателем (Preferred User) на его собственный канал. Официальная версия контента.
Preferred User / Partner (Предпочтительный пользователь / Партнер)
Правообладатель или владелец контента, который загружает Preferred Content и может заявлять права на Claimed Content.
Relevancy Score (Оценка релевантности)
Числовое значение, оценивающее релевантность элемента контента поисковому запросу. Определяет исходную позицию (ранг) в результатах поиска.
Boost Factor (F) (Коэффициент повышения)
Множитель, применяемый к Relevancy Score для корректировки ранга. Если F > 1, это повышение; если 0 < F < 1 (иногда обозначается как M), это понижение (демоция).
Threshold difference value (Пороговое значение разницы)
Максимально допустимая разница в Relevancy Score между двумя элементами, при которой допускается их перестановка.
Vp (Value of View) (Ценность просмотра)
Метрика, присваиваемая Preferred User (P), показывающая, во сколько раз больше он ценит просмотр на своем Preferred Content по сравнению с просмотром на Claimed Content (Vp>1V_p > 1Vp​>1).
C[R] (Average Chance / Click Probability) (Вероятность клика)
Средняя вероятность того, что пользователь выберет результат на позиции R.
Up (Partner Utility) (Полезность для партнера)
Функция, которую система стремится оптимизировать. Рассчитывается на основе Vp и C[R] для всего контента партнера в выдаче.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод корректировки рейтинга с обязательной проверкой качества.

  1. Система получает набор результатов поиска с рангами для контент-платформы.
  2. Идентифицируются два типа контента для пользователя:
    • Preferred Content (загружен пользователем).
    • Claimed Content (загружен другим пользователем, но заявлен первым пользователем и отслеживается согласно политике).
  3. Система корректирует позицию Preferred Content относительно Claimed Content. Эта корректировка включает обязательные шаги:
    • Определение разницы в Relevancy Score между этими двумя элементами.
    • Проверка, что эта разница меньше или равна пороговому значению (threshold difference value).
    • Если ДА, улучшение позиции Preferred Content относительно Claimed Content.

Ядро изобретения заключается в продвижении официального контента над заявленными копиями, но только при условии, что их исходная релевантность достаточно близка. Это ограничение введено для защиты качества поиска.

Claim 3 (Зависимый от 1): Уточняет способ корректировки.

Корректировка позиции заключается в том, что Preferred Content и Claimed Content меняются местами в рейтинге (Interchanging positions/Swapping).

Claim 5 (Зависимый от 1): Описывает альтернативный способ корректировки (Бустинг).

Корректировка заключается в увеличении Relevancy Score для Preferred Content на Boost Factor. Этот Boost Factor рассчитывается на основе Relevancy Score элемента Claimed Content.

Claim 7 и 8 (Зависимые от 1): Описывают способ корректировки через понижение.

Корректировка заключается в понижении (Demoting) Claimed Content. Понижение реализуется путем уменьшения Relevancy Score для Claimed Content с использованием множителя меньше 1.

Claim 9 (Зависимый от 1): Описывает корректировку на основе оптимизации полезности.

Позиции назначаются на основе функции, которая оптимизирует полезность (Utility) для пользователя (владельца). Полезность основана на ценности (Vp), которую пользователь придает просмотру своего загруженного контента по сравнению с заявленным контентом.

Где и как применяется

Изобретение применяется исключительно в рамках поисковой системы Content Sharing Platform (например, поиск YouTube).

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна собирать и индексировать данные о том, кто загрузил контент (Uploader Data) и кто заявил на него права (Claim Data). Эта информация сохраняется в базе данных (Preferred User Content Data) и обновляется в реальном времени.

RANKING – Ранжирование
Основная поисковая система генерирует начальный набор результатов поиска, отсортированный по Relevancy Score, без учета предпочтений владельца контента.

RERANKING – Переранжирование
Основное применение патента. Модуль переранжирования (Re-ranking Module) анализирует начальный набор результатов.

  1. Анализ результатов: Система идентифицирует в выдаче Preferred Content и Claimed Content, принадлежащие одним и тем же Preferred Users.
  2. Применение эвристик: Система применяет одну или несколько эвристик (Swapping, Boosting, Demoting, Utility Optimization) для корректировки Relevancy Scores или позиций.
  3. Проверка порогов: Как указано в Claim 1, для активации корректировки может проверяться, что разница в исходных оценках релевантности не превышает порог.
  4. Финальная сортировка: Результаты пересортировываются на основе скорректированных оценок.

Входные данные:

  • Начальный набор результатов поиска с Relevancy Scores.
  • База данных Preferred User Content Data.
  • Параметры эвристик (threshold difference value, коэффициенты бустинга M, значения VpV_pVp​ для партнеров, таблица вероятностей кликов C[R]C[R]C[R]).

Выходные данные:

  • Переранжированный набор результатов поиска.

На что влияет

  • Типы контента: В первую очередь влияет на медиаконтент (видео, аудио), который часто перезагружается пользователями и на который активно заявляются права (музыкальные клипы, ТВ-шоу, фильмы, вирусные видео).
  • Специфические запросы: Влияет на запросы, где в выдаче присутствуют как официальные версии, так и копии (например, запросы по названию песни или эпизода шоу).
  • Конкретные ниши: Музыкальная индустрия, киноиндустрия, крупные медиабренды.

Когда применяется

  • Условия работы: Алгоритм применяется только тогда, когда в одном наборе результатов поиска присутствуют и Preferred Content, и Claimed Content, относящиеся к одному и тому же Preferred User.
  • Триггеры активации: Наличие Claimed Content, ранжирующегося выше или близко к Preferred Content того же владельца.
  • Пороговые значения: Критическим условием (согласно Claim 1) может быть то, что разница в Relevancy Score между двумя элементами контента должна быть меньше или равна установленному порогу (threshold difference value).

Пошаговый алгоритм

Патент описывает несколько альтернативных или дополняющих друг друга эвристик для переранжирования.

Обобщенный процесс переранжирования:

  1. Получение данных: Получить начальный набор результатов поиска, отранжированный по Relevancy Score.
  2. Идентификация контента: Для каждого элемента определить его тип (Preferred или Claimed) и связанного с ним Preferred User (Партнера P).
  3. Применение эвристик корректировки: Выполнить одну или несколько из следующих эвристик.
  4. Финальное ранжирование: Пересортировать набор результатов.

Детализация эвристик:

Эвристика A: Смена позиций (Interchanging/Swapping)

  1. Идентификация пары: Найти пару элементов, где Claimed Content ранжируется выше, чем Preferred Content того же партнера P.
  2. Проверка порога: Рассчитать разницу между их Relevancy Scores.
  3. Условие выполнения: Если разница меньше или равна threshold difference value.
  4. Корректировка: Поменять местами эти два элемента контента в результатах поиска.

Эвристика B: Бустинг Предпочтительного контента (Boosting)

  1. Идентификация элементов: Найти все Preferred Content и Claimed Content партнера P в выдаче.
  2. Расчет Boost Factor (F): Рассчитать коэффициент повышения F. Он может зависеть от количества, позиций и оценок Claimed Content. Например, F может быть рассчитан как множитель M (например, 1.2), возможно, возведенный в степень количества Claimed Content, ранжирующихся выше данного Preferred Content. Также F может зависеть от надежности (trustworthiness) партнера.
  3. Применение бустинга: Умножить Relevancy Score для Preferred Content на коэффициент F.

Эвристика C: Понижение Заявленного контента (Demoting)

  1. Идентификация элементов: Найти Claimed Content партнера P в выдаче.
  2. Расчет коэффициента: Определить множитель M (где 0 < M < 1).
  3. Применение понижения: Умножить Relevancy Score для Claimed Content на коэффициент M.

Эвристика D: Оптимизация полезности (Utility Optimization)

  1. Получение параметров: Получить значение VpV_pVp​ (ценность просмотра Preferred vs Claimed) для партнера P. Получить таблицу C[R]C[R]C[R] (вероятность клика для ранга R).
  2. Расчет полезности (Up): Рассчитать текущую полезность для партнера по формуле: Up=Vp⋅∑{C[i]:Preferred}+∑{C[j]:Claimed}U_p = V_p \cdot \sum \{C[i]: \text{Preferred}\} + \sum \{C[j]: \text{Claimed}\}Up​=Vp​⋅∑{C[i]:Preferred}+∑{C[j]:Claimed}.
  3. Оптимизация: Определить оптимальное ранжирование Preferred Content и Claimed Content, которое максимизирует значение UpU_pUp​. В патенте упоминается, что эта оптимизация может достигаться, например, путем понижения (demoting) исключительно Claimed Content.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме переранжирования и использует следующие типы данных:

  • Системные данные (Платформа):
    • Relevancy Scores: Исходные оценки релевантности для каждого элемента контента относительно запроса.
    • Uploader Data: Данные о том, какой пользователь загрузил конкретный элемент контента.
    • Claim Data: Данные о том, какие правообладатели (Preferred Users) заявили права на конкретный элемент контента и какая политика применяется (отслеживание, монетизация).
  • Пользовательские факторы (Правообладатель):
    • Vp (Value of View): Индивидуальное значение для Preferred User, указывающее относительную ценность просмотра официального контента по сравнению с заявленным. Также может учитываться статус или надежность (trustworthy) партнера.
  • Поведенческие факторы (Агрегированные):
    • C[R] (Click Probability): Агрегированные данные о вероятности клика на результат в зависимости от его позиции (R) в выдаче.

Какие метрики используются и как они считаются

  • Разница в Relevancy Score: Вычисляется как Score(A) - Score(B). Используется для сравнения с threshold difference value, чтобы определить, допустима ли смена позиций без значительного ущерба для качества поиска.
  • Boost Factor (F) / Multiplier (M): Коэффициенты корректировки. Могут рассчитываться разными способами, например:
    • Фиксированный множитель (например, 1.2).
    • Множитель в степени количества Claimed Content выше Preferred Content.
    • Функция от суммы оценок (scores) всех Claimed Content в выдаче.
  • Partner Utility (Up): Метрика общей ценности выдачи для партнера. Рассчитывается по формуле, учитывающей VpV_pVp​ и C[R]C[R]C[R] (см. Алгоритм, Эвристика D). Система стремится максимизировать эту метрику.

Выводы

  1. Приоритет официального контента над копиями: Патент описывает четкий механизм предпочтения контента, загруженного непосредственно правообладателем (Preferred), над контентом, загруженным другими пользователями, но заявленным правообладателем (Claimed). Это стратегическое решение для повышения авторитетности официальных каналов на платформе.
  2. Баланс между предпочтениями владельца и качеством поиска: Система не продвигает официальный контент безусловно. Ключевым ограничением (описанным в Claim 1) является порог разницы в релевантности (Relevancy Score). Если официальная версия значительно менее релевантна запросу, система может сохранить исходное ранжирование для поддержания качества поиска.
  3. Гибкость механизмов продвижения: Патент предлагает несколько эвристик: прямая смена позиций, повышение оценки официального контента, понижение оценки копий или комплексная оптимизация полезности (Utility Optimization). Это позволяет платформе тонко настраивать алгоритмы.
  4. Измеримая ценность авторитетности: Введение метрик VpV_pVp​ и UpU_pUp​ формализует предположение, что просмотр на официальном канале имеет большую ценность для владельца (например, для брендинга и привлечения подписчиков), чем просто монетизированный просмотр копии.
  5. Критичность управления правами: Функционирование системы зависит от активного управления правами (например, Content ID). Владельцы должны заявлять права на UGC, чтобы система могла идентифицировать Claimed Content и активировать механизмы продвижения Preferred Content.

Практика

Практическое применение в SEO

ВАЖНО: Эти рекомендации применимы исключительно к платформенному SEO (Platform SEO), например, оптимизации на YouTube, а не к стандартному веб-поиску.

Best practices (это мы делаем)

  • Централизованная публикация на официальном канале: Всегда загружайте основную версию контента на официальный канал. Этот патент гарантирует, что система будет активно пытаться продвигать эту версию (Preferred Content) выше любых копий.
  • Тщательная оптимизация официальных видео: Оптимизируйте метаданные (заголовки, описания) и работайте над вовлеченностью официальных видео. Поскольку продвижение часто зависит от порога разницы в Relevancy Score (Claim 1), ваше официальное видео должно быть сопоставимо по релевантности с копиями, чтобы механизм активировался.
  • Активное использование систем управления правами (Content ID): Используйте инструменты платформы для заявления прав на копии вашего контента (превращая их в Claimed Content). Наличие Claimed Content в выдаче является триггером для механизмов бустинга вашего Preferred Content (согласно Эвристике B).
  • Стратегия монетизации/отслеживания вместо блокировки: Для активации механизмов этого патента необходимо, чтобы копии существовали в поиске как Claimed Content. Выбирайте политику монетизации или отслеживания (Monetize/Track) вместо блокировки (Block), если ваша цель — максимизировать видимость официального канала через этот механизм.

Worst practices (это делать не надо)

  • Игнорирование официального канала: Полагаться на то, что пользователи сами распространят ваш контент через перезаливы. Система будет активно бороться с видимостью этих копий в пользу официальных источников, если они существуют.
  • Слабая оптимизация официального контента: Публикация официального видео с нерелевантными метаданными. Если Relevancy Score будет слишком низким по сравнению с хорошо оптимизированной копией, система может не продвинуть вашу версию из-за порога качества.
  • Игнорирование UGC и отказ от Content ID: Если вы не заявляете права на копии, система не распознает их как Claimed Content. В этом случае ваше официальное видео будет конкурировать с ними на общих основаниях, без преимуществ, описанных в патенте.
  • Стратегия перезалива чужого контента: Для пользователей, не являющихся правообладателями, стратегия загрузки чужого контента для сбора поискового трафика неэффективна. Если правообладатель заявит права, этот контент будет понижен в пользу официальной версии.

Стратегическое значение

Этот патент подтверждает стратегическую важность развития и оптимизации официальных каналов на контент-платформах. Для SEO-специалистов, работающих с видеоконтентом, это означает, что авторитетность источника (официальный канал vs перезалив) является не просто фактором ранжирования, а основой для специального механизма переранжирования. Долгосрочная стратегия должна фокусироваться на том, чтобы официальный канал был наиболее полным и оптимизированным источником контента автора или бренда.

Практические примеры

Сценарий 1: Ранжирование музыкального клипа (Эвристика Swapping)

  1. Ситуация: Музыкальный лейбл (Preferred User) загружает официальный клип (Preferred Content). Фанаты также загружают копии, которые лейбл монетизирует (Claimed Content).
  2. Запрос: "Название песни Официальное видео".
  3. Исходное ранжирование:
    • Позиция 1: Копия клипа на фанатском канале (Claimed). Score = 90.
    • Позиция 2: Официальный клип на канале лейбла (Preferred). Score = 85.
  4. Применение алгоритма: Система идентифицирует владельца. Она сравнивает разницу оценок (90 - 85 = 5). Если порог разницы (threshold difference value) установлен в 10, условие выполняется.
  5. Результат: Система меняет позиции местами. Официальный клип перемещается на Позицию 1.

Сценарий 2: Бустинг обзора техники (Эвристика Boosting)

  1. Ситуация: Техноблогер (Preferred User) публикует обзор смартфона (Preferred). Несколько агрегаторов копируют части обзора и загружают свои версии (Claimed).
  2. Запрос: "Обзор Смартфона X".
  3. Исходное ранжирование: В Топ-10 находятся 3 копии (Claimed) выше официального обзора (Preferred).
  4. Применение алгоритма: Система рассчитывает Boost Factor. Если множитель M=1.2, а выше официального видео находятся 3 заявленные копии, буст может составить 1.2^3 = 1.728 (один из вариантов расчета, описанных в патенте).
  5. Результат: Relevancy Score официального обзора умножается на 1.728, что значительно повышает его в выдаче, потенциально выше всех копий.

Вопросы и ответы

К чему относится этот патент: к обычному веб-поиску Google или к поиску на платформах типа YouTube?

Патент явно описывает работу в рамках Content Sharing Platform, где существуют концепции каналов, загрузчиков контента, правообладателей (Partners) и механизмов заявления прав на контент (аналогичных Content ID). Это напрямую относится к поиску на платформах типа YouTube, а не к стандартному веб-поиску Google.

Что такое «Preferred Content» и «Claimed Content»?

Preferred Content — это контент, загруженный непосредственно правообладателем на свой официальный канал. Claimed Content — это копия того же контента, загруженная другим пользователем, но на которую правообладатель заявил свои права для монетизации или отслеживания. Система стремится продвигать Preferred выше Claimed.

Всегда ли официальное видео будет ранжироваться выше его копий?

Нет, не всегда. Патент (в частности, Claim 1) подчеркивает, что продвижение часто происходит только в том случае, если разница в оценках релевантности (Relevancy Score) между официальной версией и копией не превышает определенного порога. Если официальное видео плохо оптимизировано и значительно менее релевантно запросу, чем копия, оно может остаться ниже.

Что такое Vp и как он влияет на ранжирование?

VpV_pVp​ (Value of View) — это значение, присваиваемое правообладателю, которое показывает, во сколько раз он ценит просмотр на своем официальном канале выше, чем просмотр копии. Например, Vp=5 означает, что официальный просмотр в 5 раз ценнее. Чем выше VpV_pVp​, тем агрессивнее система будет пытаться переранжировать выдачу, чтобы максимизировать общую полезность (UpU_pUp​) для правообладателя при использовании эвристики Utility Optimization.

Стоит ли мне блокировать копии моего контента или лучше заявлять на них права (монетизировать)?

В контексте этого патента, выгоднее заявлять права (монетизировать или отслеживать). Механизмы продвижения активируются только при наличии Claimed Content (заявленных, но не заблокированных копий). Более того, наличие заявленных копий в выдаче может служить сигналом для бустинга вашего официального контента (Эвристика B). С точки зрения максимизации видимости официального контента через описанные механизмы, стратегия монетизации/отслеживания копий выглядит предпочтительнее их блокировки.

Как система решает, насколько сильно продвигать официальный контент?

Патент описывает несколько методов. Это может быть простая смена позиций, если оценки близки (Swapping). Это может быть применение коэффициента повышения (Boosting), который может зависеть от количества и позиций копий в выдаче. Также может использоваться понижение копий (Demoting) или комплексная модель оптимизации полезности (Utility Optimization).

Может ли этот механизм понизить мои видео, если я не являюсь правообладателем?

Да. Если вы загрузили контент (UGC), на который впоследствии заявил права владелец (сделав его Claimed Content), этот патент описывает механизмы, которые могут понизить ваше видео в поиске (Demoting) или поменять его местами с официальной версией, которая находилась ниже вас. Патент прямо указывает, что цель — защитить интересы правообладателя (Preferred User) над интересами загрузчика UGC.

Учитывает ли система авторитетность правообладателя при бустинге?

Да, в описании патента упоминается такая возможность. Множитель бустинга (M) может быть функцией от партнера (Preferred User). Более надежный партнер (more trustworthy preferred user) или партнер с контентом высокого качества может получать более высокий буст для своего Preferred Content.

Что такое C[R] и как он используется?

C[R]C[R]C[R] (Average Chance) — это средняя вероятность клика на результат, находящийся на позиции R. Эти данные собираются платформой на основе поведения пользователей. Они используются в эвристике Utility Optimization для расчета ожидаемого количества просмотров на разных позициях и определения оптимального ранжирования для максимизации полезности UpU_pUp​.

На каком этапе поиска происходит эта корректировка?

Это происходит на финальном этапе RERANKING (Переранжирование). Система сначала определяет релевантные результаты стандартным способом (этап RANKING), а затем корректирует их порядок на основе данных о владении и правах, прежде чем показать их пользователю.

Похожие патенты

Как Google повышает ранжирование каналов на основе позиций их контента в результатах поиска
Google использует механизм для улучшения видимости «Каналов» (например, каналов YouTube) в поиске на контент-платформах. Система гарантирует присутствие определенного числа каналов в выдаче, а затем агрессивно повышает ранжирование канала, если его отдельные единицы контента (например, видео) уже занимают высокие позиции по данному запросу. Это достигается путем расчета совокупной оценки канала на основе позиций его контента.
  • US9348922B2
  • 2016-05-24
  • SERP

  • Мультимедиа

Как Google (YouTube) ранжирует рекомендуемые видео, балансируя релевантность, монетизацию и вероятность просмотра рекламы
Google использует систему для ранжирования рекомендуемых (дополнительных) видео на платформах типа YouTube. Система учитывает не только релевантность и потенциал монетизации видео, но и «экспериментальные данные» о том, как пользователи взаимодействуют с рекламой в этом видео. Цель — показывать видео, где пользователи с большей вероятностью досмотрят рекламу, максимизируя доход и минимизируя отток пользователей.
  • US9405775B1
  • 2016-08-02
  • Мультимедиа

  • Поведенческие сигналы

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google (YouTube) динамически приоритизирует каверы и альтернативные версии песен в блоке рекомендаций
Google использует механизм для улучшения рекомендаций на контент-платформах (например, YouTube). Когда пользователь проявляет интерес к конкретной песне в просматриваемом видео (явно или неявно), система идентифицирует другие видео, содержащие альтернативные версии этой же песни (каверы, живые выступления). Затем блок рекомендаций обновляется, чтобы приоритизировать показ этих альтернативных версий над стандартными похожими видео.
  • US10345998B2
  • 2019-07-09
  • Мультимедиа

  • Персонализация

  • Поведенческие сигналы

Как Google использует репутацию контент-канала (например, YouTube) для ранжирования отдельных видео в зависимости от типа запроса
Google оценивает контент-каналы (например, YouTube), вычисляя специализированные «Оценки канала» (Channel Scores) для разных типов запросов (например, за свежесть или качество). Эти оценки рассчитываются на основе выбранного подмножества метрик канала и его контента, затем присваиваются отдельным видео и используются для корректировки их рейтинга в поиске.
  • US8949874B1
  • 2015-02-03
  • EEAT и качество

  • Свежесть контента

  • SERP

Популярные патенты

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов
Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.
  • US7664734B2
  • 2010-02-16
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует машинное обучение и поведенческие данные для прогнозирования полезности документов и решает, что включать в поисковый индекс
Google использует модель машинного обучения для определения, какие документы включать в поисковый индекс. Модель обучается на исторических данных о кликах и показах, чтобы предсказать будущую «оценку полезности» (Utility Score) документа. Документы ранжируются по этой оценке, а также с учетом других факторов (например, PageRank, стоимость индексации, свежесть, квоты), и лучшие из них попадают в индекс.
  • US8255386B1
  • 2012-08-28
  • Индексация

  • Поведенческие сигналы

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами
Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.
  • US8819004B1
  • 2014-08-26
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
  • US8719276B1
  • 2014-05-06
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

seohardcore