Патент Google, описывающий систему ранжирования каналов на видеохостингах (например, YouTube). Система определяет «качество» канала на основе поведения пользователей, в частности, используя данные об оттоке подписчиков (subscriber churn) и вовлеченности. При поиске система модифицирует результаты, повышая позиции качественных каналов, даже если они менее релевантны ключевым словам запроса.
Описание
Какую задачу решает
Патент решает проблему поиска и обнаружения наиболее ценного контента в рамках крупной контент-платформы (Content Hosting System, например, YouTube), где доступно огромное количество каналов. Он направлен на улучшение качества внутреннего поиска по платформе, гарантируя, что пользователи найдут каналы, которые высоко ценятся сообществом (обеспечивают наибольшую value), а не только те, которые хорошо оптимизированы под ключевые слова, но имеют низкую вовлеченность и плохое удержание.
Что запатентовано
Запатентована система для хостинга, управления и ранжирования «каналов» (channels) видеоконтента. Ядром изобретения является механизм ранжирования, который оценивает «качество» или «ценность» канала на основе агрегированных данных о поведении пользователей, в частности, оттока подписчиков (subscriber churn). Система использует эту оценку качества, чтобы модифицировать результаты поиска, отдавая приоритет качеству над прямой текстовой релевантностью.
Как это работает
Система работает следующим образом:
- Сбор данных: Платформа непрерывно отслеживает поведение подписчиков, включая время просмотра (usage data) и уровень оттока подписчиков (subscriber churn).
- Расчет качества: На основе собранных данных вычисляется рейтинг канала (channel ranking) и оценка качества предложения (quality of a subscription offering).
- Поиск и Отбор: При выполнении поиска система сначала находит каналы по степени совпадения ключевых слов (degree of match).
- Переранжирование: Система генерирует «улучшенные результаты поиска» (improved search results), повышая в выдаче каналы с высоким рейтингом качества, даже если они менее релевантны тексту запроса.
Актуальность для SEO
Высокая. Патент выдан в 2020 году и описывает фундаментальные механизмы, лежащие в основе современных алгоритмов поиска и рекомендаций на платформах пользовательского контента, таких как YouTube (заявитель патента — Google). Акцент на метриках вовлеченности и удержания аудитории как ключевых факторах ранжирования полностью соответствует текущим реалиям продвижения на этих платформах.
Важность для SEO
Патент имеет критическое значение для SEO на видеоплатформах (VSEO, YouTube SEO), но не относится к традиционному веб-поиску Google. Он прямо подтверждает, что для ранжирования внутри платформы метрики качества и удержания (низкий churn) имеют приоритет над текстовой оптимизацией. В частности, Claim 7 прямо заявляет, что высокий channel rank может компенсировать низкую степень соответствия (low degree of match) ключевым словам.
Детальный разбор
Термины и определения
- Channel (Канал)
- Набор видеоконтента на платформе, созданный поставщиком контента (content provider). Пользователи могут подписываться на канал.
- Channel Ranking (Рейтинг канала)
- Оценка, присваиваемая каналу системой. Согласно Claim 3, основывается на Usage Data. Используется для переранжирования результатов поиска.
- Content Hosting System (Система хостинга контента)
- Платформа (например, YouTube), позволяющая провайдерам загружать контент и создавать каналы, а пользователям — подписываться на них.
- Degree of match (Степень соответствия)
- Метрика, определяющая, насколько ключевые слова канала соответствуют поисковому запросу пользователя (текстовая релевантность). Используется для первичного ранжирования.
- Improved search results (Улучшенные результаты поиска)
- Финальный набор результатов поиска, порядок которых был изменен (переранжирован) на основе метрик качества.
- Quality of a subscription offering (Качество предложения подписки)
- Метрика качества канала, используемая для переранжирования результатов поиска. В патенте (Claim 1) явно связана как минимум с данными об оттоке подписчиков (subscriber churn data).
- Subscriber Churn (Отток подписчиков)
- Метрика, отражающая скорость, с которой подписчики отменяют подписку на канал. Ключевой показатель ценности и качества.
- Usage Data (Данные об использовании)
- Данные, отслеживаемые системой о поведении пользователей: время просмотра, частота сессий, процент просмотра видео и т.д. Используются для расчета Channel Ranking.
- Value Ranking Function (Функция ранжирования по ценности)
- Общий термин в описании патента для алгоритма, который ранжирует каналы на основе их ценности, определяемой поведением подписчиков.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод поиска и ранжирования на контент-платформе.
- Система получает поисковый запрос (second keyword).
- Генерируются первичные результаты поиска. Они включают каналы, чьи метаданные (first keyword) совпадают с запросом. Первичные результаты упорядочены по степени соответствия (degree of match).
- Определяется «качество предложения подписки» (quality of a subscription offering) для подмножества каналов. Это качество основано как минимум на данных об оттоке подписчиков (subscriber churn data).
- Генерируются «улучшенные результаты поиска» (improved search results) путем изменения порядка ранжирования (modifying an ordering) на основе критериев, включающих определенное качество предложения.
- Улучшенные результаты предоставляются пользователю.
Ядро изобретения — это переранжирование стандартных результатов поиска (основанных на ключевых словах) с использованием метрики качества, которая напрямую зависит от удержания аудитории (subscriber churn).
Claim 2 и 3 (Зависимые): Уточняют, что критерии переранжирования также включают channel ranking (рейтинг канала) (Claim 2), который, в свою очередь, определяется на основе usage data (данных об использовании) (Claim 3).
Claim 7 (Зависимый от 1): Критически важный пункт, определяющий логику ранжирования.
Первый канал, имеющий низкую степень соответствия (low degree of match) ключевому слову запроса, может появиться выше в улучшенных результатах поиска, чем второй канал, имеющий высокую степень соответствия (high degree of match). Это происходит на основании рейтинга канала (channel rank) первого канала. Это прямое подтверждение того, что алгоритм предпочитает качество и вовлеченность прямой текстовой релевантности.
Где и как применяется
Важно понимать, что этот патент описывает механизмы внутреннего поиска и ранжирования в рамках Content Hosting System (например, YouTube), а не общего веб-поиска Google.
INDEXING – Индексирование и извлечение признаков (В рамках платформы)
На этом этапе система индексирует метаданные каналов (ключевые слова, описания). Также происходит непрерывный сбор и агрегация поведенческих сигналов (usage data, subscriber churn), которые используются для расчета статических оценок качества канала (Channel Ranking).
RANKING – Ранжирование (В рамках платформы)
На этом этапе (соответствует Retrieval/L1) генерируется первичный набор результатов поиска (search results). Отбор кандидатов и первичное ранжирование основывается на степени соответствия (degree of match) ключевых слов запроса метаданным канала.
RERANKING – Переранжирование (В рамках платформы)
Основной этап применения патента (соответствует L2/L3). Система оценивает quality of a subscription offering для каналов-кандидатов. Затем происходит модификация порядка ранжирования для создания improved search results. Каналы с высоким качеством (низкий churn, высокий ranking) повышаются, потенциально обгоняя более релевантные по тексту, но менее качественные каналы.
Входные данные:
- Поисковый запрос пользователя (user search query).
- Индекс метаданных каналов (keywords).
- Предварительно рассчитанные метрики качества каналов (Channel Ranking, subscriber churn data, usage data).
Выходные данные:
- Улучшенный список результатов поиска (improved search results), отсортированный по комбинации релевантности и качества.
На что влияет
- Типы контента: Влияет исключительно на ранжирование и обнаружение видеоканалов внутри платформы видеохостинга (YouTube). Не влияет напрямую на ранжирование отдельных видео, но определяет видимость источника этих видео.
- Специфические запросы: Наибольшее влияние оказывается на общие тематические и информационные запросы, где пользователи ищут источники контента по теме.
Когда применяется
- При каких условиях работает алгоритм: Алгоритм переранжирования применяется при каждом поиске каналов пользователем на платформе. Также он используется при просмотре (браузинге) каталога каналов для определения наиболее заметных (prominence) предложений.
Пошаговый алгоритм
Процесс А: Расчет качества (Офлайн/Периодический)
- Сбор данных: Система отслеживает usage data (время просмотра) и агрегирует обратную связь.
- Расчет оттока: Вычисляется subscriber churn (скорость отписок).
- Расчет рейтинга: Собранные данные используются для вычисления агрегированного Channel Ranking и Quality of a subscription offering.
Процесс Б: Обработка поискового запроса (Реальное время)
- Получение запроса: Пользователь вводит поисковый запрос.
- Первичный отбор и ранжирование (Retrieval & Initial Ranking): Система находит каналы, чьи ключевые слова соответствуют запросу, и упорядочивает их по степени соответствия (degree of match).
- Оценка качества: Для топовых результатов извлекаются метрики качества (Quality of a subscription offering и Channel Ranking).
- Переранжирование (Reranking): Система модифицирует порядок результатов. Каналы с высоким качеством получают повышение (boost). Если канал имеет высокий рейтинг, он может обогнать канал с лучшим соответствием ключевых слов (согласно Claim 7).
- Выдача результатов: Пользователю предоставляются улучшенные результаты поиска.
Какие данные и как использует
Данные на входе
Патент фокусируется на данных, используемых для оценки качества канала и его релевантности запросу в рамках платформы.
- Контентные/Структурные факторы (Метаданные):
- Ключевые слова (Keywords/Tags), указанные провайдером.
- Описание канала (Description) и Название (Title).
- Derived metadata: В описании патента упоминаются производные метаданные, такие как автоматическая транскрипция речи (automatic speech-to-text transcription) и машинная классификация видео.
- Поведенческие факторы (Критические):
- Отток подписчиков (Subscriber churn data): Данные о том, как часто пользователи отписываются. Основа для Quality of a subscription offering.
- Данные об использовании (Usage data): Общее время просмотра канала, среднее время просмотра видео, частота просмотра, продолжительность сессии. Основа для Channel Ranking.
- Обратная связь: Рейтинги пользователей (User ratings), комментарии (Comments).
- Пользовательские факторы:
- User profile data: История просмотров пользователя и его предпочтения могут учитываться при генерации результатов.
Какие метрики используются и как они считаются
- Degree of match (Степень соответствия): Стандартная метрика текстовой релевантности между запросом и метаданными канала. Используется для первичного ранжирования.
- Quality of a subscription offering (Качество предложения подписки): Метрика, используемая для переранжирования. Согласно Claim 1, она рассчитывается с использованием как минимум subscriber churn data. Высокий отток = низкое качество.
- Channel Ranking (Рейтинг канала): Агрегированная оценка ценности канала. Рассчитывается преимущественно на основе usage data (Claim 3), но также может учитывать обратную связь и характеристики контента.
Выводы
- Приоритет вовлеченности и качества над текстовой релевантностью: Патент явно описывает механизм (Claim 7), при котором канал с высоким рейтингом качества, но низкой текстовой релевантностью запросу, будет ранжироваться выше, чем канал с высокой релевантностью, но низким качеством. Это фундаментальный принцип для VSEO (YouTube SEO).
- Отток аудитории (Churn) как ключевой сигнал качества: Subscriber churn выделен в основном независимом пункте (Claim 1) как ключевой компонент для расчета Quality of a subscription offering. Минимизация оттока критически важна для ранжирования канала.
- Поведенческие данные (Usage Data) формируют рейтинг: То, как пользователи реально взаимодействуют с контентом (время просмотра, частота возвратов), определяет Channel Ranking (Claim 3) и является основой для оценки ценности канала.
- Система стимулирует создание долгосрочной ценности: Механизм ранжирования поощряет создателей контента, которые удерживают аудиторию (создают value), а не тех, кто фокусируется только на оптимизации метаданных для привлечения разового трафика.
- Роль метаданных смещается к удержанию: Хотя метаданные используются для базового ранжирования, их главная роль — привлекать релевантную аудиторию. Неточные или кликбейтные метаданные приведут к быстрому оттоку подписчиков, что негативно скажется на качестве канала и его видимости в поиске.
Практика
ВАЖНО: Все практические выводы относятся к VSEO (Video SEO) и оптимизации каналов на YouTube или аналогичных платформах, а не к традиционному SEO в веб-поиске.
Best practices (это мы делаем)
- Фокус на удержании аудитории (Retention): Главная стратегическая задача — минимизация оттока подписчиков (Subscriber Churn). Создавайте контент, который максимизирует время просмотра и стимулирует пользователей оставаться на канале. Это напрямую повышает Quality of a subscription offering.
- Оптимизация под вовлеченность: Работайте над увеличением Usage Data (Watch Time). Стимулируйте взаимодействие (лайки, комментарии). Высокая вовлеченность повышает Channel Ranking.
- Регулярность и обновление контента: Регулярное добавление нового ценного контента мотивирует пользователей сохранять подписку, улучшая метрики качества и снижая Churn.
- Точные и честные метаданные: Используйте релевантные ключевые слова и описания. Это необходимо для попадания в первичный набор результатов поиска (degree of match) и для формирования правильных ожиданий у новых подписчиков, что снижает вероятность отписок.
Worst practices (это делать не надо)
- Кликбейт и обман ожиданий: Использование заголовков или метаданных, которые привлекают клик, но не соответствуют содержанию. Это ведет к быстрому уходу зрителей, увеличению Subscriber Churn и снижению рейтинга качества.
- Спам нерелевантными ключевыми словами: Попытки ранжироваться по запросам, не соответствующим контенту. Низкое качество взаимодействия приведет к высокому churn и падению Channel Ranking, что в итоге снизит видимость.
- Накрутка подписчиков без вовлечения: Увеличение числа подписчиков само по себе не поможет. Если подписчики не смотрят контент, это не улучшит usage data и не поможет в ранжировании по описанному алгоритму.
- Фокус только на SEO-оптимизации метаданных: Стратегия, основанная только на подборе ключевых слов без работы над качеством контента, неэффективна, так как факторы качества имеют приоритет при финальном ранжировании (Claim 7).
Стратегическое значение
Патент подтверждает, что алгоритмы поиска на контент-платформах (таких как YouTube) функционируют как зрелые поисковые системы, где поведенческие факторы и метрики качества играют доминирующую роль над простым текстовым соответствием. Для долгосрочной стратегии продвижения критически важно сосредоточиться на создании реальной ценности для аудитории и построении лояльного сообщества, а не на поиске алгоритмических лазеек.
Практические примеры
Сценарий: Ранжирование каналов по запросу «Изучение Python» на YouTube
- Запрос: Пользователь вводит «Изучение Python».
- Кандидаты:
Канал А: Название «Изучение Python Быстро». Много ключевых слов в описании. Контент поверхностный, много кликбейта. Высокий subscriber churn, низкие usage data.
Канал Б: Название «Уроки Программирования от [Имя]». Ключевое слово «Python» есть, но не доминирует. Контент глубокий, экспертный. Низкий subscriber churn, высокие usage data. - Первичное ранжирование: Канал А может иметь лучший degree of match (более точное вхождение запроса в название).
- Переранжирование (Reranking): Система анализирует метрики качества. Канал Б получает высокий Channel Ranking и Quality of a subscription offering. Канал А — низкий.
- Результат (Улучшенный поиск): Система применяет логику патента (Claim 7) и поднимает Канал Б выше Канала А в финальных результатах поиска, так как его высокое качество компенсирует более низкую текстовую релевантность.
Вопросы и ответы
Что важнее для ранжирования канала на YouTube: ключевые слова в описании или удержание аудитории?
Согласно патенту, удержание аудитории имеет приоритет. Ключевые слова используются для базового ранжирования (degree of match), но финальный порядок определяется качеством канала. Патент прямо утверждает (Claim 7), что канал с высоким качеством может ранжироваться выше, даже если он менее релевантен тексту запроса.
Что такое «Subscriber Churn» и почему он так важен?
Subscriber Churn — это отток подписчиков, то есть скорость, с которой пользователи отписываются от канала. В патенте (Claim 1) это ключевой показатель для определения «качества предложения подписки» (Quality of a subscription offering). Низкий отток сигнализирует системе, что канал ценен для аудитории, что напрямую улучшает его ранжирование.
Как именно система измеряет «качество» канала?
Система использует две основные метрики. Первая — Quality of a Subscription Offering, которая, согласно Claim 1, основывается как минимум на Subscriber Churn Data (оттоке подписчиков). Вторая — Channel Ranking, который рассчитывается на основе Usage Data (данных об использовании, таких как время просмотра) и обратной связи (рейтинги).
Может ли канал с плохими метаданными (тегами и описанием) ранжироваться высоко?
Да, это возможно. В Claim 7 прямо указано, что канал с низкой степенью соответствия (low degree of match) запросу может ранжироваться выше, чем канал с высоким соответствием, если у первого высокий рейтинг канала (Channel Rank). Это значит, что отличные поведенческие метрики могут компенсировать слабую текстовую оптимизацию.
Как этот патент влияет на стратегию использования кликбейта?
Патент описывает механизм, который активно борется с кликбейтом на уровне каналов. Если канал использует кликбейт для привлечения подписчиков, но контент не соответствует ожиданиям, это приведет к высокому оттоку (churn). Высокий отток снизит качество канала, и система пессимизирует его в поиске.
Применяется ли этот патент к ранжированию отдельных видео?
Патент специфически описывает ранжирование Channels (Каналов) в Channel Marketplace. Хотя логика приоритета вовлеченности применима и к отдельным видео, описанные здесь механизмы (например, использование оттока подписчиков) относятся именно к поиску по каналам.
Что такое «Usage Data» в контексте этого патента?
Это данные о том, как подписчики взаимодействуют с каналом. Примеры, приведенные в описании патента, включают общее время, проведенное подписчиком на канале, среднее время сессии, пропорцию времени, потраченного на просмотр канала относительно другого контента, и частоту просмотров.
Относится ли этот патент к ранжированию сайтов в Google Поиске?
Нет. Патент описывает Content Hosting System — платформу для создания и подписки на видеоканалы (например, YouTube). Описанные механизмы ранжирования относятся ко внутреннему поиску по этой платформе (поиск каналов на YouTube), а не к общему веб-поиску Google.
Влияет ли количество подписчиков на ранжирование согласно этому патенту?
Напрямую количество подписчиков не указано как фактор ранжирования в ключевых Claims. Система фокусируется на поведении этих подписчиков (вовлеченность и отток), а не на их абсолютном количестве. Большое количество неактивных подписчиков не улучшит Usage Data.
Что важнее для YouTube SEO в контексте этого патента: просмотры или подписчики?
Важнее вовлеченность и удержание. Патент фокусируется на том, что делают подписчики после подписки. Если они активно смотрят контент (высокие usage data) и не отписываются (низкий churn), это гораздо ценнее, чем большое количество неактивных подписчиков или разовые просмотры от случайных зрителей.