Как Google использует плейлисты для определения связанных видео и формирования рекомендаций на YouTube

Google анализирует, как часто видео появляются вместе в одних и тех же плейлистах (статистика совместного появления), чтобы формировать рекомендации на YouTube. Этот метод позволяет рекомендовать даже малопопулярные видео. Ранжирование основано на частоте совместного появления, близости в плейлисте и схожести времени загрузки видео.

Описание

Какую задачу решает

Патент решает проблему ограниченности систем рекомендаций, основанных исключительно на совместных просмотрах (co-visitation или co-watch). Такие системы неэффективны для новых, нишевых или малопопулярных видео («длинный хвост»), так как для них недостаточно данных о поведении пользователей. Изобретение предлагает альтернативный сигнал связанности контента, который не зависит от количества просмотров, решая проблему «холодного старта».

Что запатентовано

Запатентована система генерации видеорекомендаций, использующая статистику совместного появления (video co-occurrence statistics) видеоконтента в плейлистах. Суть в том, что если два видео часто добавляются в одни и те же плейлисты (пользовательские или системные), они считаются связанными. Система вычисляет частоту таких совместных появлений и использует ее как ключевой фактор для ранжирования рекомендаций.

Как это работает

Система работает в несколько этапов:

Анализ плейлистов (Офлайн): Система анализирует все доступные плейлисты и подсчитывает, как часто каждая пара видео встречается вместе. Эти данные формируют матрицу совместного появления (video co-occurrence matrix).
Генерация рекомендаций (Онлайн): Когда пользователь смотрит целевое видео (target video), система находит видео, которые чаще всего появляются с ним в плейлистах.
Ранжирование: Кандидаты ранжируются. Основной фактор — частота совместного появления. Дополнительные факторы, такие как позиционная близость в плейлисте (distance) и схожесть времени загрузки (uploading time), используются для уточнения ранжирования и разрешения коллизий.
Обновление: Список рекомендаций может динамически обновляться в реальном времени во время просмотра видео.

Актуальность для SEO

Высокая. Механизмы рекомендаций являются ядром платформ типа YouTube и критически важны для удержания пользователей и распределения трафика. Использование плейлистов как фундаментального сигнала для установления связей между видео остается актуальным подходом, особенно для обработки огромного объема пользовательского контента (UGC). Патент был выдан в 2023 году.

Важность для SEO

Влияние на традиционное Web SEO минимально, так как патент описывает внутренние механизмы видеохостинга (например, YouTube). Однако для Video SEO (VSEO) патент имеет высокое значение. Он раскрывает конкретный механизм, влияющий на получение трафика из блоков рекомендаций («Следующее», «Похожие видео»). Понимание этого механизма подчеркивает стратегическую важность работы с плейлистами как инструмента оптимизации видео.

Детальный разбор

Термины и определения

Target Video (Целевое видео): Видео, которое пользователь просматривает в данный момент и для которого генерируются рекомендации.
Video Playlist (Видеоплейлист): Список видео, сгруппированных вместе для воспроизведения в определенном порядке. Может быть создан пользователем (user playlist) или системой (system playlist).
Video Co-occurrence Data/Statistics (Данные/Статистика совместного появления): Метрика, указывающая на частоту (frequency), с которой два видео появляются вместе в одних и тех же плейлистах.
Video Co-occurrence Matrix (Матрица совместного появления видео): Структура данных, хранящая статистику совместного появления для пар видео.
Co-occurrence Videos (Совместно появляющиеся видео): Видео, которые встречаются хотя бы раз в одном плейлисте вместе с целевым видео.
Distance (Дистанция): Показатель позиционной близости двух видео в порядке воспроизведения внутри плейлиста. Меньшая дистанция предполагает более сильную связь.
Uploading Time (Время загрузки): Временная метка загрузки видео на платформу. Используется для разрешения коллизий при ранжировании.
Secondary video co-occurrence data (Вторичные данные совместного появления) / Hops (Прыжки): Метрика косвенной связи. Измеряет количество промежуточных звеньев между двумя видео, которые не находятся в одном плейлисте напрямую. Меньшее количество прыжков указывает на более тесную связь.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации и динамического обновления видеорекомендаций.

Идентификация множества плейлистов, содержащих целевое видео и другие видео.
Генерация данных совместного появления:
- Создание пар видео (video pairs) из целевого видео и других видео в том же плейлисте.
- Подсчет частоты (frequency) появления каждой пары во всем множестве плейлистов.
Генерация оценок ранжирования (Ranking Scores) для других видео на основе подсчитанной частоты. Оценка отражает вероятность просмотра.
Механизм разрешения коллизий (Tie-breaker): Если у двух разных видео (Видео 1 и Видео 2) одинаковая частота совместного появления с целевым видео, система использует время загрузки (uploading time). Видео 1 получит более высокий Ranking Score, чем Видео 2, если разница во времени загрузки между целевым видео и Видео 1 меньше, чем между целевым видео и Видео 2.
Генерация одной или нескольких видеорекомендаций на основе Ranking Scores.
Механизм обновления в реальном времени: Отображение рекомендаций одновременно с целевым видео. Идентификация новых рекомендаций в ответ на просмотр. Замена текущих рекомендаций новыми (путем удаления хотя бы одной из ранее показанных) во время продолжения показа целевого видео.

Claim 5 (Зависимый от 1): Уточняет, что ранжирование может основываться на дистанции (distance) между целевым видео и другим видео в плейлисте, определяемой порядком воспроизведения.

Claim 6 (Зависимый от 1): Описывает генерацию вторичных данных совместного появления (secondary video co-occurrence data), указывающих количество прыжков (number of hops) между целевым видео и другим видео.

Где и как применяется

Патент описывает работу рекомендательного движка внутри сервиса видеохостинга (например, YouTube), а не в основном веб-поиске Google.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-обработка данных. Система анализирует все доступные плейлисты (Video Playlists). Video Co-occurrence Module рассчитывает статистику совместного появления, частоту, дистанции и хопы. Результаты сохраняются в Video Co-occurrence DB в виде матрицы.

RANKING – Ранжирование (Генерация рекомендаций)
Когда пользователь запускает Target Video, Video Ranking Module в реальном времени обращается к матрице для идентификации кандидатов (Co-occurrence Videos). Кандидаты ранжируются на основе частоты и дополнительных факторов (Distance, Uploading Time).

RERANKING / Blending – Переранжирование и Смешивание
Recommendation Update Module формирует финальный список. Он может смешивать эти рекомендации с другими (например, основанными на co-watch) и отвечает за обновление списка в реальном времени во время просмотра видео (как описано в Claim 1).

Входные данные:

Структура плейлистов (ID видео, порядок воспроизведения).
Метаданные видео (время загрузки).
ID целевого видео (при запросе рекомендаций).

Выходные данные:

Video Co-occurrence Matrix (офлайн).
Ранжированный список рекомендованных видео (онлайн).

На что влияет

Конкретные типы контента: Влияет исключительно на видеоконтент, размещенный на платформе видеохостинга.
Специфические запросы: Влияет не на поисковую выдачу, а на трафик из блоков рекомендаций («Следующее», «Похожие видео»).
Конкретные ниши или тематики: Особенно важен для «длинного хвоста» (long-tail) — нового, нишевого или малопопулярного контента, для которого недостаточно данных о совместных просмотрах (co-watch).

Когда применяется

Триггеры активации: Запуск воспроизведения видео пользователем на платформе.
Условия работы: Применяется при генерации рекомендаций для любого видео, включенного хотя бы в один плейлист.
Временные рамки и частота применения: Расчет матрицы происходит периодически офлайн. Генерация и обновление рекомендаций происходит в реальном времени при каждом просмотре видео.

Пошаговый алгоритм

Процесс А: Офлайн-генерация матрицы совместного появления

Сбор данных: Получение доступа ко всем плейлистам (пользовательским и системным) на платформе.
Анализ и извлечение пар: Для каждого плейлиста извлекаются метаданные (состав видео, порядок воспроизведения). Генерируются все уникальные пары видео внутри каждого плейлиста.
Расчет статистики: Агрегация всех пар и подсчет частоты (frequency) для каждой уникальной пары во всей совокупности плейлистов.
Создание матрицы: Формирование и сохранение Video Co-occurrence Matrix.
Расчет вторичных данных (Опционально): Расчет количества прыжков (Hops) между видео, которые не связаны напрямую.

Процесс Б: Генерация рекомендаций в реальном времени

Обнаружение целевого видео: Система фиксирует запуск видео пользователем (Target Video).
Выбор кандидатов: Обращение к Матрице для извлечения списка Co-occurrence Videos.
Ранжирование по частоте: Сортировка кандидатов по частоте совместного появления.
Применение Tie-breaker (Uploading Time): Если частота одинакова, кандидаты сортируются по близости времени загрузки к целевому видео. Чем ближе — тем выше ранг (Claim 1).
Применение вторичных факторов: Дополнительная корректировка ранжирования на основе дистанции (Distance) в плейлистах (Claim 5) и количества хопов (Hops).
Формирование списка рекомендаций: Выбор Топ-N ранжированных видео.
Отображение и обновление: Показ рекомендаций пользователю. Динамическое обновление списка во время просмотра (замена старых рекомендаций новыми).

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании структурных и временных данных, связанных с организацией контента на платформе.

Структурные факторы (Плейлисты): Ключевые данные. Система анализирует состав плейлистов и порядок воспроизведения видео (для расчета Distance).
Временные факторы: Время загрузки видео (Uploading Time). Явно используется как фактор ранжирования для разрешения коллизий (tie-breaker).

В описании патента также упоминаются опциональные факторы, которые могут учитываться при ранжировании:

Факторы качества/Популярности: Качество видео (video quality), популярность видео, репутация создателя плейлиста.

Какие метрики используются и как они считаются

Frequency (Частота совместного появления): Основной фактор ранжирования. Прямой подсчет количества плейлистов, в которых Видео А и Видео Б присутствуют вместе.
Uploading Time Similarity (Схожесть времени загрузки): Разница между временными метками загрузки Видео А и Видео Б. Используется как tie-breaker: меньшая разница дает преимущество при одинаковой частоте.
Distance (Дистанция): Разница в порядковых номерах Видео А и Видео Б внутри плейлиста. Используется как вторичный фактор ранжирования: меньше дистанция — выше ранг.
Hops (Количество прыжков): Метрика, рассчитываемая путем обхода графа связей. Определяет степень опосредованной связи. Меньшее количество прыжков указывает на более тесную связь.
Ranking Score: Итоговая оценка, используемая для сортировки рекомендаций. Является функцией от Frequency, скорректированной вторичными факторами.

Выводы

Плейлисты — критически важный сигнал связанности для VSEO: Патент подтверждает, что организация видео в плейлисты является одним из ключевых механизмов для определения тематических и семантических связей между единицами контента на видеоплатформе.
Решение проблемы «холодного старта»: Этот механизм позволяет генерировать рекомендации независимо от данных о совместных просмотрах (co-watch), что критически важно для поддержки нового и нишевого контента.
Частота — основа, но контекст определяет результат: Хотя частота совместного появления является первичным фактором, контекст имеет решающее значение:
- Время загрузки (Uploading Time) как Tie-breaker: Запатентован конкретный механизм: при равной частоте предпочтение отдается видео, загруженным примерно в одно время.
- Близость в плейлисте (Distance): Видео, расположенные ближе в порядке воспроизведения, считаются более связанными.
Косвенная связанность (Hops): Система способна находить связи даже между видео, которые никогда не были в одном плейлисте напрямую, через цепочку посредников.
Динамические рекомендации: Система может обновлять рекомендации в реальном времени во время просмотра, что указывает на постоянную оптимизацию выдачи.

Практика

ВАЖНО: Данный патент применим исключительно к Video SEO (например, оптимизации на YouTube) и не имеет практического применения для традиционного SEO веб-сайтов.

Best practices (это мы делаем)

Активное создание тематических плейлистов: Необходимо включать каждое видео в релевантные плейлисты. Создавайте узкотематические подборки для усиления сигналов co-occurrence внутри тематического кластера.
Оптимизация структуры плейлистов (Distance): Структурируйте плейлисты логично и последовательно. Видео, которые должны рекомендоваться друг другу (например, следующая серия курса), должны находиться рядом в порядке воспроизведения (минимизация Distance).
Пакетная загрузка связанного контента (Uploading Time): Если вы публикуете серию связанных видео, загружайте их в течение короткого промежутка времени. Схожесть времени загрузки является позитивным сигналом ранжирования (tie-breaker) при прочих равных.
Стимулирование пользовательских плейлистов: Мотивируйте аудиторию добавлять ваши видео в их собственные публичные плейлисты. Это создает естественные сигналы co-occurrence с контентом других авторов, расширяя охват рекомендаций.

Worst practices (это делать не надо)

Изоляция контента: Публикация видео без включения их в какие-либо плейлисты. Это значительно снижает вероятность генерации рекомендаций на основе описанного механизма.
Хаотичная структура и плейлисты-«солянки»: Создание длинных плейлистов с нелогичным порядком или смешивание несвязанного контента. Это увеличивает Distance между связанными видео и размывает тематические сигналы.
Большие временные разрывы в сериях: Публикация частей связанного контента с разницей в недели или месяцы ослабляет сигнал Uploading Time Similarity.

Стратегическое значение

Патент подчеркивает, что для Video SEO плейлисты являются не просто функцией удобства, а критически важным инструментом для управления тем, как алгоритмы рекомендаций интерпретируют связи между видео. Стратегия контента должна включать стратегию его организации для максимизации охвата через рекомендательные системы. Это особенно важно для развития новых каналов и продвижения нишевого контента, где данных о просмотрах еще недостаточно.

Практические примеры

Сценарий: Оптимизация рекомендаций для образовательного курса

Задача: Убедиться, что после просмотра Лекции 1 пользователю рекомендуется Лекция 2.
Действия (на основе патента):
- Создать отдельный плейлист «Курс по SEO — Основы».
- Загрузить все лекции курса в течение одного дня (минимизация разницы Uploading Time).
- Добавить все лекции в плейлист строго по порядку: Лекция 1, Лекция 2 и т.д. (минимизация Distance до 1).
Ожидаемый результат: Система зафиксирует высокую частоту совместного появления Лекции 1 и Лекции 2. Благодаря минимальной дистанции и схожему времени загрузки, Лекция 2 получит максимальный Ranking Score и будет приоритетно рекомендована при просмотре Лекции 1, даже если у видео еще мало просмотров.

Вопросы и ответы

Применяется ли этот патент к Google Поиску или к YouTube?

В первую очередь он применяется к YouTube (или аналогичным сервисам). Патент описывает систему рекомендаций Video Hosting Service, основанную на плейлистах, что является основной функциональностью YouTube, а не стандартного веб-поиска Google.

Насколько важны плейлисты для продвижения видео согласно этому патенту?

Плейлисты критически важны. Патент описывает целый механизм рекомендаций, который полностью основан на статистике совместного появления видео в плейлистах (Video Co-occurrence Statistics). Если видео не включено в плейлисты, этот механизм не сможет эффективно работать для него, что особенно критично для новых или нишевых видео.

Влияет ли порядок видео в плейлисте на рекомендации?

Да, влияет. Патент явно указывает (Claim 5), что дистанция (Distance) между видео в порядке воспроизведения используется при ранжировании. Видео, расположенные ближе друг к другу в плейлисте, считаются более связанными и с большей вероятностью будут рекомендованы друг другу.

Как именно время загрузки (Uploading Time) влияет на ранжирование?

Согласно Claim 1, время загрузки используется как механизм разрешения коллизий (tie-breaker). Если два разных видео одинаковое количество раз встречаются в плейлистах с целевым видео, то видео, загруженное ближе по времени к целевому, получит более высокий Ranking Score. Это подчеркивает важность серийной загрузки связанного контента.

Учитываются ли только мои плейлисты или плейлисты других пользователей тоже?

Учитываются все плейлисты на платформе, включая созданные другими пользователями (user playlists) и сгенерированные самой системой (system playlists). Поэтому важно мотивировать аудиторию добавлять ваши видео в их плейлисты.

Что такое «прыжки» (Hops) и как они используются?

Прыжки (Hops) — это мера опосредованной связи (Claim 6). Если ваше видео (A) находится в плейлисте с видео (B), а видео (B) находится в другом плейлисте с видео (C), то система считает, что A и C связаны через 2 прыжка. Это позволяет рекомендовать видео, которые напрямую никогда не встречались в одном плейлисте, но связаны тематически через посредников.

Могут ли рекомендации меняться прямо во время просмотра видео?

Да. В патенте (Claim 1) явно описан механизм обновления рекомендаций в реальном времени. Система может идентифицировать новые рекомендации и заменять ими текущие (удаляя старые) прямо во время воспроизведения целевого видео.

В чем разница между «co-occurrence» (совместное появление) и «co-watch» (совместный просмотр)?

Co-occurrence означает, что видео сгруппированы вместе в одном плейлисте. Co-watch означает, что пользователи часто смотрят одно видео сразу после другого. Оба сигнала используются, но co-occurrence не требует большого трафика просмотров для установления связи и помогает при «холодном старте».

Как лучше всего оптимизировать серийный контент (например, веб-сериал или курс)?

Для серийного контента критически важно использовать три основных фактора из патента: загрузить все серии в короткий промежуток времени (Uploading Time), создать отдельный плейлист для сериала и расположить серии строго по порядку (минимизация Distance). Это максимизирует вероятность того, что следующая серия будет рекомендована после текущей.

Влияет ли качество или популярность видео на этот алгоритм?

В основных пунктах формулы изобретения (Claims) качество и популярность не упоминаются; ранжирование основано на частоте, дистанции и времени загрузки. Однако в общем описании патента упоминается, что эти факторы (качество видео, популярность, репутация автора плейлиста) могут учитываться при расчете итогового Ranking Score.