Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google (YouTube) использует последовательность просмотров и общее время просмотра для определения и ранжирования похожих видео

    USER INTERACTION BASED RELATED VIDEOS (Связанные видео на основе взаимодействия пользователей)
    • US9088808B1
    • Google LLC
    • 2015-07-21
    • 2008-02-08
    2008 Мультимедиа Патенты Google Персонализация Поведенческие сигналы

    Google использует поведенческие сигналы для определения похожих видео на платформах типа YouTube. Система анализирует, какие видео пользователи смотрят одно за другим в течение короткого времени (ко-просмотры). Если пользователи положительно взаимодействуют (например, долго смотрят) с Видео А и сразу после этого с Видео Б, система считает их связанными. Финальный список рекомендаций ранжируется с учетом временной близости просмотров и общего времени просмотра (Total Watch Time).

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему низкой релевантности традиционных методов подбора похожих видео, которые основывались преимущественно на метаданных (теги, ключевые слова, авторы) или общей популярности. Такие методы часто не отражали истинные интересы пользователя в контексте текущего просмотра. Изобретение улучшает качество рекомендаций, используя фактические поведенческие данные о том, как пользователи потребляют контент последовательно.

    Что запатентовано

    Запатентована система определения связанности видео на основе co-occurring positive interactions (совместно происходящих положительных взаимодействий) пользователей в пределах определенного временного окна (locality of time или sliding window). Если значительное число пользователей положительно взаимодействует с Видео А и вскоре после этого положительно взаимодействует с Видео Б, эти видео считаются связанными, независимо от их метаданных. Система применяет взвешивание (weighting) на основе временной близости между просмотрами и использует общее время просмотра (total duration of watch time) для ранжирования рекомендаций.

    Как это работает

    Система работает путем анализа логов доступа к видео (Video Access Log):

    • Сбор данных: Фиксируются все взаимодействия пользователя (просмотр, пауза, перемотка, оценка).
    • Оценка взаимодействия: Каждый просмотр классифицируется как положительный или отрицательный на основе метрик вовлеченности, таких как процент просмотра (Watch Ratio).
    • Анализ последовательности: Система выстраивает хронологическую последовательность просмотренных пользователем видео.
    • Скользящее окно (Sliding Window): Анализируются пары видео, просмотренные в пределах короткого интервала времени (например, 1 час).
    • Идентификация связей: Если оба видео в паре имеют положительное взаимодействие, фиксируется связь.
    • Взвешивание: Связи взвешиваются: чем меньше времени прошло между просмотрами, тем выше вес.
    • Агрегация: Данные агрегируются по всем пользователям в Co-occurrence Matrix.
    • Ранжирование: Список похожих видео ранжируется на основе взвешенных связей и, что критически важно, с учетом общего времени просмотра (total duration of watch time) этих видео.

    Актуальность для SEO

    Критически высокая. Описанные механизмы лежат в основе современных рекомендательных систем, особенно на YouTube. Фокус на времени просмотра (Watch Time), продолжительности сессии и рекомендациях, основанных на последовательности действий пользователя (session-based recommendations), является фундаментальным для алгоритмов обнаружения контента в 2025 году.

    Важность для SEO

    Патент имеет критическое значение для Video SEO (VSEO) и стратегий продвижения на YouTube. Он демонстрирует, что для попадания в блок «Похожие видео» (Related Videos/Up Next) поведенческие сигналы и время просмотра значительно важнее, чем оптимизация метаданных. Стратегия должна быть направлена на максимизацию положительных взаимодействий и стимулирование длительных сессий просмотра.

    Детальный разбор

    Термины и определения

    Co-occurrence Matrix (Матрица совместной встречаемости)
    Структура данных, хранящая количество (часто взвешенное) co-occurring positive interactions между всеми парами видео (Vi, Vj) по данным всех пользователей.
    Co-occurring Positive Interactions (Совместно происходящие положительные взаимодействия)
    Событие, когда один и тот же пользователь положительно взаимодействует с двумя разными видео в пределах заданного временного окна (locality of time).
    Negative Interaction (Негативное взаимодействие)
    Взаимодействие, указывающее на низкий интерес. Примеры: просмотр менее 25% видео, просмотр менее 5 секунд, низкая оценка, немедленный поиск нового запроса.
    Positive Interaction (Положительное взаимодействие)
    Взаимодействие, указывающее на интерес пользователя к видео, произошедшее после начала воспроизведения. Примеры: просмотр более 75% видео, просмотр более 30 секунд, высокая оценка, перемотка назад для повторного просмотра.
    Sliding Window (Скользящее окно)
    Механизм определения временного интервала для анализа последовательности просмотров. Может быть фиксированным (например, 1 час) или динамическим (например, сбрасываться при новом поиске).
    Total Duration of Watch Time (Общее время просмотра)
    Суммарное время, в течение которого конкретное видео просматривалось всеми пользователями. Критический фактор, используемый для ранжирования списка похожих видео.
    User Events (События пользователя)
    Любые взаимодействия пользователя с интерфейсом платформы: использование элементов управления воспроизведением (play, pause, rewind, forward), оценки, комментарии, поисковые запросы.
    Video Access Log (Журнал доступа к видео)
    База данных, хранящая записи о User Events, включая User ID, Video ID, тип взаимодействия и временную метку.
    Watch Ratio (Коэффициент просмотра)
    Отношение времени воспроизведения к общей длине видео. Используется для определения качества взаимодействия.
    Weighting (Взвешивание)
    Процесс присвоения веса (Weight) связи между двумя видео. Вес основан на продолжительности времени между просмотром первого и второго видео в паре. Чем меньше времени прошло, тем выше вес.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод выбора набора похожих видео для первого видео, включающий двухэтапное ранжирование.

    1. Система получает данные о взаимодействиях пользователей.
    2. Идентифицируются положительные взаимодействия (positive interactions) с первым видео и с множеством вторых видео, произошедшие в пределах временного окна (locality of time).
    3. Генерируются co-occurring positive interactions для пар.
    4. Взвешивание: Каждому совместному взаимодействию присваивается вес (weight), основанный на продолжительности времени между просмотром первого и второго видео.
    5. Сохраняются счетчики взвешенных совместных взаимодействий.
    6. Ранжирование 1 (Выбор): Вторые видео ранжируются с использованием этих счетчиков, и выбирается набор похожих видео.
    7. Ранжирование 2 (Вторичное): Выбранный набор похожих видео переранжируется на основе, по крайней мере частично, общего времени просмотра (total duration of watch time) каждого из этих видео всеми пользователями.
    8. Индикация набора похожих видео сохраняется.

    Ядром изобретения является комбинация поведенческой связи (что смотрят вместе) и глобальной вовлеченности (общее время просмотра) для определения лучших рекомендаций.

    Claim 7 (Независимый пункт): Описывает аналогичный процесс определения связанных видео.

    Ключевые этапы совпадают с Claim 1, подтверждая механизм двухэтапного ранжирования: выбор на основе взвешенных ко-просмотров и финальное ранжирование на основе total duration of watch time.

    Claim 18 (Независимый пункт): Описывает альтернативный вариант ранжирования.

    Процесс генерации и взвешивания взаимодействий совпадает с Claim 1. Однако ранжирование здесь описывается как основанное одновременно на счетчиках совместных взаимодействий И на total duration of watch time. Это предполагает использование комбинированной метрики ранжирования на этапе отбора, а не последовательное применение двух ранжирований.

    Где и как применяется

    Изобретение описывает работу рекомендательной системы на видеохостинге (например, YouTube).

    CRAWLING – Сбор данных (Data Acquisition)
    На этом этапе происходит сбор поведенческих данных. Video Access Log постоянно пополняется записями о действиях пользователей (User Events). Это «сырье» для работы алгоритма.

    INDEXING – Индексирование и извлечение признаков (Feature Extraction)
    Основная работа алгоритма происходит офлайн (например, ежедневно) и относится к этапу глубокого индексирования поведенческих сигналов. User Interaction Analysis Server выполняет:

    • Обработку логов и классификацию взаимодействий (позитивные/негативные).
    • Вычисление метрик (Watch Ratio).
    • Построение связей и генерацию Co-occurrence Matrix путем анализа сессий в Sliding Window.
    • Взвешивание связей.

    Результаты сохраняются в Related Videos Database.

    RANKING / RERANKING (Рекомендации)
    Когда пользователь просматривает целевое видео, система в реальном времени обращается к Related Videos Database и извлекает заранее рассчитанный список похожих видео. Этот список уже отранжирован либо в два этапа (Claims 1, 7), либо с использованием комбинированной оценки (Claim 18).

    Входные данные:

    • Video Access Log (User ID, Video ID, Timestamp, Event Type, Time Offset).
    • Данные о видео (общая длина видео).

    Выходные данные:

    • Ранжированный список связанных видео для каждого целевого видео.

    На что влияет

    • Конкретные типы контента: Влияет исключительно на видеоконтент на платформах хостинга (YouTube).
    • Обнаружение контента: Напрямую влияет на то, какой контент будет показан в блоках «Похожие видео» или «Up Next». Это ключевой механизм обнаружения нового контента и удержания пользователя на платформе.

    Когда применяется

    • Условия работы алгоритма: Алгоритм расчета связей работает периодически (офлайн). В патенте упоминаются обновления раз в день, неделю или месяц.
    • Применение результатов: Используются в реальном времени при каждой загрузке страницы просмотра видео.
    • Исключения (Фильтрация ботов): В патенте упоминается фильтрация активности программных роботов (software robot) на основе аномально высокой скорости просмотров (например, 100 видео за 2 минуты). Данные от таких источников исключаются из анализа.

    Пошаговый алгоритм

    Офлайн-процесс анализа взаимодействий

    1. Извлечение данных: Система извлекает User Events из Video Access Log.
    2. Фильтрация активности роботов: Анализируется частота доступа к видео по User ID. Аномальная активность фильтруется.
    3. Тегирование событий: Каждое событие классифицируется как положительное или отрицательное (например, на основе продолжительности просмотра).
    4. Тегирование видео и секвенирование:
      1. Определяется, было ли взаимодействие с видео в целом положительным (Тег=1) или отрицательным (Тег=0).
      2. Для каждого пользователя создается хронологическая последовательность просмотренных видео с их тегами.
    5. Обработка скользящим окном (Sliding Window):
      1. Определяется размер временного окна (например, 1 час). Окно может быть динамическим (короче для активных пользователей или сбрасываться при новом поисковом запросе).
      2. Окно перемещается по последовательности видео пользователя.
    6. Идентификация ко-просмотров: Внутри окна идентифицируются пары видео (Vi, Vj), где оба видео имеют Тег=1 (co-occurring positive interactions).
    7. Взвешивание по времени (Weighting): Для каждой положительной пары рассчитывается вес (Weight), основанный на времени между просмотром Vi и Vj. Чем меньше времени прошло, тем выше вес (функция временного затухания).
    8. Обновление матрицы: Счетчик для пары (Vi, Vj) в Co-occurrence Matrix увеличивается на рассчитанный вес. Подсчет предпочтительно однонаправленный (Vi перед Vj).
    9. Агрегация и Ранжирование:
      1. Первичное ранжирование: Для Vi кандидаты Vj ранжируются по итоговому взвешенному счетчику (Cij).
      2. Вторичное ранжирование (Claims 1, 7): Отобранный список переранжируется с использованием Total Duration of Watch Time для каждого видео Vj. (Или используется комбинированное ранжирование согласно Claim 18).
    10. Сохранение результатов: Финальный ранжированный список сохраняется в Related Videos Database.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется исключительно на поведенческих факторах и временных данных. Метаданные контента не используются для определения связанности.

    • Поведенческие факторы (User Interaction Data):
      • События воспроизведения: Play, Pause, Rewind, Fast Forward, перемещение ползунка.
      • Продолжительность просмотра (Play Time / Time Offset).
      • Оценки (Ratings): (например, от 1 до 5 звезд).
      • Комментарии (Comments): (анализ тональности).
      • Последовательность действий: Порядок просмотра видео.
      • Поисковые запросы (Search Query): Могут использоваться для сброса скользящего окна.
    • Временные факторы:
      • Временные метки (Timestamps): Используются для расчета продолжительности просмотра и времени между просмотрами.
    • Пользовательские факторы:
      • User ID: (предпочтительно анонимизированный) для отслеживания сессий.
    • Контентные факторы:
      • Общая длина видео: необходима для расчета Watch Ratio.

    Какие метрики используются и как они считаются

    • Watch Ratio (Коэффициент просмотра): Время воспроизведения/Длина видео\text{Время воспроизведения} / \text{Длина видео}. Пороги (примеры из патента): >75% (положительно), <25% (отрицательно).
    • Абсолютное время просмотра: Пороги (примеры): >30 секунд (положительно), <5 секунд (отрицательно).
    • Positive Interaction Tag (Тег положительного взаимодействия): Бинарное (1/0) или вещественное значение, присваиваемое сеансу просмотра на основе метрик вовлеченности.
    • Sliding Window Size (Размер скользящего окна): Временной интервал (например, 1 час). Может быть динамическим.
    • Weight (Вес взаимодействия / Temporal Decay): Коэффициент, применяемый к ко-просмотрам. Рассчитывается как функция от времени между просмотрами. W=f(TimeVj−TimeVi)W = f(Time_{Vj} — Time_{Vi}).
    • Weighted Co-occurrence Count (Взвешенный счетчик ко-просмотров): Сумма весов всех положительных совместных взаимодействий для пары видео по всем пользователям.
    • Total Duration of Watch Time (Общее время просмотра): Суммарное время просмотра видео всеми пользователями. Используется для финального ранжирования.

    Выводы

    1. Поведенческая связанность доминирует над семантической: Патент подтверждает, что для системы рекомендаций (Related Videos) реальные паттерны просмотра пользователей являются определяющим фактором, а не совпадение метаданных (тегов, ключевых слов).
    2. Критичность положительного вовлечения (Engagement): Недостаточно просто получить клик. Система должна классифицировать просмотр как Positive Interaction (высокий Watch Ratio, оценки). Кликбейт, ведущий к быстрому уходу, генерирует негативное взаимодействие и не создает связей.
    3. Важность сессии просмотра (Viewing Session): Ключевым элементом является анализ последовательности просмотров в рамках одной сессии (Sliding Window). Цель SEO-стратегии — встроиться в эту последовательность и продлить ее.
    4. Временная близость имеет значение (Weighting): Связь между видео тем сильнее, чем ближе по времени они были просмотрены. Система придает больший вес видео, просмотренным сразу друг за другом.
    5. Двойная роль времени просмотра (Watch Time): Время просмотра используется дважды:
      1. Локально: для определения, было ли взаимодействие положительным (Watch Ratio).
      2. Глобально: для финального ранжирования списка похожих видео (Total Duration of Watch Time). Видео с высоким общим временем просмотра имеют преимущество.
    6. Защита от манипуляций: Система включает механизмы фильтрации активности роботов, анализируя скорость просмотров, чтобы предотвратить искусственное создание связей.

    Практика

    Best practices (это мы делаем)

    Рекомендации применимы в первую очередь для оптимизации видео на YouTube (VSEO).

    • Максимизация времени удержания (Watch Time) и Watch Ratio: Это критически важно. Необходимо добиться, чтобы пользователи досматривали видео, гарантируя классификацию сессии как Positive Interaction и увеличивая Total Duration of Watch Time, что напрямую влияет на ранжирование в рекомендациях.
    • Стимулирование длительных сессий просмотра (Binge-Watching): Используйте плейлисты, конечные заставки (end screens) и призывы к просмотру следующего видео. Это увеличивает вероятность создания co-occurring positive interactions между вашими видео с максимальным весом (минимальный временной разрыв).
    • Анализ путей пользователей (Traffic Sources: Suggested Videos): Изучайте, после каких видео пользователи приходят к вам. Понимание этих реальных связей позволяет создавать контент, который естественно встраивается в существующие пользовательские пути.
    • Создание серийного контента: Разрабатывайте серии видео, которые пользователи естественно будут смотреть одно за другим. Это усиливает внутренние связи в Co-occurrence Matrix.

    Worst practices (это делать не надо)

    • Кликбейт (Clickbait): Использование обманчивых заголовков или превью. Это приводит к быстрому отказу, низкому Watch Ratio и классификации сессии как Negative Interaction, что исключает видео из системы рекомендаций.
    • Оптимизация только под клики/просмотры: Фокус на количестве просмотров без учета их продолжительности неэффективен, так как система полагается на время просмотра и качество взаимодействия.
    • Накрутка просмотров ботами: Система имеет механизмы фильтрации (Robot Filtering) аномальной активности на основе скорости просмотров. Некачественный трафик также генерирует плохие поведенческие сигналы.
    • Игнорирование метаданных: Хотя патент фокусируется на поведенческих факторах для рекомендаций, метаданные все еще важны для поискового ранжирования и первичного обнаружения контента.

    Стратегическое значение

    Патент подтверждает стратегию YouTube и подобных платформ: приоритет отдается удовлетворению пользователя и долгосрочному вовлечению (максимизации времени сессии). Для SEO-специалистов и создателей контента это означает, что успех зависит от способности создавать качественный, вовлекающий контент, который стимулирует длительные сессии просмотра, а не от технических манипуляций с метаданными. Ключевой метрикой успеха является не количество просмотров, а общее время просмотра.

    Практические примеры

    Сценарий: Попадание в рекомендации к популярному видео конкурента

    1. Цель: Получить трафик из блока «Похожие видео» при просмотре обзора нового смартфона от топового блогера (Видео А).
    2. Стратегия контента: Создать Видео Б, которое естественно продолжает сессию просмотра после Видео А. Например, «Сравнение камеры нового смартфона с конкурентами».
    3. Оптимизация Видео Б:
      1. Максимально оптимизировать удержание на Видео Б, чтобы добиться высокого Watch Ratio и увеличить Total Duration of Watch Time.
      2. Привлечь первичную аудиторию, интересующуюся Видео А, на просмотр Видео Б.
    4. Механизм работы алгоритма:
      1. Пользователи смотрят Видео А (Positive Interaction).
      2. Сразу после этого (внутри Sliding Window) они переходят к Видео Б.
      3. Просмотр Видео Б также классифицируется как Positive Interaction.
      4. Система фиксирует co-occurring positive interaction и присваивает ему высокий вес из-за минимального времени между просмотрами.
      5. Когда этот паттерн повторяется, счетчик в Co-occurrence Matrix растет.
    5. Результат: Видео Б начинает появляться в рекомендациях к Видео А. Благодаря высокому Total Duration of Watch Time, оно занимает высокие позиции в этом блоке (Вторичное ранжирование).

    Вопросы и ответы

    Что важнее для попадания в похожие видео: совпадение ключевых слов или поведенческие факторы?

    Согласно патенту, поведенческие факторы имеют решающее значение. Связанность определяется на основе того, смотрят ли пользователи оба видео последовательно в рамках одной сессии (co-occurring positive interactions). Совпадение метаданных не является обязательным условием. Система отдает приоритет тому, что пользователи делают, а не тому, что написано в описании видео.

    Как система определяет, что взаимодействие с видео было положительным (Positive Interaction)?

    Система анализирует различные сигналы (User Events). Ключевыми индикаторами являются коэффициент просмотра (Watch Ratio) — например, просмотр более 75% видео, и абсолютная продолжительность просмотра — например, более 30 секунд. Также учитываются высокие оценки (рейтинги), повторные просмотры (перемотка назад) и положительные комментарии.

    Что такое «скользящее окно» (Sliding Window) и какова его продолжительность?

    Это временной интервал, в течение которого система считает просмотры двух видео связанными. В патенте приводится пример 1 часа. Однако указано, что окно может быть динамическим: короче для очень активных пользователей или сбрасываться, если пользователь вводит новый поисковый запрос, что указывает на смену интереса.

    Влияет ли время между просмотрами двух видео на их связанность?

    Да, и это критически важно. Патент описывает механизм взвешивания (Weighting), при котором совместным просмотрам присваивается вес в зависимости от времени, прошедшего между ними. Чем меньше времени прошло между просмотром Видео А и Видео Б, тем сильнее связь между ними (механизм временного затухания).

    Какую роль играет общее время просмотра (Total Watch Time) в этом алгоритме?

    Общее время просмотра играет двойную роль. Во-первых, оно помогает определить, было ли индивидуальное взаимодействие положительным. Во-вторых, что более важно, оно используется для финального ранжирования списка похожих видео. Это гарантирует, что рекомендуются не только поведенчески связанные, но и глобально вовлекающие видео.

    Как этот патент влияет на использование кликбейта?

    Этот механизм активно борется с кликбейтом. Кликбейт ведет к быстрому уходу пользователя (низкий Watch Ratio). Система классифицирует это как Negative Interaction. Видео с негативными взаимодействиями не участвуют в формировании положительных цепочек рекомендаций, что снижает их видимость на платформе.

    Могут ли боты или накрутки повлиять на этот алгоритм?

    Патент предусматривает защиту от манипуляций. Система анализирует скорость просмотров для каждого пользователя (false activity detection). Аномально высокая активность (например, 100 видео за 2 минуты) идентифицируется как активность робота (software robot) и исключается из анализа данных.

    Как использовать знание этого патента для оптимизации канала?

    Необходимо сосредоточиться на создании контента, который максимизирует удержание и стимулирует продолжительные сессии просмотра. Используйте плейлисты и сериалы для поощрения «запойного просмотра» (binge-watching). Анализируйте, после каких видео к вам приходит аудитория, и создавайте контент, который естественно продолжает эту тему.

    Могут ли быть связаны видео из совершенно разных тематик?

    Да. Поскольку механизм основан на реальных паттернах просмотра, а не на тематическом сходстве метаданных, видео могут быть связаны, если значительное число пользователей часто переключается между этими тематиками в рамках одной сессии (например, с обзора автомобиля на музыкальный клип).

    Является ли подсчет совместных просмотров однонаправленным?

    В патенте указано, что подсчет предпочтительно однонаправленный. Это означает, что если пользователь посмотрел Vi, а затем Vj, счетчик увеличивается для пары (Vi -> Vj), но не обязательно для (Vj -> Vi). Это позволяет системе определять направление интереса пользователя и предлагать контент, который логически продолжает текущую сессию.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.