Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует кластеризацию времени просмотра (Watch Time) по сегментам аудитории для ранжирования видео

    WATCH-TIME CLUSTERING FOR VIDEO SEARCHES (Кластеризация времени просмотра для видеопоиска)
    • US20230105846A1
    • Google LLC
    • 2023-04-06
    • 2016-04-22
    2016 EEAT и качество Justin Lewis Мультимедиа Патенты Google Поведенческие сигналы

    Google использует механизм для улучшения результатов видеопоиска и рекомендаций путем анализа того, как долго различные группы пользователей (сегментированные по демографии или поведению) смотрят определенные видео. Система повышает в ранжировании те видео, которые демонстрируют высокое время просмотра (Watch Time) среди пользователей, похожих на того, кто в данный момент выполняет поиск.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неэффективности видеопоиска, когда пользователи получают нерелевантные результаты и вынуждены итеративно уточнять запросы или просматривать множество неподходящих видео. Это приводит к излишнему использованию сетевых ресурсов и вычислительных мощностей серверов и клиентских устройств. Изобретение направлено на повышение релевантности поисковой выдачи и рекомендаций за счет использования детализированных данных о вовлеченности (Watch Time) различных сегментов аудитории.

    Что запатентовано

    Запатентована система, которая использует кластеризацию данных о времени просмотра (Watch Time) для влияния на ранжирование видео. Система собирает данные о том, как долго пользователи смотрят видео, и группирует эти данные на основе характеристик пользователей (демографических и поведенческих). При получении нового поискового запроса система определяет характеристики ищущего пользователя и отдает предпочтение тем видео, которые имеют высокое накопленное Watch Time у пользователей с аналогичными характеристиками.

    Как это работает

    Система функционирует следующим образом:

    • Сбор данных: С помощью встроенного кода (instrumentation engine) система собирает данные о Watch Time с клиентских устройств.
    • Профилирование и категоризация: Система анализирует характеристики пользователей (демография, история поиска, навигация) и распределяет их по категориям (Viewer Categories).
    • Моделирование Watch Time: Создаются модели (Watch-Time Models), которые показывают распределение Watch Time для каждого видео по различным категориям пользователей.
    • Ранжирование: При поступлении запроса система идентифицирует категорию пользователя и использует Watch-Time Models для повышения рейтинга тех видео, которые популярны (имеют высокое Watch Time) именно в этой категории.
    • Моделирование эффективности авторов: Дополнительно система может рассчитывать оценки эффективности авторов (Creator Performance Scores) на основе того, насколько их контент вовлекает различные, в том числе наиболее ценные (например, генерирующие доход), категории пользователей.

    Актуальность для SEO

    Критически высокая. Вовлеченность (Watch Time) и удовлетворенность пользователя являются центральными метриками для платформ видеохостинга, таких как YouTube. Описанные механизмы, использующие сегментацию аудитории для персонализации ранжирования на основе метрик вовлеченности, лежат в основе современных рекомендательных систем и систем поиска видеоконтента.

    Важность для SEO

    Патент имеет критическое значение (90/100) для стратегий видео-SEO. Он подтверждает, что глобальное время просмотра не является единственным фактором; критически важно, кто именно смотрит видео. Ранжирование видео становится высоко персонализированным: видео может иметь высокий рейтинг для одного сегмента аудитории и низкий для другого, в зависимости от паттернов Watch Time этих сегментов. Это требует от SEO-специалистов глубокого понимания целевой аудитории и создания контента, который максимально удерживает внимание конкретных сегментов.

    Детальный разбор

    Термины и определения

    Watch Time (Время просмотра)
    Информация, определяющая количество времени, в течение которого различные оцифрованные видео были представлены (просмотрены) на клиентских устройствах.
    Watch-Time Modeling Apparatus (Аппарат моделирования времени просмотра)
    Компонент системы, который получает данные Watch Time, группирует их на основе характеристик пользователей и определяет паттерны просмотра для разных групп.
    Viewer Categories (Категории зрителей)
    Группы пользователей, объединенные на основе общих характеристик (демографических или поведенческих). Используются для сегментации данных Watch Time.
    Demographic Characteristics (Демографические характеристики)
    Персональные характеристики зрителя (возраст, пол) или внешние характеристики (геолокация, время просмотра, тип устройства, пропускная способность сети).
    Behavioral Characteristics (Поведенческие характеристики)
    Характеристики, связанные с действиями пользователя: запросы, введенные в той же сессии; история навигации, приведшая к просмотру видео; история просмотров других видео в сессии.
    Instrumentation Engine (Механизм инструментирования)
    Компонент, который генерирует и внедряет исполняемый код (например, скрипты) в веб-страницы или приложения для мониторинга статуса воспроизведения видео и отправки отчетов о Watch Time обратно в систему.
    Watch-Time Models (Модели времени просмотра)
    Структуры данных, которые хранят информацию о том, как долго различные категории зрителей смотрели отдельные видео или группы видео. Могут показывать распределение Watch Time видео по категориям зрителей.
    Creator Performance Models (Модели эффективности авторов)
    Модели, определяющие оценки эффективности авторов (Creator Performance Scores) на основе того, как долго различные категории зрителей смотрели их видео.
    Viewer Category Scores (Оценки категорий зрителей)
    Весовые коэффициенты, присваиваемые различным Viewer Categories, часто отражающие их ценность для системы (например, на основе генерируемого дохода). Используются при расчете Creator Performance Scores.

    Ключевые утверждения (Анализ Claims)

    Патент описывает два основных механизма использования кластеризации Watch Time: 1) Ранжирование на основе характеристик пользователя (описано в основном тексте патента) и 2) Категоризация пользователя на основе его собственного Watch Time (описано в предоставленных Claims 2-21).

    Механизм 1: Ранжирование на основе существующих характеристик (Анализ основного описания и Summary)

    Система выполняет следующие действия для обслуживания видео:

    1. Получение данных Watch Time для множества видео.
    2. Группировка этих данных в различные группы на основе характеристик пользователей (демографических, поведенческих).
    3. Определение на основе группировки, как долго разные группы пользователей смотрели различные видео.
    4. Получение нового запроса на видеоконтент и определение характеристик запросившего пользователя.
    5. Выбор видео для показа пользователю. Выбор основан, по крайней мере частично, на том, как долго это конкретное видео просматривалось другими пользователями, чьи характеристики совпадают с характеристиками запросившего пользователя.

    Механизм 2: Категоризация на основе Watch Time (Анализ Claim 2)

    Этот независимый пункт описывает процесс поведенческой категоризации пользователя:

    1. Система идентифицирует возможность показать видео пользователю.
    2. Система определяет, что пользователь является членом определенной Viewer Category Group.
    3. Это определение основано на том, что пользователь ранее просматривал «первое видео», соответствующее этой группе, в течение как минимум порогового количества времени (threshold amount of time).
    4. В ответ на определение членства в группе система выбирает одно или несколько «вторых видео» для пользователя на основе этой Viewer Category Group.
    5. Система предоставляет контент выбранных «вторых видео» пользователю.

    Где и как применяется

    Изобретение применяется на нескольких этапах поисковой архитектуры, преимущественно в контексте видеопоиска (например, YouTube).

    INDEXING – Индексирование и извлечение признаков
    На этом этапе система обрабатывает видео и метаданные. Хотя патент явно не детализирует этот этап, для работы механизма необходимо, чтобы видео были проиндексированы и доступны для сопоставления с данными Watch Time.

    QUNDERSTANDING – Понимание Запросов (и пользователя)
    Система анализирует входящий запрос на видеоконтент. Ключевым аспектом здесь является идентификация характеристик пользователя (user characteristics), отправившего запрос. Это включает демографические данные и поведенческие сигналы (например, предыдущие запросы в сессии, история навигации). Система должна определить, к каким Viewer Categories относится пользователь.

    RANKING / RERANKING – Ранжирование и Переранжирование
    Основной этап применения изобретения. Video Selector использует данные из Watch-Time Models для ранжирования кандидатов.

    1. Идентификация кандидатов: Определяются видео, релевантные теме запроса.
    2. Применение моделей: Система проверяет Watch-Time Models, чтобы определить накопленное время просмотра для этих видео кандидатов, но только для тех Viewer Categories, которые соответствуют текущему пользователю.
    3. Сортировка: Видео ранжируются на основе этой сегментированной метрики Watch Time (и других сигналов). Видео с более высоким Watch Time от похожих пользователей получают повышение.

    Офлайн-процессы (Data Analysis)
    Большая часть работы происходит офлайн:

    • Сбор и агрегация: Сбор отчетов Watch Time через Instrumentation Engine.
    • Моделирование: Watch-Time Modeling Apparatus периодически генерирует и обновляет Watch-Time Models и Creator Performance Models, анализируя данные за определенный период времени.

    Входные данные:

    • Запрос на видеоконтент.
    • Характеристики пользователя (демографические, поведенческие).
    • Watch-Time Models.
    • (Опционально) Creator Performance Models.

    Выходные данные:

    • Отобранный и отранжированный список видеоконтента (результаты поиска или рекомендации).

    На что влияет

    • Типы контента: Влияет на все типы видеоконтента, размещенного на платформе.
    • Специфические запросы: Влияет как на поисковые запросы (явный интент), так и на запросы рекомендаций (неявный интент, например, на главной странице или в блоке рекомендуемых видео).
    • Форматы контента: Механизм может предпочитать форматы, которые лучше удерживают внимание (например, более длинные видео, если используется абсолютное время просмотра, или любые форматы, если используется нормализованное время просмотра).

    Когда применяется

    • Условия применения: Алгоритм применяется при обработке запросов на предоставление видеоконтента, когда система может идентифицировать характеристики пользователя и сопоставить их с существующими Watch-Time Models.
    • Триггеры активации (Механизм 2): В контексте Claim 2, механизм активируется, когда пользователь просматривает определенное видео дольше установленного порога (threshold amount of time), что служит триггером для его классификации в определенную Viewer Category.

    Пошаговый алгоритм

    Процесс А: Генерация Watch-Time Model (Офлайн)

    1. Сбор данных Watch Time: Получение данных о времени просмотра различных видео от множества пользователей.
    2. Идентификация характеристик пользователей: Для каждого события просмотра определяются демографические и поведенческие характеристики зрителя.
    3. Определение категорий зрителей: Группировка пользователей в Viewer Categories на основе их характеристик.
    4. Корреляция Watch Time и категорий: Соотнесение данных о времени просмотра с соответствующими Viewer Categories.
    5. Агрегация Watch Time: Аккумулирование времени просмотра для каждого видео внутри каждой Viewer Category.
    6. Генерация модели: Создание Watch-Time Model, которая хранит распределение агрегированного Watch Time.

    Процесс Б: Обработка запроса и ранжирование (Онлайн)

    1. Получение запроса: Система получает запрос на видеоконтент.
    2. Идентификация критериев отбора: Определение тем видео (например, из поискового запроса) и определение характеристик пользователя.
    3. Доступ к моделям: Обращение к Watch-Time Models.
    4. Определение кандидатов: Выборка видеоконтента, соответствующего тематическим критериям.
    5. Ранжирование кандидатов: Ранжирование отобранных видео. Рейтинг повышается для тех видео, которые имеют высокое накопленное Watch Time от пользователей с характеристиками, соответствующими текущему пользователю.
    6. Выбор и предоставление контента: Выбор топовых результатов и отправка их на устройство пользователя.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании поведенческих и пользовательских данных для ранжирования видеоконтента.

    • Поведенческие факторы (Watch Time): Основные данные. Информация о том, как долго (абсолютное время или процент от длины видео) пользователи смотрели конкретные видео.
    • Поведенческие факторы (Контекст):
      • Запросы, введенные пользователем в той же сессии, которая привела к просмотру.
      • История навигации пользователя (страницы, посещенные до просмотра).
      • История просмотров (другие видео, просмотренные в сессии).
      • Данные о кликах или конверсиях по сопутствующему контенту (например, рекламе).
    • Пользовательские факторы (Демография и Технические данные):
      • Возрастная группа, пол.
      • Географическое местоположение.
      • Время суток просмотра.
      • Тип устройства, приложение или браузер.
      • Пропускная способность сети пользователя.
    • Контентные факторы: Метаданные видео (название, описание, ID автора, канал, жанр, возраст видео), используемые для индексации и первичного отбора кандидатов.

    Какие метрики используются и как они считаются

    • Accumulated Watch Time (Накопленное время просмотра): Агрегированное время просмотра видео, сегментированное по Viewer Categories.
    • Viewer Category Scores (Оценки категорий зрителей): Метрика ценности категории пользователей. Может рассчитываться на основе дохода (revenue generated), полученного в результате просмотра видео зрителями из этой категории (например, от показа рекламы).
    • Creator Performance Score (Оценка эффективности автора): Метрика, оценивающая автора на основе Watch Time его видео с учетом весов Viewer Categories.

      Пример расчета (упрощенный): Сумма по всем категориям (Доля Watch Time автора в категории * Viewer Category Score категории).

    • Threshold amount of time (Пороговое время просмотра): (Claim 2) Минимальное время просмотра «первого видео», необходимое для классификации пользователя в определенную Viewer Category.

    Выводы

    1. Watch Time как ключевой сигнал вовлеченности: Патент подтверждает центральную роль времени просмотра (Watch Time) как эвристики для оценки качества и релевантности видеоконтента, заменяя более простые метрики, такие как клики или просмотры.
    2. Персонализация через кластеризацию: Релевантность видео определяется не глобально, а контекстуально для каждого сегмента аудитории. Система кластеризует пользователей по демографии и поведению и использует паттерны Watch Time внутри этих кластеров для ранжирования.
    3. Контекст сессии имеет значение: Поведенческие характеристики, такие как предыдущие запросы в сессии и история навигации, используются для определения контекста пользователя и влияют на выбор релевантного контента.
    4. Поведенческая категоризация по контенту: Система может динамически классифицировать пользователя в определенную категорию, если он достаточно долго смотрит видео, связанное с этой категорией (Claim 2). Это влияет на последующие рекомендации.
    5. Оценка авторов (Creator Score) и ценность аудитории: Система оценивает авторов не только по общему Watch Time, но и по тому, насколько хорошо они вовлекают «ценные» сегменты аудитории (например, те, которые приносят больше дохода). Это может использоваться как дополнительный фактор ранжирования.
    6. Техническая эффективность поиска: Целью внедрения этих механизмов является не только повышение релевантности, но и снижение нагрузки на инфраструктуру за счет уменьшения количества итеративных запросов и просмотра нерелевантного контента.

    Практика

    Best practices (это мы делаем)

    • Оптимизация под удержание аудитории (Watch Time Optimization): Приоритет отдается созданию контента, который максимально долго удерживает внимание зрителя. Это включает оптимизацию начала видео для захвата внимания и поддержание интереса на протяжении всего ролика.
    • Глубокое понимание целевых сегментов: Необходимо четко определить целевые Viewer Categories (по демографии и интересам) и создавать контент, отвечающий их потребностям. Успех измеряется вовлеченностью именно этих сегментов, а не общим трафиком.
    • Создание контентных экосистем и серий: Поскольку система учитывает контекст сессии и может классифицировать пользователя по просмотренному контенту (Claim 2), важно создавать связанные серии видео. Это увеличивает вероятность того, что после просмотра одного видео пользователю будут рекомендованы другие видео этого же автора.
    • Оптимизация метаданных для точного таргетинга: Использование точных и релевантных заголовков, описаний и тегов помогает системе на этапе первичного отбора кандидатов (Ranking) и обеспечивает показ видео нужной аудитории, которая с большей вероятностью досмотрит его до конца.
    • Повышение авторитетности канала (Creator Authority): Работа над повышением Creator Performance Score путем стабильного выпуска качественного контента, который генерирует высокий Watch Time в ключевых категориях зрителей.

    Worst practices (это делать не надо)

    • Оптимизация под клики (Clickbait): Создание заголовков и превью, которые привлекают клики, но не соответствуют содержанию видео. Это приведет к низкому Watch Time, что негативно скажется на ранжировании согласно описанной модели.
    • Привлечение нецелевого трафика: Попытки ранжироваться по слишком широким запросам или привлечение нерелевантной аудитории. Если эти пользователи быстро уходят, это ухудшает показатели Watch Time для этих сегментов и снижает общую эффективность видео.
    • Игнорирование аналитики по сегментам: Анализ только общих показателей просмотров и Watch Time без детализации по демографическим и поведенческим сегментам не позволит выявить точки роста или проблемы с вовлечением ключевой аудитории.

    Стратегическое значение

    Этот патент подчеркивает стратегический переход от статического ранжирования к динамическому, персонализированному ранжированию, основанному на вовлеченности. Для долгосрочного успеха в видео-SEO необходимо фокусироваться на качестве контента и его способности удовлетворять потребности конкретных сегментов аудитории. Watch Time является валютой в этой экосистеме, а понимание того, как система кластеризует и использует эти данные, является ключом к эффективному продвижению видеоконтента.

    Практические примеры

    Сценарий 1: Использование демографической кластеризации для ранжирования

    1. Ситуация: Пользователь (Характеристики: Мужчина, 45 лет, Техас) ищет «Обзор Ford F-150».
    2. Действие системы: Система идентифицирует два потенциальных видео: Видео А (Детальный технический разбор двигателя) и Видео Б (Эмоциональный тест-драйв по бездорожью).
    3. Применение модели: Система проверяет Watch-Time Models. Она видит, что пользователи из категории «Мужчины, 40-50 лет, Юг США» имеют значительно более высокий Watch Time для Видео Б, чем для Видео А.
    4. Результат: Система повышает рейтинг Видео Б для данного конкретного пользователя, даже если Видео А имеет больше просмотров в целом.

    Сценарий 2: Поведенческая категоризация (Claim 2)

    1. Ситуация: Пользователь смотрит видео «Основы вязания крючком для начинающих».
    2. Действие системы: Пользователь смотрит видео 15 минут, что превышает threshold amount of time.
    3. Классификация: Система классифицирует пользователя в Viewer Category «Интересующиеся вязанием».
    4. Результат: В блоке рекомендаций система немедленно начинает предлагать другие видео, популярные в этой категории (например, «Лучшая пряжа для начинающих», «Простые узоры крючком»), заменяя более общие рекомендации.

    Вопросы и ответы

    Является ли общее время просмотра (Total Watch Time) самым важным фактором ранжирования согласно этому патенту?

    Нет, патент предлагает более сложный подход. Вместо использования глобального Watch Time, система сегментирует его по категориям пользователей (Viewer Categories). Для ранжирования видео для конкретного пользователя самым важным является Watch Time, накопленное от пользователей, похожих на него (с такими же демографическими или поведенческими характеристиками).

    Как система определяет, к какой категории относится пользователь?

    Система использует два типа характеристик. Демографические (возраст, пол, геолокация, тип устройства) и поведенческие (запросы в текущей сессии, история навигации, история просмотров). Также, согласно Claim 2, пользователь может быть динамически отнесен к категории, если он достаточно долго смотрит видео, связанное с этой категорией.

    Что такое «Creator Performance Score» и как он влияет на SEO?

    Это оценка эффективности автора, рассчитываемая на основе того, как долго разные категории зрителей смотрят его контент. Авторы, чей контент хорошо вовлекает «ценные» (например, приносящие доход от рекламы) сегменты аудитории, получают более высокий балл. Этот балл может использоваться как дополнительная эвристика при ранжировании видео, давая преимущество контенту от высоко оцененных авторов.

    Как этот патент влияет на использование кликбейта?

    Он делает кликбейт крайне неэффективной стратегией. Поскольку ранжирование основано на Watch Time (времени удержания), а не на кликах, видео, которые привлекают клики, но быстро закрываются пользователями, будут иметь низкие показатели вовлеченности в соответствующих сегментах и, следовательно, понижаться в выдаче.

    Стоит ли создавать более длинные видео, чтобы увеличить Watch Time?

    Патент упоминает возможность нормализации Watch Time (т.е. использование процента просмотра видео, а не абсолютного времени). Если система использует нормализованные данные, то длина видео не имеет прямого преимущества. Важно удерживать внимание на протяжении максимально возможной части видео, независимо от его длины.

    Как можно использовать понимание этого патента для улучшения рекомендаций моего контента?

    Необходимо сфокусироваться на создании контента, который глубоко удовлетворяет конкретный сегмент аудитории. Если ваш контент генерирует высокий Watch Time в этом сегменте, система с большей вероятностью будет рекомендовать его другим пользователям из этого же сегмента или пользователям, которых система отнесла к этому сегменту на основе их поведения.

    Что означает «кластеризация» в контексте этого патента?

    Кластеризация (или группировка/сегментация) означает разделение общего массива данных Watch Time на подгруппы на основе общих характеристик пользователей, которые это время сгенерировали. Это позволяет системе понять, какие типы контента предпочитают разные типы аудиторий.

    Учитывает ли система контекст сессии пользователя?

    Да, патент явно упоминает использование поведенческих характеристик, таких как запросы, введенные пользователем в той же сессии, и история навигации, которая привела к просмотру. Это помогает системе лучше понять текущий интент пользователя и точнее определить его поведенческую категорию.

    Как система собирает данные о времени просмотра?

    Система использует Instrumentation Engine, который внедряет исполняемый код (например, скрипты) в плеер на клиентском устройстве. Этот код отслеживает статус воспроизведения и периодически отправляет отчеты о времени просмотра обратно на серверы системы.

    Если я создаю контент в узкой нише, поможет ли мне этот механизм?

    Да, этот механизм может быть очень полезен для нишевого контента. Если ваш контент сильно вовлекает (генерирует высокий Watch Time) узкую, но четко определенную категорию пользователей, система идентифицирует этот паттерн и будет активно продвигать ваш контент среди других пользователей, относящихся к этой категории.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.