Google анализирует, какие видео пользователи смотрят в рамках одной сессии (Co-Watched Videos). Эти видео группируются в тематические кластеры на основе ключевых слов, в первую очередь — доминирующих поисковых запросов, которые к ним привели. Эти кластеры используются для диверсификации блока «Рекомендованные видео», улучшения таргетинга рекламы, а также для добавления и повышения релевантных видео в результатах поиска.
Описание
Какую задачу решает
Патент решает несколько ключевых задач в системах видеохостинга и видеопоиска (например, YouTube). Во-первых, он улучшает качество и разнообразие (Diversity) блока «Рекомендованные видео», предотвращая показ однотипных предложений. Во-вторых, он позволяет точнее определить контекст видео на основе поведения пользователей для улучшения таргетинга рекламы. В-третьих, он повышает качество поиска видео, улучшая как полноту (Recall) через дополнение выдачи (Augmentation), так и точность (Precision) через переранжирование (Re-ordering).
Что запатентовано
Запатентована система кластеризации совместно просмотренных видео (Co-watched Videos). Система идентифицирует видео, которые пользователи часто смотрят в течение одного временного окна (Time Window). Затем эти видео группируются в кластеры на основе связанных с ними ключевых слов (Keywords). Ключевым элементом является использование доминирующих поисковых запросов (First Query), которые привели к просмотру этих видео, в качестве основы для кластеризации. Эти кластеры специфичны для каждого целевого видео (Target Video).
Как это работает
Система работает в несколько этапов:
- Сбор данных: Анализируются логи для идентификации видео, просмотренных одним пользователем в рамках Time Window. Учитываются только позитивные взаимодействия (Positive Interaction), например, длительный просмотр.
- Идентификация ключевых слов: Для каждого видео определяются Keywords. Основной источник — «доминирующий запрос» (First Query), который чаще всего приводит к успешному просмотру этого видео.
- Кластеризация: Для Target Video система группирует его Co-watched Videos в тематические кластеры на основе общности их Keywords (First Queries).
- Применение: Кластеры используются для: (1) Выбора разнообразных рекомендаций (по одному из разных кластеров); (2) Определения тематики для рекламы; (3) Дополнения результатов поиска (Augmentation); (4) Переранжирования результатов поиска (Re-ordering).
Актуальность для SEO
Высокая. Анализ паттернов поведения пользователей и совместное потребление контента (co-watching) являются фундаментальными сигналами для современных рекомендательных систем, особенно на платформах уровня YouTube. Механизмы диверсификации рекомендаций и корректировки ранжирования на основе поведенческих кластеров остаются критически важными для вовлечения пользователей и эффективности платформ в 2025 году.
Важность для SEO
Патент имеет высокое значение (8.5/10) для Video SEO (VSEO) и оптимизации на YouTube. Он раскрывает механизмы, лежащие в основе формирования блока «Рекомендованные видео» — одного из главных источников трафика. Кроме того, он описывает, как поведенческие сигналы напрямую влияют на результаты поиска. Понимание процесса кластеризации и роли «доминирующего запроса» (First Query) необходимо для построения эффективной стратегии продвижения видеоконтента.
Детальный разбор
Термины и определения
- Target Video (Целевое видео)
- Видео, для которого генерируются кластеры или определяются рекомендации.
- Co-watched Video (Совместно просмотренное видео)
- Видео, просмотренное тем же пользователем в пределах определенного временного окна (Time Window) до или после просмотра Target Video.
- Time Window (Временное окно)
- Период, в рамках которого фиксируется совместный просмотр. Может определяться временем, количеством просмотренных видео или контекстом сессии (например, просмотры после схожих запросов).
- Positive Interaction (Позитивное взаимодействие)
- Критерий для учета просмотра. Включает просмотр видео в течение порогового времени (threshold time), перемотку назад или положительную оценку. Необходимо для фиксации Co-watched статуса.
- Keywords (Ключевые слова)
- Термины, ассоциированные с видео. Источники: метаданные или поисковые логи.
- First Query (Первый / Доминирующий запрос)
- Поисковый запрос, который чаще всего приводил к выбору и успешному просмотру (дольше порога) конкретного видео. Является основным источником Keywords для кластеризации (Claim 1/13).
- Co-watched Score (Оценка совместного просмотра)
- Метрика частоты совместного просмотра двух видео. Может быть взвешена по времени между просмотрами (чем ближе, тем выше вес).
- Quality Score (Оценка качества)
- Независимая от запроса мера качества видео (например, на основе ссылок или общих просмотров).
- Video Score (Оценка видео)
- Метрика для ранжирования видео внутри кластера. Может быть производной от Co-watched Score и Quality Score.
- Cluster Score (Оценка кластера)
- Агрегированная оценка кластера, основанная на Co-watched Scores видео внутри него.
- Off-topic Cluster (Офтопик кластер)
- Кластер с низким Cluster Score, который считается лишь косвенно связанным с Target Video.
- Score Adjustment (Корректировка оценки)
- Бустинг, применяемый к оценке ранжирования видео в поиске, если оно находится в кластере другого, более высоко ранжируемого видео из той же выдачи.
- Augmented List (Дополненный список)
- Список результатов поиска, в который добавлены видео из co-watched clusters исходных результатов.
Ключевые утверждения (Анализ Claims)
Claim 1 и Claim 13 (Независимые пункты): Описывают основной офлайн-процесс генерации кластеров и механизм определения ключевых слов.
- Для Target Video (просмотренного по запросу X) идентифицируются Co-watched Videos, просмотренные в рамках Time Window.
- Для каждого Co-watched Video определяется First Query — запрос, который чаще всего приводил к его успешному просмотру (дольше порога threshold time).
- Критическое условие (Claim 1/13): этот First Query должен отличаться от исходного запроса X. Это условие способствует формированию кластеров вокруг смежных, а не идентичных тем, что улучшает разнообразие.
- Из First Query извлекаются Keywords.
- Co-watched Videos группируются в кластеры на основе общности этих Keywords.
- Данные о кластерах сохраняются с привязкой к Target Video.
Ядро изобретения — использование доминирующего поискового запроса (First Query) как основного тематического идентификатора видео для целей поведенческой кластеризации.
Claim 4 (Зависимый): Описывает диверсификацию рекомендаций (Related Videos).
Система выбирает по одному (или более) видео из *каждого* идентифицированного кластера для формирования списка похожих видео. Это обеспечивает тематическое разнообразие.
Claim 6 и 18 (Зависимые): Описывают таргетинг контента (например, рекламы).
Система использует Keywords, ассоциированные с кластерами Target Video, для выбора сопутствующего контента. Контекст определяется тем, что пользователи смотрят вместе с этим видео.
Claim 7 и 19 (Зависимые): Описывают дополнение результатов поиска (Augmentation).
- Система получает запрос и начальные результаты.
- Для одного из результатов выбирается кластер, чьи Keywords лучше всего соответствуют поисковому запросу.
- Видео из этого кластера добавляются в выдачу (Augmented List).
Claim 8 и 20 (Зависимые): Описывают переранжирование результатов поиска (Re-ordering).
- В выдаче есть Видео А (высокий ранг) и Видео Б (низкий ранг).
- Система определяет, что Видео Б находится в кластере Видео А.
- Система применяет Score Adjustment к Видео Б и переупорядочивает выдачу (повышает Видео Б).
Где и как применяется
Изобретение затрагивает как офлайн-процессы анализа данных, так и онлайн-процессы ранжирования и генерации страниц.
INDEXING (Анализ данных, Офлайн)
Основная работа происходит здесь. Система анализирует логи просмотров и поиска, идентифицирует Co-watched Videos, определяет First Queries, рассчитывает Co-watched Scores и генерирует базу данных кластеров. Также рассчитываются Quality Scores.
RANKING / RERANKING (Обработка поискового запроса, Онлайн)
Применяется в видеопоиске для модификации выдачи:
- Augmentation (Дополнение): Система может дополнять выдачу видео из кластеров топовых результатов. Это может происходить на этапе RERANKING или METASEARCH.
- Re-ordering (Переранжирование): На этапе RERANKING система может корректировать оценки (Score Adjustment) и изменять порядок результатов на основе связей в кластерах.
Presentation Layer / METASEARCH (Генерация страницы просмотра, Онлайн)
При загрузке страницы просмотра видео (например, на YouTube):
- Related Videos (Рекомендации): Система использует кластеры для генерации разнообразного списка похожих видео.
- Content/Ad Targeting (Таргетинг рекламы): Система использует ключевые слова кластеров для выбора релевантной рекламы.
Входные данные:
- Логи поведения пользователей (просмотры, время, последовательность, запросы).
- Метаданные видео.
- Предварительно рассчитанные кластеры и метрики (Quality Score, Co-watched Score).
Выходные данные:
- Диверсифицированный список рекомендованных видео.
- Дополненная или переранжированная поисковая выдача по видео.
- Набор контекстуальных ключевых слов для рекламной системы.
На что влияет
- Типы контента: Сфокусирован на видеоконтенте на платформах видеохостинга (YouTube, Google Video Search).
- Специфические запросы: Влияет на широкий спектр запросов, особенно в тематиках, где пользователи склонны к сессионному просмотру (обучение, обзоры, развлечения).
Когда применяется
- Генерация кластеров: Выполняется периодически в офлайн-режиме.
- Рекомендации и Реклама: Применяется в реальном времени при каждой загрузке страницы просмотра видео.
- Корректировка поиска (Augmentation/Re-ordering): Применяется в реальном времени во время обработки поискового запроса. Augmentation может активироваться, если стандартных результатов недостаточно или для улучшения качества выдачи.
- Условие учета просмотра: Просмотр учитывается в анализе только при наличии Positive Interaction (например, достаточное время просмотра).
Пошаговый алгоритм
Процесс А: Генерация кластеров (Офлайн)
- Сбор и фильтрация логов: Сбор логов просмотров. Фильтрация для выявления только позитивных взаимодействий (Positive Interaction).
- Идентификация Co-Watched Videos: Группировка видео по сессиям пользователей в пределах Time Window. Определение пар совместно просмотренных видео.
- Расчет Co-Watched Score: Агрегация данных и расчет частоты совместного просмотра для каждой пары.
- Определение Ключевых слов (First Query): Анализ поисковых логов для определения доминирующего запроса, который приводил к успешному просмотру каждого видео.
- Кластеризация: Для каждого Target Video его Co-Watched Videos группируются на основе общности их Keywords (First Queries), при условии отличия этих запросов от запроса Target Video.
- Оценка кластеров и видео: Расчет Video Scores (для ранжирования внутри кластера) и Cluster Scores (для идентификации Off-topic Clusters).
- Сохранение: Сохранение кластеров, их ключевых слов и оценок в базе данных.
Процесс Б: Применение для Рекомендаций (Онлайн)
- Запрос на просмотр: Пользователь открывает страницу Target Video.
- Загрузка кластеров: Система загружает сохраненные кластеры для этого видео.
- Фильтрация кластеров: Исключение Off-topic Clusters на основе Cluster Score.
- Выбор кандидатов (Диверсификация): Из каждого отобранного кластера выбирается видео с наивысшим Video Score.
- Отображение: Сформированный список отображается в блоке «Похожие видео».
Процесс В: Применение для Переранжирования Поиска (Онлайн)
- Получение запроса и результатов: Система генерирует начальный список ранжированных видео.
- Идентификация связей: Проверка, находятся ли нижестоящие результаты (Видео Б) в кластерах вышестоящих результатов (Видео А).
- Расчет корректировки: Если да, рассчитывается Score Adjustment (бустинг) для Видео Б, основанный на Co-watched Score между А и Б. (Корректировка может иметь максимальное значение — capped value).
- Переранжирование: Применение бустинга и обновление порядка результатов.
- Презентация: Отображение переранжированного списка.
Какие данные и как использует
Данные на входе
Патент в значительной степени опирается на поведенческие данные.
- Поведенческие факторы (Критические):
- Логи просмотров (View Logs): Последовательность просмотра видео, временные метки. Используются для идентификации co-watched videos.
- Длительность просмотра (Watch Time): Используется для определения Positive Interaction и валидации First Query.
- Логи поиска (Search Logs): Запросы пользователей и последующие клики. Используются для определения First Query.
- Взаимодействия: Перемотка, оценки, клики по рекомендациям на странице просмотра (один из способов фиксации co-watching).
- Контентные факторы: Метаданные видео (Title, Description, Labels) могут использоваться как источник Keywords, но патент акцентирует внимание на First Query.
- Системные данные: Quality Score видео (независимая оценка качества).
Какие метрики используются и как они считаются
- Co-watched Score: Рассчитывается на основе количества совместных просмотров в рамках Time Window. Может быть взвешен по времени (чем ближе просмотры, тем выше вес).
- First Query Identification: Статистический анализ поисковых логов. Выбирается запрос с наибольшим количеством ассоциаций с видео, при условии превышения порога длительности просмотра (threshold time).
- Video Score: Комбинация Co-watched Score и Quality Score. Используется для выбора лучшего видео из кластера.
- Cluster Score: Агрегация (сумма или среднее) Co-watched Scores видео в кластере. Используется для фильтрации Off-topic Clusters.
- Score Adjustment (в поиске): Функция от Co-watched Score между двумя видео в выдаче. Используется для переранжирования. Патент упоминает возможность установки минимальных (initial value) и максимальных (capped value) значений для этой корректировки.
Выводы
- Поведение пользователей определяет тематические связи. Система полагается на данные о совместном просмотре (Co-Watching) для установления связей между видео. Это значит, что тематическая близость определяется не только схожестью контента, но и общностью интересов аудитории.
- Доминирующий запрос как главный идентификатор темы. Ключевой инсайт: для кластеризации система определяет тему видео по First Query — запросу, который чаще всего приводит к его успешному просмотру. Это важнее, чем метаданные, указанные автором.
- Разнообразие (Diversity) — цель рекомендаций. Механизм выбора похожих видео специально разработан для обеспечения разнообразия путем выбора лучших кандидатов из разных тематических кластеров (сформированных вокруг запросов, отличных от основного), а не просто самых популярных совместно просмотренных видео.
- Co-Watching напрямую влияет на ранжирование в поиске. Видео может подняться в поиске (Re-ordering), если его часто смотрят вместе с другим видео, которое уже высоко ранжируется по данному запросу. Также выдача может быть дополнена видео из кластеров (Augmentation).
- Время просмотра (Watch Time) критично. Для учета просмотра в Co-Watched Data и для валидации First Query необходимо наличие Positive Interaction (длительный просмотр). Кликбейт не работает.
Практика
Best practices (это мы делаем)
Эти рекомендации напрямую касаются оптимизации видео на платформах типа YouTube.
- Оптимизация под конкретный доминирующий запрос (First Query): Сфокусируйте видео (контент и метаданные) так, чтобы оно максимально удовлетворяло один основной целевой запрос и приводило к длительному просмотру именно по нему. Это поможет системе четко идентифицировать First Query, что улучшит кластеризацию и повысит шансы на попадание в релевантные рекомендации.
- Максимизация времени просмотра (Watch Time) и удержания: Это критически важно для достижения Positive Interaction. Только успешные просмотры учитываются при формировании Co-Watched Data. Фокусируйтесь на качестве контента и удержании аудитории.
- Стимулирование сессионного просмотра: Поощряйте пользователей смотреть больше видео за одну сессию. Создавайте серии контента, используйте плейлисты, конечные заставки. Это укрепляет Co-Watched связи между вашими видео и улучшает их взаимное продвижение.
- Стратегия «Следующего просмотра» (Next Watch): Анализируйте популярные видео в вашей нише. Создавайте контент, который естественно дополняет их и может стать следующим шагом для их аудитории. Это повышает шансы попасть в Co-Watched Clusters лидера и быть показанным в рекомендациях.
- Повышение общего качества (Quality Score): Работайте над получением ссылок и общим авторитетом канала. Высокий Quality Score влияет на Video Score, что повышает вероятность выбора вашего видео из кластера для показа в рекомендациях.
Worst practices (это делать не надо)
- Использование кликбейта: Приводит к коротким просмотрам, которые фильтруются как негативное взаимодействие. Это исключает просмотр из Co-Watched Data и мешает определению First Query, ухудшая работу рекомендательных механизмов.
- Оптимизация под слишком много разных запросов: Попытка охватить разнородные темы в одном видео «размывает» сигнал First Query. Система не сможет определить доминирующий запрос, что затруднит кластеризацию.
- Вводящие в заблуждение метаданные: Оптимизация под нерелевантные запросы неэффективна. Если пользователи не будут долго смотреть видео после перехода по этим запросам, система не ассоциирует эти запросы с видео в качестве Keywords.
Стратегическое значение
Патент подтверждает стратегическую важность поведенческих факторов в Video SEO. Он показывает, что система определяет релевантность и тематику видео в первую очередь по тому, как пользователи его находят (First Query) и потребляют (Watch Time, Co-Watching), а не только по заявленным метаданным. Успех видео зависит от того, насколько хорошо оно вписывается в общие паттерны потребления контента и поддерживает длительные сессии просмотра.
Практические примеры
Сценарий 1: Попадание в Рекомендованные видео через Кластеризацию (Диверсификация)
- Цель: Попасть в рекомендации к популярному видео (Target Video) «Обзор смартфона X».
- Анализ: Предполагаем, что у Target Video есть кластеры: (1) «Сравнения с конкурентами», (2) «Тесты камеры», (3) «Аксессуары».
- Действие: Создаем видео «Лучшие чехлы для смартфона X». Оптимизируем его так, чтобы его First Query стал именно «лучшие чехлы для смартфона X» (запрос отличается от запроса Target Video).
- Результат: Пользователи смотрят Target Video, а затем ищут и смотрят наше видео. Наше видео попадает в Кластер 3. Так как система стремится к разнообразию, она выберет лучшее видео из Кластера 3 (наше) для показа в рекомендациях.
Сценарий 2: Повышение в поиске (Re-ordering)
- Ситуация: По запросу «как настроить гитару» на 1 месте стоит авторитетное видео (Видео А). Наше видео «Как заменить струны на гитаре» (Видео Б) также релевантно этому запросу и находится на 8 месте.
- Анализ: Пользователи, которые настраивают гитару, часто также меняют струны. Формируется сильный co-watched паттерн между А и Б. Видео Б попадает в кластер Видео А.
- Результат: Система фиксирует связь в рамках текущей выдачи. Согласно механизму Score Adjustment, Видео Б получает буст и поднимается ближе к Видео А, например, на 2 место.
Вопросы и ответы
Что такое «First Query» (Доминирующий запрос) и почему это важно для SEO?
First Query — это поисковый запрос, который чаще всего приводит к выбору и длительному просмотру конкретного видео. Патент указывает, что именно этот запрос используется как основной источник ключевых слов для определения тематики видео при кластеризации. Для SEO это означает, что крайне важно оптимизировать видео под четкий основной запрос и убедиться, что оно удовлетворяет интент, чтобы система корректно определила его тематику.
Насколько важно время просмотра (Watch Time) в контексте этого патента?
Оно критически важно. Патент явно указывает, что просмотры учитываются только при наличии Positive Interaction, основным критерием которого является превышение порогового времени просмотра. Если пользователи быстро покидают видео, оно не будет участвовать в формировании Co-Watch данных и не попадет в кластеры рекомендаций.
Как система обеспечивает разнообразие (Diversity) в рекомендованных видео?
Система сначала группирует все совместно просмотренные видео в тематические кластеры. Затем, вместо того чтобы брать Топ-N самых популярных видео (которые могут быть на одну тему), она выбирает лучшее видео (с наивысшим Video Score) из *каждого* релевантного кластера. Это гарантирует, что предложенные видео охватывают разные аспекты интересов пользователя.
Может ли этот механизм повлиять на ранжирование моих видео в поиске YouTube?
Да, напрямую. Патент описывает механизм Re-ordering: если ваше видео часто смотрят вместе с видео, которое уже занимает высокие позиции по запросу, ваше видео может получить бустинг (Score Adjustment) и подняться выше в выдаче. Также есть механизм Augmentation – добавление вашего видео в выдачу, если оно есть в релевантном кластере топового результата.
Что такое «Co-watched Video» и как определяется «Time Window»?
Это видео, просмотренное тем же пользователем в течение короткого периода до или после целевого видео, при условии положительного взаимодействия. Time Window (временное окно) может быть фиксированным (например, 1 час) или динамическим, например, оно может охватывать просмотры, инициированные схожими поисковыми запросами в рамках одной сессии.
Что важнее для кластеризации: метаданные видео или поисковые запросы?
Хотя метаданные могут использоваться, патент делает основной акцент на поисковых запросах, в частности на доминирующем запросе (First Query). Это подчеркивает подход, при котором реальное поведение пользователей (как они находят видео) определяет его тематику для системы.
Влияет ли этот механизм на подбор рекламы к видео?
Да. Система использует ключевые слова, ассоциированные с Co-watched кластерами, для определения контекста страницы просмотра. Это позволяет подобрать более релевантную рекламу, основываясь на смежных темах, которые интересуют аудиторию этого видео, а не только на метаданных самого видео.
Что такое «Off-topic Cluster» и как он используется?
Это кластер с низким Cluster Score, что указывает на слабую или случайную связь с целевым видео. Система идентифицирует такие кластеры, чтобы исключить их при выборе похожих видео или при таргетинге рекламы, тем самым повышая общую релевантность предложений.
Влияет ли качество видео (например, продакшн, авторитетность канала) на эти кластеры?
Да. Патент упоминает Quality Score — независимую оценку качества видео. Этот Quality Score используется при расчете Video Score для ранжирования видео *внутри* кластера. Более качественное и авторитетное видео имеет больше шансов быть выбранным из кластера для показа в рекомендациях.
Как я могу использовать этот патент для улучшения своей стратегии контента?
Стратегия должна фокусироваться на создании серийного контента и оптимизации пользовательских сессий. Создавайте видео, которые естественно смотреть последовательно (плейлисты, тематические блоки). Это укрепляет связи Co-Watch, помогает доминировать в рекомендациях по данной теме и может положительно сказаться на ранжировании в поиске.