Google анализирует логи поисковых запросов и данные о времени просмотра (Watch Time) на видеохостинге, чтобы определить, какие видео конкурируют за внимание пользователей по одним и тем же запросам. Система рассчитывает «Оценку Конкуренции» (Competition Score), анализируя схожесть источников трафика. На основе этого анализа система рекомендует владельцам видео ключевые слова, которые приводят трафик конкурентам, но отсутствуют в их собственных метаданных, а также может корректировать ранжирование для защиты оригинального контента.
Описание
Какую задачу решает
Патент решает задачу объективной идентификации конкуренции между видео на платформе видеохостинга (например, YouTube). Он фокусируется на конкуренции между оригинальным контентом (Original Videos) и производным контентом (Derivative Videos), который может отвлекать просмотры. Изобретение предлагает метод измерения конкуренции на основе реальных поисковых запросов, которые приводят к просмотрам, и помогает создателям контента оптимизировать метаданные, выявляя эффективные поисковые термины, используемые конкурентами.
Что запатентовано
Запатентована система для определения конкуренции за поисковые запросы в системе видеохостинга. Основной механизм заключается в анализе журналов поиска (search records) и связанных с ними продолжительностей просмотра (view durations или Watch Time). Для каждого видео создается вектор в пространстве запросов (Query Space), где каждое измерение представляет запрос, а значение — время просмотра, полученное от этого запроса. Competition Score между двумя видео рассчитывается как степень схожести (например, косинусное сходство) между их векторами. Эта оценка используется для генерации рекомендаций по улучшению метаданных и потенциальной корректировки ранжирования.
Как это работает
- Сбор данных: Система собирает логи поиска, фиксируя, какой запрос привел к просмотру какого видео и какова была продолжительность просмотра (view duration).
- Генерация векторов: Для каждого видео создается вектор, отражающий, сколько времени просмотра (Watch Time) оно получило от каждого конкретного поискового запроса.
- Расчет конкуренции: Система вычисляет Competition Score между двумя видео, сравнивая их векторы. Если векторы похожи, значит, видео получают трафик из одних и тех же запросов и сильно конкурируют.
- Рекомендация метаданных: Система анализирует запросы, которые приносят трафик конкуренту (Видео B), и сравнивает их с метаданными целевого видео (Видео A). Если в метаданных Видео А отсутствуют термины из этих запросов, они предлагаются как Metadata Improvement.
- Корректировка ранжирования (Опционально): Competition Score может использоваться для корректировки ранжирования (например, понижения производного контента) или удаления конкурирующих видео из выдачи, если оценка превышает порог.
Актуальность для SEO
Высокая. Патент опубликован в 2024 году (хотя основан на заявках с 2016 года) и описывает механизмы, критически важные для современных видеоплатформ. Анализ конкуренции на основе реальных данных о трафике и времени просмотра (Watch Time) является ключевым элементом систем ранжирования и аналитики YouTube. Механизм рекомендации метаданных напрямую связан с инструментами поддержки авторов.
Важность для SEO
Патент имеет высокое значение для Video SEO (YouTube SEO). Он раскрывает, как именно система определяет конкурентов — через общие источники поискового трафика и вовлеченность. Это подтверждает первостепенную важность Watch Time как метрики. Практическая ценность заключается в механизме Metadata Recommendation, который демонстрирует необходимость анализа запросов, ведущих к конкурентам, для оптимизации собственных названий, описаний и тегов. Также критично понимание, что система может активно вмешиваться в ранжирование на основе этих оценок.
Детальный разбор
Термины и определения
- Competition Score (SCS) (Оценка Конкуренции)
- Метрика (от 0 до 1), указывающая на степень конкуренции между двумя видео за просмотры. Рассчитывается на основе схожести поисковых запросов, которые приводят к просмотру этих видео, и связанных с ними продолжительностей просмотра. Высокий балл означает, что видео конкурируют за очень похожие запросы.
- Collective Competition Score (gSCS) (Коллективная Оценка Конкуренции)
- Агрегированная метрика, измеряющая конкуренцию между одним видео и набором других видео.
- Derivative Videos (Производные видео)
- Видео, которые не созданы оригинальными авторами, но используют оригинальный контент (например, перезаливы, компиляции).
- Metadata Improvement (Улучшение метаданных)
- Идентифицированный поисковый термин (search term), который приводит трафик к конкурирующему видео, но отсутствует в метаданных целевого видео. Предлагается владельцу для включения.
- Original Videos (Оригинальные видео)
- Видео, включающие оригинальный контент и загруженные производителями контента или партнерами.
- Originality of a Channel (Оригинальность канала, Q(c))
- Метрика (от 0 до 1), измеряющая, насколько канал привлекает просмотры по сравнению с конкурирующими видео. Используется для оценки уникальности контента канала и может влиять на вознаграждение (например, монетизацию).
- Query Space (Пространство запросов)
- Векторное пространство, в котором каждое измерение соответствует одному поисковому запросу (search query).
- Search Record / Search Log (Запись поиска / Журнал поиска)
- Запись данных, включающая поисковый запрос, результирующие видео и продолжительность просмотра (view duration) для каждого из них.
- Vector (Вектор)
- Представление видео в Query Space. Вектор показывает продолжительность просмотра видео, полученную в ответ на конкретные поисковые запросы.
- View Duration / Watch Time (Продолжительность просмотра / Время просмотра)
- Количество времени, в течение которого видео просматривалось пользователем в ответ на поисковый запрос. Ключевой компонент для построения векторов.
- Video Competition Engine
- Компонент системы, отвечающий за анализ логов, расчет конкуренции и генерацию рекомендаций.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод определения конкуренции и генерации рекомендаций метаданных.
- Система идентифицирует первые поисковые запросы и связанные с ними view durations для Первого видео, и вторые поисковые запросы и view durations для Второго видео.
- Генерируется Первый вектор для Первого видео и Второй вектор для Второго видео на основе этих данных.
- Рассчитывается Competition Score, указывающий на степень конкуренции, на основе степени схожести (degree of similarity) между Первым и Вторым векторами.
- На основе Competition Score система выборочно генерирует Metadata Improvement для Первого видео путем сравнения вторых поисковых запросов (ведущих ко Второму видео) с метаданными Первого видео. Улучшение включает поисковые термины из вторых запросов, которые отсутствуют в метаданных Первого видео.
Claim 3 (Зависимый от 1): Уточняет значение Competition Score.
Competition Score измеряет схожесть между наборами поисковых запросов, за которые конкурируют видео. Более высокий балл указывает на то, что видео конкурируют за более похожие запросы.
Claim 4 (Зависимый от 1): Описывает использование Competition Score для корректировки ранжирования.
При получении нового поискового запроса и идентификации набора ранжированных видео, включающего Первое и Второе видео, ранжирование видео в наборе корректируется на основе Competition Score (например, понижение производного контента).
Claim 5 (Зависимый от 1): Описывает использование Competition Score для фильтрации результатов.
При получении нового запроса система сравнивает Competition Score с пороговым значением. Второе видео удаляется из набора результатов, если Competition Score превышает пороговое значение (например, для удаления дубликатов или производного контента).
Claim 6 (Зависимый от 1): Описывает расчет Collective Competition Score между Первым видео и набором других видео путем агрегации индивидуальных Competition Scores.
Claim 7 (Зависимый от 1): Уточняет условие для генерации рекомендаций.
Генерация Metadata Improvement для первого видео происходит в ответ на расчет Competition Score и при условии, что эта оценка превышает пороговое значение.
Где и как применяется
Изобретение применяется в рамках системы видеохостинга (Video Hosting System, например, YouTube) и затрагивает несколько этапов поисковой архитектуры, в основном в офлайн-аналитике и потенциально в онлайн-ранжировании.
INDEXING (Индексирование)
Система индексирует метаданные видео. Эти метаданные критичны для последующего этапа генерации рекомендаций. Также индексируются и обрабатываются поисковые логи, связывающие запросы, видео и view durations.
Анализ Логов и Расчеты (Офлайн-процессы)
Основная часть работы происходит в офлайн-режиме. Video Competition Engine анализирует Query Data Store (журналы поиска).
- Входные данные: Журналы поиска (запросы, результирующие видео, view durations).
- Процесс: Создаются векторы для видео. Рассчитываются Competition Scores (SCS), Collective Competition Scores (gSCS) и Channel Originality. Генерируются предложения по метаданным.
- Выходные данные: Рассчитанные метрики конкуренции и оригинальности (сохраняются в Similarity Data Store), рекомендации по метаданным.
RANKING & RERANKING (Ранжирование и Переранжирование) (Онлайн)
Предварительно рассчитанные данные о конкуренции могут использоваться Video Search Server для корректировки выдачи в реальном времени.
- Входные данные: Новый поисковый запрос, набор кандидатов, Competition Scores.
- Процесс: Система может корректировать ранжирование (Claim 4) или фильтровать результаты (Claim 5) на основе Competition Score. Например, понижать derivative videos в пользу original videos.
- Выходные данные: Скорректированный набор результатов поиска.
На что влияет
- Типы контента: В первую очередь влияет на видеоконтент. Особенно актуально для контента, где существует разделение на original videos и derivative videos (музыка, фильмы, популярные шоу, вирусные видео).
- Специфические запросы: Влияет на запросы, по которым существует высокая конкуренция между несколькими версиями одного и того же контента.
- Ниши: Наибольшее влияние в высококонкурентных нишах, где пользователи ищут конкретный контент (например, Music, Gaming, Entertainment).
- Монетизация: Метрика Channel Originality может использоваться для вознаграждения канала, например, влияя на условия монетизации.
Когда применяется
- Расчет конкуренции: Происходит периодически в офлайн-режиме путем анализа накопленных журналов поиска.
- Рекомендация метаданных (Триггер): Активируется, когда Competition Score между двумя видео превышает определенный порог (Claim 7), что указывает на значимую конкуренцию и наличие упущенных ключевых слов.
- Корректировка ранжирования (Триггер): Применяется в реальном времени при обработке нового поискового запроса. Фильтрация (Claim 5) активируется, если Competition Score между двумя результатами превышает порог.
Пошаговый алгоритм
Процесс А: Расчет конкуренции (Офлайн)
- Получение данных: Система получает журналы поиска (Search Logs).
- Идентификация взаимодействий: Идентифицируются поисковые запросы, направленные на видео, и связанные с ними продолжительности просмотра (view durations).
- Создание векторов: Для каждого видео создается вектор в Query Space. Значение в каждом измерении (запросе) равно времени просмотра (Watch Time), полученному видео от этого запроса (Формула 1).
- Определение парной конкуренции: Рассчитывается Competition Score (SCS) между парой видео с использованием их векторов (например, косинусное сходство, Формула 2).
- Определение коллективной конкуренции (Опционально): Рассчитывается Collective Competition Score (gSCS) для видео путем агрегации его SCS с другими видео (Формула 3).
- Расчет оригинальности канала (Опционально): Рассчитывается Originality of a Channel на основе gSCS и общего времени просмотра видео в канале (Формула 4).
Процесс Б: Рекомендация метаданных (Офлайн)
- Идентификация конкурентов: Для целевого видео (Видео А) идентифицируются конкурирующие видео (Видео B), чей Competition Score превышает порог.
- Анализ источников трафика конкурента: Идентифицируются поисковые запросы, направленные на Видео B.
- Извлечение терминов: Идентифицируются поисковые термины из этих запросов.
- Сравнение с метаданными: Термины сравниваются с метаданными Видео А.
- Генерация рекомендаций: Если термин отсутствует в метаданных Видео А, он идентифицируется как Metadata Improvement и предоставляется владельцу Видео А.
Процесс В: Корректировка ранжирования (Онлайн)
- Получение запроса: Система получает новый поисковый запрос.
- Идентификация результатов: Определяется набор ранжированных видео.
- Применение оценки конкуренции: Ранжирование видео корректируется на основе их предварительно рассчитанных Competition Scores (Claim 4) или применяется фильтрация (удаление видео, если SCS превышает порог, Claim 5).
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании поведенческих данных и метаданных контента.
- Поведенческие факторы (Ключевые):
- Search Queries (Поисковые запросы): Текст запросов, которые пользователи вводили для поиска видео.
- View Durations / Watch Time (Продолжительность просмотра): Время, которое пользователи потратили на просмотр видео после перехода по конкретному поисковому запросу. Это основной вес, используемый при построении векторов.
- View Counts (Количество просмотров): Используется в аналитических отчетах.
- Контентные факторы (Метаданные):
- Metadata (Метаданные видео): Названия, описания, теги. Используются на этапе генерации рекомендаций для сравнения с поисковыми терминами конкурентов.
Какие метрики используются и как они считаются
Система вычисляет несколько ключевых метрик по формулам, указанным в патенте:
1. Vector (V) (Вектор Видео)
Представление видео в пространстве запросов (Q).
Формула 1: V = {Vn} ∈ Q
Где Vn — это количество времени (Watch Time), в течение которого видео просматривалось в ответ на соответствующий поисковый запрос qn.
2. Competition Score (SCS) (Оценка Конкуренции)
Измеряет схожесть между векторами двух видео (Vi и Vj). Используется косинусное сходство.
Формула 2: SCS(Vi, Vj) = (Vi ⋅ Vj) / (|Vi| * |Vj|)
Результат находится в диапазоне от 0 до 1.
3. Collective Competition Score (gSCS) (Коллективная Оценка Конкуренции)
Агрегированная оценка конкуренции видео Vi со всеми остальными видео (j).
Формула 3: gSCS(Vi) = f⁻¹( Σj f(SCS(Vi, Vj)) )
Где функция f(x) определяет соответствие между интервалом [0, 1] и [0, ∞]. В патенте упоминаются примеры f(x), такие как x/(1-x).
4. Originality of a Channel (Q(c)) (Оригинальность Канала)
Измеряет оригинальность канала C на основе коллективной конкуренции и времени просмотра.
Формула 4: Q(c) = 1 — [ Σv∈C (gSCS(v) * watchtime(v)) ] / [ Σv∈C watchtime(v) ]
Результат от 0 до 1. 1 означает максимальную оригинальность.
Выводы
- Конкуренция определяется источниками трафика, а не схожестью контента: Ключевой вывод заключается в том, что система определяет конкуренцию на основе поведенческих данных (какие запросы приводят к просмотрам), а не путем анализа самого видеоконтента. Два видео являются конкурентами, если они получают значительное время просмотра (Watch Time) от одних и тех же поисковых запросов.
- Watch Time как основная валюта релевантности: При построении векторов видео в качестве веса используется именно view duration, а не количество кликов. Это подтверждает, что оптимизация под удержание аудитории критически важна для определения релевантности видео конкретному запросу.
- Автоматизированная рекомендация метаданных на основе данных конкурентов: Система активно помогает авторам, предлагая Metadata Improvement. Это делается путем анализа запросов, которые приносят трафик сильным конкурентам (с высоким Competition Score), и выявления отсутствующих терминов в метаданных автора.
- Влияние на ранжирование и фильтрацию (Защита оригинала): Competition Score может использоваться для активного вмешательства в результаты поиска. Система может корректировать ранжирование (Claim 4) или полностью удалять видео из выдачи (Claim 5), например, для продвижения Original Videos над Derivative Videos.
- Оценка оригинальности канала: Система агрегирует данные на уровне канала (Originality of a Channel), что может влиять на монетизацию или продвижение канала в целом.
Практика
Best practices (это мы делаем)
Рекомендации применимы в первую очередь к SEO на платформе, использующей эту систему (например, YouTube).
- Оптимизация под Watch Time: Фокусироваться на создании контента, который максимизирует время просмотра (view duration). Поскольку Watch Time является весом в векторах конкуренции, видео с высоким удержанием будут более влиятельными в Query Space и иметь лучшую релевантность по соответствующим запросам.
- Глубокий анализ поискового трафика конкурентов: Необходимо выявлять, по каким запросам ранжируются конкуренты и по каким связанным запросам они получают трафик. Патент подтверждает, что система делает это автоматически, и эти данные критичны для оптимизации.
- Расширение семантики метаданных: Активно включать релевантные синонимы и связанные фразы в названия, описания и теги. Это повышает шансы перехватить трафик у конкурентов по запросам, которые вы могли упустить (именно это система рекомендует через Metadata Improvement).
- Мониторинг YouTube Analytics (Traffic Sources): Внимательно изучать отчеты об источниках трафика. Интерфейс, описанный в патенте, показывает эффективность различных запросов и потенциальную потерю трафика в пользу конкурентов.
- Фокус на оригинальности контента: Развивать каналы с высоким показателем Originality of a Channel. Система может использовать этот показатель для поощрения каналов (например, в монетизации или ранжировании).
Worst practices (это делать не надо)
- Создание чисто производного контента (Derivative Content): Создание каналов из перезаливов или компиляций чужого контента. Система разработана для выявления такой конкуренции и может активно понижать или удалять (Claim 5) такой контент в пользу Original Videos.
- Фокус на кликах вместо удержания (Кликбейт): Оптимизация под высокий CTR без обеспечения соответствующего времени просмотра неэффективна, так как вес видео в системе определяется именно Watch Time.
- Игнорирование метаданных: Полагаться только на качество контента, не оптимизируя метаданные под релевантные запросы. Это приводит к упущенному трафику, который система идентифицирует как пробелы в оптимизации.
- Узкая оптимизация метаданных: Использование только основных ключевых слов. Это оставляет пробелы, которые могут использовать конкуренты.
Стратегическое значение
Патент подтверждает, что анализ конкуренции на видеоплатформах основан на машинном обучении и анализе больших данных о поведении пользователей. Стратегически важно понимать, что конкуренция определяется не схожестью контента, а схожестью паттернов поиска пользователей, которые приводят к этому контенту. Это подчеркивает необходимость data-driven подхода к оптимизации метаданных и важность Watch Time как фундаментального сигнала качества и релевантности.
Практические примеры
Сценарий 1: Оптимизация метаданных обучающего видео
- Ситуация: У вас есть видео (Видео А) «Как настроить OBS для стриминга».
- Анализ конкуренции (Действия системы): Система определяет, что Видео B («Лучшие настройки OBS 2025») является сильным конкурентом (высокий Competition Score), так как оба видео получают много Watch Time по схожим запросам.
- Выявление пробелов (Действия системы): Система видит, что Видео B также получает значительный трафик по запросу «OBS запись экрана без лагов», а Видео А — нет.
- Рекомендация (Действия системы): Система проверяет метаданные Видео А и видит, что фразы «запись экрана» и «без лагов» отсутствуют. Она генерирует Metadata Improvement.
- Действия SEO-специалиста: Вы получаете эту информацию (через аналитику или ручной анализ). Вы обновляете название и описание Видео А: «Как настроить OBS для стриминга и записи экрана без лагов».
- Ожидаемый результат: Видео А начинает ранжироваться и получать трафик по новому кластеру запросов.
Сценарий 2: Защита оригинального контента в ранжировании
- Ситуация: Автор загрузил оригинальный музыкальный клип (Видео А). Другой пользователь перезалил его (Видео Б).
- Действия системы: Система видит, что оба видео получают трафик по запросу «[Артист] [Название песни] официальный клип». Векторы видео почти идентичны, Competition Score близок к 1.
- Применение ранжирования: При обработке нового запроса система проверяет Competition Score. Так как он превышает порог, и система (предположительно, с помощью других сигналов) знает, что Видео А — оригинал, она может удалить Видео Б из выдачи (Claim 5) или значительно его понизить (Claim 4).
Вопросы и ответы
Как именно система определяет, что два видео являются конкурентами?
Система не анализирует содержание видео напрямую. Она анализирует журналы поиска, чтобы увидеть, какие запросы приводят к просмотру каждого видео и сколько времени просмотра (Watch Time) генерирует каждый запрос. Если два видео получают значительное время просмотра от одного и того же набора поисковых запросов, система считает их конкурентами и присваивает им высокий Competition Score.
Что важнее для этой системы: количество просмотров или время просмотра (Watch Time)?
Время просмотра (Watch Time или View Duration) является критически важным. При построении векторов видео, которые используются для расчета конкуренции, именно время просмотра используется в качестве веса для каждого поискового запроса. Видео, которое получает много кликов, но мало времени просмотра, будет иметь меньший вес в системе конкуренции.
Что такое «Metadata Improvement» и как это использовать в SEO?
Metadata Improvement — это рекомендация добавить определенные поисковые термины в метаданные вашего видео (название, описание, теги). Система генерирует эту рекомендацию, если обнаруживает, что сильный конкурент получает трафик по этим терминам, а ваше видео — нет, и эти термины отсутствуют в ваших метаданных. Это прямой сигнал для SEO: нужно интегрировать эти термины для расширения охвата аудитории.
Может ли эта система повлиять на ранжирование моего видео в поиске?
Да, патент прямо указывает на это (Claims 4 и 5). Система может использовать Competition Score для корректировки ранжирования результатов поиска. Например, если ваше видео идентифицировано как производное (Derivative), а другое как оригинальное (Original), система может понизить ваше видео или даже удалить его из выдачи, если конкуренция слишком высока.
Что такое «Вектор Видео» в контексте этого патента?
Вектор видео — это математическое представление того, откуда видео получает свое время просмотра. Он строится в пространстве (Query Space), где каждое измерение — это отдельный поисковый запрос. Вектор показывает, сколько времени просмотра видео получило от каждого из этих запросов. Сравнение векторов (например, через косинусное сходство) позволяет понять, насколько похожи источники трафика двух видео.
Применяется ли этот патент к Google Web Search или только к YouTube?
Патент описывает механизм в контексте «Системы видеохостинга» (Video Hosting System), что наиболее точно соответствует YouTube или аналогичным платформам. Описанные механизмы (Watch Time, Channel Originality, рекомендации авторам видео) специфичны для видеоплатформ.
Что такое «Оригинальность Канала» (Originality of a Channel) и зачем она нужна?
Это агрегированная метрика (от 0 до 1), которая оценивает, насколько контент канала является оригинальным по сравнению с конкурирующими видео на платформе. Она рассчитывается на основе коллективной конкуренции и времени просмотра всех видео канала. Высокая оригинальность может использоваться системой для поощрения канала, например, путем улучшения условий монетизации или повышения в ранжировании.
Как система отличает оригинальное видео от производного (копии)?
Патент не детализирует механизм определения оригинальности контента (это, вероятно, делается другими системами, такими как Content ID). Однако он описывает, как использовать это различие. Если система знает (из других источников), какое видео оригинальное, и видит высокий Competition Score между ними, она может предпринять действия для защиты оригинала, скорректировав ранжирование.
Как SEO-специалисту имитировать работу «Metadata Recommendation Module» вручную?
Необходимо идентифицировать видео, которые стабильно ранжируются по вашим целевым запросам. Затем нужно провести тщательный анализ их метаданных и попытаться определить, по каким еще связанным запросам они могут получать трафик. Термины и фразы, которые релевантны вашему контенту, но отсутствуют у вас, следует интегрировать в ваши метаданные.
Как защититься от того, чтобы мой контент не был классифицирован как «Derivative Video» и понижен?
Необходимо фокусироваться на создании оригинального контента и стремиться к высокому показателю Channel Originality. Если ваш контент слишком похож на чужой и конкурирует за идентичные запросы (высокий Competition Score), риск пессимизации возрастает. Работа над уникальностью и добавленной ценностью контента снижает риски.