
Google использует масштабируемую систему для обнаружения полных или частичных совпадений в видео и аудио контенте. Система генерирует компактные цифровые отпечатки (фингерпринты) и применяет трехэтапный процесс: быстрый поиск кандидатов с помощью Locality-Sensitive Hashing (LSH), точная классификация с использованием машинного обучения и объединение результатов. Это позволяет идентифицировать контент даже при изменении качества или скорости воспроизведения.
Патент решает проблему эффективного и масштабируемого управления огромными библиотеками медиафайлов (видео и аудио), такими как YouTube. Основные задачи: автоматическая идентификация неавторизованного контента (защищенного авторским правом), обнаружение дубликатов для экономии места хранения и улучшение организации контента. Система должна быть устойчива к стандартным искажениям (транскодирование, шум) и изменениям скорости воспроизведения, а также работать в условиях жестких временных ограничений.
Запатентована система и метод для обнаружения полных или частичных совпадений между медиафайлами с использованием цифровых отпечатков (fingerprints). Изобретение описывает трехэтапный процесс: быстрая генерация короткого списка кандидатов с использованием Locality-Sensitive Hashing (LSH), детальная оценка этих кандидатов с помощью машинно-обученного классификатора (Classifier) и объединение подтвержденных локальных совпадений во времени.
Система работает следующим образом:
sub-fingerprints. Они индексируются в Reverse Index Table с помощью LSH keys.LSH keys. Используются оптимизации, такие как Blacklisting (игнорирование слишком частых ключей) и обработка в порядке дискриминативности (редкости).Dynamic Time Warping (DTW)). Генерируется вектор признаков совпадения, который оценивается Classifier для определения валидности совпадения и расчета Confidence Score.Высокая. Описанная технология является фундаментальной для систем идентификации контента, таких как YouTube Content ID. Методы фингерпринтинга, LSH для масштабируемого поиска и использование машинного обучения для классификации совпадений остаются ключевыми технологиями для обработки мультимедийного контента в Google.
Влияние на традиционное веб-SEO низкое, но стратегическое значение для Video SEO (VSEO) и YouTube высокое. Патент не описывает алгоритмы ранжирования, но детально раскрывает инфраструктуру, используемую Google для идентификации уникальности и дублирования медиаконтента. Понимание этих механизмов критически важно для управления видимостью видео, решения проблем каноникализации медиафайлов и соблюдения авторских прав.
LSH Keys (не помогающие различать контент) исключаются из стандартного индекса. Level 1: ключ встречается в слишком большом проценте видео. Level 2: ключ встречается слишком часто в абсолютном выражении.LSH key или sub-fingerprint, указывающая на его редкость в базе данных. Наиболее дискриминативные (редкие) элементы обрабатываются первыми.LSH keys в окне, равном длине входного видео.Sub-fingerprints.Sub-fingerprint. Используется как ключ для поиска в Reverse Index Table.LSH Keys на список идентификаторов эталонных Sub-fingerprints (Video@Offset), содержащих этот ключ.Claim 1 (Независимый пункт): Описывает основной метод обнаружения дубликатов видеоконтента.
reference fingerprints), состоящие из суб-отпечатков (sub-fingerprints) для временных сегментов.input fingerprint).sub-fingerprints с входным отпечатком.machine-learned classifier).Claim 3 (Зависимый от 1): Вводит концепцию Figure of Merit.
Для каждого эталонного видео определяется figure of merit на основе временно-локализованных совпадений. Выбор кандидатов основан на этом показателе.
Claim 4 и 5 (Зависимые от 1): Описывают оптимизацию через сортировку по дискриминативности.
Эталонные суб-отпечатки (Claim 4) или ключи суб-отпечатков (Claim 5) сортируются от наиболее дискриминативных к наименее дискриминативным. Выбор кандидатов основывается на этом порядке сортировки, что повышает эффективность поиска.
Claim 6 (Зависимый от 1): Подчеркивает важность временной последовательности.
Определяются темпорально последовательные совпадения между входными и эталонными sub-fingerprints. Выбор кандидатов основан на этих последовательных совпадениях.
Claim 11 и 12 (Зависимые от 8): Описывают механизм черных списков (blacklisting) в обратном индексе.
Обратный индекс хранит специальный идентификатор для ключа, если он встречается слишком часто (превышает порог по проценту видео — Claim 11, или по абсолютному количеству — Claim 12). Это позволяет игнорировать неинформативные ключи.
Изобретение является инфраструктурным и применяется в системах идентификации контента (например, Content ID), а не в стандартном процессе ранжирования поиска.
CRAWLING – Сканирование и Сбор данных
Система получает входное видео (input video) через сервер приема (Ingest Server), например, при загрузке пользователем на YouTube.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента.
Fingerprinting Module генерирует fingerprints для эталонных и входных видео.Reverse Index Table (LSH Table) для эталонных видео, применяется Blacklisting.Matching Module выполняет трехэтапный процесс (Генерация кандидатов, Классификация, Объединение) для сравнения входного видео с индексом.Входные данные:
Fingerprint Repository).Reverse Index Table).Premium Content).Выходные данные:
Match Results): список эталонных видео (или их частей), совпадающих с входным видео, с указанием временных меток и Confidence Scores.Premium Content могут применяться более низкие пороги обнаружения совпадений.Процесс разделен на предварительную обработку и три основных этапа сопоставления.
Предварительная обработка и Индексация (Офлайн):
Sub-fingerprint.Sub-fingerprints разбираются на LSH Keys. Создается Reverse Index Table.LSH Keys (Level 1 и Level 2).Обработка запроса (Онлайн):
Входное видео поступает в систему и для него генерируется Input Fingerprint.
Этап 1: Генерация списка кандидатов
LSH Keys из входного видео ищутся в Reverse Index Table.Figure of Merit для эталонных видео на основе плотности совпадений ключей во времени. Формируется список начальных кандидатов.Chunks (например, по 10 секунд).Chunk, Sub-fingerprints и LSH Keys сортируются от наиболее редких (дискриминативных) к частым. Обработка начинается с редких.Этап 2: Оценка кандидатов (Классификация)
Chunk и кандидатом (например, с помощью DTW).Quality Measure).Classifier, который определяет валидность совпадения и рассчитывает Confidence Score.Этап 3: Объединение и фильтрация кандидатов
Chunks объединяются в единое совпадение (Combined Match), если они консистентны по времени и смещению.Fingerprints, Sub-fingerprints и LSH Keys, которые кодируют пространственные, временные и структурные характеристики медиафайла.Premium Content (используется для корректировки порогов).anchor text).Sub-fingerprints.LSH keys во временном окне, соответствующем длине входного видео (реализуется как свертка).LSH Key или Sub-fingerprint в эталонной базе. Используется для сортировки и Blacklisting.LSH (поиск), DTW (выравнивание), Преобразование Хафа (голосование), Модели машинного обучения (Classifiers).Blacklisting частых ключей (например, тишина, черные кадры).DTW для временного выравнивания контента.Classifier, который анализирует множество признаков качества и характера совпадения.Патент является инфраструктурным и не дает прямых рекомендаций по факторам ранжирования. Однако он критически важен для стратегий Video SEO и управления контентом на платформах типа YouTube.
Premium Content, необходимо использовать системы типа Content ID (основанные на этом патенте) для загрузки эталонов и защиты от неавторизованного использования.DTW, устойчивым фингерпринтам и возможности генерации нескольких отпечатков (например, для зеркальных версий).Патент подтверждает способность Google анализировать медиаконтент на глубоком уровне, основываясь на его содержании. Стратегическое значение для SEO заключается в понимании, что уникальность медиаконтента является измеримой величиной. Долгосрочная стратегия в Video SEO должна быть направлена на создание оригинальных материалов. Технологии, описанные в патенте, обеспечивают приоритет оригинального контента и борьбу с дублированием.
Сценарий: Попытка обойти Content ID изменением скорости музыки
Premium Content). Трек попадает в кандидаты.Dynamic Time Warping (DTW) компенсирует ускорение на 10% и выравнивает входное аудио с эталоном. Классификатор анализирует вектор признаков.Confidence Score. На видео поступает заявка Content ID от правообладателя.Влияет ли этот патент на ранжирование сайтов в Google Поиске?
Нет, напрямую не влияет. Патент описывает инфраструктуру для идентификации совпадений в видео и аудио (Content Identification), а не алгоритмы ранжирования веб-страниц. Однако эта технология косвенно влияет на результаты поиска по Видео, помогая Google отфильтровывать дубликаты и организовывать выдачу.
Как система справляется с изменениями в видео, например, если его ускорить, замедлить или перекодировать?
Система устойчива к таким изменениям. Для устойчивости к перекодированию используются робастные (устойчивые) фингерпринты. Для устойчивости к изменениям скорости (в патенте упоминается до 15%) используется алгоритм Dynamic Time Warping (DTW) на Этапе 2, который позволяет выровнять две последовательности с разной скоростью.
Что такое Locality-Sensitive Hashing (LSH) и зачем он используется?
LSH — это техника для быстрого приблизительного поиска похожих элементов в огромных базах данных. Она позволяет мгновенно найти список потенциально похожих видеосегментов (кандидатов), не прибегая к дорогостоящему сравнению входящего видео с каждым эталонным видео. Это ключ к масштабируемости системы.
Что означает "Blacklisting" (черный список) ключей?
Это оптимизация. Если определенный признак (LSH Key), например, соответствующий тишине или черному кадру, встречается слишком часто в базе данных, он становится бесполезным для идентификации. Такие ключи вносятся в черный список и игнорируются при поиске для экономии ресурсов.
Какова роль машинного обучения (Classifier) в этой системе?
Машинное обучение критически важно на Этапе 2. Classifier анализирует сложный вектор признаков совпадения (степень сходства, линейность выравнивания, контекст) и принимает финальное решение о том, является ли совпадение истинным или ложным. Это обеспечивает высокую точность системы.
Может ли система обнаружить очень короткие совпадения?
Да. Система анализирует короткие сегменты (sub-fingerprints длиной 0.5-5.0 секунд) и объединяет последовательные совпадения. Патент упоминает обнаружение совпадений длиной, например, 20 секунд, путем анализа 10-секундных блоков (chunks). Это позволяет надежно обнаруживать относительно короткие клипы.
Что такое "Premium Content" в контексте патента?
Это эталонный контент, требующий повышенной защиты (например, материалы крупных правообладателей). Система может применять более низкие пороги обнаружения или использовать дополнительные индексы (включая blacklisted ключи) для гарантии обнаружения совпадений с таким контентом.
Поможет ли зеркальное отражение видео обойти эту систему?
Патент предусматривает такую возможность. Упоминается, что если генерация отпечатков чувствительна к зеркалированию, система может генерировать два набора отпечатков: один для оригинала и один для зеркально отраженной версии. Таким образом, система потенциально готова к обнаружению таких модификаций.
Как система отличает похожие, но разные видео (например, два интервью на одинаковом фоне)?
Патент признает проблему типового контента ("говорящие головы"). Для ее решения предлагается анализировать совпадения по нескольким каналам. Если видеоряд похож, но аудиодорожка разная, система может понизить уверенность в совпадении или отклонить его, чтобы избежать ложных срабатываний.
Какие практические выводы для SEO-специалиста можно сделать из этого патента?
Главный вывод — критическая важность создания оригинального медиаконтента. Технологии Google для обнаружения дубликатов мультимедиа очень продвинуты. Для успеха в Video SEO и на YouTube уникальность видеоряда и аудиодорожки является необходимым условием, а попытки поверхностной "уникализации" неэффективны.

Мультимедиа
Индексация

Мультимедиа
Индексация

Мультимедиа
Индексация

Мультимедиа

Индексация
Мультимедиа

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP

SERP
Персонализация
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Ссылки
Поведенческие сигналы
Мультимедиа

Персонализация
Поведенческие сигналы
Антиспам

Персонализация
SERP
Ссылки

Структура сайта
SERP
Ссылки

Семантика и интент
EEAT и качество
SERP

SERP
Поведенческие сигналы
EEAT и качество
