
Google использует систему фингерпринтинга видео, которая анализирует не пиксели, а временные метки структурных разрывов — смены сцен (shot boundaries) и моменты тишины (silent points). Это позволяет идентифицировать дубликаты или похожий контент даже при различиях в кодировании, разрешении или частоте кадров, что используется для удаления нарушений авторских прав и организации результатов видео-поиска.
Патент решает проблему управления огромными библиотеками видео, например, на сайтах видеохостинга. Основные задачи — автоматическая идентификация неавторизованных копий защищенного авторским правом контента и обнаружение дубликатов для экономии места хранения и организации поисковой выдачи. Традиционные методы (например, хеширование файлов или сравнение отдельных кадров) неэффективны, так как они не могут идентифицировать видео с небольшими различиями в сжатии, разрешении, частоте кадров или времени начала/окончания.
Запатентована система и метод создания робастных цифровых отпечатков (фингерпринтов) для видеофайлов. В отличие от анализа пикселей, система фокусируется на временных метках структурных разрывов (discontinuities) в видеопотоке (смена сцен — shot boundaries) и/или аудиопотоке (точки тишины — silent points). Эти структурные характеристики устойчивы к изменениям в кодировании и форматировании видео.
Система работает следующим образом:
min-hash, LSH) для быстрого поиска совпадений в большой базе данных.Высокая. Управление видеоконтентом, борьба с пиратством (например, через систему Content ID на YouTube) и дедупликация данных остаются критически важными задачами для Google. Описанная технология обеспечивает надежный и масштабируемый способ идентификации видеоконтента на основе его структуры.
Патент имеет значительное влияние на Video SEO (VSEO), особенно на платформах вроде YouTube. Он не описывает ранжирование веб-страниц, но критически важен для понимания того, как Google идентифицирует уникальность видеоконтента. Система напрямую влияет на управление авторскими правами (Content ID), каноникализацию видео (объединение дубликатов) и организацию результатов поиска по видео. Для VSEO это подчеркивает абсолютную необходимость создания структурно уникального контента.
Signature). Уменьшает размерность данных, сохраняя при этом информацию о схожести.min-hash). Сигнатура используется для быстрого сравнения фингерпринтов. Она может быть разделена на блоки для использования в LSH.Claim 1 (Независимый пункт): Описывает основной метод создания фингерпринта для видео.
discontinuities) в аудиовизуальном контенте видео.encoded data representation) последовательности кадров. Кадры с разрывами (конечные точки) получают одно значение (например, 1), кадры без разрывов — другое (например, 0). Значения расположены в последовательности, соответствующей кадрам видео.partially overlapping segments). Последовательные сегменты представляют контент, который перекрывается на один или более кадров.Ядром изобретения является создание временного ряда, показывающего, где происходят структурные изменения, и последующее разделение этого представления на перекрывающиеся блоки (фингерпринты). Это обеспечивает устойчивость к различиям во времени начала/окончания видео.
Claim 9 (Независимый пункт): Описывает метод управления цифровой видео библиотекой. Он включает шаги из Claim 1 и добавляет индексацию.
Этот пункт защищает применение технологии для управления большими массивами данных, что требует эффективной индексации.
Claim 12, 13, 14 (Зависимые от 9): Детализируют процесс индексации.
Индексация включает генерацию сигнатуры (signature) для фингерпринта с использованием первого процесса хеширования (Claim 12), который может быть процессом min-hash (Claim 13). Min-hash включает перестановку битов фингерпринта согласно предопределенному набору перестановок и сохранение позиции первой "1" после каждой перестановки (Claim 14). Сигнатура содержит меньше битов, чем исходный фингерпринт.
Claim 15, 16 (Зависимые от 12): Детализируют хранение сигнатуры.
Сигнатура делится на блоки (signature blocks), и каждый блок сохраняется в хеш-таблице с использованием второго процесса хеширования (Claim 15), который может быть Locality Sensitive Hashing (LSH) (Claim 16).
Claim 18 (Независимый пункт): Описывает метод идентификации дублирующегося видеоконтента.
reference database) видео, имеющих последовательности фингерпринтов, совпадающие с последовательностью полученного видео.Этот пункт фокусируется на практическом применении технологии для обнаружения дубликатов или нарушений авторских прав.
Изобретение является инфраструктурной технологией для управления видеоконтентом. Оно применяется в основном на этапах загрузки и индексации видео, а не во время ранжирования веб-страниц в реальном времени.
CRAWLING – Сканирование и Сбор данных (Ingestion)
На этом этапе Ingest Server получает новое видео от пользователя или из другого источника.
INDEXING – Индексирование и извлечение признаков (Video Processing)
Здесь происходит основная работа, описанная в патенте:
Fingerprinting Module обрабатывает сырое видео. Это включает нормализацию, обнаружение конечных точек (Endpoint Detection), кодирование и сегментацию.Indexing Module применяет техники хеширования (Min-hash, LSH) к сгенерированным фингерпринтам.Video Library, а индексированные фингерпринты (сигнатуры) — в Reference Database.RANKING / METASEARCH (Управление видео и Видео-поиск)
Matching Module использует индексированные данные для сравнения видео.
Reference Database.Входные данные:
Выходные данные:
Fingerprint Sequence для видео.Signatures) в Reference Database.Matching scores) при сравнении двух видео.silent points).Процесс А: Генерация Фингерпринта (Fingerprint Generation)
shot boundaries) — резких смен плана, затуханий, наплывов. Это может быть реализовано через анализ движения (motion analysis) между кадрами.silent points), где громкость звука падает ниже определенного порога.bit vector), где каждый бит соответствует кадру; '1' указывает на конечную точку (разрыв), '0' — на отсутствие разрыва.Fingerprint Sequence) для всего видео.Процесс Б: Индексация (Indexing - например, Min-Hash и LSH)
Signature) для данного фингерпринта.Signature Blocks).shot boundaries).silent points).shot boundaries. Кадры, где относительное движение пикселей между кадрами достигает пика, определяются как границы сцен.silent points. Метрика определяется как временной отрезок, в течение которого громкость ниже заданного порога.signature blocks) между фингерпринтом запроса и эталонными фингерпринтами, найденными через хеш-таблицы.Min-hash и Locality Sensitive Hashing (LSH), критически важно для масштабирования этой технологии. Это позволяет быстро сравнивать миллиарды видеосегментов без необходимости прямого побитового сравнения полных фингерпринтов.Примечание: Рекомендации касаются исключительно Video SEO (VSEO) и управления видеоконтентом, в частности на YouTube.
overlapping fingerprints). Система сможет сопоставить оставшуюся основную часть видео.Патент подчеркивает технологическую невозможность масштабирования видеостратегий, основанных на дублировании или незначительных модификациях существующего контента. Для VSEO барьером для входа является оригинальный, структурно уникальный контент. Это также объясняет, как Google управляет огромным масштабом видеоданных, обеспечивает соблюдение политики в отношении контента и организует результаты видео-поиска, минимизируя дублирование.
Сценарий: Обнаружение нарушений авторских прав (Content ID)
Min-hash и LSH.Имеет ли этот патент отношение к ранжированию веб-страниц?
Нет. Этот патент описывает инфраструктурную технологию для идентификации, индексации и сопоставления видеофайлов на основе их структурного содержания (монтажа и звука). Он не связан с анализом текста, ссылок или поведенческих факторов, используемых в ранжировании веб-поиска.
Как это влияет на Video SEO (VSEO)?
Это критически важно для VSEO, поскольку определяет уникальность контента. Если ваше видео идентифицировано как дубликат существующего контента, оно может быть удалено, демонетизировано (на YouTube) или сгруппировано с оригиналом в результатах поиска. Это делает стратегию создания оригинального контента единственно возможной.
Могу ли я обойти эту систему, изменив разрешение видео или степень сжатия?
Нет. Система специально разработана для устойчивости к таким изменениям. Она анализирует временные метки смены сцен и моменты тишины, которые не меняются при перекодировании, изменении разрешения или частоты кадров.
Могу ли я обойти эту систему, добавив логотип или водяной знак?
Нет. Система фокусируется на разрывах (discontinuities) — сменах сцен и тишине. Статические наложения, такие как логотипы, обычно не влияют на обнаружение этих структурных элементов и не сделают видео уникальным для этой системы.
Что, если я обрежу начало или конец видео?
Система использует перекрывающиеся сегменты (overlapping segments) при создании фингерпринтов. Это означает, что она все равно сможет сопоставить оставшуюся основную часть видео с оригиналом, если она достаточно длинная.
Что именно определяется как "разрыв" (discontinuity) в этом патенте?
В патенте упоминаются два основных типа разрывов. Первый — это границы сцен (shot boundaries), такие как резкая смена плана, затухание или наплыв. Второй — это точки тишины (silent points), то есть моменты в аудиодорожке, где громкость падает ниже определенного порога.
Связано ли это с системой Content ID на YouTube?
Да, этот патент описывает фундаментальную технологию, которая лежит в основе систем, подобных Content ID. Она позволяет правообладателям эффективно находить неавторизованные копии своего контента в огромной библиотеке видео.
Как система обрабатывает очень короткие видео?
В патенте не указаны конкретные ограничения по длине. Однако короткие видео генерируют меньше фингерпринтов. Если в видео мало структурных разрывов, точность сопоставления может быть ниже, но система все равно будет работать на основе доступных данных.
Для чего используются Min-hash и LSH?
Min-hash и Locality Sensitive Hashing (LSH) — это сложные методы индексации, используемые для ускорения процесса сравнения. Они позволяют системе быстро находить похожие фингерпринты в огромной базе данных без необходимости сравнивать новое видео с каждым существующим видео напрямую.
Помогает ли эта технология Google понять тему видео?
Нет, этот патент касается исключительно идентификации структурного сходства между видеофайлами. Он не связан с семантическим пониманием содержания видео, распознаванием объектов или анализом речи.

Мультимедиа
Индексация

Мультимедиа
Индексация

Мультимедиа
SERP
Индексация

Мультимедиа

Индексация
Мультимедиа

Безопасный поиск
Поведенческие сигналы
Семантика и интент

Мультимедиа
EEAT и качество
Ссылки

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Персонализация
Семантика и интент

Структура сайта
Техническое SEO
Ссылки

Персонализация
Семантика и интент
Local SEO

EEAT и качество
Семантика и интент

Семантика и интент
Поведенческие сигналы
Персонализация

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация
