
Google использует многоуровневый процесс для создания компактного цифрового отпечатка (fingerprint), представляющего всё содержимое видеофайла. Система анализирует видео по сегментам (subfingerprints), агрегирует частоту визуальных признаков в гистограммы и применяет взвешенное хеширование (Weighted Min-Hash). Это позволяет эффективно обнаруживать почти идентичные видео (near-duplicates) в огромных базах данных, независимо от различий в кодировании или длительности.
Патент решает проблему эффективного и масштабируемого обнаружения дубликатов или почти идентичных видео (near-duplicate videos) в очень больших базах данных. Традиционные методы часто анализируют только часть видео (например, первые 30 секунд), что не позволяет надежно идентифицировать копии с разным временем начала, продолжительностью, разрешением или артефактами сжатия. Изобретение направлено на создание компактного представления, которое характеризует всю длину видео (full-length fingerprint) для быстрого и точного сравнения.
Запатентована система и метод для генерации полноформатного цифрового отпечатка видео. Это достигается через иерархический процесс: извлечение признаков из коротких сегментов (subfingerprints), агрегация статистики этих признаков в гистограммы (histograms) и последующее сжатие данных с использованием специализированной техники хеширования (Weighted Min-Hash). Цель — представить многомегабайтный видеофайл в виде очень компактного отпечатка (например, несколько сотен байт).
Система работает в несколько этапов:
Min-Hash в суб-отпечаток (SFP).subhistograms, которые фиксируют частоту признаков в определенном временном окне. Затем они объединяются в master histogram для всего видео.master histogram применяется процедура взвешенного хеширования (Weighted Min-Hash), которая сжимает гистограмму в финальный компактный full-length fingerprint.Высокая (Инфраструктурная). Эффективное управление огромными корпусами видео (как на YouTube), обнаружение дубликатов для улучшения качества поиска и работа систем типа Content ID остаются критически важными задачами. Описанные техники (вейвлеты, Min-Hash, Weighted Min-Hash) являются устоявшимися и эффективными методами для обнаружения схожести медиафайлов в больших масштабах.
Влияние на SEO (3/10). Патент носит инфраструктурный характер и не описывает сигналы ранжирования или оценки качества контента. Он фокусируется исключительно на идентификации видеофайлов и управлении дубликатами. Однако он имеет значение для стратегии Видео SEO, поскольку описывает механизм, с помощью которого Google идентифицирует и кластеризует похожий контент. Это влияет на дедупликацию результатов поиска и каноникализацию видео, подчеркивая важность создания действительно уникального контента.
Weighted Min-Hash к Master Histogram.subhistograms. Состоит из "бинов" (Bins) и их счетчиков (Counts).Min-Hash Value).Subfingerprints, обычно соответствующая определенному временному интервалу видео (например, 30 секунд), используемая для генерации Subhistogram.Min-Hash.subfingerprint для группы SFP в определенном временном окне (партиции). Например, как часто определенное значение Min-Hash встречается в определенной позиции SFP.Min-Hash, применяемый к Master Histogram. Элементам гистограммы (бинам) присваиваются веса (на основе их частоты/Counts), что влияет на вероятность их выбора в качестве минимального значения хеша.Claim 1 (Независимый пункт): Описывает основной процесс генерации полноформатного отпечатка.
subfingerprints (SFP) видео, где каждый SFP кодирует признаки сегмента.histogram), которая кодирует частоту признаков SFP.hashing procedure) к гистограмме для генерации full-length video fingerprint.Ядром изобретения является конвейер трансформации от локальных признаков видео (SFP) к высоко сжатому глобальному отпечатку через промежуточное статистическое представление (гистограмму).
Claim 4 (Зависимый от 1): Детализирует иерархическую генерацию гистограммы.
subhistograms, каждая из которых кодирует частоту признаков для подмножества SFP (партиции).subhistograms.Система использует иерархический подход к агрегации, сначала суммируя локальные признаки, прежде чем создавать глобальное резюме.
Claim 8 (Зависимый от 1): Детализирует процедуру хеширования как Weighted Min-Hash.
weight) каждому из множества признаков гистограммы.altered versions) каждого признака гистограммы для генерации множества выходных значений.Claim 9 (Зависимый от 8): Уточняет, что количество "измененных версий" признака основано на присвоенном ему весе.
Это подчеркивает, что более частые признаки (с большим весом/счетчиком в гистограмме) имеют большую вероятность повлиять на конечный отпечаток, так как хеш-функция применяется к ним большее количество раз.
Claim 10 (Зависимый от 8): Детализирует аспект "Min-Hash".
smallest output) для первой хеш-функции.hash input), которое привело к этому наименьшему выходу.Изобретение является частью инфраструктуры обработки и управления видеоконтентом.
CRAWLING – Сканирование и Сбор данных
Система применяется после того, как видео было загружено или обнаружено краулером и получено системой.
INDEXING – Индексирование и извлечение признаков
Основной этап применения. Процесс генерации full-length fingerprint происходит во время обработки и индексирования видеофайла. Это включает:
subfingerprints, histograms и финального отпечатка.Fingerprint Database).RANKING / METASEARCH / RERANKING
Сами отпечатки напрямую не являются сигналом ранжирования по качеству или релевантности. Однако результаты кластеризации используются на этих этапах косвенно:
Входные данные:
Выходные данные:
Full-length video fingerprint (очень компактный, например, 640 байт).Процесс состоит из четырех основных стадий.
Стадия 1: Генерация суб-отпечатков (Subfingerprint Generation)
Haar wavelet transform) для генерации массива коэффициентов.Min-Hash Value). Результат — SFP, состоящий из k значений.Стадия 2: Генерация гистограмм (Histogram Generation)
subhistogram. Она подсчитывает, как часто конкретное значение Min-Hash встречается на конкретной позиции в SFP внутри этой партиции.Subhistograms объединяются (конкатенируются) в master histogram. Она представляется в виде набора "бинов" (bins), где каждый бин идентифицирует признак и его частоту (Count).Стадия 3: Генерация финального отпечатка (Fingerprint Generation)
Применяется процедура Weighted Min-Hash.
master histogram присваивается вес (w), обычно равный его счетчику (Count).full-length video fingerprint.Стадия 4: Кластеризация (Clustering)
similarity factor) между парами отпечатков (например, процент совпадающих элементов – расстояние Хэмминга).Locality Sensitive Hashing (LSH).Система фокусируется исключительно на содержимом видеофайла.
wavelet coefficients), которые характеризуют пространственные и временные особенности видео (границы объектов, яркость, градиенты). Патент упоминает возможность использования audio features, но детализирует обработку визуальных данных.Другие факторы (ссылочные, поведенческие, метаданные) в этом патенте не используются.
Min-Hash Values.Weighted Min-Hash.Min-Hash, Weighted Min-Hash, Locality Sensitive Hashing (LSH) и алгоритмы кластеризации.Weighted Min-Hash гарантирует, что наиболее частые и устойчивые признаки видео оказывают наибольшее влияние на финальный отпечаток, повышая точность идентификации.Хотя патент носит инфраструктурный характер и не дает прямых рекомендаций по ранжированию, он определяет правила игры для Видео SEO:
Subfingerprints совпадут, что приведет к высокому фактору схожести финальных отпечатков.Патент подтверждает технические возможности Google по идентификации и управлению видеоконтентом в огромных масштабах. Он подчеркивает, что Google анализирует фактическое содержание видео на глубоком уровне, а не полагается только на метаданные. Это фундаментальная технология для систем типа Content ID и обеспечения качества поиска за счет дедупликации. Для долгосрочной стратегии Video SEO это означает, что инвестиции в уникальность самого видеоряда имеют первостепенное значение.
Сценарий: Каноникализация вирусного видео
Subfingerprints, Master Histogram и Full-length fingerprint.Описывает ли этот патент, как Google ранжирует видео в поиске?
Нет. Патент описывает исключительно инфраструктурную технологию для идентификации видеоконтента и обнаружения почти идентичных копий (near-duplicate detection). Он не затрагивает факторы ранжирования, такие как релевантность запросу, качество контента или поведенческие сигналы.
Смогу ли я обойти эту систему обнаружения дубликатов, если изменю кодировку видео или немного обрежу его?
С высокой вероятностью нет. Система разработана так, чтобы быть устойчивой к подобным изменениям. Использование вейвлет-преобразований позволяет игнорировать артефакты сжатия. А иерархическая структура с перекрывающимися сегментами и гистограммами делает отпечаток устойчивым к временным сдвигам и обрезке.
Что такое процедура Min-Hash, описанная в патенте?
Min-Hash – это техника для эффективного сжатия больших наборов данных (визуальных признаков видеосегмента) в компактный вектор (Subfingerprint). Она позволяет быстро оценить схожесть двух наборов: чем больше схожи исходные данные, тем выше вероятность совпадения их Min-hash значений. Это ключевой элемент для масштабирования системы сравнения.
В чем разница между Min-Hash и Weighted Min-Hash в этом патенте?
Min-Hash применяется к признакам сегмента для создания Subfingerprint, считая все признаки равнозначными. Weighted Min-Hash применяется к Master Histogram и учитывает вес (частоту) каждого признака. Признаки, которые встречаются чаще, получают большее влияние на финальный Full-Length Fingerprint.
Связан ли этот патент с системой YouTube Content ID?
Да, технология, описанная в патенте, напрямую связана с задачами, которые решает Content ID. Content ID также использует цифровые отпечатки для идентификации защищенного авторским правом контента в масштабах всей платформы. Описанный метод генерации full-length fingerprint является эффективным способом реализации подобной системы.
Влияют ли метаданные видео (название, описание, теги) на генерацию этого цифрового отпечатка?
Нет. Согласно патенту, Full-Length Fingerprint генерируется исключительно на основе визуального (и потенциально аудио) содержимого самого видеофайла. Метаданные игнорируются на этапе создания отпечатка.
Если я добавлю логотип или рамку на чужое видео, система распознает его как уникальное?
С высокой вероятностью, нет. Система идентифицирует его как near-duplicate. Хотя добавление элементов изменяет часть визуальных данных, общее статистическое распределение признаков (Master Histogram) останется очень похожим на оригинал, что приведет к генерации схожего финального отпечатка.
Зачем нужны суб-отпечатки и гистограммы, почему нельзя сразу создать отпечаток из видео?
Прямой анализ всего видео потребует огромных вычислительных ресурсов и создаст слишком большой объем данных. Иерархический подход (SFP -> Гистограммы -> Отпечаток) позволяет сжимать данные на каждом этапе и обеспечивает устойчивость к временным сдвигам (так как анализируются короткие перекрывающиеся сегменты).
Насколько компактным является финальный отпечаток видео?
Отпечаток очень компактен. Патент приводит примеры, где финальный Full-Length Fingerprint для всего видео может занимать, например, 640 байт. Это позволяет хранить и сравнивать миллиарды отпечатков эффективно.
Как система сравнивает два финальных отпечатка?
Финальный отпечаток представляет собой вектор записей. Сравнение происходит путем вычисления фактора схожести (Similarity Factor), который часто является вариацией расстояния Хэмминга – подсчитывается процент совпадающих записей в двух векторах. Если процент совпадений выше порога, видео считаются дубликатами.

Мультимедиа
Индексация

Мультимедиа
Индексация

Мультимедиа
Индексация

Мультимедиа
SERP
Индексация

Мультимедиа
Индексация

Local SEO
Поведенческие сигналы
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Мультимедиа
EEAT и качество
Семантика и интент

Персонализация
Поведенческие сигналы

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Индексация
Структура сайта

Безопасный поиск
Поведенческие сигналы
Семантика и интент

Knowledge Graph
Ссылки
EEAT и качество

Персонализация
SERP
Семантика и интент
