Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google автоматически распознает и каталогизирует пользовательский контент (UGC) с живых мероприятий с помощью аудиовизуальных цифровых отпечатков

    DIGITAL FINGERPRINTING OF LIVE EVENTS FOR AUTOMATIC DETECTION (Цифровые отпечатки живых событий для автоматического обнаружения)
    • US10158926B1
    • Google LLC
    • 2018-12-18
    • 2012-08-02
    2012 EEAT и качество Knowledge Graph Мультимедиа Патенты Google

    Google использует технологию цифровых отпечатков для автоматической идентификации пользовательских фото, видео и аудио, записанных на живых мероприятиях. Система внедряет незаметные сигналы (аудио, визуальные, световые) непосредственно во время события. При загрузке контента эти сигналы распознаются, что позволяет автоматически тегировать медиа, управлять цифровыми правами (DRM) и агрегировать контент для поиска.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему ручной идентификации и тегирования пользовательского контента (UGC) — фото, видео, аудио, — записанного на живых мероприятиях (концерты, спортивные события и т.д.) и загруженного онлайн. Ручной процесс является медленным и дорогим. Изобретение автоматизирует этот процесс для двух основных целей: обеспечения соблюдения цифровых прав (Digital Rights Management — DRM) и каталогизации контента для последующего поиска и агрегации.

    Что запатентовано

    Запатентована система для автоматического обнаружения и идентификации медиафайлов, записанных на живых мероприятиях. Суть изобретения заключается во внедрении одного или нескольких обнаруживаемых сигналов (Digital Fingerprints) непосредственно в среду мероприятия (например, через аудиосистему или проекторы). Эти сигналы записываются устройствами пользователей вместе с основным контентом. При последующей загрузке контента система распознает эти сигналы, идентифицирует мероприятие и применяет соответствующие действия.

    Как это работает

    Система работает в несколько этапов:

    • Генерация идентификатора и сигнала: Для живого мероприятия создается уникальный идентификатор (Identifier) и связанный с ним сигнал (Signal). Сигнал может быть аудио, визуальным (проекция изображения) или модуляцией света, разработанным так, чтобы быть незаметным для человека, но обнаруживаемым цифровыми устройствами.
    • Внедрение сигнала: Во время мероприятия сигнал транслируется (overlay) в физическом пространстве (physical venue) (например, смешивается со звуком или проецируется на сцену).
    • Запись: Устройства пользователей записывают мероприятие, одновременно фиксируя внедренный сигнал.
    • Обнаружение и Сопоставление: Когда запись загружается, система анализирует ее, обнаруживает сигнал и сопоставляет его с идентификатором мероприятия в базе данных.
    • Применение действий: Система автоматически выполняет действия, связанные с идентификатором, такие как применение политик DRM или добавление метаданных (Metadata) для каталогизации и создания агрегированного контента (Crowd-sourced experience).

    Актуальность для SEO

    Высокая. Автоматическая идентификация контента и управление UGC являются критически важными задачами для платформ Google, особенно YouTube. Технологии, подобные Content ID, постоянно развиваются для более точного распознавания контента и управления правами. Описанный метод внедрения отпечатков непосредственно в источник (живое событие) представляет собой мощный подход к каталогизации и контролю контента в реальном мире.

    Важность для SEO

    Патент имеет высокое значение для SEO (8/10), особенно в контексте видеохостингов (YouTube) и поиска по изображениям. Он описывает механизм, позволяющий Google автоматически понимать контекст UGC, связывая медиафайлы с конкретными сущностями реального мира (мероприятиями, артистами, местами) без зависимости от пользовательских метаданных. Это напрямую влияет на то, как контент индексируется, каталогизируется, ранжируется и управляется с точки зрения авторских прав (DRM), что определяет его видимость в поиске.

    Детальный разбор

    Термины и определения

    Correlation Component (Компонент корреляции)
    Компонент, который сопоставляет сгенерированный сигнал (Signal) с идентификатором мероприятия (Identifier) и сохраняет это соответствие в базе данных.
    Crowd-sourced experience / Social experience (Краудсорсинговый/Социальный опыт)
    Агрегированный контент, созданный путем объединения нескольких записей одного и того же события, сделанных с разных точек зрения разными пользователями.
    Digital Fingerprint (Цифровой отпечаток)
    Идентификатор, внедренный в цифровой медиафайл (или в среду его записи) таким образом, чтобы он был устойчив к изменениям файла и мог быть впоследствии обнаружен для идентификации источника. В контексте патента это Signal.
    Digital Rights Management (DRM) policy (Политика управления цифровыми правами)
    Набор правил, определяющий допустимое использование контента. Действия могут включать удаление контента, запрос лицензии, монетизацию или проверку прав пользователя на публикацию.
    Identifier (Идентификатор)
    Уникальное значение (например, целое число), используемое для идентификации конкретного реального события (время, дата, место, исполнитель) или класса событий.
    Implementation Component (Компонент реализации)
    Компонент, который применяет одно или несколько действий (например, применение DRM, каталогизация) после того, как запись была сопоставлена с идентификатором мероприятия.
    Live Event / Real-time event (Живое событие)
    Физическое событие (концерт, спортивное мероприятие), происходящее в определенном месте (physical venue) и времени.
    Mapping Component (Компонент сопоставления)
    Компонент, который анализирует загруженную запись, обнаруживает сигнал (Signal) и сопоставляет его с идентификатором (Identifier) мероприятия.
    Marker Component (Компонент маркировки)
    Компонент, который создает и ассоциирует идентификатор (Identifier) и связанные метаданные (Metadata) с живым событием.
    Metadata (Метаданные)
    Данные, связанные с идентификатором мероприятия. Включают информацию о событии, владельцах прав, политиках использования (DRM policy) и действиях, которые необходимо выполнить при обнаружении.
    Signal (Сигнал)
    Обнаруживаемый отпечаток, генерируемый системой и внедряемый в среду живого события. Может быть в формате цифрового аудиосигнала (digital audio signal), цифрового изображения (digital image) или модулированного света (modulated light).

    Ключевые утверждения (Анализ Claims)

    Примечание: Патент US10158926B1 является дивизионным (продолжением заявки) и фокусируется на системе обнаружения и реагирования после загрузки контента.

    Claim 1 (Независимый пункт): Описывает систему идентификации записей живых событий.

    1. Система получает первую запись (first recording) живого события, происходящего в физическом месте (physical venue).
    2. Запись содержит как минимум один Signal (отпечаток).
    3. Ключевой механизм: этот Signal был наложен (overlaid) на физическое место во время события и захвачен записывающим устройством (recording device) одновременно с контентом события.
    4. Компонент сопоставления (Mapping component) сравнивает отпечаток (fingerprint) с Identifier, связанным с событием.
    5. Компонент реализации (Implementation component) извлекает политику DRM на основе сигнала.
    6. Применяется действие на основе результата сопоставления и политики DRM.

    Ядром изобретения является автоматическая идентификация медиаконтента путем обнаружения отпечатка, физически внедренного в среду события, и последующее применение политик DRM.

    Claim 12 (Независимый пункт): Описывает метод идентификации записей, зеркальный Claim 1.

    Включает генерацию сигнала для события, получение записи с этим сигналом, доступ к базе данных, сопоставление отпечатка для извлечения идентификатора, ассоциирование записи и инициирование действия, включающего извлечение и применение политики DRM.

    Claim 3, 4, 14, 15 (Зависимые): Детализируют процесс агрегации контента.

    Система может получать вторую запись, сопоставлять ее с тем же событием и агрегировать (aggregating) первую и вторую записи (которые могут быть в разных форматах) для создания social experience (социального опыта) с разных точек зрения.

    Claim 5, 13 (Зависимые): Детализируют действие каталогизации.

    Действие включает категоризацию записи и ассоциирование с ней searchable elements (элементов, доступных для поиска). Это ключевой пункт для SEO, указывающий на автоматическое добавление метаданных.

    Где и как применяется

    Изобретение охватывает весь жизненный цикл контента, от его создания (на живом мероприятии) до его обработки и использования на поисковой/хостинговой платформе.

    Вне рамок стандартных фаз поиска (Предварительная обработка в реальном мире):

    Система взаимодействует с реальным миром для внедрения сигналов:

    • Генерация Identifier и Signal.
    • Физическая трансляция сигнала (аудио, видео проекция) во время мероприятия.
    • Сохранение связи Сигнал-Идентификатор-Метаданные в Database.

    CRAWLING – Сбор данных (Data Acquisition)

    Применяется, когда пользователь загружает UGC (фото, видео, аудио) на платформу (например, YouTube, Google Photos). Это является моментом сбора данных для системы.

    INDEXING – Индексирование и извлечение признаков (Ingestion & Feature Extraction)

    Основной этап применения патента. Во время индексации (Ingestion) загруженного медиафайла:

    • Извлечение признаков: Система анализирует медиафайл для обнаружения внедренного сигнала (Signal).
    • Сопоставление и Идентификация: Обнаруженный сигнал сравнивается с базой данных для нахождения соответствующего Identifier.
    • Извлечение Метаданных: Извлекаются Metadata и DRM policies.
    • Тегирование и Каталогизация: Медиафайл автоматически аннотируется (searchable elements) и связывается с сущностью живого события.

    RANKING / RERANKING – Ранжирование и Переранжирование

    Результаты идентификации влияют на ранжирование:

    • Применение DRM: Если политика DRM требует удаления или демонетизации контента, это напрямую влияет на его видимость (например, удаление из индекса).
    • Улучшение релевантности: Точная каталогизация позволяет лучше ранжировать контент в медиа-вертикалях по запросам, связанным с мероприятием.

    METASEARCH – Метапоиск и Смешивание

    Система может использовать идентификацию для создания агрегированных страниц или Crowd-sourced experiences, объединяя контент от разных пользователей об одном событии в единый блок выдачи или интерфейс.

    На что влияет

    • Типы контента: В первую очередь влияет на пользовательский контент (UGC) – видео, аудиозаписи и фотографии.
    • Специфические запросы: Влияет на запросы, связанные с живыми мероприятиями, концертами, спортивными событиями, фестивалями.
    • Конкретные ниши: Музыкальная индустрия, спорт, театр, публичные выступления – любые сферы, где проводятся мероприятия, которые записываются пользователями и где важен контроль авторских прав.

    Когда применяется

    • Триггеры активации (Внедрение): Активируется во время проведения живого мероприятия, когда система проецирует или транслирует Signal в физическом пространстве.
    • Триггеры активации (Обнаружение): Активируется каждый раз, когда новый медиафайл загружается на платформу и проходит процесс индексации и анализа контента.

    Пошаговый алгоритм

    Алгоритм состоит из двух основных процессов: Внедрение отпечатка и Обнаружение отпечатка.

    Процесс А: Внедрение цифрового отпечатка (Офлайн/Реальное время)

    1. Создание идентификатора: Marker Component создает уникальный Identifier для реального события.
    2. Ассоциация метаданных: Metadata (детали события, DRM policies) ассоциируются с Identifier.
    3. Генерация сигнала: Signal Generation Component создает один или несколько Signals (аудио, визуальные, световые) на основе Identifier.
    4. Сохранение соответствия: Correlation Component сохраняет соответствие между Signal, Identifier и Metadata в Database.
    5. Трансляция сигнала: Во время живого события Output Component транслирует Signal в физическое пространство.
    6. Запись: Устройства пользователей записывают событие, одновременно фиксируя транслируемый Signal.

    Процесс Б: Обнаружение и обработка (После загрузки)

    1. Прием записи: Reception Component получает загруженную запись (UGC).
    2. Анализ и извлечение сигнала: Mapping Component анализирует запись для обнаружения и извлечения внедренного Signal.
    3. Доступ к базе данных и Сопоставление: Mapping Component сопоставляет извлеченный Signal с Identifier в базе данных.
    4. Оценка уверенности (Опционально): Confidence Component может оценить уровень уверенности в совпадении, используя несколько сигналов или внешние данные (GPS, время).
    5. Извлечение Метаданных и Политик: Извлекаются Metadata и DRM policy, связанные с найденным Identifier.
    6. Применение действий: Implementation Component выполняет действия:
      • Применяет политику DRM (удаление, монетизация).
      • Каталогизирует запись, добавляя поисковые теги (searchable elements).
      • Агрегирует запись с другими записями этого события для создания Social experience.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы (Мультимедиа): Система анализирует аудиодорожки, пиксельные данные изображений и видеокадры загруженного контента для обнаружения внедренных сигналов (Signals).
    • Временные факторы: Метаданные о времени записи медиафайла (time information) могут использоваться для повышения уровня уверенности (confidence level) в сопоставлении с событием.
    • Географические факторы: Данные геолокации (Global Positioning System information), если они доступны в медиафайле, могут использоваться для повышения уровня уверенности в сопоставлении с местом проведения события.
    • Системные данные: База данных (Database), содержащая предварительно рассчитанные Identifiers, сгенерированные Signals и связанные с ними Metadata и DRM policies.

    Какие метрики используются и как они считаются

    • Signal Detection (Обнаружение сигнала): Система использует алгоритмы для обнаружения специфических паттернов в медиаданных, соответствующих сгенерированным сигналам (например, паттерны пикселей, аудиочастоты, временные модуляции света).
    • Identifier Matching (Сопоставление идентификатора): Процесс сопоставления обнаруженного сигнала с записями в базе данных.
    • Confidence Level (Уровень уверенности): Метрика, оценивающая вероятность того, что запись действительно относится к данному событию. Может повышаться при обнаружении нескольких разных сигналов в одной записи или при подтверждении совпадения данными GPS/времени.

    Выводы

    1. Автоматизация понимания контента (Content Understanding): Патент описывает мощный механизм для автоматической идентификации и каталогизации UGC, связанного с реальными событиями. Это позволяет Google связывать неструктурированные медиаданные с конкретными сущностями (мероприятия, артисты) без опоры на пользовательский ввод.
    2. Независимость от пользовательских метаданных: Система позволяет точно тегировать контент, даже если пользователь предоставил неверное или неполное описание. Это значительно улучшает качество данных в индексе для поиска по медиаконтенту.
    3. Интеграция DRM в индексацию: Управление цифровыми правами (DRM policy) является неотъемлемой частью процесса идентификации. Система не просто каталогизирует контент, но и мгновенно применяет правила его использования, что влияет на его доступность и видимость.
    4. Физическое внедрение отпечатков: Ключевой особенностью является активное внедрение Digital Fingerprints непосредственно в физическую среду события (аудио, свет, проекция), а не только пост-обработка официальных записей. Это обеспечивает маркировку любого контента, записанного в этом месте.
    5. Агрегация и создание опыта: Помимо контроля и каталогизации, система нацелена на агрегацию контента от разных пользователей (Crowd-sourced experience), что указывает на стремление Google организовывать UGC в структурированные и богатые пользовательские интерфейсы.

    Практика

    Best practices (это мы делаем)

    Этот патент описывает технологию, используемую платформой (Google/YouTube) и потенциально организаторами мероприятий. Практическое применение для SEO-специалистов заключается в понимании того, как Google обрабатывает UGC, и адаптации контент-стратегий.

    • Оптимизация ассоциации с сущностями (для организаторов/артистов): Обеспечьте максимальную четкость информации о событии для Google (используя разметку Schema на официальных сайтах). Это предоставляет достоверные метаданные (ground truth), которые Google может связать с UGC, идентифицированным с помощью этой системы.
    • Оптимизация UGC на платформах (YouTube SEO): Понимая, что Google может автоматически идентифицировать контент, следует уделять внимание точности собственных метаданных (заголовки, описания). Совпадение пользовательских данных с автоматически распознанными данными может служить положительным сигналом релевантности.
    • Стимулирование создания UGC для агрегации: Если цель – продвижение мероприятия, можно стимулировать пользователей создавать и загружать контент, зная, что система может автоматически агрегировать его в Crowd-sourced experience, создавая дополнительный охват и повышая видимость бренда.
    • Управление авторскими правами (DRM/Content ID): Для владельцев контента этот патент подтверждает важность использования систем типа Content ID. Необходимо активно управлять политиками DRM для контроля за распространением или монетизацией UGC.

    Worst practices (это делать не надо)

    • Манипуляция метаданными для чужого контента: Попытки выдать контент за запись определенного популярного события путем подделки метаданных будут неэффективны, если система не обнаружит соответствующий Digital Fingerprint.
    • Игнорирование заявок DRM: Загрузка контента с живых мероприятий без соответствующих прав рискованна. Система автоматического обнаружения быстро идентифицирует контент и применит политики DRM, что может привести к удалению контента или блокировке канала.
    • Попытки удалить отпечатки: Патент предполагает, что отпечатки устойчивы к обработке и могут быть внедрены несколькими способами (аудио и видео одновременно). Попытки удалить их могут значительно ухудшить качество контента и, вероятно, будут безуспешными.

    Стратегическое значение

    Патент подтверждает стратегию Google по глубокому пониманию контента за пределами текста. Автоматическая связь медиафайлов с сущностями реального мира является ключевым элементом для организации информации и обогащения Knowledge Graph. Для SEO это означает, что контекст и содержание медиафайлов становятся все более важными, а зависимость от текстовых описаний снижается. Это напрямую влияет на Video SEO и контент-стратегию для брендов, участвующих в живых мероприятиях.

    Практические примеры

    Сценарий: Автоматическая каталогизация и DRM видео на YouTube

    1. Событие: Организаторы концерта группы «The Testers» используют систему для внедрения аудио и визуальных Digital Fingerprints во время выступления.
    2. Действие пользователя: Пользователь записывает фрагмент концерта на смартфон и загружает его на YouTube с заголовком «Крутая группа в клубе».
    3. Обработка Google: Во время индексации система YouTube обнаруживает внедренные Signals в аудио и видео дорожках.
    4. Идентификация: Система сопоставляет сигналы с Identifier концерта «The Testers, 29.10.2025, Городской Клуб».
    5. Результат (Каталогизация): Видео автоматически тегируется и связывается с официальным каналом группы, местом проведения и датой. Оно начинает появляться в поиске по запросу «The Testers концерт 2025», несмотря на неинформативный заголовок пользователя.
    6. Результат (DRM): К видео автоматически применяется политика DRM, установленная группой (например, монетизация видео в пользу правообладателя).

    Вопросы и ответы

    Какое основное назначение технологии, описанной в патенте?

    Основное назначение – автоматизировать идентификацию и каталогизацию пользовательского контента (фото, видео, аудио), записанного на живых мероприятиях. Это необходимо для двух целей: эффективного управления цифровыми правами (DRM) и улучшения поиска и агрегации этого контента на платформе.

    Как именно внедряются цифровые отпечатки?

    Отпечатки (Signals) внедряются непосредственно в физическую среду мероприятия. Патент описывает несколько методов: трансляция специального цифрового аудиосигнала через динамики, проекция незаметных цифровых изображений на сцену (например, с помощью лазера или проектора) или модуляция источников света по определенному шаблону.

    Влияет ли этот патент только на YouTube?

    Хотя YouTube является наиболее очевидным применением, патент описывает идентификацию фото, видео и аудио. Следовательно, эта технология может применяться на любых платформах Google, обрабатывающих UGC, включая Google Photos, и влиять на результаты Поиска по Картинкам и Видео.

    Может ли система ошибочно идентифицировать контент?

    Патент предполагает использование уровня уверенности (Confidence Level) для верификации совпадений. Для повышения точности система может использовать комбинацию нескольких сигналов (аудио + видео), а также сверять время и GPS-координаты записи (если доступны) с данными мероприятия.

    Что это значит для SEO-специалиста, работающего с контентом о мероприятиях?

    Для SEO это означает, что Google может понять содержание медиафайла точнее, чем полагаясь только на заголовок и описание. Если вы загружаете легитимный контент, эта технология поможет ему быть правильно каталогизированным и найденным. Если контент нарушает права, он будет быстро идентифицирован и к нему будут применены меры DRM.

    Можно ли обойти эту систему, отредактировав видео?

    Патент утверждает, что Digital Fingerprints разрабатываются так, чтобы быть устойчивыми к значительному редактированию, такому как обрезка или цветокоррекция. Поскольку информация распределена по всей записи и может быть внедрена разными способами (аудио и видео одновременно), удалить ее сложно без существенного ухудшения качества контента.

    Как система использует метаданные (Metadata)?

    Metadata связаны с идентификатором мероприятия и хранятся в базе данных заранее. Они содержат всю информацию о событии (кто, где, когда), а также инструкции о том, что делать с обнаруженным контентом, включая политики DRM и правила тегирования.

    Что такое «Crowd-sourced experience», упоминаемый в патенте?

    Это функция, которая позволяет системе автоматически собирать записи одного и того же события от разных пользователей, сделанные с разных ракурсов. Система может объединить их в единый агрегированный опыт просмотра события.

    Должен ли я как SEO пытаться добавить такие отпечатки в свой контент?

    Нет. Эта технология предназначена для использования платформами или организаторами мероприятий для маркировки самого события в реальном мире. SEO-специалисты не могут самостоятельно генерировать эти отпечатки постфактум для улучшения ранжирования.

    Как этот патент связан с Content ID?

    Этот патент описывает альтернативный или дополнительный метод к стандартному Content ID. В то время как Content ID обычно сравнивает загруженное видео с базой данных эталонных файлов, предоставленных правообладателями, этот патент описывает маркировку самого источника (живого события). Это позволяет идентифицировать контент, для которого может еще не существовать эталонного файла.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.