Патент Google описывает систему автоматического анализа мультимедийного контента (видео и аудио) для идентификации срочных новостей. Система использует распознавание образов, аудио и текста для извлечения сущностей и событий. Определив новостной характер контента, система сопоставляет его с профилем пользователя, вычисляет «Оценку интереса» и отправляет персонализированные уведомления о релевантных новостях.
Описание
Какую задачу решает
Патент решает проблему задержки в обнаружении недавно загруженного, чувствительного ко времени контента (time-sensitive content), такого как новостные видео. Зачастую такой контент изначально не имеет достаточного количества описательных метаданных или ссылок, что затрудняет его своевременное нахождение пользователями через традиционный поиск до того, как новость устареет. Система направлена на быстрое выявление такого контента и уведомление заинтересованных пользователей.
Что запатентовано
Запатентована система и метод для автоматического анализа мультимедийного контента (видео и аудио) с целью определения, является ли он новостным (news-related content) или чувствительным ко времени. После идентификации такого контента система сопоставляет его с интересами пользователей, используя User Profiles, и отправляет персонализированные уведомления (notification) тем пользователям, чей потенциальный интерес превышает заданный порог.
Как это работает
Система анализирует загруженный контент с использованием различных технологий распознавания:
- Извлечение признаков: Используются распознавание образов (pattern recognition), распознавание аудио (audio recognition) и оптическое распознавание символов (OCR) для извлечения сущностей (люди, места, объекты) и контекста из видеоряда и звуковой дорожки.
- Классификация контента: Система определяет, является ли контент новостным. Это может включать использование предиктивной модели (представленной как vector of binary values), сравнение извлеченных визуальных объектов с базой данных известных сущностей и, возможно, выполнение внешних поисковых запросов для подтверждения контекста.
- Оценка интереса: Если контент классифицирован как новостной, система сравнивает его признаки с данными User Profile (интересы, история просмотров) и вычисляет Interest Score.
- Уведомление: Если Interest Score удовлетворяет определенному пороговому значению (defined threshold interest score), система отправляет уведомление на устройство пользователя.
Актуальность для SEO
Высокая. В 2025 году платформы обнаружения контента (например, Google Discover, персонализированные ленты новостей, уведомления YouTube) играют ключевую роль в дистрибуции информации. Способность Google анализировать видео и аудио напрямую, минуя метаданные, является критически важной для индексации и понимания мультимедийного контента в реальном времени.
Важность для SEO
Влияние на SEO от умеренного до высокого (6.5/10). Этот патент не описывает ранжирование в традиционной поисковой выдаче (SERP), но он критически важен для видимости в персонализированных потоках обнаружения (Discover, News, YouTube) и системах уведомлений. Он подчеркивает важность четких визуальных и аудиосигналов внутри мультимедийного контента для его автоматического понимания и классификации системой.
Детальный разбор
Термины и определения
- Audio Recognizer Component (Компонент распознавания аудио)
- Модуль, использующий техники распознавания голоса или аудио для идентификации аудиоинформации и сущностей в контенте.
- Content Identification Criterion (Критерий идентификации контента)
- Определенные правила или критерии, которые система использует для классификации контента как чувствительного ко времени или новостного.
- Content Management Component (Компонент управления контентом)
- Основная система, которая анализирует контент, определяет его тип, оценивает интерес пользователей и управляет уведомлениями.
- Defined Match Criterion (Определенный критерий соответствия)
- Правила, используемые для оценки соответствия между признаками контента и профилем пользователя, часто используемые для расчета Interest Score.
- Defined Threshold Interest Score (Определенная пороговая оценка интереса)
- Минимальное значение Interest Score, необходимое для того, чтобы система инициировала отправку уведомления пользователю.
- Interest Score (Оценка интереса)
- Расчетное значение, указывающее на уровень потенциального интереса пользователя к определенному контенту.
- News-related content (Новостной контент)
- Контент, идентифицированный системой как содержащий информацию о недавних событиях или новостях.
- Pattern Recognizer Component (Компонент распознавания образов)
- Модуль, использующий техники распознавания образов для идентификации визуальных объектов (людей, мест, вещей) в видеоконтенте.
- Text Recognizer Component (Компонент распознавания текста)
- Модуль (например, OCR), используемый для распознавания и идентификации алфавитно-цифровых символов в видеоконтенте или связанных с ним данных.
- Time-sensitive content (Чувствительный ко времени контент)
- Контент, актуальность или значимость которого может уменьшаться со временем (например, срочные новости).
- User Profile (Профиль пользователя)
- Набор данных о пользователе, включающий интересы, предпочтения, историю просмотров и демографическую информацию.
- Vector of binary values (Вектор бинарных значений)
- Представление модели для классификации контента, где каждый бит вектора соответствует определенной сущности, слову, фразе, поисковому запросу или тегу.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает комплексный метод для представления контента.
- Система извлекает модель, которая представляет новостной контент (newsworthy content) как vector of binary values.
- Система получает элемент медиаконтента.
- В ответ на получение извлекаются визуальные объекты (visual objects) из изображений контента.
- Определяется, соответствуют ли извлеченные визуальные объекты объектам в базе данных (database of stored visual objects), связанным с ранее идентифицированными физическими сущностями.
- При обнаружении соответствия система определяет, содержит ли контент новости, основываясь на модели И выполняя поиск (performing a search) с использованием терминов, соответствующих извлеченному объекту, и анализируя результаты поиска.
- Если контент новостной, вычисляется Interest Score на основе User Profile.
- Определяется, достигает ли пользователь определенного уровня интереса на основе Interest Score.
- Если да, система передает уведомление (notification) на устройство пользователя, направляющее его к контенту.
Claim 3 (Зависимый от 1): Уточняет, что используется распознавание аудио (audio recognition) для идентификации аудиоинформации, и определение новостного характера контента также основывается на этой информации.
Claim 4 (Зависимый от 1): Уточняет, что анализируется текстовая информация, связанная с медиаконтентом, и определение новостного характера контента также основывается на этой информации.
Claim 7 (Зависимый от 1): Указывает, что модель применяется к части медиаконтента для определения его новостного характера.
Где и как применяется
Изобретение в первую очередь связано с этапами индексирования и системами персонализированной доставки контента (Discovery).
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Система функционирует как часть конвейера обработки после загрузки или сканирования нового мультимедийного контента (видео/аудио). Происходит глубокий анализ контента:
- Извлечение сигналов: Использование Pattern Recognizer, Audio Recognizer, и Text Recognizer для извлечения визуальных объектов, аудиосигналов и текста.
- Идентификация сущностей: Сравнение извлеченных объектов с базой данных известных сущностей.
- Классификация: Определение того, является ли контент новостным или чувствительным ко времени, с использованием предиктивной модели (vector of binary values) и, возможно, внешних поисковых сигналов.
RERANKING (Персонализация и Системы Обнаружения)
Хотя патент не описывает ранжирование в SERP, процесс сопоставления контента с пользователями и отправки уведомлений тесно связан с системами персонализированной доставки контента (такими как Google Discover, Google News или системы уведомлений YouTube).
- Персонализация: Система использует User Profiles для расчета Interest Score, что является формой персонализации доставки контента.
Входные данные:
- Элемент медиаконтента (видео и/или аудио).
- База данных хранимых визуальных объектов и связанных с ними сущностей.
- Предиктивная модель (vector of binary values).
- User Profiles (интересы, история просмотров).
- Результаты внешних поисковых запросов (используемые для валидации новостного контекста).
Выходные данные:
- Классификация контента (Новостной / Не новостной).
- Рассчитанные Interest Scores для пользователей.
- Сообщения-уведомления (Notification messages).
На что влияет
- Типы контента: В первую очередь влияет на видео и аудио контент.
- Специфические запросы/Ниши: Наибольшее влияние оказывается на новостные тематики, освещение текущих событий, спорт, развлечения и любые другие области, где важна своевременность информации.
- Платформы: Влияет на системы дистрибуции контента, такие как YouTube, Google News и Google Discover, а также на системы уведомлений.
Когда применяется
- Триггеры активации: Обнаружение нового контента (например, при загрузке на платформу или при сканировании краулером).
- Условия применения: Алгоритм сопоставления с пользователем активируется только в том случае, если контент предварительно классифицирован как time-sensitive и/или news-related content. Уведомление отправляется только при превышении Defined Threshold Interest Score.
Пошаговый алгоритм
- Обнаружение контента: Мониторинг и обнаружение недавно загруженного или просканированного медиаконтента.
- Извлечение признаков: Анализ контента с использованием компонентов распознавания образов, аудио и текста. Извлечение визуальных объектов, аудиосигналов и текстовой информации.
- Сопоставление сущностей: Сравнение извлеченных визуальных объектов с базой данных хранимых визуальных объектов для идентификации известных физических сущностей.
- Классификация новостного характера: Определение того, является ли контент новостным (newsworthy content). Этот шаг включает:
- Применение предиктивной модели (vector of binary values).
- Анализ информации о сущностях, полученной на шаге 3.
- Выполнение поисковых запросов с использованием терминов, соответствующих идентифицированным сущностям, и анализ результатов поиска для подтверждения контекста.
- Оценка интереса пользователя (Если контент новостной):
- Извлечение релевантных User Profiles.
- Сравнение признаков контента с информацией, связанной с пользователем (интересы, история).
- Расчет оценки интереса: Вычисление Interest Score на основе результатов сравнения и Defined Match Criterion.
- Сравнение с порогом: Сравнение Interest Score с Defined Threshold Interest Score.
- Генерация и отправка уведомления (Если порог достигнут): Создание и передача notification message на устройство или адрес пользователя.
Какие данные и как использует
Данные на входе
- Мультимедиа факторы: Критически важные данные. Анализируются видеокадры (для распознавания образов и OCR) и звуковая дорожка (для распознавания голоса/аудио).
- Контентные/Технические факторы: Метаданные (время загрузки, время съемки, если доступно). Связанная текстовая информация: субтитры (closed-caption text), комментарии пользователей (user comments), описания, предоставленные загрузчиком.
- Пользовательские факторы: Данные User Profile: явно указанные интересы, предпочтения, история просмотров контента, демографическая информация.
Какие метрики используются и как они считаются
- Vector of binary values: Предиктивная модель, используемая для классификации контента. Патент указывает, что это представление модели, где биты соответствуют сущностям, словам, тегам и т.д. Конкретный метод расчета этих значений в патенте не детализирован, но он основан на извлеченной из контента информации.
- Interest Score: Метрика, рассчитываемая путем сравнения признаков контента и данных профиля пользователя в соответствии с Defined Match Criterion. Патент не предоставляет конкретной формулы, но упоминает возможность взвешивания различных типов информации (например, общие темы против конкретных сущностей).
- Defined Threshold Interest Score: Пороговое значение, используемое для принятия решения об отправке уведомления.
- Defined Content Identification Criterion: Набор правил или условий, определяющих, что считать новостным контентом.
Выводы
- Анализ контента помимо метаданных: Google активно анализирует фактическое содержание видео и аудио файлов. Классификация не зависит исключительно от заголовков, описаний или тегов.
- Идентификация новостей через сущности и внешние сигналы: Классификация контента как «новостного» основывается на распознавании известных сущностей (людей, мест, объектов) внутри контента. Важно, что патент описывает использование результатов поиска (search results) для подтверждения новостного контекста, связывая внутренний анализ контента с более широким информационным пространством.
- Использование предиктивных моделей для классификации: Система использует сложные модели (описанные как vector of binary values) для определения типа контента, что указывает на применение машинного обучения для классификации.
- Персонализация как драйвер обнаружения: Для новостного контента обнаружение (через уведомления) сильно зависит от персонализации. Interest Score определяет, увидит ли пользователь контент своевременно.
- Фокус на скорости и своевременности: Вся архитектура направлена на минимизацию задержки между публикацией контента и уведомлением заинтересованных пользователей.
Практика
Best practices (это мы делаем)
Этот патент имеет прямое отношение к стратегиям оптимизации видео (Video SEO) и оптимизации для платформ обнаружения контента (Google Discover, Google News).
- Оптимизация мультимедиа для распознавания: Обеспечьте визуальную четкость ключевых сущностей (лица спикеров, логотипы, узнаваемые места) в видеоряде. Системы распознавания образов (Pattern Recognition) должны легко идентифицировать их.
- Четкость аудио и ключевые фразы: Используйте четкую речь, ясно идентифицируя ключевые темы, людей и контекст. Это облегчит работу Audio Recognition и поможет системе понять содержание контента.
- Использование текста в видео (In-video text): Применяйте четкий, релевантный текст на экране (например, титры, плашки в новостных сюжетах). Компонент Text Recognizer (OCR) может извлечь эту информацию для лучшего понимания контекста.
- Быстрое установление контекста: В начале видео или аудиоматериала четко обозначьте «кто, что, где, когда». Это поможет системе быстро классифицировать контент как новостной и определить его релевантность.
- Создание контента, соответствующего интересам аудитории: Поскольку доставка контента зависит от Interest Score, необходимо создавать контент, который точно соответствует устоявшимся интересам целевых пользователей в их User Profiles.
Worst practices (это делать не надо)
- Полагаться исключительно на метаданные: Стратегия оптимизации видео, основанная только на заголовках и тегах, неэффективна, так как система анализирует сам контент.
- Низкое качество продакшена: Размытые визуальные образы, плохое освещение или приглушенный звук могут помешать системам распознавания корректно идентифицировать сущности и классифицировать контент.
- Кликбейт без содержания: Использование сенсационных заголовков при отсутствии соответствующего содержания в видео или аудио не приведет к успешной классификации, так как анализ основан на фактическом контенте.
Стратегическое значение
Патент подтверждает инвестиции Google в глубокое понимание мультимедийного контента на гранулярном уровне. Он раскрывает механику работы платформ персонализированного обнаружения контента за пределами традиционного поиска. Для издателей новостей и создателей видео оптимизация под эти автоматизированные системы извлечения данных критически важна для быстрого распространения срочной информации и получения видимости в Google Discover и Google News.
Практические примеры
Сценарий: Оптимизация видео для быстрого обнаружения новостей
- Ситуация: Новостное агентство загружает срочный репортаж о выступлении известного политика (Сущность А) на определенном мероприятии (Событие Б).
- Действия по оптимизации:
- Визуально: В кадре четко видно лицо политика (для Pattern Recognition). На экране присутствует плашка с его именем и должностью (для OCR). В кадре видны узнаваемые элементы места проведения мероприятия.
- Аудио: Ведущий четко произносит имя политика и название мероприятия в первые 15 секунд (для Audio Recognition).
- Как работает система:
- Система распознает лицо политика, сравнивая его с базой данных.
- Система извлекает текст с плашки.
- Система распознает ключевые фразы в аудио.
- Система классифицирует контент как новостной (возможно, выполнив быстрый поиск по имени политика и увидев свежие результаты о мероприятии).
- Система вычисляет высокий Interest Score для пользователей, интересующихся политикой или этим конкретным политиком.
- Ожидаемый результат: Пользователи быстро получают уведомление о новом видео или видят его в своих лентах Discover/News, что приводит к быстрому набору просмотров от релевантной аудитории.
Вопросы и ответы
Означает ли этот патент, что метаданные (заголовки, описания) больше не важны для видео?
Метаданные остаются важными факторами ранжирования и контекстуализации. Однако этот патент подчеркивает, что Google анализирует сам контент (видеоряд и аудио) для классификации, особенно при идентификации срочных новостей. Для достижения максимальной видимости необходимо оптимизировать как метаданные, так и само содержание видео/аудио.
Как система определяет, что контент является именно «новостным»?
Патент описывает несколько механизмов. Во-первых, используется предиктивная модель (vector of binary values). Во-вторых, система распознает известные сущности (например, политиков, знаменитостей) через распознавание образов и аудио. В-третьих, система может выполнять внешние поисковые запросы, связанные с этими сущностями, и анализировать результаты поиска для подтверждения актуального новостного контекста.
Как этот патент связан с Google Discover?
Механизмы, описанные в патенте, идеально подходят для Google Discover. Discover фокусируется на предоставлении персонализированного, часто свежего контента на основе интересов пользователя без явного запроса. Система в патенте делает именно это: идентифицирует свежий контент, оценивает его релевантность интересам пользователя (Interest Score) и активно доставляет его (через уведомление или размещение в ленте).
Что такое «Vector of binary values» и как он используется?
Это техническое описание способа представления предиктивной модели. По сути, это длинный вектор (список), где каждая позиция соответствует определенному признаку (сущности, слову, тегу). Значение «1» указывает на присутствие признака, «0» — на отсутствие. Система использует этот структурированный набор данных для быстрой классификации контента как новостного.
Как можно улучшить распознавание моего контента системами, описанными в патенте?
Необходимо сосредоточиться на четкости продакшена. Используйте хорошее освещение, четкий звук, ясно произносите ключевые имена и термины. Визуально выделяйте важные объекты и используйте четкий текст на экране (например, титры или плашки), чтобы облегчить работу систем распознавания образов, аудио и OCR.
Влияет ли этот патент на ранжирование в обычном поиске Google (SERP)?
Напрямую нет. Патент фокусируется на обнаружении новостного контента и отправке уведомлений, а не на алгоритмах ранжирования синих ссылок в SERP. Однако технологии анализа видео и аудио, описанные здесь, безусловно, используются Google и для индексации контента, что может косвенно влиять на ранжирование видео в универсальном поиске.
Что определяет «Interest Score» пользователя?
Interest Score вычисляется путем сравнения признаков, извлеченных из контента (сущности, темы, ключевые слова), с данными в User Profile. Профиль пользователя включает его явные интересы, историю просмотров, демографические данные и предполагаемые интересы, основанные на его поведении в сети.
Может ли система ошибочно классифицировать старый контент как новостной?
Теоретически это возможно, но система использует механизмы для минимизации таких ошибок. Патент упоминает анализ времени загрузки и, что более важно, выполнение внешних поисковых запросов для анализа результатов. Если результаты поиска по теме контента не показывают свежей активности, система вряд ли классифицирует его как срочную новость.
Применимы ли эти механизмы только к видео?
Нет. Патент явно указывает, что анализируется как видео, так и аудио контент. Это означает, что подкасты или аудиорепортажи также могут быть обработаны этой системой для обнаружения новостей и отправки уведомлений.
Как система узнает, какие сущности являются важными (например, что это известный политик)?
Система использует базу данных (database of stored visual objects), которая содержит информацию о ранее идентифицированных физических сущностях. Это эквивалент Knowledge Graph для визуальных и аудио данных, позволяющий системе сопоставлять извлеченные образы или голоса с известными людьми, местами и объектами.