Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google автоматически создает видео-хайлайты, анализируя всплески поисковых запросов во время трансляции

    SYSTEMS AND METHODS FOR GENERATING VIDEO PROGRAM EXTRACTS BASED ON SEARCH QUERIES (Системы и методы генерации выдержек из видеопрограмм на основе поисковых запросов)
    • US9535990B2
    • Google LLC
    • 2017-01-03
    • 2014-07-18
    2014 Мультимедиа Патенты Google Поведенческие сигналы Свежесть контента

    Google анализирует поисковые запросы пользователей в реальном времени во время трансляции видеоконтента. Система выявляет всплески интереса к определенным темам (search query spikes), сопоставляет их с конкретными моментами в видео (используя субтитры или распознавание речи) и автоматически монтирует из этих сцен короткий видеодайджест (snippet или extract).

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу автоматического определения наиболее интересных или значимых моментов в длинных видеопрограммах (например, телепередачах, спортивных трансляциях) без ручного вмешательства. Цель — создать короткие дайджесты (video program extracts или snippets), содержащие хайлайты программы, основываясь на объективных данных о коллективном интересе пользователей в реальном времени.

    Что запатентовано

    Запатентована система автоматической генерации видео-выдержек. Ключевым механизмом является анализ аномальной активности поисковых запросов (search query spikes) во время трансляции видео. Система коррелирует эти всплески запросов с конкретными временными метками в видео (используя subtitles или распознанный аудио текст) и автоматически монтирует эти сегменты в единый дайджест.

    Как это работает

    Система функционирует следующим образом:

    • Мониторинг и Группировка Запросов: Система агрегирует поисковые запросы и объединяет эквивалентные запросы (синонимы, разные формулировки одного концепта) в группы (Query Groups).
    • Детекция Всплесков: Выявляются search query spikes — моменты, когда частота запросов в группе резко превышает фоновый уровень (средний или максимальный).
    • Корреляция с Видео: Всплеск сопоставляется с контентом транслируемого видео в близком временном окне. Это достигается путем сравнения терминов или linguistic concepts запроса с субтитрами или транскриптом видео.
    • Генерация Дайджеста: Определяются границы сцены (video scene boundaries) вокруг найденной временной метки. Эти сцены затем «сшиваются» (stitching together), обычно в хронологическом порядке, для создания итогового видеофрагмента.

    Актуальность для SEO

    Высокая. Автоматическое сегментирование видеоконтента (например, Key Moments на YouTube) и использование машинного обучения для генерации видео-хайлайтов являются активно развивающимися направлениями. Механизмы анализа всплесков интереса (Google Trends) также критичны для современного поиска, особенно для новостного и спортивного контента. Принципы, описанные в патенте, остаются актуальными.

    Важность для SEO

    Влияние на SEO высокое (7.5/10), особенно в контексте Video SEO. Патент не описывает алгоритмы ранжирования веб-страниц, но раскрывает механизм, как Google определяет «интересность» сегментов контента на основе массовых пользовательских сигналов (запросов). Это напрямую влияет на то, какие фрагменты видео будут показаны в выдаче (например, в блоках Key Moments), что критично для вовлеченности и видимости видеоконтента.

    Детальный разбор

    Термины и определения

    Equivalent Queries (Эквивалентные запросы)
    Запросы, которые система считает одинаковыми либо из-за высокой схожести последовательности терминов, либо из-за выражения одного и того же linguistic concept.
    Linguistic Concept (Лингвистическая концепция)
    Базовое семантическое значение или сущность (в описании упоминаются как knowledge graph entities). Например, «жизнь на Марсе» и «марсианская жизнь» могут представлять одну концепцию.
    Search Query Spike (Всплеск поисковых запросов)
    Резкое увеличение частоты отправки группы эквивалентных запросов за короткий период времени, превышающее фоновый уровень (средний или максимальный) на пороговую величину.
    Subtitles (Субтитры)
    Текстовое сопровождение видеопрограммы. Используется как основной источник данных для сопоставления терминов запроса с контентом видео. Также упоминается возможность использования voice recognition (распознавания речи).
    Video Program Extract / Snippet (Выдержка / Сниппет видеопрограммы)
    Короткое видео (хайлайт), смонтированное из сцен оригинальной видеопрограммы, которые были идентифицированы как наиболее интересные.
    Video Scene Boundaries (Границы видеосцены)
    Точки начала и конца логически завершенной сцены в видео. Фрагменты для дайджеста расширяются до этих границ.
    Video Summary (Видеосводка)
    Видеоролик, созданный путем объединения snippets из нескольких разных видеопрограмм, транслировавшихся в течение определенного периода (например, сводка дня).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает базовый метод создания видеодайджеста.

    1. Идентификация множества search query spikes на основе запросов пользователей.
    2. Условие всплеска: частота группы equivalent queries превышает среднюю частоту (average span of time) на пороговое значение (predefined threshold amount).
    3. Корреляция подмножества этих всплесков с транслируемой видеопрограммой. Каждый коррелированный всплеск соответствует определенной локации (временной метке) в видео.
    4. Создание snippet путем монтажа (stitching together) частей видеопрограммы, содержащих эти локации.

    Claim 4 (Зависимый от 1): Определяет метод семантической группировки запросов.

    Запросы эквивалентны, если они выражают одну и ту же лингвистическую концепцию (linguistic concept), даже если используются разные слова. Это указывает на использование продвинутого NLP и семантического анализа.

    Claim 6 (Зависимый от 1): Уточняет метод корреляции.

    Корреляция всплеска с видеопрограммой включает сопоставление поисковых терминов из запросов с субтитрами (subtitles) видеопрограммы в соответствующей локации.

    Claim 8 (Зависимый от 1): Уточняет границы включаемых фрагментов.

    Части видеопрограммы, включаемые в дайджест, расширяются до границ видеосцены (video scene boundaries) до и после найденной локации, чтобы обеспечить связность клипа.

    Claim 9 (Зависимый от 1): Описывает создание сводного дайджеста.

    Система может создать отдельные дайджесты для множества программ за определенный период времени и смонтировать их в единое сводное видео (single video summary).

    Claim 10 (Зависимый от 1): Устанавливает временное ограничение.

    Разница во времени между всплеском запросов и временем трансляции соответствующего фрагмента должна быть меньше предопределенной задержки (predefined delay).

    Где и как применяется

    Изобретение затрагивает несколько ключевых этапов работы поисковой системы, преимущественно в области обработки видео и понимания запросов.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит обработка видеоданных. Система должна получить или сгенерировать синхронизированные по времени текстовые данные (Subtitles или транскрипты через voice recognition). Также система должна проанализировать видео для определения Video Scene Boundaries и проиндексировать расписание трансляций (Broadcast Data).

    QUNDERSTANDING – Понимание Запросов
    Ключевой компонент системы. Происходит анализ потока запросов в реальном времени, их группировка по эквивалентности (семантической или синтаксической) и анализ частотности для выявления search query spikes. Это требует мощных возможностей NLP для понимания linguistic concepts.

    METASEARCH – Метапоиск и Смешивание (Генерация Контента)
    Основной процесс патента происходит здесь. Video Extract Module использует данные о всплесках и проиндексированные видеоданные для генерации нового медиа-объекта — Snippet или Video Summary.

    RANKING / RERANKING
    Сгенерированный Snippet предназначен для предоставления пользователю в ответ на запрос о видеопрограмме (Claim 2). Это означает, что дайджест участвует в ранжировании как элемент поисковой выдачи (SERP Feature), например, в виде блока Key Moments или видеокарусели.

    Входные данные:

    • Поток поисковых запросов от пользователей (Search Query Log).
    • Синхронизированные субтитры или распознанный текст видео.
    • Данные о трансляции видео (расписание, канал, регион).

    Выходные данные:

    • Сгенерированный видеодайджест (Video Extract / Snippet).
    • Идентификация ключевых моментов (временных меток) в оригинальном видео.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на видеоконтент, особенно транслируемый в прямом эфире или по расписанию (ТВ-шоу, новости, спорт), где большая аудитория смотрит контент одновременно. Патент упоминает возможность применения к Video on Demand (VOD), но основной фокус сделан на broadcast video program.
    • Специфические запросы: Информационные запросы, связанные с текущими событиями или просматриваемым контентом. Сгенерированные сниппеты могут быть ответом на эти запросы.
    • Конкретные ниши: Спорт, новости, развлекательные шоу — тематики, где зрители активно реагируют на происходящее и ищут дополнительную информацию в реальном времени.

    Когда применяется

    Алгоритм активируется при выполнении специфических условий, связанных с поведением пользователей:

    • Триггеры активации: Обнаружение Search Query Spike. Частота запросов по определенной теме должна превысить пороговое значение (predefined threshold amount) относительно среднего (average span of time) или максимального фонового уровня.
    • Условия применения: Должна существовать корреляция между терминами/концепциями запроса и контентом видео (субтитрами). Эта корреляция должна происходить в пределах короткого временного окна (predefined delay, например, 5-10 минут) между событием в видео и последующим всплеском запросов.

    Пошаговый алгоритм

    Процесс А: Подготовка и Мониторинг

    1. Группировка запросов: Система непрерывно классифицирует запросы в Query Groups на основе синтаксической схожести или семантической эквивалентности (linguistic concept).
    2. Расчет базовых метрик: Для каждой группы рассчитываются фоновые показатели частоты (средняя Average Query Frequency, максимальная Max Query Frequency).
    3. Индексация видеоданных: Обработка видео для извлечения субтитров/транскриптов с таймкодами и определения Video Scene Boundaries.
    4. Мониторинг в реальном времени: Отслеживание текущей частоты запросов для всех Query Groups.

    Процесс Б: Обнаружение всплесков и Генерация выдержек

    1. Обнаружение всплеска: Если частота резко возрастает и превышает установленное пороговое значение, система идентифицирует Search Query Spike.
    2. Корреляция Запрос-Видео: Термины/концепции из запросов, сформировавших всплеск, сравниваются с текстом видео в небольшом временном окне, предшествующем всплеску.
    3. Локализация события: При обнаружении совпадения система определяет точную локацию (временную метку) события в видео.
    4. Определение Границ Сцены: Для каждой найденной локации система определяет начало и конец соответствующей логической сцены (video scene boundaries). Могут применяться ограничения по максимальной длине фрагмента (например, 30 секунд до и после метки).
    5. Монтаж Дайджеста: Выбранные видеосцены «сшиваются» (stitching together), как правило, в хронологическом порядке.
    6. Генерация Сводки (Опционально): Дайджесты из разных программ могут быть объединены в единое сводное видео (single video summary).

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы (Ключевые): Поток поисковых запросов от множества пользователей (Search Query Log). Это основной сигнал для определения интереса. Анализируются термины, частота и динамика их появления.
    • Контентные факторы (Видео): Субтитры (Subtitles) или текст, полученный с помощью систем распознавания речи (voice recognition software). Используются для точной привязки запросов к контенту видео.
    • Временные факторы: Временные метки поступления запросов и временные метки субтитров/контента. Критически важна синхронизация и учет естественной задержки реакции пользователя.
    • Географические факторы: Местоположение пользователя и регион трансляции могут использоваться для корреляции локальных трансляций с локальными всплесками запросов.
    • (Опционально) Социальные факторы: В описании патента упоминается возможность использования постов в социальных сетях (например, Twitter Tweets™) вместо или в дополнение к поисковым запросам.

    Какие метрики используются и как они считаются

    • Average Query Frequency (Средняя частота запросов): Фоновая частота запросов в определенной Query Group за длительный период.
    • Max Query Frequency (Максимальная частота запросов): Пиковая частота запросов в группе за недавний скользящий период (например, последний час, исключая самые последние минуты).
    • Predefined Threshold Amount (Пороговое значение): Величина (абсолютная или процентная), на которую текущая частота должна превысить фоновую для детекции всплеска.
    • Predefined Delay (Предопределенная задержка): Максимально допустимое время между событием в видео и связанным с ним всплеском запросов.
    • Методы анализа текста (NLP): Используются для определения эквивалентности запросов и для сопоставления запросов с субтитрами. Патент явно упоминает сопоставление последовательностей терминов и сопоставление лингвистических концептов (linguistic concept).

    Выводы

    1. Коллективный интерес как индикатор ключевых моментов: Патент демонстрирует, как Google использует агрегированные поведенческие данные (всплески поисковых запросов) в качестве объективного сигнала для определения «интересных» моментов в видеоконтенте в реальном времени.
    2. Автоматизация создания хайлайтов (Key Moments): Описан конкретный механизм автоматической генерации видеодайджестов. Система не полагается на разметку автора, а вычисляет интересность на основе поведения зрителей.
    3. Критическая важность текстовой дорожки видео: Для работы системы необходимо наличие качественных текстовых данных, синхронизированных с видео (субтитры или распознанная речь). Это подчеркивает важность предоставления точных субтитров для VSEO.
    4. Продвинутое понимание запросов (NLP): Система не ограничивается простым совпадением слов. Она группирует запросы и сопоставляет контент на уровне лингвистических концептов (linguistic concept), что позволяет учитывать разные формулировки одного интента.
    5. От реакции к продукту: Система эффективно трансформирует спонтанную реакцию пользователей (поиск информации) в конечный продукт (видеодайджест), который затем используется в поиске для улучшения ответов на запросы о видеопрограмме.

    Практика

    Best practices (это мы делаем)

    • Обеспечение качественных субтитров и транскриптов: Критически важно предоставлять точные, синхронизированные субтитры для видеоконтента. Поскольку система использует subtitles для корреляции запросов с моментами видео, наличие и качество субтитров напрямую влияет на вероятность того, что ваш контент будет правильно сегментирован (например, для Key Moments).
    • Четкая дикция и терминология в видео: Если субтитры генерируются автоматически, критически важна чистота речи и использование понятной терминологии. Это улучшает качество распознавания речи (voice recognition), что позволяет системе точнее сопоставлять аудиодорожку с поисковыми запросами.
    • Оптимизация под лингвистические концепции (сущности): Понимая, что Google группирует запросы по концепциям, следует насыщать аудиодорожку видео (и, следовательно, транскрипт) терминами, связанными с ключевыми сущностями. Это повышает шансы на совпадение с различными формулировками запросов пользователей.
    • Структурирование видеоконтента: Создавайте видео с четкой структурой. Система ищет scene boundaries для создания когерентных клипов. Четкие переходы могут помочь системе определить эти границы.

    Worst practices (это делать не надо)

    • Игнорирование субтитров или использование некачественных автосубтитров: Загрузка видео без текстовой дорожки или с большим количеством ошибок в автоматических субтитрах снижает способность Google глубоко понять содержание видео и выделить в нем ключевые моменты, релевантные запросам пользователей.
    • Манипуляции с транскриптами (Keyword Stuffing): Попытки перенасыщения транскриптов ключевыми словами без соответствующего аудиосопровождения будут неэффективны, если Google использует собственное распознавание речи для верификации или сверяет текст с аудио.
    • Использование неоднозначных терминов: Использование жаргона или терминов, которые пользователи вряд ли будут искать в момент просмотра, может привести к тому, что важный момент не будет идентифицирован системой, так как не вызовет релевантного query spike.

    Стратегическое значение

    Патент подчеркивает стратегическую важность Video SEO и концепции «Key Moments». Видимость видео в поиске все больше зависит не только от ранжирования всего видео, но и от того, насколько эффективно система может извлечь из него конкретные сегменты. Долгосрочная стратегия должна быть направлена на создание контента, который легко сегментируется и содержит ярко выраженные моменты интереса, подкрепленные четкой текстовой информацией.

    Практические примеры

    Сценарий: Автоматическое создание Key Moments для спортивного события.

    1. Событие: Идет прямая трансляция футбольного матча. Игрок «Иванов» забивает гол. Комментатор (и субтитры) фиксируют это событие.
    2. Реакция пользователей: Тысячи зрителей одновременно начинают вводить запросы: «Иванов гол», «кто такой Иванов футболист».
    3. Действие системы: Система Google фиксирует массивный Search Query Spike по концепции, связанной с игроком «Иванов».
    4. Корреляция: Система анализирует субтитры трансляции и находит момент, когда имя «Иванов» упоминалось незадолго до всплеска запросов.
    5. Генерация хайлайта: Система определяет границы сцены (Scene Boundaries) — момент атаки и гола, извлекает этот фрагмент.
    6. Результат: При поиске этого матча в Google или YouTube, этот фрагмент будет показан как хайлайт или Key Moment.

    Вопросы и ответы

    Как система определяет, какие моменты в видео интересны пользователям?

    Система использует объективный поведенческий сигнал: резкое увеличение количества поисковых запросов (Search Query Spike) по определенной теме сразу после того, как эта тема была упомянута или показана в видео. Этот всплеск интерпретируется как индикатор коллективного интереса аудитории к данному моменту.

    Как Google определяет, что два разных запроса являются эквивалентными?

    Патент описывает два метода. Первый — синтаксический: последовательность терминов практически идентична (с учетом опечаток или стоп-слов). Второй — семантический: запросы выражают один и тот же лингвистический концепт (linguistic concept), даже если используют разные слова. Это указывает на использование продвинутых NLP-моделей и Графа Знаний.

    Насколько важны субтитры для работы этого механизма?

    Они критически важны. Патент указывает субтитры (subtitles) как основной механизм для корреляции всплеска запросов с конкретным моментом в видео (Claim 6). Хотя упоминается и возможность использования распознавания речи, наличие точных субтитров значительно повышает надежность и точность работы системы по определению ключевых моментов.

    Описывает ли этот патент механизм «Ключевые моменты» (Key Moments) в Google Поиске и на YouTube?

    Патент описывает очень похожий механизм. Хотя терминология отличается (Video Program Extracts вместо Key Moments) и фокус сделан на корреляции с внешними поисковыми запросами, базовый принцип тот же: идентифицировать интересные моменты в видео и извлечь их. Технологии, описанные здесь, актуальны для реализации Key Moments.

    Применяется ли этот патент только к телевизионным трансляциям?

    Основной фокус патента — на транслируемых программах (Broadcast video program), которые много людей смотрят одновременно. Однако в тексте упоминается возможность адаптации технологии для Video on Demand (VOD). В этом случае система может агрегировать данные о запросах от разных пользователей, смотревших видео в разное время.

    Как система определяет границы сцены для включения в дайджест?

    После того как найдена точная временная метка, соответствующая всплеску запросов, система расширяет этот момент до ближайших границ видеосцены (video scene boundaries) вперед и назад (Claim 8). Это делается для того, чтобы фрагмент был логически завершенным. Границы могут определяться по резким изменениям в аудио- или видеосигнале.

    Что такое «Сводное видео» (single video summary), упомянутое в патенте?

    Это «дайджест дайджестов» (Claim 9). Система может создать отдельные дайджесты для разных программ (например, всех новостных выпусков за день), а затем смонтировать их вместе в одно сводное видео, представляющее собой обзор главных событий за этот период времени.

    Какая задержка допустима между событием в видео и реакцией пользователей в поиске?

    Система учитывает естественную задержку (predefined delay). Пользователям нужно время, чтобы среагировать и ввести запрос. Патент предполагает, что эта задержка невелика (Claim 10), упоминая временные окна в пределах нескольких минут (например, 5 или 10 минут) для поиска корреляции.

    Могут ли посты в социальных сетях использоваться вместо поисковых запросов?

    Да. В описании патента упоминается, что в некоторых реализациях могут использоваться посты в социальных сетях (например, Twitter Tweets™) вместо или в дополнение к поисковым запросам для определения интереса пользователей к определенным фрагментам видеопрограммы.

    Какие практические действия для VSEO следуют из этого патента?

    Ключевые действия: всегда добавлять качественные, проверенные и синхронизированные субтитры к видео. Обеспечивать чистый звук для корректной работы систем распознавания речи. Структурировать видео логически, чтобы системам было проще определить границы сцен и сопоставить контент с лингвистическими концепциями.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.