Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует краудсорсинг и сегментацию аудитории для автоматического создания персонализированных Ключевых моментов в видео

    CROWD SOURCE-BASED TIME MARKING OF MEDIA ITEMS AT A PLATFORM (Краудсорсинговая разметка времени медиафайлов на платформе)
    • US12273603B2
    • Google LLC
    • 2025-04-08
    • 2022-05-17
    2022 Мультимедиа Патенты Google Персонализация Поведенческие сигналы

    Патент Google описывает систему автоматического определения наиболее интересных сегментов в видео или аудио на основе агрегированных данных от пользователей (краудсорсинг). Система анализирует, какие моменты зрители активно отмечают, кластеризует эти данные и создает автоматические закладки (Ключевые моменты/Главы). Ключевая особенность — возможность генерации разных наборов закладок для разных сегментов аудитории на основе их общих характеристик.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему трудоемкости и субъективности ручного создания таймкодов (глав или ключевых моментов) для медиаконтента. Создатели контента тратят значительное время на разметку и не могут точно предсказать, какие сегменты будут интересны разным группам пользователей. Кроме того, интересы аудитории меняются, что делает статичную разметку неактуальной. Система автоматизирует этот процесс, опираясь на фактический интерес аудитории, и обеспечивает динамическое обновление разметки.

    Что запатентовано

    Запатентована система для автоматической генерации и персонализации закладок (Bookmarks) на временной шкале медиафайла с помощью краудсорсинга. Система собирает явные сигналы интереса от пользователей (Time Marks), агрегирует и кластеризует их для определения оптимальных точек разметки. Ключевым элементом (Claim 1) является возможность генерации этих закладок на основе данных от пользователей с определенными общими характеристиками (Common Characteristic) и показа этих специфических закладок только соответствующему сегменту аудитории.

    Как это работает

    Система работает в несколько этапов:

    • Сбор данных (Crowd-sourcing): Пользователи при просмотре контента активно отмечают интересные моменты (Time Marks), например, через специальную кнопку в UI.
    • Сегментация: Система группирует эти отметки по сегментам аудитории, имеющим общие характеристики (например, интересы, демография, подписки).
    • Агрегация и Кластеризация: Time Marking Engine собирает отметки и строит гистограмму (Histogram Data Structure). Учитывая неточность пользовательского ввода, система кластеризует близко расположенные отметки в пределах порогового временного окна (Threshold Time Window, например, 4 секунды).
    • Определение пиков интереса: Для каждого кластера анализируется частотное распределение. Система вычисляет Aggregate Time Mark (например, медиану или моду кластера), определяя наиболее точный момент интереса.
    • Генерация закладок: На основе агрегированных отметок создаются автоматические закладки (Bookmarks).
    • Персонализированный показ: Закладки, сгенерированные для определенного сегмента аудитории, показываются пользователям из этого же сегмента.
    • Итеративное улучшение: Система динамически обновляет, добавляет или удаляет закладки на основе новых данных.

    Актуальность для SEO

    Высокая. Патент подан в 2022 году. Автоматизация разметки видео (Key Moments в Google Search, автоматические главы на YouTube) является критически важным направлением для улучшения UX и вовлеченности. Этот патент описывает конкретный механизм краудсорсинга и глубокой персонализации этих моментов для разных групп пользователей, что соответствует текущей стратегии Google.

    Важность для SEO

    Патент имеет высокое значение (7.5/10), преимущественно для Video SEO (VSEO). Он не описывает ранжирование веб-страниц, но раскрывает механизм автоматической сегментации видео. Наличие Ключевых моментов напрямую влияет на метрики вовлеченности и удержания аудитории (Watch Time, Audience Retention) — ключевые факторы ранжирования на YouTube. Кроме того, сегментированные видео чаще получают расширенные сниппеты (Rich Snippets) в Google Поиске, что значительно увеличивает видимость и CTR.

    Детальный разбор

    Термины и определения

    Aggregate Time Mark (Агрегированная временная отметка)
    Вычисленное значение времени, представляющее оптимальную точку для кластера пользовательских отметок. Рассчитывается на основе статистического анализа (среднее, медиана, мода, максимум) распределения отметок внутри временного окна.
    Bookmark (Закладка)
    Индикация интересного сегмента контента, предоставляемая пользователю через UI (например, Ключевой момент или глава на временной шкале). Генерируется на основе Aggregate Time Mark.
    Common Characteristic (Общая характеристика)
    Атрибут, общий для группы пользователей (например, интересы, подписки, принадлежность к социальной группе, учебному заведению). Используется для сегментации аудитории при генерации и показе персонализированных закладок (Claim 1).
    Data Item Criterion (Критерий элемента данных)
    Условие для валидации кластера временных отметок. Выполняется, если количество отметок в кластере превышает порог ИЛИ если разброс отметок (дистанция между минимумом и максимумом) ниже пороговой дистанции (Claim 4).
    Distance Criterion (Критерий расстояния)
    Порог, используемый для определения, находится ли новая временная отметка достаточно близко к существующей закладке, чтобы обновить ее (Claim 5), или достаточно далеко, чтобы инициировать новую (Claim 6).
    Histogram Data Structure (Гистограмма)
    Структура данных, используемая для отслеживания количества Time Marks, полученных для каждого момента времени медиафайла.
    Threshold Time Window (Пороговое временное окно)
    Временной интервал (например, 4 секунды, упомянутые в описании), используемый для кластеризации близлежащих временных отметок. Отметки внутри этого окна считаются относящимися к одному сегменту.
    Time Mark (Временная отметка)
    Явный сигнал, предоставляемый пользователем через UI (например, нажатие кнопки), указывающий на время в медиафайле, которое пользователь считает интересным.
    Time Marking Engine (Механизм обработки временных отметок)
    Компонент системы, отвечающий за обнаружение, агрегацию Time Marks и генерацию Bookmarks.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает процесс генерации персонализированных закладок на основе краудсорсинга от определенного сегмента аудитории.

    1. Система предоставляет медиафайл группе пользователей, имеющих at least one common characteristic.
    2. Система получает от них запросы на создание закладок (Time Marks) для интересных сегментов.
    3. Проверяется условие: достаточно ли запросов получено от пользователей с этой характеристикой (удовлетворяет ли one or more request criteria).
    4. Если ДА, система идентифицирует range of time periods (кластер отметок).
    5. Система ассоциирует сегмент контента в этом диапазоне с Bookmark.
    6. Система предоставляет медиафайл и эту закладку последующему пользователю, который также имеет эту common characteristic.

    Ядро изобретения — это не просто краудсорсинг таймкодов, а их генерация и показ для специфических, сегментированных групп пользователей.

    Claim 3 (Зависимый): Детализирует технический процесс агрегации и определения точного времени закладки.

    1. Идентифицируются записи в структуре данных (гистограмме), где набор отметок удовлетворяет data item criterion.
    2. Вычисляется aggregated data value (агрегированное значение) для этого набора. Указано, что это значение может быть средним (average), максимальным (maximum), медианным (median) или модой (mode) набора данных.
    3. Определяется конкретный момент времени, соответствующий этому агрегированному значению, который используется для размещения Bookmark.

    Claim 4 (Зависимый): Определяет, когда кластер отметок считается валидным (data item criterion). Критерий выполняется, если: (i) количество отметок превышает пороговое число, ИЛИ (ii) расстояние между минимальным и максимальным значением в наборе (разброс кластера) ниже порогового расстояния.

    Claim 5 и 6 (Зависимые): Описывают механизм итеративного обновления и добавления закладок.

    • Claim 5: Если новая отметка получена близко к существующей закладке (удовлетворяет distance criterion), система пересчитывает оптимальное положение закладки и обновляет ее (updating the bookmark).
    • Claim 6: Если новая отметка получена далеко от существующих закладок, система может инициировать создание новой дополнительной закладки (additional bookmark).

    Где и как применяется

    Изобретение применяется на контент-платформах (например, YouTube) и влияет на индексацию и представление контента.

    INDEXING – Индексирование и извлечение признаков

    Основная логика реализуется в конвейере обработки данных. Time Marking Engine анализирует логи взаимодействия пользователей с медиафайлом.

    • Сбор и Агрегация: Система собирает Time Marks и данные о пользователях (Common Characteristics).
    • Вычисление и Генерация: Происходит кластеризация, расчет Aggregate Time Marks и генерация Bookmarks.
    • Сохранение признаков: Сгенерированные закладки сохраняются как признаки (features) медиафайла. Для одного видео может храниться несколько наборов закладок для разных сегментов аудитории. Эти данные могут индексироваться поисковой системой для использования в SERP (например, блоки Key Moments).

    RERANKING – Переранжирование (Персонализация) / Уровень Представления

    На этапе доставки контента система применяет логику персонализации.

    • Идентификация пользователя: Система определяет характеристики пользователя, запрашивающего медиафайл.
    • Выбор закладок: Система выбирает набор закладок, соответствующий характеристикам пользователя (согласно Claim 1).
    • Презентация: Медиафайл предоставляется пользователю вместе с персонализированным набором закладок в UI плеера.

    Входные данные:

    • Медиафайл (Video/Audio).
    • Временные отметки (Time Marks) от пользователей.
    • Данные о пользователях (интересы, подписки, социальные группы) для определения Common Characteristics.

    Выходные данные:

    • Наборы закладок (Bookmarks), ассоциированные с медиафайлом и характеристиками пользователей.

    На что влияет

    • Типы контента: В первую очередь влияет на длинные медиафайлы (видео, подкасты, лекции, вебинары, туториалы), где навигация затруднена.
    • Метрики вовлеченности (VSEO): Напрямую влияет на метрики Audience Retention и Watch Time. Удобная навигация по интересным моментам удерживает пользователя и увеличивает время просмотра.
    • Видимость в поиске (SERP Features): Автоматически сгенерированные закладки используются для формирования расширенных сниппетов (Rich Snippets) с Ключевыми моментами в результатах поиска Google, что повышает CTR.

    Когда применяется

    • Триггеры активации генерации: Процесс активируется, когда достигается request criteria — пороговое количество отметок для медиафайла в целом или для конкретного сегмента аудитории.
    • Условия показа: Персонализированные закладки показываются только тем пользователям, которые соответствуют Common Characteristics группы, на основе которой эти закладки были созданы.

    Пошаговый алгоритм

    Процесс А: Генерация персонализированных закладок (Офлайн или Near Real-Time)

    1. Сбор данных: Система накапливает Time Marks от пользователей. Для каждой отметки фиксируется время и характеристики пользователя.
    2. Сегментация аудитории: Данные группируются по Common Characteristics.
    3. Проверка критериев активации: Для каждой группы проверяется, достигнуто ли пороговое количество отметок (request criteria).
    4. Идентификация и Валидация кластеров: Система анализирует гистограмму отметок, идентифицирует пики активности и определяет кластеры в пределах Threshold Time Window. Проверяется data item criterion (количество или плотность отметок).
    5. Расчет агрегированной отметки: Для валидных кластеров вычисляется aggregated data value (например, медиана или мода распределения). Это определяет точное время для закладки.
    6. Генерация и сохранение: Система генерирует Bookmark и сохраняет ее, ассоциируя с медиафайлом и соответствующей Common Characteristic.

    Процесс Б: Показ закладок (Real-Time)

    1. Запрос медиафайла: Пользователь запрашивает доступ к медиафайлу.
    2. Идентификация характеристик: Система определяет Common Characteristics пользователя.
    3. Выбор релевантных закладок: Система ищет наборы закладок, сгенерированные для этих характеристик (или использует общий набор, если специфического нет).
    4. Предоставление ответа: Медиафайл и соответствующий набор закладок передаются на клиентское устройство.

    Процесс В: Обновление закладок (Итеративный)

    1. Получение новой отметки: Система получает новую Time Mark.
    2. Проверка близости: Определяется расстояние между новой отметкой и существующими закладками (distance criterion).
    3. Обновление существующей закладки (Claim 5): Если отметка близка, система пересчитывает aggregated data value для кластера и обновляет положение закладки.
    4. Инициация новой закладки (Claim 6): Если отметка далеко, она добавляется в гистограмму и может стать основой для нового кластера.
    5. Удаление закладок: (Упомянуто в описании) Если пользователи игнорируют существующую закладку (порог невостребованности превышен), система может ее удалить.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы (User Interaction Data): Основные данные — это Time Marks (явные сигналы интереса от пользователей). Также используется информация о взаимодействии (или его отсутствии) с уже существующими закладками.
    • Пользовательские факторы (User Segmentation Data): Данные, используемые для определения Common Characteristics: интересы пользователя, история просмотров, подписки, демографические данные или принадлежность к социальным группам (например, студенты одного университета).

    Какие метрики используются и как они считаются

    • Request Criteria: Пороговое количество временных отметок, необходимое для активации генерации закладок (для всего видео или сегмента аудитории).
    • Threshold Time Window / Distance Criterion: Максимально допустимое время между отметками для их объединения в один кластер (в описании упоминается пример в 4 секунды). Также используется для определения близости новой отметки к существующей закладке.
    • Data Item Criterion: Метрика валидности кластера. Основана на количестве отметок И/ИЛИ плотности кластера (разница между Max и Min значениями времени).
    • Frequency Distribution (Частотное распределение): Статистический анализ (упоминается Гауссово распределение) отметок внутри кластера.
    • Aggregated Data Value (Aggregate Time Mark): Статистическая метрика, определяющая центр кластера. Рассчитывается как среднее, максимум, медиана или мода распределения временных отметок в кластере.

    Выводы

    1. Краудсорсинг как основа для структурирования контента: Google использует активное поведение пользователей (Time Marks) для автоматического определения структуры и выделения интересных моментов в видео/аудио. Это снижает зависимость от ручной разметки авторами.
    2. Персонализация на уровне навигации по контенту: Патент демонстрирует глубокий уровень персонализации (Claim 1). Разные пользователи могут видеть разные ключевые моменты для одного и того же видео, в зависимости от того, к какому сегменту аудитории (Common Characteristic) они принадлежат.
    3. Статистический подход к определению интереса: Система учитывает неточность пользовательского ввода. Механизм агрегации через кластеризацию (Threshold Time Window) и расчет статистического центра (Aggregate Time Mark) позволяет точно определить момент интереса, даже если пользователи отмечают его с разбросом.
    4. Итеративность и адаптивность: Механизм обновления (Claims 5 и 6) позволяет закладкам эволюционировать со временем. Если интересы аудитории смещаются или появляются новые данные, система автоматически адаптирует закладки.
    5. Вовлеченность (Engagement) как ключевой сигнал: Система фокусируется на идентификации «интересных» сегментов, что подчеркивает важность метрик вовлеченности (удержание, время просмотра) для алгоритмов платформы.

    Практика

    Best practices (это мы делаем)

    Рекомендации применимы в первую очередь к Video SEO (VSEO) на платформах Google (YouTube).

    • Создание четких «пиков интереса»: Оптимизируйте контент так, чтобы в нем были ярко выраженные кульминационные или ключевые моменты. Используйте визуальные подсказки, смену темпа, интонационные акценты. Это помогает пользователям синхронно реагировать на момент (ставить Time Mark или пересматривать), формируя четкие кластеры для системы.
    • Анализ удержания аудитории (Audience Retention): Тщательно изучайте графики удержания в аналитике. Пики интереса указывают на сегменты, которые аудитория считает ценными. Система с высокой вероятностью создаст автоматические Bookmarks именно в этих точках.
    • Структурирование длинного контента: Для длинных видео (лекции, вебинары) наличие логичной структуры и явных переходов между темами помогает системе краудсорсинга более точно формировать кластеры интереса и генерировать релевантные закладки.
    • Мониторинг автоматических Ключевых моментов в SERP: Отслеживайте, какие моменты Google выделяет в ваших видео при показе в результатах поиска (Rich Snippets). Это дает обратную связь о том, что система считает наиболее релевантным и интересным.
    • Анализ сегментов аудитории: Понимайте, что разные сегменты аудитории могут интересоваться разными частями видео (согласно Claim 1). Убедитесь, что контент удовлетворяет интересы ваших ключевых сегментов.

    Worst practices (это делать не надо)

    • Создание монотонного контента: Контент без явных пиков интереса, «размазанный» по всей длительности, затруднит для пользователей и системы идентификацию ключевых моментов. Это негативно скажется на вовлеченности и эффективности автоматической разметки.
    • Игнорирование данных об удержании: Не анализировать, какие моменты вызывают всплеск интереса или отток зрителей, означает упускать возможность оптимизировать контент под алгоритмы и интересы пользователей.
    • Накрутка сигналов интереса: Попытки манипулировать системой путем генерации фальшивых Time Marks могут быть неэффективны или обнаружены, так как система анализирует характеристики пользователей (Common Characteristics) и использует статистические методы для фильтрации выбросов.

    Стратегическое значение

    Патент подтверждает стратегическую важность пользовательских сигналов вовлеченности (Engagement Signals) для структурирования и представления видеоконтента. Он показывает, что Google развивает механизмы для анализа поведения внутри видео (in-video behavior analysis). Для VSEO это означает, что оптимизация внутри видео становится критически важной. Персонализация теперь затрагивает не только рекомендации, но и навигацию внутри контента, что требует более глубокого понимания различных сегментов аудитории.

    Практические примеры

    Сценарий 1: Оптимизация обучающего вебинара по SEO

    1. Контент: 1-часовой вебинар по техническому SEO.
    2. Поведение пользователей: Участники (сегмент: «интерес к SEO») активно отмечают (Time Marks) момент на 25:00, где дается чек-лист по Core Web Vitals.
    3. Обработка системой: Time Marking Engine обнаруживает кластер активности. Несмотря на разброс отметок (24:55-25:05), система вычисляет Aggregate Time Mark на 25:01.
    4. Результат: Для последующих пользователей с интересом к SEO система автоматически генерирует Bookmark (Ключевой момент) на 25:01. Это повышает ценность записи и улучшает метрики удержания.

    Сценарий 2: Персонализация закладок для обзора смартфона

    1. Контент: Длинный видеообзор нового смартфона.
    2. Сегмент А (Интерес: Фотография): Пользователи из этого сегмента активно отмечают часть видео с тестом ночной съемки (10:00). Система генерирует закладку «Тест ночной съемки» для этого сегмента.
    3. Сегмент Б (Интерес: Мобильные игры): Пользователи из этого сегмента отмечают часть с тестом производительности в играх (18:00). Система генерирует закладку «Тест в играх» для этого сегмента.
    4. Результат: Новый пользователь, интересующийся фотографией, открывает видео и видит акцент на закладке «Тест ночной съемки». Игроман увидит акцент на закладке «Тест в играх». Это реализация Claim 1.

    Вопросы и ответы

    В чем разница между «Time Mark» и «Bookmark» в контексте патента?

    Time Mark — это «сырой» сигнал, который активно оставляет один пользователь (например, клик по кнопке «Отметить момент»), чтобы указать на интересный момент. Bookmark (Закладка или Ключевой момент) — это результат работы системы; это навигационный элемент, который генерируется автоматически на основе анализа множества Time Marks от разных пользователей и показывается будущим зрителям.

    Является ли этот патент описанием функции «Key Moments» в Google Search или автоматических глав на YouTube?

    Да, этот патент описывает один из ключевых механизмов реализации подобных функций. Он фокусируется именно на краудсорсинговом подходе (сбор явных сигналов от пользователей) и, что важно, на персонализации этих закладок для разных групп аудитории.

    Описывает ли этот патент анализ повторных просмотров (например, график «Most Replayed»)?

    Нет. Этот патент фокусируется на активном краудсорсинге, где пользователи намеренно создают Time Mark. Он не описывает анализ пассивных сигналов, таких как то, какие части видео пользователи пересматривают чаще всего, хотя эти системы могут работать параллельно.

    Как система определяет точное время для закладки, если пользователи отмечают моменты неточно?

    Система использует статистический анализ. Она группирует близкие отметки в пределах порогового временного окна (Threshold Time Window, например, 4 секунды) в один кластер. Затем она анализирует распределение отметок внутри кластера и вычисляет оптимальный центр (Aggregate Time Mark) — например, медиану или моду. Это позволяет нивелировать индивидуальные неточности.

    Могут ли автоматические закладки быть разными для разных зрителей?

    Да, это ключевой аспект Claim 1. Система может идентифицировать группы пользователей с общими характеристиками (Common Characteristics) и генерировать для них специфические наборы закладок. Например, новички и эксперты в теме могут увидеть разные ключевые моменты в одном и том же видео.

    Как этот патент влияет на SEO и ранжирование?

    Влияние сильное для VSEO. Патент направлен на улучшение UX и навигации. Это повышает метрики удержания и времени просмотра, которые являются важными факторами ранжирования видео. Кроме того, наличие Ключевых моментов увеличивает вероятность получения расширенного сниппета в Google Поиске, что повышает CTR.

    Как оптимизировать видео, чтобы система лучше распознавала интересные моменты?

    Необходимо создавать контент с четкими пиками интереса. Используйте визуальные подсказки, смену темпа, интонационные акценты на ключевых моментах. Это увеличивает вероятность того, что пользователи синхронно отреагируют на этот момент, что позволит системе сформировать четкий кластер и создать закладку.

    Нужно ли по-прежнему добавлять таймкоды вручную?

    Да, это остается лучшей практикой. Ручные таймкоды дают вам контроль над структурой и гарантируют наличие навигации сразу после публикации. Автоматическая система требует времени и данных для генерации закладок и может дополнить вашу ручную разметку моментами, которые вы не выделили, но которые оказались популярны у аудитории.

    Могут ли закладки меняться со временем?

    Да. Патент описывает механизм итеративного обновления (Claims 5 и 6). Если система получает новые данные от пользователей, она может скорректировать положение существующих закладок, добавить новые, если интересы аудитории сместились, или удалить неактуальные (если пользователи их игнорируют).

    Как система определяет, что пользователи принадлежат к одной группе («Common Characteristic»)?

    Система использует стандартные методы сегментации аудитории Google. Патент упоминает общие интересы, подписки на одни и те же каналы, принадлежность к одной социальной группе или организации (например, студенты одного университета) как примеры таких характеристик.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.