
Google использует систему для автоматической генерации движущихся миниатюр (анимированных превью). Система анализирует видео покадрово, оценивая визуальное качество, наличие лиц и движение. Затем она использует метод «скользящего окна» для оценки целых сегментов и выбирает наиболее качественный и информативный фрагмент. Этот фрагмент может быть дополнительно скорректирован по границам сцен и скорости воспроизведения для повышения вовлеченности пользователей (CTR).
Патент решает проблему выбора наиболее репрезентативного и привлекательного сегмента видео для использования в качестве движущейся миниатюры (moving thumbnail или анимированного превью). Статические миниатюры ограничены в информативности. Случайный или хронологический выбор сегмента для превью часто приводит к некачественным результатам: превью может быть неинформативным, содержать спойлеры или быть визуально непривлекательным. Цель изобретения — автоматизировать создание высококачественных движущихся миниатюр, которые привлекают внимание зрителя.
Запатентована система автоматической генерации движущихся миниатюр на основе многофакторной оценки качества контента. Суть изобретения заключается в методологии покадровой оценки качества (Frame-level quality scores) и последующей агрегации этих оценок на уровне сегментов (Group-level quality scores) с использованием техники «скользящего окна» (sliding window). Система выбирает сегмент с наивысшей оценкой для финальной миниатюры и проводит его постобработку.
Система работает следующим образом:
frame-level scorers), которые измеряют визуальное качество, наличие и размер лиц, а также движение.shot boundary) и изменяется по скорости воспроизведения в зависимости от интенсивности движения.Высокая. Анимированные превью активно используются на платформах Google (включая Google Search, YouTube, Discover) для повышения CTR. Автоматизация этого процесса с фокусом на качестве критически важна для масштабирования. Методы, описанные в патенте (DNN для оценки качества, анализ лиц и движения), соответствуют современным подходам в области компьютерного зрения.
Патент имеет высокое значение для Video SEO (8.5/10). Он не описывает алгоритм ранжирования, но раскрывает механизм генерации актива (превью), который напрямую влияет на кликабельность (CTR) видео. Привлекательное превью ведет к большему количеству кликов и лучшим поведенческим сигналам, которые учитываются алгоритмами ранжирования и рекомендаций. Понимание критериев выбора сегмента позволяет оптимизировать видео для создания лучших превью.
Frame-level Quality Scores.Claim 1 (Независимый пункт): Описывает основной метод генерации движущейся миниатюры.
Frame-level quality scores для этих кадров.sliding window для идентификации множества групп последовательных кадров. Группы перекрываются (имеют общие кадры) и оцениваются на групповом уровне.Group-level quality scores для этих групп на основе покадровых оценок.Group-level quality scores.moving thumbnail, используя видеоданные из временного диапазона выбранной группы.Claim 4, 5, 6 (Зависимые): Детализируют процесс покадровой оценки.
Frame-level quality score рассчитывается путем суммирования оценок от нескольких скореров (Claim 4). Эти скореры включают оценку визуального качества, размера лиц и движения (Claim 5). Суммирование производится с использованием linear weighted summation (Claim 6).
Claim 10 (Зависимый от 1): Описывает постобработку миниатюры.
Миниатюра модифицируется так, чтобы ее первый и/или последний кадр находился вблизи shot boundary (границы сцены).
Claim 11 (Зависимый от 1): Описывает дополнительную постобработку.
Скорость воспроизведения (playback speed) миниатюры модифицируется на основе измерения движения в кадрах миниатюры.
Изобретение применяется на этапе обработки видео после его загрузки или во время индексации контента.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Система (Moving Thumbnail Generator) анализирует видеоконтент для извлечения признаков и генерации связанного ассета — оптимальной движущейся миниатюры.
Frame-level quality scores с применением моделей компьютерного зрения (DNN, детекторы лиц).Sliding Window и агрегации для выбора лучшего сегмента.METASEARCH / RERANKING (Уровень представления)
Результат работы алгоритма (сгенерированная миниатюра) используется для отображения в выдаче (SERP, ленты рекомендаций). Качество миниатюры влияет на CTR, что косвенно влияет на ранжирование через поведенческие сигналы.
Входные данные:
Video Item).Выходные данные:
Moving Thumbnail).beginning portion), например, первой половиной или двумя третями, чтобы избежать спойлеров из концовки (ending portion).Этап 1: Сэмплирование (Video Frame Sampler)
Этап 2: Покадровая оценка (Frame-Level Quality Scorer)
Frame-level Quality Score путем линейного взвешенного суммирования оценок от всех скореров.Этап 3: Оценка сегментов и выбор (Group-Level Quality Scorer)
Group-level Quality Score путем агрегации Frame-level Quality Scores кадров внутри окна.Group-level Quality Score.Этап 4: Генерация миниатюры (Animation Generator)
Этап 5: Постобработка и уточнение
shot boundary), миниатюра обрезается так, чтобы начинаться/заканчиваться на границе сцены. Границы в середине игнорируются.Система использует исключительно данные, извлеченные из самого видеофайла.
Система вычисляет несколько ключевых метрик:
Face Ratio). Патент упоминает порог (например, 0.375). Если Face Ratio превышает порог, оценка снижается по формуле, например: 2×(Порог)−Face Ratio.Linear Weighted Summation): W1⋅Visual+W2⋅Facial+W3⋅Motion.Frame-level Quality Scores всех кадров в сегменте (скользящем окне).Shot Boundaries) обеспечивает плавность просмотра, а корректировка скорости делает медленные сегменты более динамичными.Для Video SEO этот патент дает четкие указания по оптимизации структуры и качества видео для улучшения автоматических превью и повышения CTR.
Thumbnail Quality Scorer (на основе DNN) предпочтет кадры высокого качества.Motion Scorer оценивает движение. Слишком статичные кадры могут быть проигнорированы или неестественно ускорены.Shot Boundary Adjustment).Thumbnail Quality Scorer.Face Scorer.Патент подтверждает фокус Google на пользовательском опыте и метриках вовлеченности. Система стремится сделать сниппет видео максимально привлекательным. Для долгосрочной стратегии Video SEO необходимо учитывать, как алгоритмы машинного зрения воспринимают визуальный ряд. Оптимизация видео под автоматический генератор миниатюр становится неотъемлемой частью процесса продвижения видеоконтента.
Сценарий: Оптимизация видео-обзора гаджета для лучшего Moving Thumbnail
Face Scorer) активно взаимодействует с гаджетом (Motion Scorer).Thumbnail Quality Scorer).Shot Boundary).Moving Thumbnail, что приведет к увеличению CTR видео.Какие три основных фактора Google оценивает при выборе сегмента для анимированного превью?
Согласно патенту, система оценивает три ключевых аспекта на уровне кадров: 1. Визуальное качество (четкость, освещенность, оценивается моделью ML/DNN). 2. Наличие и размер лиц (предпочтение отдается лицам оптимального размера). 3. Движение между кадрами (уровень динамики в сцене).
Влияет ли этот патент напрямую на ранжирование видео?
Нет, напрямую не влияет. Патент описывает генерацию ассета (анимированной миниатюры), а не алгоритм ранжирования. Однако он имеет значительное косвенное влияние: более качественное превью повышает CTR и сигналы вовлеченности, которые уже учитываются алгоритмами ранжирования видео на YouTube и в Google.
Анализирует ли система все видео целиком для создания превью?
Не обязательно. В патенте указано, что анализ может быть ограничен только начальной частью видео (beginning portion), например, первой половиной или двумя третями. Это делается для того, чтобы избежать спойлеров. Это подчеркивает важность размещения качественного контента в начале ролика.
Как система определяет оптимальный размер лица в кадре?
Система использует Close-up Face Scorer, который измеряет отношение размера лица к размеру кадра. В патенте приводится пример порога (0.375 или 37.5%). Если лицо слишком маленькое или слишком большое (значительно превышает порог), оценка снижается с использованием специальной формулы. Цель — выбрать кадры с узнаваемыми, но не чрезмерно крупными лицами.
Что произойдет, если система выберет очень медленный сегмент?
Система включает модуль регулировки скорости воспроизведения (Playback Speed Module). Если измеренное общее движение в выбранном сегменте ниже определенного порога (т.е. сегмент слишком медленный), система автоматически увеличит скорость воспроизведения превью (например, в 1.5x или 2x), чтобы сделать его более динамичным.
Что такое «Shot Boundary» и почему это важно для превью?
Shot Boundary — это граница сцены или монтажная склейка. Система старается начинать и заканчивать превью именно на этих границах. Если превью начнется или закончится резко посреди сцены, это ухудшает восприятие. Система корректирует границы (обрезает начало или конец превью), чтобы обеспечить плавное воспроизведение.
Что такое метод скользящего окна (Sliding Window) в этом контексте?
Sliding Window — это метод анализа последовательности кадров. Система берет окно фиксированной длины (например, 8 секунд) и перемещает его вдоль видео. В каждой позиции она суммирует оценки качества всех кадров внутри окна. Сегмент, где эта сумма максимальна, выбирается в качестве кандидата для превью.
Как комбинируются оценки визуального качества, лиц и движения?
Используется линейное взвешенное суммирование (linear weighted summation). Это означает, что платформа может настраивать веса для каждого фактора, определяя, что важнее (например, визуальное качество может иметь больший вес, чем движение).
Как оптимизировать видео, если в нем нет лиц (например, DIY или кулинария)?
В этом случае необходимо сфокусироваться на двух других факторах: максимальном визуальном качестве и интересном движении. Создавайте сегменты с хорошим освещением, резкостью и динамичными действиями (например, процесс сборки, нарезка ингредиентов). Эти сегменты получат высокие оценки от Thumbnail Quality Scorer и Motion Scorer.
Влияет ли звук на выбор сегмента для Moving Thumbnail?
В данном патенте анализ аудиокомпонента не упоминается. Система фокусируется исключительно на визуальных характеристиках кадров. Moving Thumbnails часто воспроизводятся без звука, поэтому приоритет отдается визуальной привлекательности.

Семантика и интент
Мультимедиа
Индексация

Поведенческие сигналы
Персонализация

Мультимедиа
Свежесть контента

SERP
Мультимедиа
Семантика и интент

Семантика и интент
Мультимедиа
Индексация

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Краулинг
Техническое SEO

Ссылки
Мультимедиа
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Антиспам
SERP

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
SERP
Антиспам

Персонализация
Поведенческие сигналы
SERP
