Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google вычисляет оценку качества продакшена (Production Quality Score) для видео и мультимедиа

    MECHANISM FOR AUTOMATIC QUANTIFICATION OF MULTIMEDIA PRODUCTION QUALITY (Механизм автоматической количественной оценки качества производства мультимедиа)
    • US9009083B1
    • Google LLC
    • 2015-04-14
    • 2012-02-15
    2012 Мультимедиа Патенты Google

    Google автоматически оценивает техническое качество мультимедиа (видео, аудио, изображений) с помощью Production Quality Score. Система обучается на основе относительных сравнений асессоров и анализирует технические признаки (визуальные, аудио, метаданные, качество текста). Этот скор используется для ранжирования в поиске и определения стоимости рекламы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему автоматической и надежной оценки технического качества (Production Quality) мультимедийного контента (видео, аудио, изображений) на платформах общего доступа. Традиционные методы оценки качества часто требовали эталонного (неискаженного) файла, которого обычно нет, или полагались на абсолютные оценки пользователей, которые субъективны и непоследовательны. Изобретение позволяет автоматически идентифицировать контент с высоким техническим качеством (хорошее освещение, стабильная камера, чистый звук), что улучшает пользовательский опыт и повышает потенциал монетизации.

    Что запатентовано

    Запатентована система автоматического присвоения оценки качества продакшена (Production Quality Score) мультимедийному контенту. Система использует статистическую модель машинного обучения, обученную на основе относительных сравнений качества, сделанных людьми-асессорами. Модель учится взвешивать различные извлеченные признаки контента (визуальные, звуковые, метаданные, текстовые), чтобы предсказать восприятие качества человеком.

    Как это работает

    Система работает в несколько этапов:

    • Сбор данных (Ground-truth data collection): Асессорам показывают наборы контента (например, пары видео) и просят указать, какой элемент имеет лучшее техническое качество.
    • Сэмплирование: Для эффективного сбора данных часто используется метод активного сэмплирования (Active Sampling), который подбирает для сравнения контент с близким уровнем качества.
    • Извлечение признаков (Feature Extraction): Из контента извлекаются технические характеристики: визуальные (резкость, размытость, движение камеры), аудио (громкость, тембр), метаданные (разрешение, камера) и текстовые сигналы (качество заголовка/описания).
    • Обучение модели: Machine Learning Engine обучается предсказывать относительные суждения асессоров, определяя вес каждого извлеченного признака.
    • Применение: Обученная модель применяется ко всему контенту на платформе для вычисления Production Quality Score.

    Актуальность для SEO

    Высокая. Автоматическая оценка технического качества контента критически важна для платформ с пользовательским контентом (например, YouTube, Google Images). Методы машинного обучения для оценки качества без эталона, основанные на человеческом восприятии, являются стандартом индустрии и продолжают развиваться.

    Важность для SEO

    Патент имеет высокое значение (80/100) для Video SEO и Image SEO. В патенте (Claim 6) прямо указано, что Production Quality Score используется для «фильтрации контента в результатах поиска» (filter the another content item with respect to other content items in a search result). Это подтверждает, что техническое качество мультимедиа является измеримым фактором ранжирования. При схожей релевантности контент с более высоким Production Quality Score получит преимущество.

    Детальный разбор

    Термины и определения

    Active Sampling (Активное сэмплирование)
    Стратегия сбора данных, при которой система выбирает для оценки человеком наиболее информативные примеры (например, пары видео с близким, неопределенным качеством), чтобы быстрее и эффективнее обучить модель. Также известно как optimal experimental design.
    Content Features (Признаки контента)
    Извлекаемые характеристики мультимедийного элемента. Делятся на классы: Visual Signals, Audio Signals, Metadata, и Text Signals.
    Implicit Sampling (Неявное сэмплирование)
    Метод оценки качества, основанный на анализе поведения пользователей (например, клики по результатам поиска или внесенные пользователем правки в видеоредакторе для улучшения качества), а не на прямом опросе.
    Production Quality (Качество продакшена)
    Техническое качество мультимедийного контента (освещение, стабильность камеры, четкость звука, отсутствие артефактов), в отличие от качества самого содержания (Content Quality).
    Production Quality Score (Оценка качества продакшена)
    Числовая метрика, присваиваемая контенту обученной моделью. Более высокое значение соответствует более высокому техническому качеству.
    Relative Production Quality (Относительное качество продакшена)
    Оценка качества одного элемента контента по сравнению с другим. Используется вместо абсолютных оценок для повышения надежности данных обучения.
    Statistical Model (Статистическая модель)
    Математическая формула (модель машинного обучения), которая предсказывает Production Quality Score на основе входных переменных (Content Features). Коэффициенты (веса) модели определяются в процессе обучения.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод автоматической оценки качества.

    1. Система предоставляет подмножество контента для сравнения пользователем, причем подмножество выбирается с использованием Active Sampling.
    2. Система получает выбор пользователя, указывающий на более высокое относительное качество одного из элементов.
    3. Система собирает образцы данных (data samples) от множества пользователей.
    4. Извлекаются Content Features из оцениваемых элементов.
    5. Система обучает Statistical Model. Обучение включает присвоение весовых коэффициентов (weight factor values) признакам для предсказания выбора пользователей.
    6. Обученная модель применяется к другому элементу контента (не входившему в обучающую выборку).
    7. Этому другому элементу присваивается Production Quality Score с использованием присвоенных весовых коэффициентов.

    Ядром изобретения является использование относительных человеческих суждений, собранных через Active Sampling, для обучения ML-модели, которая взвешивает технические признаки, позволяя автоматически оценивать новый контент.

    Claim 2 (Зависимый от 1): Уточняет типы признаков.

    Признаки контента включают как минимум одно из: визуальные сигналы, аудиосигналы, метаданные или текстовые сигналы.

    Claims 5, 6, 7 (Зависимые от 1): Описывают применение Production Quality Score.

    • Claim 5: Использование оценки для обратной связи с владельцем контента, информируя его о качестве и о том, какие признаки можно улучшить.
    • Claim 6: Использование оценки в качестве метаданных для фильтрации элемента контента относительно других элементов в результатах поиска. Это прямое указание на использование оценки в ранжировании.
    • Claim 7: Использование оценки как фактора для размещения рекламы (advertisement placement), связанной с элементом контента.

    Где и как применяется

    Изобретение затрагивает несколько этапов поисковой архитектуры, а также включает важный офлайн-процесс обучения.

    INDEXING – Индексирование и извлечение признаков

    1. Извлечение признаков: При загрузке или обработке контента система анализирует мультимедиа и извлекает Content Features (визуальные, аудио, метаданные, текстовые).
    2. Вычисление оценки: Production Quality Measure Engine применяет предварительно обученную Statistical Model к извлеченным признакам для вычисления Production Quality Score. Эта оценка сохраняется в индексе.

    RANKING / RERANKING – Ранжирование / Переранжирование

    На этих этапах Production Quality Score используется как сигнал ранжирования. Как указано в Claim 6, оценка используется для «фильтрации» результатов поиска. При формировании выдачи (особенно в поиске по видео или картинкам) система может предпочесть контент с более высоким техническим качеством при схожей релевантности.

    METASEARCH – Метапоиск и Смешивание

    При смешивании результатов в универсальной выдаче (например, показ блока с видео) Production Quality Score может влиять на выбор кандидатов. Также используется системами размещения рекламы для определения пригодности контента и ценообразования.

    Офлайн-процессы (Обучение модели):

    • Test Data Set Collection Server собирает относительные оценки качества от асессоров (используя Active Sampling) или анализирует неявные сигналы (Implicit Sampling).
    • Machine Learning Engine использует эти оценки и извлеченные признаки для обучения и периодического обновления Statistical Model.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на мультимедийный контент: видео (основной фокус патента), изображения, аудио.
    • Специфические запросы: Влияет на все запросы, по которым показываются мультимедийные результаты – как в специализированных вертикалях (Google Video, Google Images), так и в универсальном поиске.
    • Конкретные ниши или тематики: Особенно важно для ниш, где техническое качество критично для пользователя (обзоры, обучение) и для платформ с большим объемом пользовательского контента (UGC).

    Когда применяется

    • Вычисление оценки: Происходит во время индексирования или обработки контента после его загрузки на платформу.
    • Использование оценки: Происходит в реальном времени на этапе ранжирования, когда контент рассматривается как кандидат для показа в результатах поиска или рекомендациях.
    • Обновление модели: Происходит периодически офлайн на основе новых данных от асессоров.

    Пошаговый алгоритм

    Процесс разделен на две основные фазы: обучение модели и ее применение.

    Фаза А: Обучение модели (Офлайн)

    1. Выборка контента: Случайный выбор набора видео из базы данных контента.
    2. Сэмплирование и создание подмножеств: Формирование пар или групп видео для сравнения. Используются методы:
      • Active Sampling (предпочтительно): Выбор пар с высокой неопределенностью в относительном качестве.
      • Фильтрация: Выбор пар, схожих по метаданным (дата загрузки, длина), чтобы изолировать влияние продакшена.
    3. Сбор оценок (Human Rating): Представление подмножеств асессорам с запросом выбрать элемент с лучшим техническим качеством. (Опционально: сбор данных через Implicit Sampling).
    4. Извлечение признаков: Извлечение Content Features (визуальных, аудио, метаданных, текстовых) для всех оцененных видео.
    5. Обучение (Learning): Обучение Statistical Model на извлеченных признаках для предсказания восприятия качества асессорами. Модель определяет относительную важность (веса) каждого признака.
    6. Итерация: Повторение процесса обучения на основе новых данных для поддержания актуальности модели.

    Фаза Б: Применение модели (Индексирование и Ранжирование)

    1. Извлечение признаков: Для нового (или обновленного) видео извлекаются Content Features.
    2. Вычисление оценки (Scoring): Применение обученной Statistical Model к извлеченным признакам для расчета Production Quality Score.
    3. Использование оценки (Utilization): Использование Production Quality Score в качестве сигнала для ранжирования в поиске, для обратной связи с пользователем и для определения стоимости рекламы.

    Какие данные и как использует

    Данные на входе

    Система использует четыре основных класса признаков (Content Features), а также данные для обучения:

    • Мультимедиа факторы (Visual Signals):
      • Цветовая композиция, резкость (sharpness), размытость (blurriness), насыщенность (saturation).
      • Признаки движения: движение объекта и движение камеры (camera motion).
      • Тип разрешения (HD, SD) и разрешение (resolution).
      • Признаки лиц (количество лиц, их свойства).
    • Аудио факторы (Audio Signals):
      • Громкость (loudness), спектрограмма, стабилизированные слуховые образы.
      • Тон, тембр, мелодия, ритм (beats), темп.
    • Технические факторы (Metadata):
      • Информация о камере, программное обеспечение для редактирования (editing software).
      • Разрешение, формат файла.
    • Контентные/Текстовые факторы (Text Signals):
      • Показатели качества (например, орфография и грамматика) окружающего текста: заголовок, описание и комментарии, связанные с видео.
    • Поведенческие факторы (Данные для обучения):
      • Явные: Относительные оценки качества производства от людей-асессоров.
      • Неявные (Implicit Sampling): Клики пользователей в поиске или действия по улучшению видео в редакторе.

    Какие метрики используются и как они считаются

    • Production Quality Score: Основная выходная метрика. Вычисляется путем применения обученной Statistical Model к вектору извлеченных признаков контента.
    • Weight Factor Values (Весовые коэффициенты): Внутренние параметры Statistical Model, которые определяют вклад каждого Content Feature в итоговую оценку. Определяются в процессе машинного обучения для максимизации точности предсказания человеческих суждений.
    • Алгоритмы машинного обучения: Используется для обучения Statistical Model (обучение с учителем).
    • Active Sampling: Алгоритм, использующий метрики неопределенности для оптимизации процесса сбора данных от асессоров.

    Выводы

    1. Техническое качество мультимедиа – это измеримый фактор ранжирования. Патент прямо заявляет (Claim 6) об использовании Production Quality Score для фильтрации результатов поиска. Это критически важно для Video и Image SEO.
    2. Определение качества основано на человеческом восприятии. Google использует данные от асессоров (Ground-truth data), чтобы понять, что люди считают высоким техническим качеством. Машинное обучение используется для масштабирования этого понимания.
    3. Относительные сравнения надежнее абсолютных оценок. Система обучается на сравнениях («Видео А лучше, чем Видео Б»), а не на абсолютных оценках, что повышает согласованность данных.
    4. Оценка качества является многофакторной и комплексной. Модель учитывает широкий спектр сигналов: визуальные, аудио, технические метаданные и, что критически важно, качество окружающего текста (заголовки, описания, комментарии).
    5. Эффективность обучения через Active Sampling. Google использует продвинутые методы (Active Sampling) для быстрого сбора наиболее полезных данных от асессоров, фокусируясь на сложных для системы случаях.
    6. Качество влияет на монетизацию. Production Quality Score используется для определения вариантов размещения и стоимости рекламы (Claim 7), что связывает техническое качество контента с его коммерческой ценностью.

    Практика

    Best practices (это мы делаем)

    • Инвестируйте в техническое качество производства. Поскольку Production Quality Score является фактором ранжирования, необходимо уделять внимание техническим аспектам:
      • Видео: Обеспечьте хорошее освещение, используйте стабилизацию (минимизация camera motion), снимайте в фокусе (минимизация blurriness).
      • Аудио: Записывайте чистый звук без фонового шума, с оптимальной громкостью. Audio Signals являются важной частью оценки.
    • Используйте высокое разрешение и современные форматы. Разрешение (HD/SD) является входным признаком (Visual Signals, Metadata). Контент в высоком разрешении (1080p, 4K) с большей вероятностью получит высокий скор.
    • Обеспечивайте абсолютную грамотность окружающего текста. Патент указывает, что орфография и грамматика заголовков, описаний и комментариев (Text Signals) используются как признаки для оценки качества видео. Пишите грамотные и качественные тексты.
    • Используйте ПО для монтажа и сохраняйте метаданные. Использование editing software упоминается как признак. Обработанный контент может получить более высокую оценку. Также убедитесь, что технические метаданные (информация о камере) сохраняются при экспорте.

    Worst practices (это делать не надо)

    • Игнорирование технических дефектов. Загрузка контента с очевидными проблемами (трясущаяся камера, размытое изображение, плохое освещение, артефакты сжатия, плохой звук) приведет к низкому Production Quality Score и ухудшит ранжирование.
    • Массовое создание низкокачественного контента. Стратегии, основанные на объеме, а не на качестве продакшена, неэффективны, так как система фильтрует такой контент.
    • Низкое качество текстового сопровождения. Создание грамматически некорректных заголовков и описаний негативно скажется на оценке качества продакшена видео.

    Стратегическое значение

    Патент подтверждает, что для успешного продвижения мультимедийного контента недостаточно только релевантности содержания. Техническое качество (Production Quality) является критически важным сигналом, влияющим как на ранжирование, так и на монетизацию. В конкурентных нишах высокое качество производства может стать решающим фактором для занятия топовых позиций в поиске по видео и картинкам. Стратегия должна включать контроль технических стандартов создания контента.

    Практические примеры

    Сценарий: Ранжирование обучающего видео по ремонту

    1. Запрос: «Как починить протекающий кран».
    2. Кандидаты: Система находит два видео (А и Б) с одинаковой релевантностью и схожим содержанием.
    3. Анализ Видео А (Low Quality): Снято на старый телефон (480p), изображение трясется (высокий camera motion), освещение плохое, звук тихий и с эхом. Заголовок содержит грамматические ошибки (низкие Text Signals).
    4. Анализ Видео Б (High Quality): Снято на современную камеру (1080p), используется штатив (низкий camera motion), хорошее освещение, чистый звук с микрофона. Заголовок и описание грамотные (высокие Text Signals).
    5. Вычисление оценки: Система применяет Statistical Model. Признаки Видео Б получают высокие веса. Видео Б получает значительно более высокий Production Quality Score, чем Видео А.
    6. Результат ранжирования: Используя Production Quality Score как фактор ранжирования, система повышает Видео Б в результатах поиска (в YouTube или блоке видео в Google Search) выше Видео А.

    Вопросы и ответы

    Чем отличается «Качество продакшена» (Production Quality) от «Качества контента» (Content Quality)?

    Production Quality относится к техническому исполнению: четкость изображения, стабильность камеры, освещение, качество звука, монтаж. Content Quality относится к содержанию: информативность, полезность, оригинальность материала. Патент фокусируется именно на автоматической оценке Production Quality и упоминает, что система может собирать данные о Content Quality отдельно, чтобы лучше разграничить эти два аспекта.

    Влияет ли качество заголовка и описания на Production Quality Score видео?

    Да, это важный вывод из патента. Система использует Text Signals – показатели качества (например, орфографию и грамматику) окружающего текста (заголовок, описание, комментарии) – как входные данные для оценки качества продакшена самого видео. Это подчеркивает важность грамотного текстового сопровождения.

    Насколько важно качество звука для оценки видео?

    Качество звука очень важно. Патент явно перечисляет Audio Signals (громкость, тембр, тон, темп и т.д.) как один из основных классов признаков, используемых моделью. Видео с плохим звуком получит низкий общий Production Quality Score, даже если визуальное качество высокое.

    Как система узнает, что считать «высоким качеством»?

    Система не определяет качество самостоятельно. Она обучается на основе тысяч примеров, оцененных людьми-асессорами. Асессорам показывают пары видео и спрашивают, какое из них технически лучше. Модель машинного обучения затем находит паттерны в технических признаках (например, низкая размытость, стабильная картинка), которые коррелируют с выбором асессоров.

    Какие технические характеристики видео наиболее важны согласно патенту?

    Патент не выделяет наиболее важные характеристики, так как их вес определяется системой машинного обучения. Однако он перечисляет ключевые визуальные сигналы: резкость, размытость, насыщенность, движение камеры (стабильность) и разрешение (HD/SD). Также важны аудиосигналы и метаданные (например, использование ПО для редактирования).

    Что такое Active Sampling и почему это важно?

    Active Sampling – это метод эффективного сбора данных. Вместо того чтобы показывать асессорам случайные пары видео, система старается показывать пары, которые ей сложнее всего различить (с близким качеством). Это позволяет быстрее собрать наиболее ценные данные и точнее настроить модель, экономя время асессоров.

    Применяется ли этот патент только к YouTube?

    Нет. Патент описывает механизм для количественной оценки качества мультимедиа в целом (видео, аудио, изображения). Хотя YouTube является очевидным примером применения, описанные механизмы, вероятно, используются также в Google Images, Google Video Search и при ранжировании мультимедийных результатов в универсальном поиске Google.

    Влияет ли Production Quality Score на рекламу и монетизацию?

    Да, патент прямо заявляет, что Production Quality Score используется для определения мест размещения рекламы и дифференциации цен. Рекламодатели могут выбирать, с каким уровнем качества контента они хотят ассоциироваться. Размещение рекламы на видео с высоким качеством продакшена может стоить дороже, что выгодно авторам качественного контента.

    Учитывает ли система пользовательские клики для оценки качества?

    Да, патент упоминает Implicit Sampling. Если пользователю показывают страницу результатов поиска и он кликает на определенное видео, этот клик может рассматриваться как сигнал, указывающий на качество. Также анализируются действия пользователей по улучшению видео в редакторах (например, применение стабилизации).

    Влияют ли комментарии под видео на его оценку качества продакшена?

    Да, согласно патенту. Качество текста (орфография и грамматика) в комментариях анализируется как часть Text Signals, наряду с заголовком и описанием. Большое количество некачественных или спамных комментариев может негативно повлиять на общий Production Quality Score видео.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.