Как Google использует машинное обучение и обратную связь для понимания субъективного восприятия контента (например, «смешное видео»)

Google использует сигналы взаимодействия пользователей (комментарии, лайки, плейлисты) для определения субъективных характеристик контента, таких как «смешной» или «вдохновляющий». Система обучает классификатор связывать объективные признаки контента (визуальные, аудио, текстовые) с этими субъективными атрибутами. Затем она предсказывает, как конкретный пользователь воспримет новый контент, и использует его обратную связь для переобучения модели.

Описание

Какую задачу решает

Патент решает проблему автоматической классификации контента (в частности, видео) по субъективным признакам, отражающим человеческое восприятие, настроение или мнение (например, «смешной», «милый», «вдохновляющий»). Стандартные методы анализа часто не могут уловить эти нюансы. Система стремится понять субъективное значение контента для улучшения поиска, рекомендаций и персонализации, а также уточнить это понимание на уровне отдельного пользователя с помощью механизма обратной связи.

Что запатентовано

Запатентована система машинного обучения, которая использует Curation Signals (сигналы курирования или реакции пользователей) для обучения классификатора (Classifier). Эта модель учится предсказывать Subjective Attributes (субъективные атрибуты) контента на основе его объективных признаков (Feature Vector). Ключевым аспектом является механизм персонализации и обратной связи: система уточняет предсказания для конкретного пользователя и использует его несогласие (Negative Signal) для переобучения классификатора.

Как это работает

Система работает в несколько этапов:

Сбор данных и Определение атрибутов: Анализируются реакции пользователей (комментарии, лайки, добавление в плейлисты) на существующий контент для выявления Subjective Attributes и расчета их релевантности (Relevancy Scores).
Извлечение признаков: Из самого контента извлекаются объективные признаки (визуальные, аудио, текстовые характеристики), формируя Feature Vector.
Обучение: Классификатор обучается находить корреляцию между Feature Vector (вход) и Relevancy Scores (выход).
Предсказание: Для нового контента система генерирует Feature Vector и использует обученный классификатор для предсказания его субъективных атрибутов.
Обратная связь и Переобучение: Предсказанные атрибуты предлагаются пользователю. Если пользователь отклоняет предложенный атрибут как нерелевантный, система использует этот контент как отрицательный пример (Negative Signal) и переобучает классификатор для уточнения модели, в том числе персонально для этого пользователя.

Актуальность для SEO

Высокая. Понимание намерений пользователей и субъективного качества контента является центральной задачей современных поисковых и рекомендательных систем. Этот патент (являющийся продолжением более ранней заявки и опубликованный в 2022 г.) описывает конкретный механизм для интерпретации UGC (User-Generated Content), особенно видео (YouTube), и критически важен для систем рекомендаций (например, Google Discover), где необходимо предсказать субъективную реакцию пользователя и адаптироваться к его обратной связи.

Важность для SEO

Патент имеет высокое значение (8.5/10), особенно для видео-SEO (YouTube) и продвижения контента на платформах UGC и в рекомендательных системах. Он показывает, как Google систематически использует сигналы вовлеченности пользователей не просто как фактор ранжирования, а как обучающие данные для понимания семантики контента за пределами объективных данных. Это подчеркивает важность качества продакшена и стимулирования естественного взаимодействия для правильной классификации контента системой.

Детальный разбор

Термины и определения

Curation Signals / User Reactions (Сигналы курирования / Реакции пользователей): Действия пользователей в отношении контента. Включают комментарии, демонстрацию одобрения (Like!, +1), шеринг, добавление в закладки (bookmarking), добавление в плейлисты (playlisting). Используются как обучающие данные.
Subjective Attributes (Субъективные атрибуты): Описательные термины, отражающие человеческое восприятие, мнение, настроение или вкус (например, «смешной», «милый», «вдохновляющий», «скучный»).
Entity (Сущность / Единица контента): Объект классификации. Описание упоминает медиа клипы, изображения, статьи, блоги, людей, организации. Claims данного патента фокусируются на Video Item (видео элемент).
Feature Vector (Вектор признаков): Набор объективных, измеримых характеристик Entity. Для видео/изображений: цвет, текстура, интенсивность. Для аудио: амплитуда, спектральные коэффициенты. Для текста: частотность слов, длина предложений. Также может включать метаданные.
Classifier (Классификатор): Модель машинного обучения (например, SVM, AdaBoost, нейронная сеть, дерево решений), обученная предсказывать Relevancy Scores для Subjective Attributes на основе Feature Vector.
Relevancy Score (Оценка релевантности): Числовая оценка (например, от 0.0 до 1.0), указывающая, насколько сильно данный Subjective Attribute связан с Entity. Рассчитывается на основе частоты и контекста User Reactions.
Negative Signal / Negative Example (Отрицательный сигнал / Отрицательный пример): Обратная связь от пользователя, указывающая, что предсказанный системой Subjective Attribute нерелевантен для данного контента. Используется для переобучения (Retraining) классификатора.
Subjective Attribute Vocabulary (Словарь субъективных атрибутов): Набор терминов, используемых для классификации. Генерируется вручную, автоматически или комбинированным способом.

Ключевые утверждения (Анализ Claims)

Патент US11328218B1 является продолжением (continuation) более ранней заявки и фокусируется на обучении классификатора для видео, с ключевым акцентом на персонализации и переобучении на основе обратной связи.

Claim 1 (Независимый пункт): Описывает метод машинного обучения для предсказания субъективных атрибутов видео и его персонализации.

Определение множества Subjective Attributes для первого видео на основе реакций пользователей.
Определение Relevancy Scores для этих атрибутов.
Получение первого набора признаков (Feature Vector) для первого видео.
Обучение Classifier. Вход: признаки первого видео. Целевой выход: Relevancy Scores.
Предоставление второго набора признаков (от второго видео) на вход обученному классификатору.
Получение выхода классификатора: предсказанные Relevancy Scores для Subjective Attributes второго видео. Ключевое уточнение: эти оценки представляют релевантность атрибутов для конкретного пользователя.
Получение ввода от этого конкретного пользователя, указывающего, что предсказанные атрибуты не релевантны для него.
Переобучение (Retraining) классификатора, используя второе видео как Negative Signal (отрицательный сигнал), соответствующий этому конкретному пользователю.

Ядро изобретения — это система ML, которая соединяет объективные характеристики видео с субъективным восприятием пользователей и включает механизм персонализированной корректировки модели через явную обратную связь.

Зависимые пункты (Claims 2-9): Детализируют источники данных и методы расчета.

Claims 2, 3: Определение атрибутов может основываться на шеринге видео (Claim 2) или добавлении его в плейлисты (Claim 3).
Claims 4, 6, 7: Relevancy Score может основываться на количестве закладок (Claim 4), количестве появлений атрибута в комментариях (Claim 6) или общем количестве комментариев (Claim 7).
Claim 9: Реакция пользователя отражает его настроение, вкус или отношение (sentiment).

Где и как применяется

Изобретение применяется на нескольких этапах обработки данных, преимущественно в системах, управляющих большими объемами UGC, таких как YouTube или Google Discover.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые процессы:

Извлечение объективных признаков: Система анализирует сырой контент (видео, аудио, текст) для генерации Feature Vector.
Анализ Curation Signals (Офлайн/Периодически): Обработка накопленных реакций пользователей (комментарии, лайки, плейлисты) для расчета Subjective Attributes и Relevancy Scores.
Обучение Классификатора (Офлайн/Периодически): Происходит обучение и переобучение Classifier, используя извлеченные признаки и рассчитанные субъективные оценки.
Предсказание (Новый контент): При индексации нового контента система использует обученный Classifier для предсказания его субъективных атрибутов на основе его Feature Vector. Эти атрибуты сохраняются в индексе.

QUNDERSTANDING – Понимание Запросов
Система может использовать Subjective Attribute Vocabulary для лучшего понимания запросов с субъективным интентом (например, «вдохновляющие речи»).

RERANKING – Переранжирование (Персонализация)
Предсказанные оценки релевантности адаптируются для конкретного пользователя (Claim 1), влияя на ранжирование в персонализированной выдаче или рекомендациях. Механизм обратной связи (Negative Signal) используется здесь для сбора данных для переобучения.

На что влияет

Конкретные типы контента: В первую очередь видеоконтент (Video Items), как указано в Claims. Также применимо к изображениям, аудио, статьям, блогам и отзывам о бизнесе (Local SEO), согласно описанию.
Специфические запросы: Запросы, где важна субъективная оценка или настроение (например, «смешные видео про собак», «расслабляющая музыка», «уютное кафе»).
Ниши: Наибольшее влияние в нишах с высоким уровнем UGC и сильной эмоциональной составляющей (развлечения, хобби, обзоры).

Когда применяется

Триггеры активации (Обучение): Наличие достаточного объема контента с Curation Signals для формирования обучающей выборки.
Триггеры активации (Предсказание): Индексация нового контента, требующего классификации.
Триггеры активации (Переобучение): Получение явной обратной связи от пользователя (например, удаление предложенного тега или атрибута), что генерирует Negative Signal.

Пошаговый алгоритм

Алгоритм состоит из трех основных фаз: Обучение, Предсказание и Уточнение/Переобучение.

Фаза 1: Обучение классификатора (Офлайн-процесс)

Генерация словаря: Создание Subjective Attribute Vocabulary.
Обработка обучающей выборки: Для каждого объекта (например, видео) в выборке:
1. Анализ реакций: Идентификация Subjective Attributes на основе User Reactions (анализ комментариев, плейлистов и т.д.).
2. Расчет оценок: Определение Relevancy Scores для каждого атрибута (например, на основе частоты упоминаний или авторитетности пользователей).
3. Извлечение признаков: Генерация Feature Vector из самого объекта (анализ визуальных, аудио, текстовых характеристик).
4. Формирование примера: Создание пары (Feature Vector, Relevancy Scores).
Обучение модели: Обучение Classifier на сформированном наборе данных для предсказания оценок релевантности на основе признаков.

Фаза 2: Предсказание атрибутов (Индексация/Онлайн)

Получение объекта: Поступление нового объекта в систему.
Извлечение признаков: Генерация Feature Vector.
Классификация: Подача Feature Vector на вход обученному Classifier.
Получение результата: Получение предсказанных Subjective Attributes и их Relevancy Scores.
Индексация: Ассоциация предсказанных атрибутов с объектом.

Фаза 3: Уточнение, Персонализация и Переобучение

Предложение пользователю: Предложение предсказанных атрибутов пользователю.
Получение обратной связи: Получение уточненного набора атрибутов от пользователя (удаление или добавление).
Анализ обратной связи: Если пользователь удалил предложенный атрибут:
1. Система фиксирует это как указание на нерелевантность для данного пользователя.
2. Объект сохраняется как Negative Example (отрицательный пример) для удаленного атрибута.
Переобучение: Использование полученной обратной связи (Negative Signal) для периодического переобучения и персонализации Classifier.

Какие данные и как использует

Данные на входе

Система использует два основных типа данных: объективные характеристики контента и субъективные реакции пользователей.

Контентные и Мультимедиа факторы (Объективные, для Feature Vector):
- Визуальные признаки: цвет, текстура, интенсивность (для видео и изображений).
- Аудио признаки: амплитуда, спектральные коэффициенты (для видео и аудио).
- Текстовые признаки: частотность слов, средняя длина предложения, параметры форматирования (для текста или метаданных).
Поведенческие факторы (Curation Signals, для обучения):
- Текст комментариев и отзывов.
- Сигналы одобрения (Like!, Dislike!, +1).
- Шеринг контента.
- Добавление в закладки (Bookmarking).
- Добавление в плейлисты (Playlisting).
Пользовательские факторы (для персонализации и переобучения):
- Явная обратная связь пользователя о предложенных атрибутах (удаление как Negative Signal).
- Авторитетность пользователя (упоминается, что реакции некоторых пользователей могут иметь больший вес при расчете Relevancy Score).

Какие метрики используются и как они считаются

Relevancy Score (Оценка релевантности): Ключевая метрика. Рассчитывается для пары (Атрибут, Контент). Может быть нормализована от 0.0 до 1.0. Расчет основывается на:
- Частоте появления атрибута в комментариях.
- Пропорции комментариев, содержащих атрибут.
- Количестве сигналов курирования (лайки, плейлисты, закладки).
Default Relevancy Score: Оценка (например, 1.0), присваиваемая атрибутам, добавленным пользователем вручную в процессе обратной связи.
Алгоритмы машинного обучения: Используется Classifier. В патенте упоминаются Support Vector Machines (SVM), AdaBoost, нейронные сети, деревья решений.
Методы анализа текста (NLP): Используются для обработки комментариев и сопоставления их с Subjective Attribute Vocabulary.
Методы извлечения признаков: Используются для генерации Feature Vector. Упоминаются техники вроде Principal Components Analysis (PCA).

Выводы

Мост между объективными данными и субъективным восприятием: Патент описывает механизм, позволяющий Google автоматически понимать субъективные характеристики контента («смешной», «полезный») путем обучения ML-моделей связывать объективные признаки (визуальные, аудио, текстовые) с массовыми реакциями пользователей.
Curation Signals как источник истины (Ground Truth): Сигналы вовлеченности (комментарии, лайки, плейлисты, шеры) являются основным источником данных для обучения системы пониманию субъективного значения контента.
Предсказание для нового контента: Система может классифицировать новый контент еще до того, как он наберет достаточное количество реакций, используя обученный Classifier, что критично для масштабирования рекомендательных систем.
Персонализация субъективности: Claim 1 явно указывает, что система не просто определяет общие атрибуты, но и оценивает их релевантность для *конкретного пользователя*, моделируя индивидуальные вкусы.
Цикл обратной связи и Negative Signals: Система активно использует обратную связь (особенно отрицание предложенных атрибутов) для переобучения и уточнения модели. Это делает классификатор более точным и адаптивным.
Фокус на видео: Хотя технология применима шире, защищенное изобретение в этом патенте сосредоточено на видеоконтенте (Video Items), что подчеркивает важность этих механизмов для YouTube и Google Video Search.

Практика

Best practices (это мы делаем)

(YouTube/Video SEO) Оптимизация объективных признаков (Feature Vector): Создавайте контент, который визуально и аудиально соответствует желаемым субъективным атрибутам. Если вы хотите, чтобы видео считалось «профессиональным» или «расслабляющим», используйте соответствующие технические приемы (освещение, звук, темп монтажа). Классификатор улавливает эти объективные признаки и использует их для классификации.
Стимулирование естественного взаимодействия (Curation Signals): Активно мотивируйте пользователей оставлять осмысленные комментарии, делиться контентом и добавлять его в тематические плейлисты. Эти сигналы являются ключевыми обучающими данными для Classifier. Чем точнее реакции отражают суть контента, тем лучше система его классифицирует.
(Local SEO) Работа с отзывами и атрибутами: Анализируйте текст отзывов на предмет часто встречающихся субъективных описаний (например, «уютная атмосфера»). Убедитесь, что визуальный контент (фотографии бизнеса) подкрепляет эти атрибуты. Google может использовать отзывы для обучения классификатора, который затем будет оценивать ваш бизнес.
Активное управление обратной связью: На платформах, где Google предоставляет инструменты обратной связи (например, управление тегами в YouTube Studio или атрибутами в Google Business Profile), активно используйте их. Удаление нерелевантных предложений служит Negative Signal для переобучения системы.

Worst practices (это делать не надо)

Накрутка поведенческих факторов и комментариев: Искусственное генерирование комментариев или лайков для манипуляции Subjective Attributes. Система ищет естественную корреляцию между Feature Vector контента и реакциями. Аномальные паттерны реакций, не соответствующие контенту, вероятно, будут отфильтрованы или могут привести к некорректному обучению.
Игнорирование мультимедийных аспектов: Полагаться исключительно на текстовую оптимизацию для видео или изображений рискованно. Если объективные признаки контента (визуальное качество, звук) не соответствуют заявленной теме, классификатор может присвоить нежелательные субъективные атрибуты.
Кликбейт и несоответствие контента: Создание контента, который провоцирует реакции, не соответствующие его сути. Это может привести к негативной классификации или генерации массовых Negative Signals от пользователей, когда они будут отклонять контент или связанные с ним атрибуты в рекомендациях.

Стратегическое значение

Патент подтверждает стратегию Google на глубокое понимание контента за пределами ключевых слов, стремясь моделировать человеческое восприятие и вкус. Для долгосрочной SEO-стратегии это означает необходимость интеграции качественного продакшена и анализа пользовательского опыта. Вовлеченность пользователей становится не просто метрикой успеха, а способом активного «обучения» алгоритмов Google о том, как следует классифицировать ваш контент и контент вашей ниши.

Практические примеры

Сценарий: Оптимизация обучающего видео по кулинарии (Video SEO) для атрибутов «Простой» (Easy) и «Быстрый» (Quick)

Анализ (Curation Signals): SEO-специалист анализирует популярные видео и замечает, что пользователи часто используют слова «просто», «легко» в комментариях и добавляют их в плейлисты типа «Рецепты для новичков».
Создание контента (Feature Vector): Видео создается с учетом объективных признаков, коррелирующих с этими атрибутами: яркое освещение, короткие и четкие инструкции, быстрый темп монтажа, позитивная фоновая музыка.
Стимулирование взаимодействия: В конце видео автор просит зрителей написать в комментариях, было ли им легко следовать рецепту.
Результат (Обучение и Предсказание): Система анализирует объективные признаки (Feature Vector) и первые реакции пользователей (Curation Signals). Classifier присваивает атрибуты «простой» и «быстрый» видео, увеличивая его шансы на ранжирование по соответствующим запросам и попадание в рекомендации для начинающих кулинаров.

Вопросы и ответы

Что такое «Субъективные атрибуты» в контексте этого патента?

Это термины, описывающие контент с точки зрения человеческого восприятия, вкуса или мнения, например, «смешной», «вдохновляющий», «скучный» или «полезный». В отличие от объективных фактов (например, длительность видео), эти атрибуты сложно извлечь напрямую из контента без анализа реакции аудитории или использования обученных ML-моделей.

Как Google определяет эти субъективные атрибуты для нового контента без комментариев?

В этом суть изобретения. Система обучается на старом контенте, находя связь между его объективными признаками (визуальными, аудио – Feature Vector) и реакциями пользователей. Для нового контента система анализирует только его Feature Vector и использует обученный классификатор для предсказания атрибутов, предполагая, что похожий контент вызовет похожие реакции.

Что такое «Curation Signals» и почему они важны для SEO?

Curation Signals — это действия пользователей: комментарии, лайки, шеры, добавление в закладки и плейлисты. Они критически важны, так как выступают как основной источник данных (ground truth) для обучения ML-моделей пониманию субъективного значения контента. Активное и естественное взаимодействие помогает Google точнее классифицировать ваш контент.

Насколько важен аспект персонализации в этом патенте (Claim 1)?

Он критически важен. Субъективное восприятие различается у разных людей. Патент описывает механизм, где система адаптирует свои предсказания для конкретного пользователя. Если пользователь указывает, что предсказанный атрибут неверен (например, удаляет тег «смешно»), система использует это как Negative Signal для переобучения персонализированной модели восприятия.

Что такое «Negative Signal» и как он используется?

Negative Signal (отрицательный сигнал) возникает, когда система предсказывает атрибут, а пользователь явно его отклоняет (например, удаляет предложенный тег или нажимает «Не интересует» на рекомендации). Система использует этот контент как отрицательный пример для данного атрибута при переобучении (Retraining) классификатора, чтобы в будущем делать более точные предсказания.

Влияет ли этот патент только на видеоконтент?

Claims (формула изобретения) данного патента сфокусированы на Video Items. Однако в описании патента упоминается, что технология может применяться к более широкому спектру контента (изображения, статьи, блоги) и сущностям (организации, люди). Логично предположить, что подобные механизмы используются Google повсеместно, но для видео они наиболее детализированы.

Как SEO-специалист может повлиять на Feature Vector своего контента?

Через качество продакшена. Для видео это означает работу над освещением, качеством звука, монтажом, визуальным стилем. Для статей — над структурой, форматированием, качеством изображений. Создавая контент, который технически соответствует лучшим практикам в нише, вы формируете Feature Vector, который система с большей вероятностью свяжет с положительными субъективными атрибутами.

Поможет ли накрутка комментариев или лайков обмануть эту систему?

Это рискованно и неэффективно в долгосрочной перспективе. Система ищет естественную корреляцию между самим контентом и реакциями. Если искусственно сгенерированные сигналы противоречат реальному восприятию пользователей (что может проявиться через Negative Signals) или имеют аномальный паттерн, система может скорректировать классификацию или пессимизировать контент за манипуляции.

Учитывает ли система авторитетность пользователя, который оставляет реакцию?

Да, в патенте упоминается, что при расчете Relevancy Score может учитываться вес пользователя. Например, комментарии или действия (добавление в плейлист) от пользователя, который считается авторитетом в определенной теме или который в прошлом демонстрировал точность в оценках, могут иметь больший вес.

Каково значение этого патента для Google Discover и YouTube рекомендаций?

Значение критически высокое. Рекомендательные системы сильно зависят от понимания интересов пользователя и характеристик контента. Способность автоматически классифицировать контент по субъективным атрибутам (например, «вдохновляющий», «расслабляющий») позволяет точнее подбирать контент под настроение и интент пользователя, повышая вовлеченность.