Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google автоматически создает и персонализирует Web Stories для живых событий в реальном времени

    SYSTEMS AND METHODS FOR GENERATING STORIES FOR LIVE EVENTS USING A SCALABLE PIPELINE (Системы и методы генерации историй для живых событий с использованием масштабируемого конвейера)
    • US20250061144A1
    • Google LLC
    • 2025-02-20
    • 2022-07-21
    2022 Мультимедиа Мультиязычность Патенты Google Персонализация

    Google использует масштабируемый конвейер для автоматического создания мультимедийного контента (Web Stories) о живых событиях в реальном времени. Система обнаруживает важные события, запрашивает медиаданные у поставщиков, персонализирует контент для разных групп пользователей (язык, интересы), автоматически выбирает шаблоны и генерирует визуально богатые истории для распространения через свои платформы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему медленного, дорогостоящего и трудоемкого ручного курирования контента, особенно в контексте живых событий (live events), где информация быстро устаревает. Он направлен на автоматическое преобразование доступного контента в иммерсивные, мультимедийные форматы (истории/Stories) в масштабе и в реальном времени. Цель — обеспечить доступность актуального контента в различных форматах, на разных языках и интерфейсах для глобальной аудитории.

    Что запатентовано

    Запатентована система и масштабируемый конвейер (scalable pipeline) для автоматической генерации мультимедийных историй о живых событиях. Система отслеживает публичные данные для обнаружения текущих событий, запрашивает медиа-активы у поставщиков, кастомизирует контент для различных групп пользователей (например, через перевод, локализацию и интеллектуальную обрезку медиа с использованием ML) и использует механизм выбора шаблонов для автоматической сборки и распространения контента.

    Как это работает

    Система работает по следующему алгоритму:

    • Обнаружение событий: Мониторинг публичных данных (соцсети, новости) для выявления популярных тем (popular topics) и определения важных текущих событий (currently occurring live event). Также может работать по расписанию.
    • Сбор данных: Автоматический и периодический запрос медиаданных (media data), включая изображения, видео, текст и нарративные метаданные, у поставщиков контента.
    • Кастомизация: Адаптация медиаданных для групп пользователей (user groups). Это включает перевод текста и трансформацию медиа, например, «умную обрезку» изображений с использованием ML-модели для расчета Aesthetic Score и сохранения важных частей кадра (Salient Portions).
    • Выбор шаблонов: Выбор Page Templates или Story Templates на основе типа события, доступных медиа-активов и результатов кастомизации (например, длины переведенного текста).
    • Генерация контента: Автоматическое создание контентных страниц (например, HTML) путем слияния кастомизированных данных и выбранных шаблонов.
    • Распространение и ранжирование: Предоставление сгенерированных историй пользователям, при этом истории ранжируются на основе важности события, актуальности (recency), интересов и местоположения пользователя.

    Актуальность для SEO

    Высокая. Автоматизация создания контента и продвижение формата Web Stories являются ключевыми направлениями для Google, особенно на мобильных устройствах и в таких платформах, как Google Discover. Описанный механизм позволяет Google быстро реагировать на тренды и живые события, создавая визуально привлекательный контент в масштабе, что критически важно в 2025 году.

    Важность для SEO

    Патент имеет высокое стратегическое значение для SEO (8/10). Хотя он не описывает ранжирование сторонних сайтов в основном веб-индексе, он раскрывает инфраструктуру, позволяющую Google автоматически генерировать собственный контент (Web Stories) для удовлетворения спроса на информацию о живых событиях. Это напрямую влияет на видимость контента в Google Discover и специализированных блоках SERP (например, Top Stories), создавая конкуренцию традиционным издателям и подчеркивая важность формата Stories как точки входа трафика.

    Детальный разбор

    Термины и определения

    Aesthetic Score (Эстетическая оценка)
    Метрика, генерируемая с помощью модели машинного обучения (machine-learned model) для оценки визуальной привлекательности, композиции и качества обрезанного изображения. Используется для выбора наилучшего варианта изображения.
    Content Page (Контентная страница)
    Единица контента, сгенерированная на основе медиаданных и шаблона. Может быть частью многостраничной истории (multi-page story).
    Customization System (Система кастомизации)
    Компонент, отвечающий за адаптацию медиаданных под требования шаблонов и характеристики групп пользователей. Включает перевод текста и трансформацию медиа (обрезка, изменение размера).
    Live Event (Живое событие)
    Текущее событие (спортивное соревнование, выборы, погодное явление и т.д.), для которого система генерирует контент в реальном времени.
    Narrative Metadata (Нарративные метаданные)
    Структурированные данные о ходе события (например, голы, ключевые моменты), получаемые от Source Narrative Provider и используемые для формирования повествования истории.
    Page Template / Story Template (Шаблон страницы / Шаблон истории)
    Структуры данных, описывающие макет контентной страницы или последовательность страниц для многостраничной истории, включая расположение, размер и тип медиа-активов.
    Salient Portions (Значимые части)
    Важные элементы изображения (ключевые фигуры, текст, объекты), которые идентифицируются системой и должны быть сохранены при автоматическом кадрировании.
    Scalable Pipeline (Масштабируемый конвейер)
    Архитектура системы, позволяющая автоматически генерировать контент для большого количества событий и пользователей в реальном времени.
    User Groups (Группы пользователей)
    Сегменты аудитории, объединенные общими характеристиками (язык, страна, интересы, тип устройства), для которых контент кастомизируется и ранжируется.

    Ключевые утверждения (Анализ Claims)

    Анализ основан на Claims 21-40, представленных в документе (так как это продолжение заявки, Claims 1-20 отменены).

    Claim 21 (Независимый пункт): Описывает основной процесс автоматической генерации контента, инициированный мониторингом внешних данных.

    1. Система отслеживает (monitoring) общедоступные данные через сеть.
    2. На основе этих данных определяется текущее живое событие (currently occurring live event).
    3. Система запрашивает медиаданные, связанные с этим событием.
    4. Выбираются один или несколько шаблонов страниц (page templates) на основе события.
    5. Генерируются контентные страницы на основе медиаданных и шаблонов.
    6. Сгенерированные страницы передаются множеству пользователей.

    Ядром изобретения является автоматизация всего процесса: от обнаружения события в публичных источниках до генерации и распространения контента.

    Claim 22 (Зависимый от 21): Уточняет механизм определения события.

    1. Определение популярных тем (popular topics) на основе общедоступных данных.
    2. Определение того, что популярная тема связана с текущим живым событием.

    Система использует анализ трендов (популярности тем) как триггер для запуска генерации контента.

    Claim 23 (Зависимый от 22): Вводит фильтрацию по важности.

    1. Определение оценки важности (importance score) для события.
    2. Если оценка ниже порогового значения, данные о событии отбрасываются.

    Система фокусируется только на достаточно важных событиях, оптимизируя ресурсы.

    Claim 26 и 27 (Зависимые): Описывают процесс получения и кастомизации данных в реальном времени.

    1. Система автоматически запрашивает данные у стороннего поставщика и получает поток медиаконтента (stream of media content) (Claim 26).
    2. Контент выбирается из потока в реальном времени на основе актуальности (recency) И характеристик группы пользователей (Claim 27).
    3. Выбранный контент автоматически кастомизируется для этой группы пользователей (Claim 27), например, путем перевода (Claim 33) или обрезки изображений (Claim 34).

    Ключевой аспект — персонализация и локализация контента на лету с использованием внешних источников данных.

    Где и как применяется

    Этот патент описывает систему генерации контента, которая функционирует параллельно основному поисковому процессу, но взаимодействует с его этапами.

    CRAWLING – Сканирование и Сбор данных (Data Acquisition)
    Система активно собирает данные из двух основных источников:

    1. Мониторинг публичных данных: Отслеживание социальных сетей, новостных лент и других публичных источников для обнаружения живых событий и popular topics.
    2. Запрос медиа-активов: Периодические запросы к внутренним или сторонним поставщикам медиа (third-party media content provider) для получения изображений, видео, текста и narrative metadata.

    INDEXING – Индексирование и извлечение признаков (Конвейер обработки)
    Система выполняет процессы обработки медиа-активов:

    • Трансформация медиа: Обработка изображений и видео (обрезка, изменение размера).
    • Извлечение признаков (Feature Extraction): Использование ML-моделей для определения важных (salient) частей изображения и вычисления Aesthetic Score.
    • NLP: Обработка текста, включая автоматический перевод на разные языки.

    RANKING – Ранжирование (Внутреннее)
    Система имеет собственную логику ранжирования (Ranking System) для определения порядка показа сгенерированных историй пользователю. Ранжирование основано на:

    • Важности события (importance score).
    • Актуальности (recency).
    • Персонализации: интересы пользователя, местоположение, язык.

    METASEARCH – Метапоиск и Смешивание
    Сгенерированные истории интегрируются в выдачу через механизмы Метапоиска как специализированные блоки (SERP Features, карусели историй) или распространяются через платформы типа Google Discover.

    Входные данные:

    • Публичные данные (соцсети, новости).
    • Потоки медиа-активов и нарративных метаданных от поставщиков.
    • Характеристики групп пользователей (язык, интересы, локация).
    • База данных шаблонов (Template Data Store).

    Выходные данные:

    • Сгенерированные контентные страницы или многостраничные истории (например, в формате HTML).
    • Ранжированный список историй для конкретных пользователей или групп.

    На что влияет

    • Конкретные типы контента: Напрямую влияет на создание и распространение формата Web Stories (или аналогичных визуальных историй).
    • Специфические запросы: Влияет на выдачу по запросам, связанным с текущими событиями, трендами и популярными темами (QDF-запросы), особенно на мобильных устройствах.
    • Конкретные ниши или тематики: Наибольшее влияние в нишах с высокой событийностью: спорт, политика, развлечения, экстренные новости.

    Когда применяется

    • Триггеры активации:
      • Обнаружение текущего живого события (currently occurring live event) на основе анализа popular topics в публичных данных.
      • Событие должно превысить пороговое значение важности (threshold importance score).
      • Также активируется по расписанию для запланированных событий (например, Олимпиада).
    • Временные рамки: Применяется в реальном времени (real-time) или псевдо-реальном времени, пока событие продолжается. Частота запросов данных может адаптироваться (например, каждые 5 минут).

    Пошаговый алгоритм

    Процесс А: Обнаружение события и инициализация

    1. Мониторинг: Непрерывный мониторинг общедоступных данных (соцсети, новости) системой Event Detection.
    2. Анализ трендов: Определение популярных тем (popular topics).
    3. Идентификация события: Определение того, что популярная тема связана с живым событием.
    4. Оценка важности: Расчет Importance Score для события.
    5. Фильтрация и Планирование: Если Importance Score выше порога, Scheduler планирует периодические запросы данных и помещает их в Message Queue.

    Процесс Б: Генерация контента (Конвейер)

    1. Запрос данных: Выполнение запросов из очереди к поставщикам медиа (Source Media Provider) и нарратива (Source Narrative Provider).
    2. Получение данных: Получение медиа-активов и narrative metadata.
    3. Слияние данных (Data Fusion): Сопоставление медиа-активов с нарративом (например, фото гола с описанием гола).
    4. Кастомизация для групп пользователей:
      • Трансформация текста (Text Transforms): Перевод текста на языки целевых групп.
      • Трансформация медиа (Image Transforms / Smart Cropping):
        1. Идентификация кандидатов изображений.
        2. Обрезка кандидатов под требования потенциальных шаблонов.
        3. Фильтрация: удаление изображений, где обрезка повредила важные части (Salient Portions).
        4. Оценка: расчет Aesthetic Score для оставшихся кандидатов с помощью ML-модели.
        5. Выбор наилучшего изображения.
    5. Выбор шаблонов (Template Generation): Выбор или адаптация Page Templates на основе типа события и результатов кастомизации (например, адаптация под длину переведенного текста).
    6. Рендеринг (Templating Engine): Слияние кастомизированных медиа-активов и нарратива в выбранные шаблоны. Генерация HTML.
    7. Хранение и распространение: Загрузка контента в кэш (Content Cache / Unstructured Storage) и уведомление систем распространения (Story Distributor).

    Процесс В: Ранжирование и доставка

    1. Ранжирование (Ranking System): Оценка сгенерированных историй для конкретного пользователя/группы на основе интересов, локации и актуальности (Content Score).
    2. Доставка: Предоставление ранжированного списка историй на устройства пользователей.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Текст, полученный от поставщиков медиа (заголовки, описания, подписи). Narrative metadata.
    • Мультимедиа факторы: Изображения, видео и аудио. Критически важны метаданные изображений, описывающие содержание и расположение объектов/людей/текста в кадре (используются для определения Salient Portions).
    • Пользовательские факторы: Данные для сегментации User Groups: язык, страна проживания, интересы пользователя (user interest data), тип устройства.
    • Временные факторы: Актуальность (recency) медиаконтента и самого события.
    • Внешние данные: Общедоступные данные (publicly available data) из социальных сетей и новостных источников для обнаружения событий и оценки трендов.

    Какие метрики используются и как они считаются

    • Importance Score (Оценка важности): Метрика для оценки значимости живого события. Используется для фильтрации событий, для которых стоит генерировать контент. Расчет основан на анализе публичных данных и популярных тем.
    • Aesthetic Score (Эстетическая оценка): Метрика для оценки качества и привлекательности изображений после обрезки. Рассчитывается с помощью модели машинного обучения (machine-learned model).
    • Content Score (Оценка контента): Метрика для ранжирования сгенерированных историй (используется Ranking System). Учитывает важность события, актуальность, предполагаемый интерес пользователя и локацию. Упоминается, что оценка может ослабевать со временем (time decay).

    Выводы

    1. Google как автоматизированный издатель: Патент демонстрирует, как Google использует масштабируемую автоматизацию для создания собственного контента в ответ на живые события. Это позволяет покрывать тренды быстрее и дешевле, чем при ручном курировании, создавая прямую конкуренцию традиционным издателям.
    2. Web Stories как приоритетный формат: Описанный конвейер сфокусирован на генерации визуальных, иммерсивных историй. Это подтверждает стратегическую важность формата Stories для Google, особенно в контексте мобильного поиска и Discover.
    3. Обнаружение событий через тренды: Система полагается на мониторинг публичных данных и выявление popular topics для определения того, о чем создавать контент. Это подчеркивает важность анализа трендов в реальном времени.
    4. Глубокая персонализация и локализация: Контент не просто генерируется, он активно кастомизируется для User Groups на основе языка, местоположения и интересов. Это происходит на всех этапах: от выбора медиа до динамической адаптации шаблона и финального ранжирования.
    5. ML для оценки визуального качества: Использование Aesthetic Score, рассчитываемого ML-моделью, для выбора и обрезки изображений указывает на то, что Google алгоритмически оценивает визуальное качество и привлекательность контента.

    Практика

    Best practices (это мы делаем)

    Хотя патент описывает внутреннюю систему Google для генерации контента, он дает важные инсайты о том, какой контент Google считает качественным и как он подходит к освещению событий.

    • Инвестиции в формат Web Stories: Подтверждается важность использования формата Web Stories для освещения трендовых и живых событий. Необходимо создавать визуально богатый, быстро загружаемый контент в этом формате для повышения видимости в Discover и мобильном поиске.
    • Фокус на визуальном качестве (Aesthetic Quality): Google использует ML для оценки эстетики (Aesthetic Score). SEO-специалистам следует уделять первостепенное внимание качеству изображений и видео: высокой четкости, хорошей композиции и фокусу на ключевых объектах/людях. Изображения (особенно миниатюры) должны быть привлекательными и сохранять ключевую информацию (Salient Portions) даже после обрезки.
    • Ориентация на тренды и скорость реакции (QDF): Система Google запускается при обнаружении popular topics и работает в реальном времени. Издателям необходимо иметь инструменты для мониторинга трендов и быстро создавать контент по актуальным событиям, чтобы конкурировать с автоматически сгенерированным контентом.
    • Локализация и многоязычность: Патент подчеркивает важность перевода и адаптации контента для разных User Groups. Для глобальных проектов необходимо обеспечивать качественную локализацию контента (текста и визуала), учитывая местные интересы.
    • Четкая повествовательная структура (Narrative): Система Google использует Narrative Metadata для построения логичной истории. Собственные Web Stories также должны иметь четкую структуру и повествование, а не быть просто набором слайдов.

    Worst practices (это делать не надо)

    • Игнорирование формата Stories: Рассматривать Web Stories как второстепенный формат нецелесообразно, так как Google активно инвестирует в его автоматическую генерацию и распространение.
    • Использование низкокачественного визуала: Использование стоковых, нечетких или плохо скомпонованных изображений снижает конкурентоспособность контента, учитывая, что Google алгоритмически оценивает эстетическое качество.
    • Медленное освещение событий: Задержка в публикации контента о живых событиях может привести к потере трафика, так как Google быстро заполнит информационный вакуум автоматически сгенерированным контентом.
    • Публикация только длинных текстов: Полагаться исключительно на традиционные текстовые статьи для освещения событий неэффективно, так как патент направлен на переход к визуальным, иммерсивным форматам.

    Стратегическое значение

    Этот патент подчеркивает переход Google от роли чистого агрегатора к роли автоматизированного создателя контента, особенно в быстро меняющихся нишах (Live Events). Для SEO-стратегии это означает необходимость конкурировать не только с другими издателями, но и с самим Google. Долгосрочная стратегия должна включать развитие сильных визуальных форматов (в частности, Web Stories) и повышение скорости реакции на события. Также это подтверждает глобальный тренд на глубокую персонализацию контента и его доставки.

    Практические примеры

    Сценарий: Оптимизация Web Stories для спортивного события

    1. Мониторинг трендов: Отслеживание популярных игроков и ключевых моментов матча в реальном времени (аналогично тому, как Google ищет popular topics).
    2. Создание визуала и миниатюр: Подготовка высококачественных изображений ключевых моментов. При создании миниатюр (thumbnails/постеров) необходимо убедиться, что фокус сохраняется на главном действии или популярном игроке (аналогично механизму Aesthetic Score и сохранению Salient Portions). Это повысит CTR в Discover.
    3. Структура истории: Использование разнообразных шаблонов для поддержания интереса и построение четкого нарратива (например, страница на каждый гол). Включение страниц со статистикой и профилями игроков (как показано на FIG. 8 в патенте).
    4. Локализация: Если аудитория международная, быстро подготовить версии истории на разных языках и с акцентом на игроков, популярных в конкретных регионах (аналогично кастомизации для User Groups).
    5. Ожидаемый результат: Повышение вероятности ранжирования в Google Discover и каруселях Stories в поиске за счет соответствия критериям качества, актуальности и визуальной привлекательности, которые Google применяет в своей собственной системе генерации.

    Вопросы и ответы

    Означает ли этот патент, что Google создает собственный контент и конкурирует с издателями?

    Да, именно так. Патент описывает инфраструктуру, позволяющую Google автоматически генерировать полноценные мультимедийные истории (Web Stories) о живых событиях в масштабе. Этот контент напрямую удовлетворяет интент пользователя и конкурирует за внимание в поисковой выдаче и Google Discover с контентом, созданным традиционными издателями и новостными сайтами.

    Что такое «Aesthetic Score» и как он влияет на SEO?

    Aesthetic Score — это метрика, рассчитываемая ML-моделью для оценки визуальной привлекательности изображения, особенно после его обрезки. Хотя это внутренняя метрика данного конвейера, это указывает на то, что Google алгоритмически оценивает качество визуала. Для SEO это означает, что использование высококачественных, хорошо скомпонованных и привлекательных изображений критически важно, особенно в Web Stories и для попадания в Discover.

    Как система определяет, о каких событиях создавать истории?

    Система использует два метода. Во-первых, она работает по расписанию для запланированных событий. Во-вторых, она постоянно мониторит общедоступные данные (социальные сети, новости) для выявления popular topics (трендов). Если тренд связан с живым событием и превышает порог важности (Importance Score), система запускает генерацию контента.

    Насколько важна скорость реакции издателей (QDF) в свете этого патента?

    Скорость реакции становится критически важной. Поскольку система Google работает в автоматическом режиме и в реальном времени (упоминается выбор контента на основе recency), она может очень быстро генерировать контент по горячим темам. Издателям необходимо максимально ускорить свои процессы, чтобы успеть занять нишу.

    Какую роль играет персонализация в этом патенте?

    Персонализация играет центральную роль. Система активно кастомизирует контент для разных User Groups. Это включает перевод текста, выбор медиа-активов на основе интересов группы, адаптацию шаблонов под длину текста на разных языках. Финальное ранжирование историй также зависит от местоположения, языка и интересов пользователя.

    Стоит ли мне инвестировать в Web Stories, основываясь на этом патенте?

    Да. Патент демонстрирует значительные инвестиции Google в инфраструктуру для создания и распространения формата Stories. Это подтверждает, что данный формат является стратегическим приоритетом. Создание качественных Web Stories повышает шансы на получение трафика из Discover и мобильного поиска.

    Как Google обрабатывает изображения в этой системе?

    Используется сложный процесс «умной обрезки» (Smart Cropping). Система определяет важные части изображения (Salient Portions), пробует разные варианты обрезки под шаблон, отфильтровывает неудачные варианты (где важное скрыто) и выбирает лучший вариант с помощью ML-модели, оценивающей Aesthetic Score.

    Откуда Google берет исходные данные для этих историй?

    Система запрашивает медиа-активы и нарративные данные у поставщиков. В патенте упоминается возможность использования как внутренних, так и сторонних поставщиков медиаконтента (third-party media content provider), таких как новостные агентства или спортивные лиги.

    Может ли эта система обновлять уже опубликованные истории?

    Да. Патент описывает возможность обновления существующих страниц (упоминается Page Update System в описании) или добавления новых страниц в многостраничную историю по мере поступления новой информации о текущем событии (например, изменении счета в матче).

    Какова основная угроза для SEO-специалистов, исходящая из этого патента?

    Основная угроза — это усиление Google как генератора контента (что ведет к Zero-Click или переходам на собственный контент Google). В нишах, связанных с живыми событиями, Google может мгновенно создавать качественное визуальное покрытие, перехватывая трафик, который ранее доставался сторонним издателям.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.