Google анализирует объем поисковых запросов, упоминания в социальных сетях и ссылки в онлайн-документах для выявления наиболее популярных цитат и сущностей внутри видеоконтента. Эти данные используются для выделения ключевых моментов и обогащения базы знаний, демонстрируя, как внешние сигналы определяют значимость контента.
Описание
Какую задачу решает
Патент решает проблему предоставления пользователям релевантной контекстной информации (например, популярных цитат или информации о сущностях) о медиаконтенте во время его просмотра. Система направлена на автоматическое выявление наиболее интересных или популярных фрагментов диалога (quotations) и сущностей (entities) в медиаконтенте и их представление пользователю, устраняя необходимость ручного поиска.
Что запатентовано
Запатентована система для идентификации воспроизводимого медиаконтента и представления связанных с ним популярных цитат и сводок. Ключевым аспектом изобретения являются методы определения популярности (popularity criteria) этих цитат и сущностей с использованием внешних сигналов, таких как поисковый трафик и активность в социальных сетях.
Как это работает
Система функционирует в двух режимах:
- Офлайн (Анализ популярности): Система анализирует веб-документы, социальные сети и логи поисковых запросов для выявления цитат и сущностей, связанных с медиаконтентом. Популярность рассчитывается на основе объема поисковых запросов (search query volume) и количества упоминаний. Эти данные сохраняются в репозитории сущностей (Entities Repository).
- Онлайн (Доставка пользователю): Система идентифицирует контент, который смотрит пользователь (часто через аудио-фингерпринтинг на втором устройстве). Она извлекает наиболее популярные цитаты из Entities Repository и отправляет их на устройство пользователя вместе с интерактивными элементами (affordances) для взаимодействия (например, поделиться или найти информацию).
Актуальность для SEO
Высокая. Хотя конкретная реализация «второго экрана», описанная в патенте, может варьироваться, лежащая в ее основе технология идентификации популярных сегментов, цитат и сущностей в медиаконтенте крайне актуальна. Эти механизмы тесно связаны с тем, как Google анализирует видео для поиска, выделения ключевых моментов (Key Moments), интеграции с Графом Знаний (Knowledge Graph) и анализа трендов.
Важность для SEO
Патент имеет значительное влияние на SEO, особенно в области Video SEO и понимания сущностей (Entity Understanding). Он не описывает алгоритмы ранжирования веб-страниц, но предоставляет явное подтверждение сигналов, которые Google использует для измерения интереса и популярности конкретных элементов внутри медиаконтента (поисковый объем, социальные сигналы, веб-упоминания). Это критически важно для разработки контент-стратегий и понимания того, как Google оценивает значимость сущностей.
Детальный разбор
Термины и определения
- Affordance (Аффорданс / Интерактивный элемент)
- Элемент пользовательского интерфейса, предоставляющий пользователю опции для взаимодействия с соответствующей цитатой или сущностью (например, кнопки «Поделиться», «Поиск»).
- Content fingerprint (Цифровой отпечаток контента)
- Компактное представление (сигнатура) аудио-, видеопотока или данных субтитров. Используется для идентификации медиаконтента и временной метки.
- Entity (Сущность)
- Любой отдельный объект, связанный с видеоконтентом. Примеры: названия, люди (актеры, персонажи), места, музыка, продукты, цитаты и награды.
- Entities Database / Repository (База данных / Репозиторий сущностей)
- Хранилище сущностей, связанных с видеоконтентом, включающее их взаимосвязи, метрики популярности и временные метки появления в контенте. Тесно связано с Knowledge Graph.
- Levels of Interest / Popularity metrics (Уровни интереса / Метрики популярности)
- Метрика, количественно определяющая популярность сущности или цитаты на основе агрегации внешних сигналов.
- Popularity criteria (Критерии популярности)
- Сигналы, используемые для определения Levels of Interest. Включают объем поисковых запросов, упоминания в социальных сетях и документах.
- Quotation (Цитата)
- Фрагмент устного диалога из видеоконтента, например, реплика или крылатая фраза.
- Subtitles data / Caption data (Данные субтитров)
- Текстовая транскрипция устного диалога в видеоконтенте. Используется для идентификации и сопоставления цитат с таймкодами.
Ключевые утверждения (Анализ Claims)
Патент включает несколько наборов утверждений, фокусирующихся на отображении популярных цитат (например, Claim 1) и генерации сводок сущностей.
Анализ Claim 1 (Независимый пункт): Описывает процесс идентификации и отображения популярных цитат.
- Обнаружение воспроизведения media content item на первом устройстве вблизи второго устройства.
- Идентификация этого media content item.
- Идентификация множества первых цитат (first quotations), связанных с этим контентом.
- Ключевое условие: эти цитаты определены как популярные на основе объема поисковых запросов (search query volume) для соответствующей цитаты в медиаконтенте.
- Передача на второе устройство этих популярных цитат и множества интерактивных элементов (quotation operation affordances) для взаимодействия с ними.
Ядром изобретения является выборочное отображение фрагментов, популярность которых измеряется через активность пользователей в поиске.
Анализ Claim 5 (Зависимый): Расширяет определение критериев популярности.
Критерии популярности (popularity criteria) дополнительно включают один или несколько из следующих факторов: совокупный объем поисковых запросов (aggregate search query volume), количество упоминаний цитаты в социальных сетях и количество документов предопределенных категорий, включающих эту цитату (number of documents of predefined categories).
Анализ Claim 6 (Зависимый): Вводит понятие популярности в реальном времени.
Критерии популярности могут включать один или несколько критериев реального времени (realtime criteria), что позволяет определять популярность цитат в реальном времени.
Где и как применяется
Изобретение затрагивает несколько этапов поисковой архитектуры, в основном связанных с обработкой данных, анализом популярности и доставкой функций пользователю.
CRAWLING – Сканирование и Сбор данных
Система сканирует и собирает данные из внешних источников: веб-документы (content hosts), социальные сети (social networks) и логи поисковых систем (search engines) для выявления упоминаний цитат и сущностей.
INDEXING – Индексирование и извлечение признаков
Это основной этап для офлайн-обработки:
- Извлечение и Ассоциация: Анализ собранных внешних документов и медиаконтента (субтитров/аудио). Сопоставление найденных цитат с конкретными media content items (например, путем сравнения с subtitles data) и таймкодами.
- Хранение: Сохранение цитат и сущностей, их взаимосвязей в Entities Database. Генерация Content Fingerprints для медиаконтента.
QUNDERSTANDING / RANKING (Анализ популярности)
Этот этап включает расчет и обновление метрик популярности:
- Расчет метрик: Определение popularity metrics (уровней интереса) для цитат и сущностей на основе собранных внешних сигналов (поисковые запросы, социальные упоминания, веб-упоминания).
- Анализ в реальном времени: Определение популярности в реальном времени для выявления трендов.
- Внутреннее ранжирование: Ранжирование цитат и сущностей по популярности для последующего отбора.
METASEARCH / RERANKING (Уровень представления)
Это этап доставки функции пользователю в реальном времени:
- Система идентифицирует контент по фингерпринту, полученному от пользователя.
- Извлекает Топ-N популярных цитат/сущностей (полученных на этапе RANKING), возможно, фильтруя их по близости к текущей временной метке.
- Доставляет эти данные и Affordances на клиентское устройство.
На что влияет
- Типы контента: В первую очередь влияет на видеоконтент (фильмы, телешоу, онлайн-видео) с устным диалогом.
- Сущности и данные: Влияет на то, как Google измеряет и понимает популярность конкретных сущностей (людей, продуктов) и фрагментов диалога (цитат) внутри этого контента.
- Ниши: Наиболее актуально для медиа, развлечений, новостей и любого контента, который генерирует активное обсуждение и поиск конкретных моментов.
Когда применяется
- Офлайн-процесс: Анализ популярности и индексация цитат/сущностей происходят непрерывно по мере сканирования внешних источников и обработки медиаконтента.
- Триггер активации (в реальном времени): Система представления активируется, когда обнаруживается воспроизведение идентифицируемого медиаконтента вблизи пользователя, у которого есть совместимое устройство (например, в рамках Google Assistant или подобных сервисов).
Пошаговый алгоритм
Процесс А: Офлайн-индексация и анализ популярности цитат
- Сбор данных: Сканирование множества документов (веб-страницы, социальные сети) и сбор логов поисковых запросов.
- Идентификация цитат: Анализ документов для выявления потенциальных цитат, связанных с медиаконтентом.
- Ассоциация с контентом: Идентификация конкретных media content items, в которых были произнесены эти цитаты. Это включает сопоставление цитат с subtitles data (данными субтитров) соответствующего контента.
- Расчет популярности: Определение метрик популярности (popularity metrics) для каждой цитаты.
- Применение критериев: Критерии включают объем поисковых запросов по цитате, количество упоминаний в социальных сетях и количество документов, включающих цитату.
- Хранение: Сохранение в Entities repository ассоциаций между цитатами, медиаконтентом и их метриками популярности. Также сохраняются связи между цитатами и другими сущностями.
Процесс Б: Представление популярных цитат в реальном времени
- Обнаружение контента: Идентификация media content item, который в данный момент воспроизводится рядом с пользователем. Определение текущего момента воспроизведения.
- Поиск популярных цитат: Идентификация в Entities repository цитат, связанных с этим контентом, которые определены как популярные на основе popularity criteria.
- Фильтрация по времени (Опционально): Выбор цитат, которые находятся вблизи (proximate) от текущего момента воспроизведения.
- Передача данных: Отправка выбранных популярных цитат и соответствующих интерактивных элементов (affordances) на клиентское устройство пользователя.
- Взаимодействие и Выполнение операции: Получение выбора пользователем интерактивного элемента и выполнение связанной операции (например, поделиться цитатой, найти ее в поиске, воспроизвести клип).
Какие данные и как использует
Данные на входе
Патент явно указывает на использование следующих данных для определения популярности и генерации сводок:
- Контентные/Структурные факторы:
- Subtitles data / Caption data: Используются для сопоставления цитат, найденных во внешних источниках, с оригинальным медиаконтентом.
- Поведенческие/Внешние факторы (Ключевые для популярности):
- Search query volume: Объем поисковых запросов для конкретной цитаты или сущности (как агрегированный, так и специфичный для пользователя). Ключевой сигнал, упомянутый в Claim 1.
- Mentions in social networks: Количество упоминаний цитаты или сущности в социальных сетях.
- Mentions in documents: Количество документов (веб-страниц), которые включают цитату или упоминают сущность.
- Query histories of users: Агрегированные истории запросов пользователей.
- Histories of media consumption: Агрегированные истории потребления медиаконтента пользователями.
- Пользовательские факторы (Используются для персонализации сводок):
- Location of the user, Demographic characteristics, Query history of the user, Media consumption history of the user.
- Технические факторы (Идентификация): Content Information (аудио/видео фингерпринты) с клиентского устройства.
Какие метрики используются и как они считаются
- Popularity Metrics / Levels of Interest: Основная метрика, агрегирующая внешние сигналы для оценки интереса к цитате или сущности. Рассчитывается путем взвешивания и объединения объема поиска, социальных упоминаний и веб-упоминаний.
- Real-time popularity: Метрика, основанная на realtime criteria, измеряющая недавние изменения или всплески в сигналах популярности (например, объем поиска за последний час).
- Взвешивание документов: Патент предполагает, что не все упоминания равны. Упоминания в документах «предопределенных категорий» (predefined categories), таких как редакционные обзоры, могут иметь больший вес. Также может учитываться репутация (reputability) источника документа.
- Персонализированный уровень интереса: Метрика, которая учитывает как агрегированную популярность, так и сигналы, специфичные для пользователя, для определения интереса с точки зрения конкретного пользователя.
Выводы
- Измерение популярности микро-моментов: Google активно измеряет популярность не только медиаконтента в целом, но и конкретных микро-моментов (цитат) и сущностей внутри него. Это позволяет понять, что именно резонирует с аудиторией.
- Внешние сигналы как мера интереса: Патент явно подтверждает, что поведение пользователей вне самого контента (поиск в Google, обсуждения в социальных сетях, упоминания на сайтах) напрямую используется для определения того, что Google считает «популярным» или значимым внутри видео.
- Объем поисковых запросов — ключевой сигнал: Search query volume выделен в независимом Claim 1 как основной критерий популярности цитаты.
- Важность данных субтитров/транскриптов: Subtitles data используются как основа для точного сопоставления внешних обсуждений (цитат) с конкретными моментами в видеоконтенте. Наличие точных текстовых данных критично для этого процесса.
- Взвешивание источников упоминаний: Система может придавать больший вес упоминаниям на авторитетных сайтах или в документах определенных категорий (например, обзоры, новости), чем случайным упоминаниям.
- Анализ популярности в реальном времени: Google отслеживает тренды и всплески интереса к цитатам и сущностям в реальном времени (realtime criteria), что позволяет системе быстро реагировать на вирусный контент.
Практика
Best practices (это мы делаем)
- Мониторинг внешнего резонанса и трендов: Активно отслеживайте, как аудитория обсуждает ваш видеоконтент (или контент в вашей нише) в социальных сетях и что ищет в поисковых системах. Выявляйте популярные цитаты, обсуждаемые моменты и сущности.
- Создание качественного веб-контента вокруг популярных сущностей: Разрабатывайте авторитетный контент (статьи, обзоры), который обсуждает популярные цитаты и сущности. Это соответствует сигналу «упоминания в документах» (mentions in documents), особенно если ваш сайт попадает в авторитетные категории (например, editorial reviews).
- Оптимизация под запросы-цитаты: Если цитата генерирует значительный search query volume, оптимизируйте страницы под эти точные фразовые запросы, чтобы захватить связанный трафик.
- Обеспечение точных транскриптов и субтитров (Video SEO): Поскольку система использует subtitles data для сопоставления цитат, критически важно предоставлять точные и полные субтитры для видеоконтента. Это помогает Google корректно индексировать диалоги.
- Стимулирование обсуждения и шеринга: Поощряйте цитирование вашего контента в социальных сетях, так как это является прямым сигналом популярности (mentions in social networks), который Google учитывает.
Worst practices (это делать не надо)
- Игнорирование текстовой составляющей видео: Публикация видео без субтитров или транскрипта затрудняет для Google точное сопоставление внешних обсуждений (цитат) с вашим контентом.
- Создание поверхностного контента (Quote Farms): Публикация страниц, содержащих только наборы цитат без дополнительной ценности или анализа. Такие страницы вряд ли будут считаться авторитетными «документами».
- Манипуляция обсуждениями низкого качества: Попытки искусственно завысить количество упоминаний на некачественных сайтах могут быть неэффективны, если Google применяет взвешивание на основе репутации источника или категории документа.
Стратегическое значение
Этот патент имеет важное стратегическое значение для Video SEO и Entity SEO. Он подтверждает переход от анализа видео как монолитного блока к гранулярному пониманию его содержания и популярности отдельных его частей. Это напрямую связано с такими функциями, как Key Moments в поиске. Стратегия должна фокусироваться не только на оптимизации под общие темы видео, но и на идентификации и продвижении конкретных моментов и цитат, которые вызывают наибольший интерес у аудитории во внешних каналах (поиск, социальные сети, веб).
Практические примеры
Сценарий: Оптимизация видео-интервью с известным экспертом
- Действие до публикации: Подготовка точных субтитров (subtitles data) для интервью.
- Действие после публикации (Мониторинг): Отслеживание социальных сетей и поисковых запросов. Выявление того, что одна конкретная цитата эксперта стала вирусной и активно ищется пользователями.
- Действие (Оптимизация):
- Обновление описания видео и тайм-кодов (Key Moments), чтобы явно выделить этот популярный сегмент.
- Создание короткого клипа (Shorts/Reels) с этой цитатой для распространения в социальных сетях (увеличение mentions in social networks).
- Публикация статьи в блоге, цитирующей этот фрагмент и раскрывающей тему подробнее (увеличение mentions in documents).
- Ожидаемый результат: Система Google, используя описанные в патенте механизмы, идентифицирует эту цитату как высокопопулярную (popular quotation) на основе внешних сигналов и с большей вероятностью будет выделять этот момент в поиске или включать эксперта и цитату в релевантные сводки.
Вопросы и ответы
Какие именно сигналы Google использует для определения популярности цитаты из видео?
Патент явно выделяет три основных сигнала: объем поисковых запросов (search query volume) по этой цитате (это ключевой сигнал, указанный в Claim 1), количество упоминаний цитаты в социальных сетях (mentions in social networks) и количество веб-документов, включающих эту цитату (mentions in documents). Внешнее вовлечение напрямую определяет популярность.
Насколько важны субтитры для Video SEO в контексте этого патента?
Они критически важны. Патент описывает использование данных субтитров (subtitles data или caption data) для точного сопоставления цитат, найденных во внешних источниках (веб, социальные сети), с конкретным моментом в оригинальном медиаконтенте. Без точных субтитров этот механизм не сможет надежно работать.
Как этот патент связан с функцией Key Moments (Ключевые моменты) в поиске Google?
Патент описывает базовую технологию, необходимую для работы Key Moments. Он объясняет, как Google идентифицирует потенциально важные сегменты (цитаты) и, что более важно, как он измеряет их популярность с помощью внешних сигналов. Key Moments — это вероятное применение этой технологии в интерфейсе поиска для выделения наиболее релевантных и популярных частей видео.
Имеет ли значение, на каком сайте упоминается цитата или сущность?
Да, патент предполагает возможность взвешивания источников. Упоминается, что система может учитывать количество документов «предопределенных категорий» (predefined categories), таких как обзоры или новости. Также упоминается возможность учета репутации (reputability) источника, что означает, что упоминания на авторитетных сайтах могут иметь больший вес.
Влияет ли этот патент напрямую на ранжирование обычных веб-страниц?
Прямого влияния на ранжирование веб-страниц патент не описывает. Однако он показывает, как Google измеряет популярность сущностей, используя упоминания на веб-страницах. Это косвенно подтверждает важность создания качественного контента о популярных сущностях и получения упоминаний на авторитетных сайтах для повышения значимости связанных тем.
Отслеживает ли Google популярность в реальном времени?
Да, патент явно упоминает использование критериев реального времени (realtime criteria). Это позволяет системе определять популярность цитат и сущностей в реальном времени, выявляя актуальные тренды, всплески интереса или вирусный контент сразу после его появления.
Что такое Entities Repository в контексте этого патента?
Entities Repository — это база данных, где Google хранит информацию о сущностях (людях, местах, цитатах), связанных с медиаконтентом. Она содержит сами сущности, их метрики популярности, таймкоды их появления в видео и связи между ними. Это компонент, тесно связанный с Google Knowledge Graph.
Может ли система персонализировать популярные сущности для конкретного пользователя?
Да, патент допускает такую возможность. При генерации сводок система может учитывать сигналы, специфичные для пользователя: его местоположение, демографию, историю поисковых запросов и историю потребления медиа. Это позволяет определить уровень интереса к сущности с точки зрения конкретного пользователя.
Как SEO-специалист может использовать информацию из этого патента для продвижения видео?
Необходимо фокусироваться на создании контента, который генерирует внешнее вовлечение. Стимулируйте обсуждение конкретных моментов, поощряйте цитирование и шеринг в социальных сетях, а также оптимизируйте метаданные и окружающий текст под те фразы и цитаты, которые пользуются популярностью у аудитории. Это увеличит popularity metrics вашего контента.
Является ли это патентом о «втором экране» или о понимании контента?
И то, и другое. Он описывает конкретное применение (интерфейс «второго экрана»), но для его реализации он раскрывает критически важные механизмы того, как Google понимает видеоконтент и измеряет значимость его отдельных частей, используя сигналы со всего интернета. Для SEO второе важнее первого.