
Google использует технологию для автоматизации поиска на основе медиаконтента, потребляемого пользователем. Система записывает аудиосэмпл с устройства пользователя (например, звук телевизора), идентифицирует контент (шоу или рекламу) с помощью аудиофингерпринтинга и извлекает связанную метаинформацию (субтитры, EPG, текст из видео). На основе этих данных автоматически формируется и выполняется поисковый запрос, предоставляя пользователю релевантные результаты без ручного ввода ключевых слов.
Патент решает проблему сложности и неудобства ручного ввода поисковых запросов на мобильных устройствах, особенно когда пользователи ищут информацию, связанную с медиаконтентом (ТВ, радио, видео), который они потребляют в данный момент (эффект «второго экрана»). Изобретение автоматизирует процесс, позволяя инициировать релевантный поиск на основе аудиоконтекста без ввода ключевых слов (non-keyword-based search).
Запатентована система, которая использует аудиосэмплы, захваченные клиентским устройством, для идентификации медиаконтента в реальном времени. Система сопоставляет аудио с базой данных предварительно проиндексированного медиа (включая трансляции и рекламу). После идентификации контента система извлекает связанную с ним богатую метаинформацию (например, субтитры, данные EPG, распознанный текст из видеоряда) и автоматически генерирует поисковый запрос на основе этой контекстуальной информации.
Система работает по следующей схеме:
audio fingerprints) и извлекают метаданные (субтитры, EPG, анализ видео).Search Query Builder) автоматически конструирует текстовый поисковый запрос, используя извлеченные метаданные.Высокая. Технологии распознавания медиаконтента (такие как Google Assistant's Now Playing) широко распространены. Этот патент описывает инфраструктуру, позволяющую не просто идентифицировать контент, но и автоматически генерировать сложные контекстуальные поисковые запросы на его основе. Это критически важно для понимания того, как Google связывает потребление медиа (особенно рекламы) с последующей поисковой активностью.
Патент имеет высокое стратегическое значение (8/10). Он раскрывает механизм генерации запросов, который полностью обходит традиционный ввод ключевых слов. Это влияет на SEO, поскольку показывает, как Google использует контекст медиа для формирования поискового интента. Особое внимание в патенте уделяется анализу рекламы (включая OCR текста), подчеркивая важность оптимизации онлайн-активов под запросы, инициированные офлайн-кампаниями. SEO-специалистам необходимо понимать, какие метаданные извлекаются из медиа для формирования этих автоматических запросов.
repetition pattern algorithm)."forgiving hash".Media Sources), таких как ТВ или радио, и обрабатывает его для извлечения аудиоотпечатков и метаданных.Video-Based Keyword Metadata. Использует OCR и методы распознавания объектов/лиц.audio fingerprint, полученный от клиентского устройства, с базой данных отпечатков захваченного медиаконтента.Content Identifier.Image Analysis Server.Анализ Claims показывает сильный фокус изобретения на идентификации рекламы и генерации поисковых запросов на её основе.
Claim 1 (Независимый пункт): Описывает основной процесс обработки аудиоданных для идентификации рекламы и генерации запроса.
concurrently) с получением данных от клиента для идентификации в почти реальном времени.known advertisement).Claim 8 и 9 (Зависимые): Детализируют инфраструктуру бэкенда.
Система мониторит медиа-источники (например, ТВ-каналы), извлекает аудиопотоки и генерирует audio fingerprints (Claim 8). Параллельно извлекается дополнительная информация, генерируются метаданные (content-related metadata), и все данные связываются уникальным идентификатором контента (unique content identifier) и сохраняются (Claim 9).
Claim 11 и 12 (Зависимые): Описывают методы идентификации и обработки рекламы.
repetition pattern algorithm) на бэкенде (Claim 11).image analysis process) для генерации video-based keywords и оптическое распознавание символов (OCR) для получения специфичной информации о рекламе (Claim 12).Claim 27 (Независимый пункт): Описывает процесс с точки зрения клиентского устройства, фокусируясь на рекламе.
Устройство захватывает аудиосэмпл рекламы и отправляет его в систему. Система идентифицирует рекламу, выбирает поисковые термины на основе дополнительной информации, полученной путем анализа аудио-видео презентации рекламы (включая анализ изображений и OCR), и возвращает результаты поиска.
Изобретение связывает процессы индексирования медиаконтента с пониманием контекста пользователя и генерацией поисковых запросов.
INDEXING – Индексирование и извлечение признаков (Бэкенд)
На этом этапе происходит основная работа бэкенд-системы. Capture Servers постоянно записывают медиаисточники. Происходит глубокое извлечение признаков (Feature Extraction):
Audio Fingerprints.Subtitle Metadata (включая OCR и Voice-to-Text).EPG Metadata.Video-Based Keyword Metadata.Ad Detection Server.Результат: Пополняемая база данных аудиоотпечатков и связанных с ними метаданных на Service Information Server.
QUNDERSTANDING – Понимание Запросов (и Генерация Запросов)
Это ключевой этап применения патента. Когда пользователь отправляет аудиосэмпл:
Match Server идентифицирует контент.Search Query Builder Server извлекает все связанные метаданные.RANKING – Ранжирование
Сгенерированный запрос поступает на стандартный Search Server, который выполняет ранжирование по своим алгоритмам. Патент не описывает изменений на этом этапе.
Входные данные (от пользователя):
Audio Fingerprint.Входные данные (бэкенд):
Выходные данные:
Capture Application на клиентском устройстве во время потребления медиаконтента.continuous mode), когда устройство периодически отправляет аудиосэмплы и постоянно обновляет результаты поиска по мере изменения контента (например, при смене новостных сюжетов или рекламных блоков).Процесс А: Обработка запроса пользователя (Фронтенд)
Front-End Server генерирует audio fingerprint из сэмпла.Match Server и сравнивается с базой данных захваченного медиа.content identifier). (При неудаче система может запросить ручной ввод канала).Search Query Builder Server запрашивает связанные метаданные (EPG, субтитры, видео-ключевые слова) у Service Information Server.Search Query Builder Server автоматически формирует текстовый поисковый запрос на основе полученных метаданных.Search Engine, результаты возвращаются на клиентское устройство.Процесс Б: Захват и индексирование медиа (Бэкенд)
Capture Server постоянно записывает контент из медиаисточников.audio fingerprints и сохраняются с уникальным идентификатором.Image Analysis Server) для извлечения ключевых слов.Ad Detection Server анализирует поток для идентификации рекламы (сравнение отпечатков или анализ повторов) и извлекает специфичные для неё данные (например, через OCR).Service Information Server и ассоциируются с уникальным идентификатором контента.Система использует разнообразные данные, извлеченные непосредственно из медиапотоков, а также данные от пользователя.
audio fingerprinting. Используются аудиосэмплы от пользователя и аудиопотоки из медиаисточников.Video-Based Keyword Metadata путем анализа стоп-кадров (распознавание текста, логотипов, объектов, лиц).Патент не детализирует метрики ранжирования, но описывает ключевые процессы анализа данных:
Match Server может использовать уровни уверенности (confidence levels) для определения наилучшего совпадения.Image Analysis Server для распознавания логотипов, объектов, лиц.Ad Detection Server для идентификации новых рекламных роликов в медиапотоке на основе шаблонов повторения.Ad Detection) является ключевым компонентом, что подчеркивается в Claims. Система специально разработана для того, чтобы сделать офлайн-рекламу интерактивной, автоматически генерируя коммерческие запросы на основе распознанного текста (OCR) и изображений из рекламного ролика.Video-Based Keyword Metadata) напрямую влияют на результат.Video-Based Keyword Metadata и включения этой информации в автоматический поисковый запрос.Subtitle Metadata для понимания контекста. Оптимизируйте текст субтитров под ключевые слова, связанные с контентом. Если субтитров нет, система использует Voice-to-Text, поэтому чистота аудиодорожки также важна.Этот патент подтверждает стратегию Google по захвату и пониманию информации из всех доступных источников, включая традиционные медиа. Для SEO это означает, что источники трафика становятся более диверсифицированными, а генерация запросов — более автоматизированной и контекстуальной. Это стирает грань между офлайн-маркетингом и SEO, требуя интегрированного подхода к управлению информацией во всех каналах. Понимание механизмов анализа мультимедиа (OCR, субтитры) становится обязательным навыком.
Сценарий: Оптимизация телевизионной рекламы автомобиля
known advertisement) с помощью Ad Detection Server.Voice-to-Text (или субтитры) распознает речь диктора.Image Analysis Server распознает логотип "Brand".OCR распознает текст на экране: "Model X 2025" и "Специальное предложение 0% кредит".Search Query Builder автоматически генерирует запрос, например: [Brand Model X 2025 специальное предложение 0% кредит].Как этот патент влияет на традиционное исследование ключевых слов?
Он расширяет понимание источников запросов. Теперь нужно учитывать не только то, что пользователи вводят вручную, но и то, какие запросы система может сгенерировать автоматически на основе медиаконтента. Это требует анализа метаданных и визуального контента медиа (текст на экране, субтитры) для прогнозирования потенциальных запросов, которые могут включать уникальные комбинации сущностей.
Какие данные система извлекает из видео для генерации запроса?
Система анализирует видеопоток с помощью Image Analysis Server для генерации Video-Based Keyword Metadata. Извлекаются данные путем распознавания текста и логотипов (с помощью OCR), а также потенциально распознавания лиц, объектов и локаций. Вся эта информация используется для построения контекстуального поискового запроса.
Насколько важны субтитры для этого механизма?
Субтитры критически важны. Система напрямую извлекает Subtitle Metadata для понимания контекста происходящего. Если субтитры текстовые, они используются напрямую. Если графические, используется OCR. Если субтитров нет, система может применять Voice-to-Text. Наличие точных субтитров значительно повышает качество сгенерированного запроса.
Патент много говорит о рекламе. В чем особенность её обработки?
Реклама обрабатывается специализированным Ad Detection Server. Система идентифицирует известные ролики и может выявлять новые с помощью анализа повторов (repetition pattern algorithm). Для рекламы особенно активно используется OCR и анализ изображений для извлечения коммерческой информации (названий продуктов, условий акций), которая становится основой для генерации поискового запроса.
Как SEO-специалист может оптимизировать контент под этот механизм?
Ключевая оптимизация происходит на этапе создания медиаконтента. Необходимо обеспечить чистоту аудио для точного фингерпринтинга, предоставлять точные субтитры, и, самое главное, размещать ключевую информацию (бренды, продукты, URL) в видеоряде четко и читаемо для систем OCR. На стороне сайта необходимо подготовить страницы, релевантные этим автоматически сгенерированным запросам.
Применяется ли этот механизм только к живому эфиру (Live TV)?
Нет. Хотя система оптимизирована для работы в реальном времени с трансляциями, она также может обрабатывать записанный контент (time-shifted content), DVD, Blu-ray и потоковое интернет-медиа. Это зависит от того, как долго бэкенд-система хранит индексы захваченного медиа или индексирует ли она статический контент.
Что такое "Непрерывный режим" (Continuous Mode), упомянутый в патенте?
Это режим, при котором клиентское устройство не делает разовый запрос, а непрерывно или периодически отправляет аудиосэмплы. Система постоянно идентифицирует контент и обновляет результаты поиска на экране устройства по мере изменения контента (например, при смене новостного сюжета или начале рекламного блока), обеспечивая постоянный поток релевантной информации.
Использует ли система данные о местоположении пользователя?
Да, патент упоминает возможность использования информации о местоположении клиентского устройства. Это позволяет системе сузить круг поиска, например, сравнивая аудио только с локальными телеканалами или радиостанциями (Media Sources), что повышает эффективность и точность идентификации.
Влияет ли этот патент на ранжирование результатов поиска?
Патент не описывает изменения в алгоритмах ранжирования. Он описывает механизм генерации запроса. Сгенерированный запрос затем обрабатывается стандартной поисковой системой. Однако, поскольку сгенерированный запрос является высококонтекстуальным, он может приводить к выдаче, отличной от той, которую пользователь получил бы при ручном вводе более общего запроса.
Какова роль EPG Metadata в этом процессе?
EPG Metadata (данные электронного телегида) предоставляют базовую информацию о транслируемом контенте — название программы, описание, жанр. Когда система идентифицирует контент, эти данные извлекаются и используются Search Query Builder для добавления контекста к поисковому запросу, например, включения названия шоу или имен актеров.

Поведенческие сигналы
Мультимедиа
Семантика и интент

Персонализация
Семантика и интент
Поведенческие сигналы

Мультимедиа
Индексация
Семантика и интент

Мультимедиа

Свежесть контента
Мультимедиа

Персонализация
Поведенческие сигналы
Local SEO

Local SEO
Поведенческие сигналы

Персонализация
Ссылки

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

Ссылки
Индексация
Техническое SEO

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Персонализация
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Антиспам
