Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google измеряет аудиторию ТВ и радио, анализируя всплески поисковых запросов после трансляций

    SYSTEM AND METHOD FOR ASSOCIATING SEARCH QUERIES WITH REMOTE CONTENT DISPLAY (Система и метод ассоциации поисковых запросов с удаленным отображением контента)
    • US11546659B2
    • Google LLC
    • 2023-01-03
    • 2014-12-01
    2014 Мультимедиа Патенты Google Поведенческие сигналы

    Google использует систему для измерения аудитории офлайн-медиа (ТВ, радио). Система отслеживает эфир и ищет резкие всплески («spikes») связанных поисковых запросов. Если запрос резко возрастает сразу после трансляции соответствующего контента, система делает вывод, что пользователи, отправившие запрос, вероятно, смотрели эту трансляцию и сопутствующую рекламу.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему точного и масштабируемого измерения аудитории широковещательного контента (например, телевидения, радио), где отсутствует прямой обратный канал от зрителя к вещателю. Традиционные методы (панельные исследования) дороги и статистически ограничены. Изобретение предлагает метод измерения аудитории и атрибуции путем корреляции офлайн-воздействия (просмотр трансляции) с последующим онлайн-поведением (поисковыми запросами или другими взаимодействиями), не требуя специального оборудования у пользователей или встраивания водяных знаков в сигнал.

    Что запатентовано

    Запатентована система измерения аудитории (Audience Measurement), которая использует данные онлайн-взаимодействий (Interactions, например, поисковых запросов) как индикатор просмотра транслируемого контента. Система отслеживает эфир и параллельно анализирует логи поиска для выявления spiking queries (резких всплесков активности). При обнаружении контекстуальной и временной корреляции между всплеском и недавней трансляцией система делает вывод, что пользователи, выполнившие поиск, вероятно, видели этот контент, а также смежный контент (например, рекламу).

    Как это работает

    Система работает в несколько этапов:

    • Мониторинг трансляций: Система отслеживает вещательный контент, извлекая идентификаторы: субтитры (Closed Captioning), распознанный текст (OCR), музыку, лица и аудио/видео отпечатки (Fingerprints). Создается база данных контента с временными метками.
    • Обнаружение всплесков: Анализируются логи поиска для выявления запросов, объем которых резко возрастает выше базового уровня (Baseline Query Volume).
    • Корреляция: Система проверяет, транслировался ли недавно контент, контекстуально связанный с spiking query.
    • Вывод о просмотре: Если корреляция найдена, идентификаторы устройств (Device Identifiers) пользователей ассоциируются с контентом. Этой связи присваивается оценка уверенности или вероятность (Confidence Score / Probability).
    • Атрибуция смежного контента: Ключевой аспект патента — система также делает вывод, что эти пользователи видели контент до или после основного (например, рекламу), применяя понижающий коэффициент (Adjustment Factor) к Confidence Score.

    Актуальность для SEO

    Высокая (для AdTech и аналитики). Атрибуция кросс-медийной рекламы (связь ТВ-рекламы с онлайн-активностью) является ключевой задачей в современной рекламной индустрии. Хотя приоритет патента датируется 2014 годом (этот патент является продолжением), описанные механизмы лежат в основе современных систем атрибуции Google.

    Важность для SEO

    Влияние на SEO минимальное (1/10). Патент описывает исключительно систему измерения аудитории и атрибуции рекламы (AdTech). Он не имеет отношения к алгоритмам ранжирования органического поиска и не дает практических рекомендаций по SEO-оптимизации сайтов. Его ценность для SEO-специалистов заключается только в понимании того, как Google анализирует тренды и коррелирует офлайн-события с поведением пользователей в поиске.

    Детальный разбор

    Термины и определения

    Audience Measurement Server (Сервер измерения аудитории)
    Компонент системы, который выполняет корреляцию между логами поиска и данными мониторинга трансляций.
    Baseline Query Volume (Базовый объем запросов)
    Средний или ожидаемый уровень поисковой активности по определенному запросу, используемый как эталон для выявления всплесков.
    Device Identifier (Идентификатор устройства)
    Уникальный идентификатор (например, Cookie, IP-адрес, логин пользователя, GUID), используемый для идентификации устройства или пользователя, совершившего взаимодействие.
    Entity Extractor (Извлекатель сущностей)
    Компоненты, анализирующие вещательный контент для извлечения идентифицируемой информации. Включают декодер субтитров (Closed Captioning Decoder), OCR Detector, Music Detector, Person Detector (распознавание лиц).
    Fingerprint (Цифровой отпечаток)
    Уникальный идентификатор аудио или видео контента. Используется для точной идентификации контента.
    Interaction (Взаимодействие)
    Действие пользователя. Включает поисковый запрос, посещение веб-страницы или загрузку контента (Claim 4).
    Prior/Subsequent Confidence Adjustment (Корректировка уверенности для предыдущего/последующего контента)
    Механизм снижения Confidence Score для контента, который транслировался до или после контента, вызвавшего всплеск запросов. В патенте также называется Adjustment factor (Claim 9).
    Spiking Query (Всплеск запросов)
    Поисковый запрос, объем которого резко и значительно превышает Baseline Query Volume за короткий промежуток времени. Также определяется как Uplift (Claim 5).
    Viewership Confidence Score / Probability (Оценка уверенности в просмотре / Вероятность)
    Вероятностная оценка того, что пользователь, совершивший взаимодействие, действительно видел соответствующий контент в эфире.

    Ключевые утверждения (Анализ Claims)

    Патент US11546659B2 является продолжением (continuation) и фокусируется на механизме вывода о просмотре смежного контента.

    Claim 1 (Независимый пункт): Описывает метод измерения взаимодействия (interaction measurements).

    1. Система (measurement server) определяет взаимодействие (например, поисковый запрос) в течение первого периода времени.
    2. Система извлекает идентификацию первого элемента транслируемого контента, соответствующего этому взаимодействию и показанного в течение этого же первого периода времени.
    3. Система извлекает идентификацию второго элемента контента (смежного), показанного в течение второго периода времени.
    4. Система генерирует вероятность (probability) того, что пользователь, совершивший взаимодействие, также получил (просмотрел) второй элемент контента.
    5. Система ассоциирует идентификатор пользователя со вторым элементом контента на основе этой вероятности.

    Ядром этого конкретного патента является не просто фиксация просмотра контента, вызвавшего запрос (первый элемент), а расчет вероятности и атрибуция просмотра смежного контента (второй элемент, например, рекламы), который сам по себе запроса не вызвал.

    Claim 5 (Зависимый): Уточняет, что взаимодействие должно иметь подъем (uplift) выше базового объема (baseline volume). Это подтверждает, что триггером является обнаружение всплеска (spike).

    Claim 9 (Зависимый): Уточняет, что генерация вероятности для второго элемента включает определение корректирующего фактора (adjustment factor), который корректирует вероятность на основе ранее сгенерированной вероятности (вероятно, вероятности просмотра первого элемента).

    Где и как применяется

    Этот патент не является частью стандартной архитектуры веб-поиска (Crawling, Indexing, Ranking), направленной на ранжирование документов. Это система аналитики и атрибуции (AdTech), которая использует данные поисковой системы как входной сигнал.

    Сбор данных (Data Acquisition)
    Система использует два источника:

    1. Broadcast Monitoring System: Осуществляет собственный процесс «индексирования» офлайн-трансляций (ТВ/Радио). Entity Extractors и Fingerprint Generators анализируют эфир и сохраняют данные в Entity Database, Caption Logs.
    2. Search System / Website Service: Предоставляет логи взаимодействий (Interactions), например поисковых запросов (Search Logs) с Device Identifiers.

    Анализ и Атрибуция (Analytics/Attribution Layer)
    Основная работа происходит в Audience Measurement Server. Он выполняет обнаружение всплесков (Spike Detection) и корреляцию данных из двух источников для заполнения Viewership database.

    Входные данные:

    • Данные мониторинга трансляций: Идентификаторы контента (субтитры, сущности, отпечатки) и время трансляции.
    • Логи взаимодействий: Запросы/посещения страниц, Device Identifiers, время.

    Выходные данные:

    • Viewership database: Ассоциации между контентом и Device Identifiers с соответствующими Confidence Scores (вероятностями).
    • Отчеты об измерении аудитории.

    На что влияет

    • Конкретные типы контента: Влияет на измерение аудитории и атрибуцию рекламы для широковещательного медиа (ТВ, радио, стриминг). Не влияет на ранжирование органического поиска.
    • Специфические запросы: Эффективен для запросов с низким базовым уровнем, которые резко возрастают в ответ на внешние события (названия продуктов, имена знаменитостей, песни).
    • Географические ограничения: Система может учитывать географию пользователя и регион вещания для повышения точности, исключая пользователей, которые не могли видеть локальную трансляцию.

    Когда применяется

    • Триггеры активации: Алгоритм корреляции активируется при обнаружении Spiking Query или всплеска взаимодействий (Uplift).
    • Пороговые значения: Всплеск фиксируется, когда объем запросов превышает Baseline Query Volume на определенную величину (порог) или когда скорость роста объема запросов (dV/dT) превышает пороговое значение.
    • Временные рамки: Корреляция ищется только в том случае, если контент транслировался в течение определенного временного окна до начала всплеска (например, последние 5-15 минут). Это окно может быть динамическим.

    Пошаговый алгоритм

    Процесс А: Мониторинг и Индексирование Трансляций (Выполняется непрерывно)

    1. Получение потока: Система принимает широковещательный поток (ТВ/Радио).
    2. Извлечение признаков: Анализируется контент. Извлекаются субтитры, распознается текст (OCR), идентифицируется музыка и лица, генерируются отпечатки (Fingerprints).
    3. Индексирование: Извлеченные данные сохраняются в базах данных (Entity Database / Caption Logs) с указанием канала и времени трансляции.

    Процесс Б: Обнаружение Всплесков и Корреляция

    1. Получение логов взаимодействий: Audience Measurement Server получает логи запросов или посещений.
    2. Обнаружение всплеска (Spike/Uplift Detection): Система анализирует объем взаимодействий. Определяется, превышен ли порог объема или порог скорости изменения объема (dV/dT) по сравнению с базовым уровнем.
    3. Идентификация Spiking Query: Если пороги превышены, взаимодействие классифицируется как всплеск.
    4. Поиск соответствующего контента (Контекстуальная корреляция): Система ищет сущности, связанные с всплеском, в базе данных трансляций. Может использоваться семантический словарь (semantic dictionary).
    5. Временная валидация: Проверяется, была ли трансляция в пределах недавнего временного окна.
    6. Идентификация аудитории (Первый элемент контента): Если валидация пройдена, Device Identifiers пользователей ассоциируются с первым элементом контента (который вызвал всплеск). Рассчитывается первичная вероятность (Confidence Score).
    7. Атрибуция смежного контента (Второй элемент контента): Система идентифицирует второй элемент контента, транслировавшийся до или после первого.
    8. Расчет скорректированной вероятности: Рассчитывается вероятность просмотра второго элемента с применением понижающего коэффициента (Adjustment Factor) в зависимости от временного расстояния.
    9. Сохранение ассоциации: Device Identifiers ассоциируются со вторым элементом контента на основе этой скорректированной вероятности.

    Какие данные и как использует

    Данные на входе

    Система использует данные из двух основных источников: мониторинга трансляций и онлайн-сервисов (поиск, веб-сайты).

    Данные мониторинга трансляций:

    • Контентные факторы: Текст из субтитров (Closed Captioning data). Текст и логотипы на экране, извлекаемые через OCR.
    • Мультимедиа факторы: Аудио и видео данные для генерации Fingerprints, распознавания лиц (Person Detector) и музыки (Music Detector).
    • Технические факторы: Идентификатор канала/потока, временные метки трансляции.

    Данные онлайн-сервисов:

    • Поведенческие факторы: Логи взаимодействий (Interactions), включая поисковые запросы (Search Logs) или посещения веб-сайтов, время взаимодействия.
    • Пользовательские факторы: Device Identifiers (Cookie, IP, Usernames, GUIDs и т.д.).
    • Географические факторы: Локация пользователя (может использоваться для подтверждения нахождения в зоне вещания).

    Какие метрики используются и как они считаются

    • Baseline Query Volume: Рассчитывается как среднее значение объема запросов за определенный период.
    • Spike Threshold (Порог всплеска / Uplift): Динамический порог, часто определяемый как множитель от Baseline Query Volume или как базовый объем плюс фиксированное значение.
    • dV/dT (Скорость изменения объема): Метрика, измеряющая ускорение активности.
    • Viewership Confidence Score (Probability): Вероятностная оценка просмотра. Может базироваться на разнице между пиковым объемом всплеска и базовым объемом. Также учитывает частоту трансляции контента и редкость запроса (редкость повышает уверенность).
    • Adjustment Factor: Коэффициенты затухания уверенности во времени. Используются для снижения Confidence Score для смежного контента пропорционально разнице во времени трансляции основного и смежного контента.

    Выводы

    1. Фокус на измерении и атрибуции, а не на ранжировании: Патент описывает сложную инфраструктуру для AdTech и измерения аудитории широковещательных медиа. Он не содержит информации об алгоритмах ранжирования органического поиска.
    2. Связь офлайн-событий и онлайн-поведения: Google активно использует данные онлайн-взаимодействий (включая поиск) как сигнал внимания к офлайн-событиям (ТВ-трансляции). Система позволяет связать просмотр ТВ-рекламы с последующими действиями пользователя в интернете.
    3. Анализ аномалий (Spiking Queries): Обнаружение всплесков активности является центральным механизмом для выявления реакции аудитории на внешние стимулы.
    4. Детальный мониторинг медиа: Google обладает инфраструктурой для индексации ТВ/радио эфира в реальном времени, используя разнообразные методы (OCR, субтитры, отпечатки, распознавание лиц и музыки).
    5. Вероятностная модель просмотра смежного контента: Ключевой аспект этого патента (Claim 1) — расчет вероятности просмотра смежного контента (например, рекламы до или после шоу) с использованием временного затухания уверенности (Confidence Score / Adjustment Factor).

    Практика

    ВАЖНО: Данный патент является инфраструктурным и описывает механизмы измерения аудитории (AdTech). Он не дает практических выводов для улучшения органического ранжирования (SEO).

    Best practices (это мы делаем)

    Хотя прямых SEO-рекомендаций нет, патент дает контекст для общей маркетинговой стратегии:

    • Интеграция SEO с офлайн-кампаниями: При запуске ТВ или радио рекламы SEO-команды должны быть готовы к всплескам поискового трафика (Search Spikes). Необходимо убедиться, что сайт хорошо ранжируется по запросам, упомянутым в рекламе (брендовые запросы, названия продуктов, слоганы), чтобы захватить этот спрос.
    • Анализ всплесков трафика: Понимание механизма, описанного в патенте, помогает SEO-специалистам точнее интерпретировать внезапные всплески органического трафика, коррелируя их с офлайн-активностью, а не с изменениями алгоритмов.
    • Ситуативный маркетинг и мониторинг трендов: Патент подтверждает, что Google внимательно анализирует всплески как реакцию на внешние события. Быстрое создание контента в ответ на тренды (Newsjacking), вызванные медиа-событиями, остается важной тактикой.

    Worst practices (это делать не надо)

    Патент не описывает механизмы пессимизации или борьбы с SEO-манипуляциями.

    Стратегическое значение

    Стратегическое значение патента для SEO минимально. Он демонстрирует возможности Google в области кросс-медийной аналитики и подчеркивает ценность поисковых данных как индикатора интересов и поведения пользователей в реальном мире. Это подтверждает необходимость интеграции SEO в общую маркетинговую стратегию компании.

    Практические примеры

    Сценарий: Поддержка ТВ-рекламной кампании

    Компания запускает новый рекламный ролик на ТВ.

    1. Действия Google (согласно патенту): Google мониторит эфир, идентифицирует ролик (например, по Fingerprint) и фиксирует время показа. После показа система обнаруживает всплеск (Spike) поисковых запросов по названию продукта. Google ассоциирует пользователей, выполнивших поиск, с просмотром этой рекламы и смежного контента.
    2. Действия SEO-специалиста: Зная график кампании, специалист заранее оптимизирует целевую страницу продукта под запросы из рекламы. Во время трансляции отслеживается всплеск органического трафика.
    3. Ожидаемый результат: Сайт компании занимает топовые позиции по релевантным запросам во время пикового интереса, вызванного ТВ-рекламой, и эффективно конвертирует этот трафик. Атрибуция этого трафика к ТВ-кампании становится возможной благодаря механизмам, схожим с описанными в патенте.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в органическом поиске?

    Нет, прямого влияния нет. Патент описывает систему измерения аудитории для широковещательного контента (ТВ/радио) и атрибуции рекламы. Он не затрагивает алгоритмы, определяющие позиции сайтов в органической выдаче.

    Что такое Spiking Query (Всплеск запросов) в контексте этого патента?

    Это ситуация, когда количество поисковых запросов по определенной теме резко и значительно возрастает за короткий промежуток времени, превышая обычный базовый уровень (Baseline Query Volume). Google интерпретирует это как реакцию аудитории на внешнее событие, например, на показ ТВ-рекламы.

    Как Google узнает, что показывают по телевизору или радио?

    Система использует инфраструктуру мониторинга эфира. В патенте описаны различные технологии: анализ субтитров (Closed Captioning), оптическое распознавание текста и логотипов на экране (OCR), распознавание музыки и лиц, а также создание уникальных аудио/видео отпечатков (Fingerprints) для идентификации контента.

    Если я запущу ТВ-рекламу, и трафик на мой сайт вырастет, этот патент объясняет, как Google это отслеживает?

    Да, именно так. Патент описывает механизм, который позволяет Google связать всплеск поисковых запросов (или других взаимодействий, таких как посещение сайта) с показом вашей ТВ-рекламы. Это используется для атрибуции и позволяет Google предоставлять рекламодателям отчеты об эффективности офлайн-кампаний.

    Что такое Confidence Score или Probability (Оценка уверенности / Вероятность)?

    Это вероятностная оценка того, что пользователь, совершивший поиск, действительно видел контент в эфире. Она рассчитывается на основе нескольких факторов: мощности всплеска (разница между пиком и базовым уровнем), редкости запроса и частоты трансляции контента. Чем уникальнее совпадение, тем выше оценка.

    Может ли система определить, что я смотрел рекламу, которая шла *до* передачи, вызвавшей мой интерес?

    Да, это ключевая часть патента (Claim 1). Если система определила, что вы смотрели передачу (потому что вы ее искали), она предполагает, что вы, вероятно, видели и смежный контент (например, рекламу) до или после нее. Однако Confidence Score для смежного контента будет ниже и будет уменьшаться по мере удаления от времени основного события.

    Использует ли Google эту информацию для таргетинга рекламы?

    Патент фокусируется на измерении аудитории. Однако данные о просмотренном контенте (например, если система определила, что пользователь смотрел передачу об автомобилях) логично могут использоваться в экосистеме Google для уточнения интересов пользователя и последующего таргетинга рекламы.

    Работает ли эта система только с поисковыми запросами?

    Хотя примеры часто используют поисковые запросы, в патенте используется более общий термин «взаимодействие» (interaction). Упоминается (Claim 4), что это может включать посещение веб-страницы или загрузку контента. Это предполагает, что система может анализировать не только поиск, но и другие виды онлайн-активности.

    Есть ли польза от этого патента для SEO-специалиста?

    Прямой пользы для улучшения позиций нет. Косвенная польза заключается в лучшем понимании анализа трафика, особенно при проведении комплексных маркетинговых кампаний. Это помогает в атрибуции всплесков органического трафика и подчеркивает важность синхронизации SEO с офлайн-рекламой.

    Работает ли эта система, если я смотрю контент в записи (Time-Shift/VOD)?

    Да, в патенте упоминается возможность измерения аудитории для контента с временным сдвигом. Если система может идентифицировать контент (например, через Fingerprints), она сможет сопоставить его с поисковым запросом, даже если он сделан позже оригинального эфира, так как данные хранятся некоторое время (час, день, неделю).

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.