Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует всплески поисковых запросов для идентификации аудитории телепередач и таргетинга контента

    SYSTEMS AND METHODS FOR CONTENT SELECTION BASED ON SEARCH QUERY CORRELATION WITH BROADCAST MEDIA (Системы и методы выбора контента на основе корреляции поисковых запросов с транслируемыми медиа)
    • US10296645B2
    • Google LLC
    • 2019-05-21
    • 2015-02-13
    2015 Патенты Google Персонализация Поведенческие сигналы

    Google анализирует корреляцию между всплесками поисковой активности и трансляцией медиаконтента (ТВ, радио). Если во время первой трансляции наблюдается резкий рост запросов по теме передачи, система запоминает эту связь. Во время повторной трансляции пользователи, вводящие те же запросы, идентифицируются как зрители и могут получать таргетированный контент или рекламу, связанную с передачей.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает две основные задачи. Во-первых, он предлагает альтернативный метод измерения аудитории транслируемых медиа (ТВ, радио), который не полагается на традиционные панели (опросы, специальные устройства у зрителей), имеющие недостатки в точности и стоимости. Во-вторых, он решает задачу идентификации и таргетинга пользователей, которые активно вовлечены в просмотр конкретного медиаконтента в реальном времени, позволяя доставлять им релевантный дополнительный контент (например, рекламу).

    Что запатентовано

    Запатентована система выбора контента, основанная на корреляции поисковой активности с трансляциями медиа. Система идентифицирует всплески поисковых запросов (Spiking Queries), которые контекстуально и темпорально совпадают с трансляцией определенного контента. Эта корреляция используется предиктивно: когда контент транслируется повторно, пользователи, вводящие ассоциированные запросы, идентифицируются как зрители и получают таргетированный контент.

    Как это работает

    Система работает в два этапа: Измерение и Предиктивный таргетинг.

    1. Измерение аудитории: Система мониторит трансляции (используя субтитры, распознавание образов/лиц, аудио/видео отпечатки) и одновременно анализирует логи поисковых запросов. Она выявляет запросы, объем которых резко возрастает (Spike) выше базового уровня (Baseline) сразу после трансляции связанного контента. Устанавливается корреляция и рассчитывается оценка уверенности (Confidence Score).
    2. Предиктивный таргетинг: Когда тот же контент транслируется повторно (например, в другом часовом поясе), система отслеживает запросы, которые ранее коррелировали с этим контентом. Если пользователь вводит такой запрос во время повторной трансляции, система немедленно идентифицирует его как зрителя (даже до того, как новый всплеск будет подтвержден) и выбирает для него таргетированный контент, связанный с трансляцией.

    Актуальность для SEO

    Средняя. Механизм корреляции поведения в поиске с внешними событиями (такими как телетрансляции) остается актуальным, особенно в контексте Connected TV и феномена «второго экрана» (использование смартфона во время просмотра ТВ). Хотя патент фокусируется на традиционных трансляциях и их повторах, описанная технология связывания сущностей, анализа всплесков запросов и таргетинга контента является фундаментальной для экосистемы Google.

    Важность для SEO

    Влияние на органическое SEO низкое (3/10). Патент не описывает алгоритмы ранжирования органической выдачи. Он фокусируется на измерении аудитории и выборе дополнительного контента (вероятно, рекламы), который доставляется пользователю. Однако он имеет стратегическое значение для понимания того, как Google анализирует тренды, связывает сущности (Entities) из разных источников (поиск и медиа) и интерпретирует намерения пользователей, вызванные внешними медиа-триггерами.

    Детальный разбор

    Термины и определения

    Baseline (Базовый уровень)
    Обычная или средняя частота получения определенного поискового запроса до возникновения всплеска.
    Content Selection Server (Сервер выбора контента)
    Сервер (часто связанный с поисковой системой или рекламной сетью), который выбирает, какой дополнительный контент (например, рекламу) показать пользователю на основе анализа его запроса и контекста.
    Content Stream (Поток контента)
    Последовательность медиаконтента (программы, реклама), транслируемая через канал вещания (ТВ, радио, интернет-стрим).
    Entity (Сущность)
    Идентифицируемый объект (человек, продукт, песня, место, ключевое слово), извлеченный из транслируемого медиа (через субтитры, распознавание лиц, OCR, аудио) или связанный с поисковым запросом.
    Peak/baseline ratio (Отношение пика к базовому уровню)
    Метрика, используемая для расчета Confidence Score. Показывает, насколько значительным был всплеск запросов. Используется для определения процента пользователей, которым будет показан таргетированный контент во время повторной трансляции.
    Semantic dictionary (Семантический словарь)
    Структура данных, которая связывает различные поисковые запросы и сущности в семантические категории. Позволяет системе понять, что разные запросы (например, имя актера, название фильма и цитата) относятся к одному и тому же медиаконтенту.
    Spike / Spiking Query (Всплеск / Всплесковый запрос)
    Резкое и значительное увеличение объема конкретного поискового запроса за короткий период времени, превышающее Threshold.
    Threshold (Порог)
    Уровень объема запросов или скорости изменения объема (dV/dT), при превышении которого фиксируется Spike. Может устанавливаться динамически на основе Baseline.
    Viewership confidence score (Оценка уверенности в просмотре)
    Метрика, определяющая вероятность того, что пользователь, отправивший запрос во время всплеска, действительно смотрел ассоциированный медиаконтент.

    Ключевые утверждения (Анализ Claims)

    Патент (в версии B2) содержит важные поправки в Claims, касающиеся расчета уверенности и пропорциональной доставки контента.

    Claim 1 (Независимый пункт): Описывает метод выбора контента во время повторной трансляции (Rebroadcast).

    1. Сервер получает запрос от клиентского устройства во время повторной трансляции медиа.
    2. Сервер определяет (из логов поисковой системы), что частота получения связанных запросов (related entities) во время первоначальной трансляции этого медиа превысила порог (т.е. был зафиксирован Spike).
    3. Вычисляется разница между частотой запросов во время первоначального всплеска и базовым уровнем (Baseline).
    4. На основе этой разницы определяется оценка уверенности (Confidence Score) для ассоциации запросов с медиа.
    5. Таргетированный контент передается проценту устройств (включая исходное устройство), пропорциональному этой оценке уверенности. Это происходит в ответ на (i) фиксацию всплеска во время первой трансляции и (ii) получение запросов во время повторной трансляции.

    Claim 7 (Независимый пункт): Описывает схожий процесс с точки зрения поисковой системы (Search Provider).

    1. Поисковая система получает запросы во время первой трансляции медиа.
    2. Определяется, что частота запросов превысила порог (Spike).
    3. Вычисляется разница между частотой всплеска и Baseline.
    4. Определяется Confidence Score на основе этой разницы.
    5. Во время повторной трансляции поисковая система получает те же запросы.
    6. Поисковая система дает указание серверу выбора контента предоставить связанный контент проценту устройств, пропорциональному Confidence Score.

    Claim 11 (Независимый пункт): Описывает систему (Content Selection Server), сконфигурированную для выполнения шагов, аналогичных Claim 1 (получение запросов, анализ логов для фиксации всплеска во время первой трансляции, расчет разницы с Baseline, определение Confidence Score и пропорциональная передача контента во время повторной трансляции).

    Где и как применяется

    Изобретение затрагивает несколько этапов, связанных с анализом данных и выбором контента.

    INDEXING – Индексирование и извлечение признаков
    Система мониторинга медиа (Measurement system) функционирует аналогично этапу индексирования, но для broadcast-медиа. Она извлекает сущности (Entities) из трансляций с помощью различных детекторов (Closed Captioning, OCR, Music Detector, Person Detector) и сохраняет их в Entity Database с метками времени и канала.

    QUNDERSTANDING – Понимание Запросов
    Система анализирует логи поисковых запросов (Search Logs) для выявления всплесков (Spikes). Она использует Semantic dictionary для агрегации связанных запросов (related entities) и определения общего объема запросов по теме. Это позволяет понять, какие темы вызывают резкий рост интереса.

    METASEARCH – Метапоиск и Смешивание / RANKING (Content Selection)
    Основное применение патента происходит на этапе выбора дополнительного контента (например, рекламы), который будет показан вместе с результатами поиска. Это не ранжирование органических результатов, а процесс выбора контента (Content Selection).

    1. Корреляция: Система сопоставляет время и контекст всплесков запросов со временем и сущностями из Entity Database.
    2. Расчет уверенности: Вычисляется Confidence Score на основе Peak/baseline ratio.
    3. Предиктивный таргетинг (во время повтора): При получении запроса система проверяет, был ли он ранее ассоциирован со всплеском и транслируется ли сейчас связанный контент. Если да, система выбирает таргетированный контент вместо стандартного для показа пользователю.

    Входные данные:

    • Логи поисковых запросов (Search Logs), включая текст запроса, время и идентификатор устройства.
    • Данные о трансляциях (время, канал).
    • Извлеченные сущности из трансляций (текст субтитров, распознанные лица, музыка, OCR текста на экране, аудио/видео отпечатки).
    • Semantic dictionary.

    Выходные данные:

    • База данных просмотров (Viewership database) с идентификаторами устройств, контента и Confidence Scores.
    • Идентификация таргетированного контента для доставки пользователю.

    На что влияет

    • Конкретные типы контента: Влияет на контент, который вызывает немедленный интерес и побуждает пользователей искать дополнительную информацию (феномен «второго экрана»). Это могут быть продукты в рекламе, музыка в фильмах, знаменитости в ток-шоу, спортивные события, новости.
    • Специфические запросы: Информационные и коммерческие запросы, связанные с сущностями, появляющимися в медиа.
    • Конкретные ниши или тематики: Развлечения, спорт, потребительские товары, музыкальная индустрия.

    Когда применяется

    • Триггеры активации (Этап 1 — Измерение): Когда объем поискового запроса или скорость его роста (dV/dT) превышает установленный порог (Threshold) выше базового уровня (Baseline), И когда связанный по контексту контент недавно транслировался.
    • Триггеры активации (Этап 2 — Таргетинг): Когда пользователь вводит запрос, который ранее был идентифицирован как Spiking Query, И когда медиаконтент, связанный с этим всплеском, недавно транслировался повторно (Rebroadcast).
    • Временные рамки: Корреляция устанавливается в узком временном окне (например, несколько минут) после трансляции, чтобы гарантировать причинно-следственную связь.

    Пошаговый алгоритм

    Процесс А: Измерение и Корреляция (Анализ первой трансляции)

    1. Мониторинг медиа: Система непрерывно обрабатывает потоки контента, извлекает сущности (текст, аудио, видео) и сохраняет их в базу данных с метками времени и канала.
    2. Получение и анализ поисковых логов: Система получает логи поисковых запросов.
    3. Определение базового уровня: Для каждого запроса (или группы связанных запросов через Semantic dictionary) определяется средний объем запросов (Baseline).
    4. Обнаружение всплеска: Система определяет, превышает ли текущий объем запросов или скорость его роста установленный порог (Threshold).
    5. Поиск корреляции: Если обнаружен всплеск, система ищет в базе данных медиа-сущностей совпадения по контексту.
    6. Темпоральная валидация: Проверяется, транслировался ли контент с соответствующей сущностью в течение недавнего периода времени перед всплеском.
    7. Идентификация аудитории: Если корреляция найдена, идентификаторы устройств, отправивших запросы во время всплеска, помечаются как аудитория данного контента в Viewership database.
    8. Расчет уверенности: Вычисляется Confidence Score на основе разницы между пиковым объемом всплеска и Baseline. Эта оценка сохраняется вместе с ассоциацией «Запрос-Контент».

    Процесс Б: Предиктивный Таргетинг (Во время повторной трансляции)

    1. Получение запроса: Поисковая система или Content Selection Server получает новый поисковый запрос от пользователя.
    2. Проверка ассоциации со всплеском: Система проверяет, был ли этот запрос ранее идентифицирован как Spiking Query (в Процессе А).
    3. Проверка повторной трансляции: Если ассоциация есть, система проверяет, транслировался ли недавно связанный с этим всплеском медиаконтент повторно.
    4. Принятие решения о таргетинге: Если контент транслировался повторно, система принимает решение о показе таргетированного контента. Это решение может быть вероятностным: контент показывается проценту пользователей, пропорциональному ранее рассчитанному Confidence Score.
    5. Выбор контента: Если принято решение о таргетинге, система выбирает контент, ассоциированный с транслируемым медиа (вместо стандартного контента).
    6. Доставка: Идентификация выбранного контента передается клиентскому устройству.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Поисковые запросы пользователей (текст, изображения, аудио), объем запросов, скорость изменения объема запросов, идентификаторы устройств (device identifiers).
    • Временные факторы: Время отправки поискового запроса, время трансляции медиаконтента (первой и повторной).
    • Контентные факторы (из медиа): Текст субтитров (Closed Captioning data), текст на экране (извлеченный через OCR), распознанные лица (Person Detector), распознанная музыка (Music Detector).
    • Технические факторы (из медиа): Аудио и видео отпечатки (Fingerprints) для идентификации конкретных единиц контента (например, рекламных роликов).
    • Структурные данные: Semantic dictionary для связи запросов и сущностей.

    Какие метрики используются и как они считаются

    • Baseline Rate (Базовый уровень): Средняя частота запросов за определенный период.
    • Threshold (Порог): Динамически определяемый уровень (например, кратный Baseline) для обнаружения всплеска.
    • dV/dT (Скорость изменения объема): Метрика для обнаружения резкого начала всплеска.
    • Peak Rate (Пиковая частота): Максимальная частота запросов во время всплеска.
    • Viewership Confidence Score (Оценка уверенности): Рассчитывается на основе разницы между Peak Rate и Baseline Rate. Большая разница означает более высокую уверенность в том, что всплеск вызван именно трансляцией.
    • Peak/baseline ratio (Отношение пика к базовому уровню): Используется для определения процента пользователей, которым будет доставлен таргетированный контент во время повторной трансляции. Патент предлагает формулы, например, (Peak-Baseline)/(Peak+Baseline) или пропорциональные им значения.

    Выводы

    1. Поиск как сенсор реального мира: Google использует поисковую активность как сенсор для измерения вовлеченности аудитории в события реального мира (в данном случае, медиа-трансляции). Всплески запросов интерпретируются как прямое следствие просмотра контента.
    2. Корреляция требует контекста и времени: Для установления связи между трансляцией и поиском система требует как контекстуального совпадения (через Entities и Semantic dictionary), так и темпоральной близости.
    3. Предиктивный таргетинг на основе корреляций: Ключевая особенность патента — использование прошлых корреляций для предиктивного таргетинга во время повторных трансляций. Система может таргетировать пользователей немедленно, не дожидаясь подтверждения нового всплеска.
    4. Управление неопределенностью через Confidence Score: Система признает, что корреляция не всегда идеальна. Confidence Score, основанный на силе всплеска (Peak/baseline ratio), используется для управления рисками. Таргетированный контент доставляется только проценту пользователей, пропорциональному этой оценке.
    5. Важность Сущностей (Entities): Способность системы извлекать сущности из медиа (песни, люди, продукты) и связывать их с поисковыми запросами через Semantic dictionary является критически важной для работы механизма.
    6. Низкое влияние на органическое SEO: Патент не описывает изменений в ранжировании органических результатов. Он направлен на улучшение выбора дополнительного контента (Ads) и измерение аудитории.

    Практика

    Best practices (это мы делаем)

    Хотя патент слабо влияет на органическое SEO, он дает важные инсайты для холистической цифровой стратегии (SEO + Контент + Реклама).

    • Анализ трендов и триггеров интента: SEO-специалистам необходимо глубоко понимать, какие внешние события (включая медиа-трансляции, новости, события) провоцируют всплески поискового спроса в их нише. Это позволяет прогнозировать трафик и готовить релевантный контент.
    • Оптимизация под сущности, связанные с медиа: Если бренд или продукт появляется в медиа (ТВ-шоу, реклама, интервью), необходимо убедиться, что сайт хорошо оптимизирован под связанные сущности (название продукта, имя спикера, ключевые термины из рекламы). Это гарантирует видимость сайта, когда пользователи ищут информацию после просмотра.
    • Синергия SEO и Рекламы (PPC): Используйте данные из SEO об актуальных трендах для информирования рекламных кампаний. Если ожидается трансляция, связанная с вашим продуктом, подготовьте таргетированные рекламные кампании, которые могут быть показаны вовлеченной аудитории (потенциально с помощью механизма, описанного в патенте).
    • Понимание «Second-Screening» поведения: Создавайте контент, который отвечает на вопросы, возникающие у пользователей во время просмотра медиа. Это могут быть подробные обзоры, биографии, инструкции или страницы продуктов.

    Worst practices (это делать не надо)

    • Игнорирование темпорального контекста: Рассматривать поисковый спрос только как статический или сезонный, игноруя краткосрочные всплески, вызванные медиа-событиями.
    • Фокус только на ключевых словах, а не на сущностях: Неспособность понять, как разные запросы связаны с одной сущностью (как описано в Semantic dictionary), приведет к упущенным возможностям при анализе трендов.

    Стратегическое значение

    Патент подтверждает, что Google активно стирает грань между онлайн и офлайн мирами. Поисковая система функционирует не в вакууме, а как часть более широкой информационной экосистемы, реагируя на внешние медиа-сигналы. Для SEO это означает, что понимание контекста пользователя и триггеров его поискового намерения становится все более сложным и требует учета внешних факторов, выходящих за рамки традиционного анализа ключевых слов.

    Практические примеры

    Сценарий: Таргетинг рекламы во время повтора ТВ-шоу

    1. Первая трансляция (Восточное побережье США): В популярном ТВ-шоу персонаж использует новый смартфон модели «Galaxy X1».
    2. Измерение: Google фиксирует резкий всплеск (Spike) запросов «Galaxy X1 цена» и «Galaxy X1 обзор» сразу после этого момента. Система коррелирует этот всплеск с трансляцией шоу и рассчитывает высокий Confidence Score.
    3. Повторная трансляция (Западное побережье США, 3 часа спустя): То же шоу транслируется повторно.
    4. Предиктивный таргетинг: Пользователь на Западном побережье смотрит шоу и вводит запрос «Galaxy X1».
    5. Результат: Система немедленно идентифицирует его как зрителя (на основе корреляции, установленной 3 часа назад) и вместо стандартной рекламы показывает ему таргетированную рекламу смартфона «Galaxy X1» или специальное предложение от ритейлера.

    Вопросы и ответы

    Влияет ли этот патент на алгоритмы органического ранжирования (SEO)?

    Нет, напрямую не влияет. Патент описывает механизм измерения аудитории и выбора дополнительного контента (Content Selection), который показывается пользователю. Это, скорее всего, относится к выбору рекламных объявлений (Google Ads), которые показываются вместе с результатами поиска, а не к порядку органических синих ссылок.

    Что такое «Semantic dictionary» и как он используется в этом патенте?

    Semantic dictionary — это база данных, которая связывает разные запросы и сущности в общие категории. В контексте патента это позволяет системе понять, что запросы [имя актера], [название фильма] и [известная цитата] могут относиться к одной и той же трансляции. Система агрегирует объем всех этих связанных запросов для более точного обнаружения всплеска (Spike).

    Как система определяет, что пользователь смотрит именно эту передачу?

    Система делает вывод на основе строгой корреляции двух факторов: Контекст и Время. Пользователь вводит запрос, который контекстуально связан с содержанием передачи (Entity), и делает это в узком временном окне сразу после трансляции этого контента в его регионе. Если много людей делают это одновременно (Spike), уверенность системы возрастает.

    Что такое «Confidence Score» и зачем он нужен?

    Confidence Score (Оценка уверенности) показывает, насколько вероятно, что всплеск запросов вызван именно трансляцией, а не совпадением. Он рассчитывается на основе того, насколько сильно пиковый объем запросов превышает базовый уровень (Peak/baseline ratio). Чем мощнее всплеск, тем выше уверенность.

    Как используется Confidence Score при повторных трансляциях?

    Он используется для управления объемом таргетинга. Если Confidence Score был высоким, система покажет таргетированный контент большему проценту пользователей, вводящих запрос во время повтора. Если уверенность была низкой, таргетированный контент увидят немногие, чтобы снизить риск показа нерелевантного контента тем, кто не смотрит передачу.

    Как Google узнает, что именно транслируется по ТВ или радио?

    Патент описывает систему мониторинга (Measurement system), которая анализирует трансляции. Она использует данные субтитров (Closed Captioning), распознавание текста на экране (OCR), распознавание лиц (Person Detector), распознавание музыки (Music Detector) и аудио/видео отпечатки (Fingerprints) для идентификации контента и извлечения сущностей.

    В чем ключевое преимущество этого механизма таргетинга?

    Ключевое преимущество — скорость и предиктивность. Во время повторной трансляции система может таргетировать пользователей немедленно, как только они вводят запрос. Ей не нужно ждать, пока накопится достаточно данных для обнаружения нового всплеска; она полагается на данные, собранные во время первой трансляции.

    Какое значение этот патент имеет для SEO-специалистов?

    Хотя прямого влияния на ранжирование нет, патент подчеркивает важность понимания триггеров поискового интента. SEO-специалисты должны анализировать, как медиа-события влияют на спрос в их нише, и готовить контент, оптимизированный под сущности, которые могут вызвать всплеск интереса (например, во время крупных спортивных событий, запуска продуктов или выхода популярных шоу).

    Применяется ли этот механизм только к повторам трансляций?

    Патент описывает два процесса. Первый — это измерение аудитории во время любой трансляции путем корреляции со всплесками запросов. Второй — это предиктивный таргетинг, который специфически использует данные, собранные во время первой трансляции, для таргетинга во время повторной трансляции (Rebroadcast).

    Может ли эта система ошибочно идентифицировать меня как зрителя?

    Да, это возможно, если вы ввели запрос, совпадающий с темой трансляции, случайно в то же самое время. Для минимизации таких ошибок система использует Confidence Score и доставляет таргетированный контент только определенному проценту пользователей, пропорциональному этому показателю уверенности.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.