
Google отслеживает внезапные всплески частоты поисковых запросов и сопоставляет их с субтитрами (или аудиодорожкой) транслируемых в этот момент телепрограмм. Это позволяет системе понять, какой именно момент в эфире вызвал интерес пользователей, и проактивно предоставить связанную информацию зрителям через «вторые экраны» (например, смартфоны).
Патент решает задачу предоставления своевременной и высокорелевантной дополнительной информации пользователям, которые смотрят телевизионные программы и одновременно используют мобильное устройство (концепция «второго экрана» – Second Screen). Система улучшает понимание того, что именно интересует зрителей в конкретный момент трансляции, не полагаясь на общие демографические данные, предположения или инвазивные опросы.
Запатентована система, которая в реальном времени идентифицирует всплески поисковой активности (Search Query Spikes) и коррелирует их с контентом транслируемых телепрограмм. Корреляция достигается путем сопоставления терминов или концептов из группы «всплесковых» запросов с субтитрами (Subtitle Terms) или распознанным аудио, которые появились в эфире незадолго до всплеска. Цель – проактивно предоставить релевантную информацию зрителям программы.
Система работает в несколько этапов:
Linguistic Concept) объединяются в группы (Query Groups).Высокая. Потребность в контекстуальной информации в реальном времени и использование мобильных устройств во время просмотра медиаконтента остаются актуальными трендами. Технологии анализа данных в реальном времени и автоматического распознавания контента (ACR) активно развиваются и интегрируются в экосистемы (например, Google Assistant).
Патент имеет ограниченное прямое влияние на классическое SEO (4/10). Он не описывает механизмы ранжирования веб-страниц в органической выдаче. Однако он критически важен для понимания того, как Google интерпретирует тренды в реальном времени (Real-Time Search / QDF), группирует семантически близкие запросы (Equivalent Queries) на основе сущностей и связывает данные из разных источников (поисковые логи и медиаконтент).
voice recognition algorithms) из аудиодорожки.Knowledge Graph Entities), которая может быть выражена разными наборами терминов. Используется для группировки запросов и сопоставления с субтитрами.Search Query Spike и конкретным местом (Location) в видеопрограмме на основе совпадения терминов/концептов и временной близости (субтитры появились незадолго до всплеска).Claim 1 (Независимый пункт): Описывает основной процесс идентификации всплесков и проактивной доставки информации с учетом часовых поясов.
Search Query Spike от пользователей в первом часовом поясе (Time Zone 1). Всплеск – это превышение частоты группы эквивалентных запросов над средним значением на пороговую величину.Subtitle Terms, появившимися в программе в определенном месте (first location) в течение заданного времени (predefined time) непосредственно перед всплеском.current location) в этом втором поясе.Система использует данные о всплеске, зафиксированном ранее (в Time Zone 1), чтобы предоставить информацию позже (в Time Zone 2) мгновенно, без задержки, необходимой для детекции нового всплеска.
Claim 3 и 4 (Зависимые): Уточняют методы определения эквивалентности запросов.
substantially identical) последовательности другого (учет порядка слов, незначительных вариаций и опечаток).Linguistic Concept, даже если используют разные термины.Claim 6 (Зависимый): Уточняет способ определения интереса пользователя. Система получает аудиопоток с пользовательского устройства и коррелирует его с аудиодорожкой видеопрограммы (механизм аудио-фингерпринтинга).
Claim 7 и 8 (Зависимые): Уточняют методы сопоставления запросов и субтитров. Они аналогичны Claims 3 и 4: сопоставление может происходить либо через существенно идентичные упорядоченные последовательности терминов (Claim 7), либо через совпадение Linguistic Concept (Claim 8).
Claim 10 (Зависимый): Описывает использование корреляции для улучшения результатов поиска для других пользователей.
Изобретение затрагивает сбор данных и понимание запросов для обеспечения контекстного и проактивного поиска.
CRAWLING – Сканирование и Сбор данных (Data Acquisition)
На этом этапе система собирает и обрабатывает данные о телепрограммах: расписание трансляций (Broadcast Data), метаданные и, что критически важно, потоки субтитров (Subtitle Data) или аудио в реальном времени.
QUNDERSTANDING – Понимание Запросов
Основное применение патента. Система обрабатывает логи поисковых запросов в реальном времени (Search Query Log). Происходит:
Query Groups на основе эквивалентности (семантика, Linguistic Concepts).Search Query Spikes (используя Spike Identification Module).Search Term Matching Module).RANKING / METASEARCH (Contextual Delivery)
Система определяет контекст пользователя (просмотр ТВ-программы) с помощью Television Program Determination Module. Вместо формирования стандартной SERP, система использует результаты анализа для проактивной доставки контента через Media Supplement Module. Также, согласно Claim 10, корреляция может влиять на выбор документов в основном ранжировании для трендовых запросов.
Входные данные:
Выходные данные:
Search Query Spike, когда частота группы запросов превышает заданный порог (predefined threshold percentage) по сравнению со средней частотой (Average Query Frequency).predefined time) до начала всплеска.Процесс А: Подготовка (Офлайн/Предварительно)
Query Groups с использованием методов семантического анализа (Linguistic Concepts) и сопоставления последовательностей.Average Query Frequency) и, возможно, максимальной (Max Query Frequency) частоты для каждой группы.Процесс Б: Обработка в реальном времени (Первый часовой пояс)
Query Groups. Идентификация Search Query Spike, когда текущая частота превышает установленный порог.Linguistic Concepts из «всплесковой» группы с субтитрами, появившимися в эфире незадолго до всплеска. Фиксация связи между всплеском и конкретным местом в программе.Процесс В: Обработка в реальном времени (Последующие часовые пояса)
Search Query Log) являются основным источником данных для обнаружения всплесков и анализа интересов аудитории.User Time Zone) и регионы трансляции (Broadcast Time Zone) для корректной корреляции и оптимизации доставки контента.Subtitle Terms) или распознанный текст из аудиодорожки. Также могут использоваться метаданные программ (Program Profile).audio stream).Query Group за определенный период. Используются как базовый уровень.substantially identical ordered sequence).Linguistic Concepts (семантическая близость, распознавание сущностей).Search Query Spikes) в реальном времени.Linguistic Concepts (сущностей), а не только буквального совпадения терминов. Это позволяет точно детектировать всплески интереса к теме, даже если пользователи используют разные формулировки.Патент в первую очередь описывает инфраструктуру для проактивного поиска и работы Ассистентов/«вторых экранов», а не механизмы ранжирования веб-сайтов. Прямое влияние на стандартные SEO-практики ограничено, но есть важные стратегические выводы.
Search Query Spikes), критично для новостных сайтов. Необходимо максимально быстро реагировать на события, вызывающие массовый интерес (спортивные матчи, политические дебаты, премьеры), создавая релевантный контент.Linguistic Concepts (сущностей) для группировки запросов. SEO-стратегия должна фокусироваться на раскрытии сущностей и их связей (Knowledge Graph), а не на конкретных ключевых фразах.Query Group.Патент подтверждает стратегический приоритет Google на понимание контекста пользователя и причин возникновения запроса. Система стремится не просто ответить на введенный текст, но и понять, какое внешнее событие его вызвало. Это еще одно доказательство важности семантического и сущностного поиска, а также движения в сторону проактивного предоставления информации (Proactive Search), где система предвосхищает запрос пользователя.
Сценарий: Real-Time SEO во время спортивного события с учетом часовых поясов
Search Query Spike и коррелирует его с моментом трансляции.Как Google определяет, что два разных запроса эквивалентны?
Патент описывает два основных метода. Первый – это существенное совпадение упорядоченной последовательности терминов (учитывает порядок слов, игнорирует мелкие различия или опечатки). Второй, более продвинутый метод – это совпадение Linguistic Concept (лингвистического концепта или сущности). Это означает, что запросы считаются эквивалентными, если они выражают одну и ту же идею, даже если используют совершенно разные слова.
Влияет ли этот патент на ранжирование в обычном поиске Google?
Напрямую – минимально. Патент фокусируется на проактивной доставке информации на «вторые экраны». Однако в патенте (Claim 10) упоминается возможность использования этой корреляции для выбора документов, связанных с видеопрограммой, в ответ на обычные поисковые запросы других пользователей. Это может косвенно влиять на выдачу по трендовым запросам (QDF).
Что такое «Linguistic Concept» в контексте патента и почему это важно для SEO?
Linguistic Concept – это то, что в SEO принято называть сущностью (Entity) или концептом. Патент упоминает их как Knowledge Graph Entities. Это важно, потому что система группирует запросы и сопоставляет их с контентом на уровне этих концептов, а не ключевых слов. Это подтверждает необходимость оптимизации контента под сущности (Entity SEO).
Как система узнает, что я смотрю телевизор и какую именно программу?
Патент описывает несколько способов получения уведомления (notification) от пользовательского устройства. Это может быть явное уведомление от специализированного приложения («второго экрана») или ТВ-приставки. Также упоминается получение аудиопотока (audio stream) с микрофона устройства и его корреляция с аудиодорожкой программы (аудио-фингерпринтинг) для автоматического определения контента.
Какова задержка между событием в эфире и реакцией системы?
В первом часовом поясе есть задержка, необходимая для того, чтобы пользователи успели ввести запросы, а система – задетектировать всплеск и провести корреляцию (упоминаются окна в 30 секунд, минуту, 5 минут). Однако ключевая особенность патента в том, что для последующих часовых поясов эта задержка устраняется: система показывает информацию мгновенно, синхронно с эфиром, используя данные, собранные ранее.
Использует ли система только субтитры для понимания ТВ-контента?
Нет. Хотя патент фокусируется на субтитрах (Subtitle Terms), в описании явно упоминается возможность применения алгоритмов распознавания речи (voice recognition algorithms) непосредственно к аудиодорожке ТВ-контента для генерации текстового потока. Также возможно использование обоих источников одновременно.
Как это связано с QDF (Query Deserves Freshness)?
Этот механизм является одним из способов реализации QDF в реальном времени. Система идентифицирует запросы, которые внезапно стали популярными (заслуживают свежести) из-за внешнего события (ТВ-трансляции). Понимание этого механизма помогает SEO-специалистам понять, как Google выявляет горячие тренды.
Что дает механизм использования разных часовых поясов?
Он позволяет превратить реактивную систему в проактивную. Вместо того чтобы ждать, пока пользователи в новом регионе начнут искать информацию (и только потом реагировать), система уже знает, что вызовет интерес, и предоставляет информацию мгновенно, улучшая пользовательский опыт.
Какие типы контента выигрывают от этого механизма?
В первую очередь выигрывает контент, связанный с событиями в реальном времени: новости, спорт, развлекательные шоу, политические дебаты. Сайты, способные быстро создавать качественный контент в ответ на эти события, получат преимущество в видимости по трендовым запросам, которые могут быть доставлены пользователям проактивно.
Как SEO-специалисту использовать знание об этом механизме?
Необходимо сфокусироваться на двух аспектах. Первый – это скорость реакции на тренды (Real-Time SEO), так как система очень быстро идентифицирует всплески интереса. Второй – это семантическая оптимизация контента под сущности (Linguistic Concepts) и использование разнообразной лексики, так как Google агрегирует эквивалентные запросы на основе концептов, а не ключевых слов.

Поведенческие сигналы
Мультимедиа
Семантика и интент

Семантика и интент
Персонализация
SERP

Свежесть контента
Семантика и интент
Мультимедиа

Свежесть контента
Мультимедиа

Персонализация
Семантика и интент
Поведенческие сигналы

SERP
Семантика и интент
Поведенческие сигналы

Knowledge Graph
Семантика и интент
Ссылки

Local SEO
SERP
Ссылки

Индексация
Поведенческие сигналы

Поведенческие сигналы
SERP

Антиспам
Ссылки
Техническое SEO

Семантика и интент
Поведенческие сигналы
Персонализация

Мультиязычность
Семантика и интент
Ссылки

SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP
