Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует OCR и анализ текста (NLP) для идентификации ТВ-контента и генерации связанных поисковых запросов

    IDENTIFICATION AND PRESENTATION OF CONTENT ASSOCIATED WITH CURRENTLY PLAYING TELEVISION PROGRAMS (Идентификация и представление контента, связанного с текущими телевизионными программами)
    • US11917242B2
    • Google LLC
    • 2024-02-27
    • 2013-03-14
    2013 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

    Патент Google описывает систему для интерактивного ТВ, которая идентифицирует просматриваемую программу путем захвата экрана и применения оптического распознавания символов (OCR) к информационным оверлеям (например, ТВ-гиду). Система анализирует извлеченный текст, выделяет ключевые сущности (Noun Phrases) и автоматически генерирует релевантные поисковые запросы, используя метрики приоритета (Proximity Score) для предоставления связанного интернет-контента.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему идентификации контента, который пользователь просматривает на телевизоре через ТВ-приставку (Set-top Box), без необходимости прямой интеграции или использования специфических API провайдера телевидения. Это позволяет системам интерактивного ТВ (например, Google TV, Smart TV) понимать контекст просмотра и предоставлять связанный интернет-контент и сервисы в режиме реального времени.

    Что запатентовано

    Запатентована система для идентификации медиапрограмм путем анализа видеовыхода. Система захватывает данные дисплея, определяет наличие информационного текстового оверлея (Program Information Overlay – например, всплывающего описания передачи) и применяет оптическое распознавание символов (OCR) для извлечения текста. Извлеченный текст затем анализируется с помощью NLP для генерации поисковых запросов и поиска связанного контента в интернете.

    Как это работает

    Система работает в несколько этапов:

    • Захват и Обнаружение: Система захватывает экран (Screen Capture) и ищет предопределенные индикаторы (Predefined Indicators), сигнализирующие о наличии оверлея. Это может происходить пассивно, активно (система сама вызывает оверлей) или реактивно (на действия пользователя).
    • Извлечение текста (OCR): Применяется OCR для извлечения текста (название, описание) из оверлея.
    • Анализ текста (NLP): Извлеченный текст обрабатывается: удаляется стандартная информация (время, канал), выделяются именные группы (Noun Phrases).
    • Генерация запросов: Лучшие именные группы становятся ключевыми фразами (Keyword Phrases).
    • Поиск и Ранжирование: По этим фразам выполняется интернет-поиск. Результаты ранжируются с использованием метрик Query Score (базовая релевантность) и Proximity Score (важность на основе порядка слов) и отображаются пользователю.

    Актуальность для SEO

    Высокая. Хотя методы идентификации через OCR оверлеев частично вытесняются современными технологиями ACR (Automatic Content Recognition), описанные в патенте механизмы NLP для анализа текста, извлечения сущностей и генерации запросов остаются крайне актуальными и отражают фундаментальные подходы Google к пониманию контента.

    Важность для SEO

    Влияние на SEO — среднее (6/10). Патент не описывает алгоритмы ранжирования веб-поиска. Однако он представляет значительную ценность, так как детально раскрывает конкретный механизм NLP, используемый Google для анализа текста, извлечения ключевых сущностей (Noun Phrases) и определения их приоритета (Proximity Score). Это дает критически важное понимание того, как Google интерпретирует контент и важность порядка слов.

    Детальный разбор

    Термины и определения

    Descriptive Phrases (Описательные фразы)
    Текст, оставшийся после удаления из распознанной информации стандартных данных о показе программы (время, канал, рейтинги).
    Keyword Phrases (Ключевые фразы)
    Отобранный набор именных групп (Noun Phrases), используемых в качестве поисковых запросов.
    Noun Phrases (Именные группы)
    Фразы, извлеченные из Descriptive Phrases с помощью NLP, представляющие собой сущности (названия шоу, имена актеров, темы).
    OCR (Optical Character Recognition)
    Оптическое распознавание символов. Процесс извлечения текста из захваченных изображений экрана.
    Predefined Indicators (Предопределенные индикаторы)
    Визуальные характеристики (цвет, размер, контраст, расположение текста), используемые системой для обнаружения наличия информационного оверлея на экране.
    Program Information Overlay (Информационный оверлей программы)
    Текстовый блок, отображаемый ТВ-приставкой поверх видео, содержащий информацию о текущей программе (ТВ-гид).
    Proximity Score (Оценка близости/порядка)
    Метрика, присваиваемая Keyword Phrase на основе порядка ее появления в исходном тексте. Используется для расчета Relevance Score.
    Query Score (Оценка запроса)
    Метрика, присваиваемая результатам поиска по Keyword Phrase. Может учитывать данные о местоположении, историю поиска и предпочтения пользователя.
    Relevance Score (Оценка релевантности)
    Итоговая оценка для ранжирования результата поиска, вычисляемая как произведение Query Score на соответствующий Proximity Score.
    Second Screen Client Device (Устройство второго экрана)
    Дополнительное устройство (смартфон, планшет), синхронизированное с телевизором для отображения связанного контента.

    Ключевые утверждения (Анализ Claims)

    Примечание: Патент US11917242B2 является продолжением (Continuation) более ранних патентов. Финальные Claims фокусируются на обнаружении оверлея и синхронизации экранов, но описание патента детализирует критически важный процесс NLP.

    Claim 1, 11, 21 (Независимые пункты): Описывают систему и метод реагирования на запрос связанного контента.

    1. Система получает запрос на связанный контент во время отображения медиапрограммы и информационного оверлея (Program Information Overlay).
    2. Система определяет, отображается ли оверлей, анализируя данные экрана (screen display data) на наличие порогового количества предопределенных индикаторов (predefined indicators) – например, цвета, размера, контраста.
    3. Система получает связанный контент с сервера.
    4. Система отображает полученный контент на основном устройстве И синхронно на втором клиентском устройстве (Second Screen Client Device).

    Анализ механизма генерации запросов (на основе Description FIG. 9 и FIG. 10):

    1. Из текста, полученного через OCR, удаляется техническая информация (время, канал, шаблонные данные) для выделения описательных фраз (Descriptive Phrases).
    2. В описательных фразах с помощью NLP идентифицируются именные группы (Noun Phrases).
    3. Определенное количество этих Noun Phrases выбирается в качестве ключевых фраз (Keyword Phrases).
    4. Для каждой Keyword Phrase выполняется интернет-поиск.
    5. Результаты оцениваются и ранжируются. Оценка включает присвоение Query Score (базовая релевантность/персонализация) и Proximity Score (вес на основе порядка появления фразы в исходном тексте).
    6. Итоговый Relevance Score вычисляется как Query Score * Proximity Score.

    Где и как применяется

    Этот патент описывает технологию, применяемую преимущественно на клиентских устройствах (Smart TV), но дает ключевые инсайты о процессах NLP, релевантных для Понимания Запросов.

    QUNDERSTANDING – Понимание Запросов
    Патент детально описывает процесс преобразования неструктурированного текста в структурированные поисковые запросы. Это включает:

    • NLP и извлечение признаков: Использование методов NLP для выделения Noun Phrases и определения Keyword Phrases. Это демонстрирует, как Google извлекает сущности из текста.
    • Определение приоритетов: Использование Proximity Score для взвешивания важности фраз на основе их порядка в тексте.

    RANKING / RERANKING (в контексте интерфейса ТВ)
    Система применяет собственный механизм ранжирования результатов перед их показом пользователю в интерфейсе ТВ, используя специфические метрики (Query Score, Proximity Score, Relevance Score).

    Входные данные:

    • Видеосигнал или данные захвата экрана (Screen Capture Data).
    • Текст, извлеченный с помощью OCR.
    • Пользовательские данные (история поиска, предпочтения, локация) для расчета Query Score.

    Выходные данные:

    • Сгенерированные поисковые запросы (Keyword Phrases).
    • Ранжированный список связанного интернет-контента.

    На что влияет

    • Конкретные ниши или тематики: Наибольшее влияние на медиа, развлечения, спорт, новости. Важно для издателей, чья аудитория ищет дополнительную информацию во время просмотра ТВ.
    • Типы контента: Влияет на видимость веб-страниц, новостей и изображений, связанных с сущностями (актерами, названиями), упоминаемыми на ТВ.

    Когда применяется

    • Триггеры активации:
      • Пользователь явно запрашивает связанный контент.
      • Система автоматически обнаруживает появление информационного оверлея (например, при переключении канала).
      • Система активно вызывает оверлей для идентификации контента (эмулируя пульт).

    Пошаговый алгоритм

    Этап А: Идентификация контента и извлечение текста

    1. Инициация: Получение запроса от пользователя или автоматическое обнаружение оверлея.
    2. Захват экрана: Система захватывает текущие данные дисплея.
    3. Обнаружение оверлея: Анализ захваченных данных на наличие Predefined Indicators.
    4. Извлечение текста: Применение OCR к области оверлея для получения текста (название, описание).

    Этап Б: Анализ текста и генерация запросов (NLP — FIG. 10)

    1. Очистка текста: Удаление из текста данных о показе (время, дата, канал) для выделения Descriptive Phrases.
    2. Идентификация сущностей: Применение NLP для идентификации именных групп (Noun Phrases) в описательных фразах.
    3. Выбор ключевых фраз: Выбор порогового количества Noun Phrases в качестве Keyword Phrases (например, первые 5).
    4. Уточнение фраз (Опционально): Коррекция ошибок OCR, сверка с базой знаний или историей поиска.

    Этап В: Поиск и Ранжирование

    1. Выполнение поиска: Отправка интернет-запросов для каждой Keyword Phrase.
    2. Категоризация: Группировка результатов (веб, новости, изображения).
    3. Расчет Query Score: Присвоение оценки топовым результатам, возможно, с учетом контекста пользователя.
    4. Расчет Proximity Score: Присвоение оценки каждой Keyword Phrase на основе порядка ее появления в исходном тексте.
    5. Расчет Relevance Score: Вычисление итоговой оценки: Query Score * Proximity Score.
    6. Отображение: Сортировка результатов по Relevance Score и их отображение на ТВ и/или втором экране.

    Какие данные и как использует

    Данные на входе

    • Мультимедиа факторы: Захваченные данные дисплея (скриншоты или видеопоток). Анализируются визуальные индикаторы (Predefined Indicators) и текст (через OCR).
    • Контентные факторы: Текст, извлеченный из информационного оверлея (название программы, описание, имена актеров).
    • Пользовательские факторы: История поиска, предпочтения пользователя и местоположение могут использоваться для расчета Query Score и уточнения запросов.

    Какие метрики используются и как они считаются

    • Методы анализа текста (NLP): Используются для удаления шаблонных данных, идентификации описательных фраз и извлечения именных групп (Noun Phrases).
    • Proximity Score: Оценка, основанная на позиции (порядке появления) ключевой фразы в исходном тексте. Фразы в начале текста получают больший вес.
    • Query Score: Оценка качества/релевантности результата поиска, потенциально персонализированная под пользователя. Конкретная формула не приводится.
    • Relevance Score: Итоговая метрика для ранжирования. Формула расчета: Relevance Score = Query Score * Proximity Score.

    Выводы

    1. Детальный алгоритм преобразования описаний в запросы: Патент раскрывает конкретную методологию NLP для генерации поисковых запросов из неструктурированного текста. Ключевым является фокус на извлечении именных групп (Noun Phrases) как наиболее важных элементов для поиска.
    2. Критическая важность порядка слов (Proximity Score): Система явно придает больший вес тем сущностям, которые упоминаются раньше в тексте. Proximity Score является множителем для базовой оценки результата (Query Score). Это важнейший инсайт для SEO.
    3. Структурированный подход к извлечению смысла: Система использует четкий алгоритм: очистка текста -> выделение описательных фраз -> извлечение именных групп -> выбор ключевых фраз. Это подчеркивает важность сущностей в понимании контента.
    4. Персонализация и контекст (Query Score): Базовая оценка результатов (Query Score) может учитывать контекст пользователя (историю, местоположение), что указывает на персонализированный характер генерируемых результатов.
    5. Использование визуального анализа (OCR): Google разработал механизм для идентификации ТВ-контента путем анализа того, что фактически отображается на экране, обходя необходимость сложной интеграции с оборудованием.

    Практика

    Best practices (это мы делаем)

    Описанные в патенте методы NLP (обработка текста и генерация запросов) дают критически важные инсайты для SEO-стратегии.

    • Соблюдение принципа «Перевернутой пирамиды»: Метрика Proximity Score напрямую подтверждает важность размещения наиболее значимых ключевых фраз и сущностей в начале контента (заголовки, первые абзацы). Чем раньше появляется фраза, тем больший вес она получает.
    • Фокус на именных группах (Noun Phrases) и сущностях: Подтверждается важность насыщения контента четкими и релевантными именными группами (сущностями). Google использует их как основу для генерации Keyword Phrases.
    • Оптимизация под медиа-сущности: Для сайтов о фильмах, сериалах, спорте, новостях критически важно оптимизировать контент под конкретные сущности (имена актеров, названия команд). Этот патент показывает, что Google активно генерирует запросы по этим сущностям во время просмотра ТВ.
    • Четкость и структурированность текста: Текст должен быть написан так, чтобы алгоритму было легко отделить ключевую информацию (Descriptive Phrases) от «воды» и шаблонных элементов, что способствует эффективному извлечению сущностей.

    Worst practices (это делать не надо)

    • Размытие ключевых сущностей и «Вода» в начале текста: Использование сложных предложений или размещение важных сущностей в середине/конце текста снизит их Proximity Score и общую значимость для системы.
    • Игнорирование структуры контента: Размещение важной информации глубоко в документе затрудняет ее извлечение и снижает вероятность ее использования в качестве приоритетной Keyword Phrase.
    • Создание описаний без явных сущностей: Использование абстрактных фраз вместо конкретных имен и названий снижает вероятность того, что система сможет извлечь релевантные Noun Phrases.

    Стратегическое значение

    Патент подтверждает стратегический фокус Google на понимании естественного языка и извлечении сущностей. Описанный механизм генерации запросов показывает, как Google интерпретирует контент: он ищет именные группы и приоритизирует их на основе порядка появления. Для SEO это означает, что долгосрочная стратегия должна фокусироваться на создании хорошо структурированного контента, где ключевые идеи представлены ясно и в начале текста (Entity-First Optimization).

    Практические примеры

    Сценарий: Оптимизация статьи о фильме для повышения релевантности с учетом Proximity Score

    Применяем принципы извлечения Keyword Phrases и расчета Proximity Score.

    • Плохой пример (начало статьи): «Вчера вечером я посмотрел этот удивительный фильм. Он заставил меня задуматься о многом. Режиссером выступил Кристофер Нолан, а главную роль сыграл Леонардо Ди Каприо. Фильм называется ‘Начало’».
    • Анализ Google (Гипотетический):
      • Noun Phrases (в порядке появления): «удивительный фильм», «Кристофер Нолан», «Леонардо Ди Каприо», «Начало».
      • Proximity Score: Самый высокий у «удивительный фильм» (нерелевантно), самый низкий у «Начало» (ключевая сущность).
    • Хороший пример (начало статьи): «’Начало’ (Inception) – научно-фантастический фильм Кристофера Нолана. Главную роль исполняет Леонардо Ди Каприо, играющий специалиста по промышленному шпионажу, использующего технологию осознанных сновидений».
    • Анализ Google (Гипотетический):
      • Noun Phrases (в порядке появления): «Начало (Inception)», «научно-фантастический фильм», «Кристофер Нолан», «Леонардо Ди Каприо»…
      • Proximity Score: Самые высокие баллы у ключевых сущностей («Начало», «Кристофер Нолан», «Леонардо Ди Каприо»). Система сгенерирует наиболее релевантные запросы с высоким приоритетом.

    Вопросы и ответы

    Что такое Proximity Score и как это влияет на SEO?

    Proximity Score — это метрика, присваиваемая ключевой фразе на основе порядка ее появления в исходном тексте. Фразы, появившиеся раньше, получают более высокую оценку. Для SEO это является прямым подтверждением важности размещения ключевых тем и сущностей в начале контента (заголовки, первые абзацы), так как это увеличивает их вес в автоматизированных системах анализа текста.

    Какая основная ценность этого патента для SEO-специалиста, если он про телевидение?

    Основная ценность заключается в детальном описании процесса обработки естественного языка (NLP), который Google использует для анализа блока текста и генерации релевантных поисковых запросов (FIG. 10). Это дает представление о том, как Google интерпретирует контент, какие элементы текста считает важными (Noun Phrases) и как определяет их приоритет (Proximity Score).

    Что такое Noun Phrases и почему они важны?

    Noun Phrases (Именные группы) — это ключевые элементы смысла текста: названия, имена, объекты, темы (сущности). Система Google извлекает их из текста и использует как основу для генерации поисковых запросов (Keyword Phrases). Это подтверждает стратегическую важность четкого использования и оптимизации под сущности в вашем контенте.

    Описывает ли этот патент алгоритмы ранжирования Google Web Search?

    Нет, он не описывает, как Google ранжирует веб-страницы в основном поиске. Он описывает систему для интерактивного ТВ. Ранжирование, описанное в патенте (с использованием Relevance Score), относится к сортировке связанных результатов внутри ТВ-интерфейса, хотя и использует схожие принципы оценки релевантности.

    Как рассчитывается итоговая оценка релевантности в этой системе?

    Итоговая оценка (Relevance Score) рассчитывается путем умножения Query Score на Proximity Score. Query Score отражает базовую релевантность результата поиска (возможно, с учетом персонализации), а Proximity Score отражает важность термина в зависимости от его позиции в исходном тексте. Это многофакторная модель оценки.

    Использует ли система машинное обучение для анализа текста?

    Патент не упоминает конкретные модели машинного обучения, но описывает процессы, которые являются стандартными задачами NLP (обработки естественного языка). Идентификация Noun Phrases и анализ Descriptive Phrases предполагают использование инструментов NLP, которые часто основаны на машинном обучении.

    Может ли эта технология использоваться для анализа контента веб-страниц?

    Хотя патент описывает применение технологии к тексту из ТВ-оверлеев, сами методы NLP (извлечение именных групп, оценка на основе порядка появления) являются универсальными. Высока вероятность, что аналогичные или схожие механизмы используются Google для анализа текста веб-страниц при индексировании и определении релевантности.

    Как система определяет, что на экране появился информационный оверлей?

    Система анализирует захваченные данные дисплея на наличие предопределенных индикаторов (Predefined Indicators). Эти индикаторы могут включать цвет оверлея, процент занимаемой им площади экрана, расположение текста, а также уровень контраста между областью программы и областью оверлея.

    Может ли система сама вызвать информационный оверлей?

    Да, в описании патента упоминается такая возможность. Система может эмулировать пульт дистанционного управления и отправить инфракрасный (IR) код на ТВ-приставку (например, команду INFO), чтобы заставить ее показать оверлей. После захвата экрана и OCR она может отправить команду для его закрытия.

    Какие типы сайтов получат наибольшую выгоду от этого механизма?

    Наибольшую выгоду получат сайты, связанные с медиа, развлечениями, спортом и новостями (официальные сайты фильмов, фан-сайты, спортивные порталы). Они будут получать трафик от пользователей, которые ищут дополнительную информацию о том, что они видят по телевизору в данный момент, используя интерфейс Smart TV или второй экран.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.