Как Google связывает веб-контент с медиа для воспроизведения на ТВ (Google TV/Chromecast)

Патент описывает технологию (например, расширение для браузера), которая анализирует просматриваемую веб-страницу для обнаружения связанного медиаконтента (ТВ-программы, потоковое видео). Система позволяет пользователю выбрать этот контент на компьютере и автоматически воспроизвести его на другом устройстве, например, подключенном телевизоре (Google TV).

Описание

Какую задачу решает

Патент решает проблему разрыва между просмотром веб-контента на одном устройстве (например, компьютере или планшете) и потреблением связанного медиаконтента на другом устройстве (например, телевизоре). Он устраняет необходимость для пользователя вручную прерывать просмотр веб-страницы, переключаться на телевизор и заново искать там интересующий медиаконтент, упомянутый или связанный с темой веб-страницы.

Что запатентовано

Запатентована система, состоящая из клиентского модуля (например, расширения браузера) и серверной инфраструктуры, которая анализирует электронный документ, открытый на первом устройстве. Цель анализа — обнаружить медиа-сущности (Media Entities), связанные с тематикой документа, даже если они явно не встроены в документ. Система предоставляет список этих медиа-сущностей пользователю и позволяет инициировать воспроизведение выбранного контента на втором устройстве (например, Connected TV/STB).

Как это работает

Механизм работает следующим образом: клиентский модуль на первом устройстве получает идентификационную информацию о документе (Document Identifying Information) — это может быть URL или исходный код страницы. Эта информация отправляется на сервер (Backend System). Сервер анализирует документ, используя извлечение сущностей (Entity Retriever/WebRef), чтобы понять тематику и найти связанные медиа-сущности в своей базе данных. Эти сущности фильтруются (остаются только медиа) и возвращаются клиенту. Клиент отображает список, и при выборе пользователя отправляет команду воспроизведения на подключенный телевизор или приставку.

Актуальность для SEO

Низкая/Средняя. Патент напрямую связан с продуктом Google TV (предшественник Android TV и Chromecast). Хотя конкретная реализация в виде анализирующего страницу расширения для браузера сейчас не является доминирующей технологией, базовая концепция связи устройств и кросс-платформенного воспроизведения контента (например, Chromecast) остается актуальной. Технология извлечения сущностей (WebRef), лежащая в основе патента, критически важна для Google.

Важность для SEO

Влияние на SEO минимальное (1/10). Патент описывает функциональность конкретного продукта (Google TV/Chrome Extension), а не алгоритмы ранжирования веб-поиска. Он не влияет на то, как сайты ранжируются в Google Search. Однако он демонстрирует возможности Google по глубокому анализу контента и извлечению сущностей (Entity Extraction) для понимания тематики документа, что является важным фоновым знанием для SEO-специалистов.

Детальный разбор

Термины и определения

Backend System (Серверная система): Сервер, который получает информацию о документе от клиентского устройства, анализирует ее и возвращает список связанных медиа-сущностей.
Client System (Клиентская система / Первое устройство): Устройство (например, компьютер, планшет), на котором пользователь просматривает электронный документ и взаимодействует с модулем управления ТВ.
Connected TV and/or Set-top box (Подключенный ТВ и/или Приставка / Второе устройство): Устройство вывода (например, Google TV), которое получает команду от клиентской системы и воспроизводит выбранный медиаконтент.
Document Application (Приложение для работы с документами): Программа на клиентском устройстве для просмотра контента, чаще всего веб-браузер.
Document Identifying Information (Идентификационная информация о документе): Данные, отправляемые клиентом на сервер для идентификации контента. Это может быть часть сетевого идентификатора (например, URL) или исходный код документа (например, HTML).
Entity Database (База данных сущностей): Хранилище, содержащее информацию о различных сущностях (медиа, люди, места и т.д.) и их связях с электронными документами.
Entity Retriever (WebRef) (Извлекатель сущностей): Компонент серверной системы, который идентифицирует сущности, связанные с электронным документом, используя Entity Database. WebRef — это вероятное внутреннее название системы аннотирования и извлечения сущностей Google.
Media Entity (Медиа-сущность): Сущность, соответствующая медиаконтенту, такому как запланированные ТВ-программы, потоковое медиа (например, YouTube) или локально сохраненные медиафайлы.
TV Remote Control Module (Модуль дистанционного управления ТВ): Компонент на клиентском устройстве (часто реализованный как расширение или плагин браузера), который управляет взаимодействием с сервером и подключенным ТВ.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на функциональности продукта, а не на алгоритмах поиска.

Claim 1 (Независимый пункт): Описывает метод на стороне клиентского (первого) устройства.

Открытие электронного документа и получение его идентификационной информации (включая исходный код).
Отправка запроса на сервер для поиска медиа-сущностей, связанных с тематикой (subject) документа. Важное уточнение: эти сущности не обязательно должны быть связаны ссылками или включены в сам документ. Запрос включает идентификационную информацию документа.
Получение от сервера медиа-сущностей, связанных с тематикой документа. Сервер идентифицирует их путем парсинга исходного кода и извлечения данных из базы сущностей.
Отображение списка полученных медиа-сущностей на первом устройстве.
Получение выбора пользователя.
Отправка информации о выборе на второе устройство (ТВ), которое настроено для доступа и отображения соответствующего контента.

Claim 18 (Независимый пункт): Описывает метод на стороне сервера.

Получение от первого устройства идентификационной информации документа (включая исходный код).
В ответ на это:
- Идентификация тематики (subject) документа.
- Идентификация медиа-сущностей, связанных с тематикой, путем парсинга исходного кода и извлечения данных из базы сущностей. Включаются сущности, которые не связаны ссылками или не включены в документ.
Отправка набора медиа-сущностей первому устройству для отображения.

Где и как применяется

Этот патент не описывает часть стандартного конвейера веб-поиска (Ranking, Reranking). Он описывает отдельную продуктовую функциональность, которая, однако, опирается на данные, генерируемые на этапе индексирования.

INDEXING – Индексирование и извлечение признаков
Система полагается на предварительно обработанные данные. На этапе индексирования Google анализирует документы, идентифицирует сущности и сохраняет эти связи в Entity Database. Компонент Entity Retriever (WebRef) использует эти данные для быстрого нахождения сущностей, связанных с документом.

Взаимодействие компонентов:

TV Remote Control Module (обычно плагин браузера) на клиентском устройстве взаимодействует с Backend System для получения медиа-списка и с Connected TV/STB для инициации воспроизведения.
Backend System использует Entity Retriever (WebRef) и Entity Database для анализа и Content Filter для отбора релевантных медиа.

Входные данные:

Document Identifying Information (URL или исходный код страницы).
Критерии фильтрации (Filtering Criteria) на сервере.
Выбор пользователя и команды управления воспроизведением.

Выходные данные:

Список медиа-сущностей (Media Entities), отправляемый с сервера клиенту.
Информация о выборе (Selection Information), отправляемая клиентом на ТВ.

На что влияет

Пользовательский опыт: Влияет только на пользователей, которые используют совместимую экосистему (например, браузер с соответствующим расширением и Google TV/Chromecast).
Типы контента: Влияет на обнаружение медиаконтента (ТВ-программы, потоковое видео, локальные файлы), связанного с любыми типами электронных документов (веб-страницы, текстовые файлы).

Когда применяется

Условия работы: Алгоритм активируется, когда пользователь просматривает электронный документ на первом устройстве, которое подключено (спарено) со вторым устройством (ТВ).
Триггеры активации: Обнаружение связанных медиа-сущностей может происходить автоматически при загрузке страницы или по запросу пользователя через интерфейс модуля управления ТВ.

Пошаговый алгоритм

Этап 1: Подготовка и Идентификация Документа

Соединение устройств: Клиентское устройство устанавливает соединение (спаривание) с Подключенным ТВ/Приставкой (например, через локальную сеть).
Загрузка документа: Пользователь открывает электронный документ (например, веб-страницу) в приложении (например, браузере) на клиентском устройстве.
Получение идентификаторов: TV Remote Control Module получает Document Identifying Information. Это может быть URL или, если контент недоступен публично (например, защищен паролем), исходный код документа.

Этап 2: Обработка на Сервере

Отправка данных: Клиент отправляет идентификационную информацию документа на Backend System.
Извлечение сущностей: Backend System использует Entity Retriever (WebRef) для идентификации множества сущностей, связанных с документом.
- Если получен URL и страница ранее индексировалась, сущности извлекаются из Entity Database.
- Если получен исходный код, сервер парсит его для идентификации тематики и сущностей.
Фильтрация: Content Filter применяет критерии фильтрации к найденным сущностям, чтобы отобрать только медиа-сущности (например, отфильтровываются сущности типа «Книга», «Место», «Человек», остаются «ТВ-программа», «Потоковое медиа»).

Этап 3: Взаимодействие с Пользователем и Воспроизведение

Возврат результатов: Backend System отправляет отфильтрованный список Media Entities обратно клиенту.
Отображение списка: TV Remote Control Module отображает список связанных медиа (включая заголовки, типы, миниатюры).
Выбор пользователя: Система получает выбор пользователя из списка.
Инициация воспроизведения: Клиент отправляет Selection Information, идентифицирующую выбранную медиа-сущность, на Подключенный ТВ/Приставку.
Воспроизведение: ТВ/Приставка получает команду, находит соответствующий контент (в интернете, локальной сети или на ТВ-канале) и начинает воспроизведение.
Управление: Клиентское устройство может использоваться как пульт для управления воспроизведением на ТВ.

Какие данные и как использует

Данные на входе

Патент сосредоточен на инфраструктуре связи между устройствами и использовании данных об индексации. Он не детализирует факторы ранжирования.

Контентные/Технические факторы (Документ): Используется либо URL (сетевой идентификатор), либо полный исходный код (Source Code) просматриваемого документа. Это ключевые входные данные для анализа.
Данные индексации (Системные): Entity Database, содержащая предварительно вычисленные связи между документами и сущностями, полученные в ходе индексирования интернета (например, с помощью WebRef).

Какие метрики используются и как они считаются

В патенте не упоминаются метрики ранжирования (Ranking Scores) или формулы для определения релевантности медиа. Основной механизм — это фильтрация.

Filtering Criteria (Критерии фильтрации): Используются для отсева не-медийных сущностей из общего списка сущностей, связанных с документом. Фильтрация происходит по типу сущности (например, оставить только TV programming, Streaming media, Local media content).

Выводы

Патент описывает внутренние процессы Google, связанные с функциональностью конкретных продуктов (Google TV, расширения браузера), и не дает прямых рекомендаций для SEO.

Отсутствие влияния на SEO-ранжирование: Описанные механизмы не влияют на ранжирование сайтов в веб-поиске. Это патент о пользовательском интерфейсе и кросс-устройственом взаимодействии.
Демонстрация возможностей Entity Extraction (WebRef): Патент подтверждает, что Google (через систему, названную здесь Entity Retriever/WebRef) активно анализирует документы для идентификации связанных сущностей и понимания тематики (Subject) документа.
Анализ контента за пределами ссылок: Ключевой аспект патента (Claims 1 и 18) — способность системы находить медиаконтент, связанный с тематикой документа, даже если этот контент явно не связан ссылками или не встроен в документ. Это подчеркивает важность семантического анализа контента.
Возможность анализа исходного кода: Система может принимать не только URL, но и исходный код страницы от клиента. Это позволяет ей анализировать контент, который может быть недоступен поисковым роботам (например, контент за paywall или в интранете), если пользователь предоставляет к нему доступ через расширение.
Фокус на экосистеме: Изобретение направлено на удержание пользователя внутри экосистемы Google (Chrome/Browser + Google TV/Android TV), упрощая потребление контента.

Практика

Этот патент является инфраструктурным и описывает функциональность продукта. Он не дает практических выводов для улучшения позиций в SEO.

Best practices (это мы делаем)

Хотя прямого влияния на SEO нет, патент косвенно подтверждает важность следующих практик для обеспечения корректного понимания контента системами Google (такими как WebRef):

Четкое тематическое позиционирование контента: Создание контента с ясной структурой и семантикой помогает системам извлечения сущностей (Entity Retriever) точно определить тематику (Subject) документа и связать его с релевантными сущностями в Knowledge Graph.
Использование микроразметки (Schema.org): Разметка медиаконтента (VideoObject, Movie, TVSeries) помогает Google однозначно идентифицировать медиа-сущности на странице, что может улучшить их обработку подобными системами и повысить видимость в релевантных вертикалях.

Worst practices (это делать не надо)

Патент не выявляет новых неэффективных или опасных SEO-тактик.

Стратегическое значение

Стратегическое значение патента для SEO заключается в очередном подтверждении роли семантического анализа и Графа Знаний (Knowledge Graph) в продуктах Google. Системы типа WebRef, которые используются здесь для поиска связанного медиа, также используются в основном поиске для понимания релевантности. Понимание того, как Google интерпретирует сущности, остается ключевым элементом долгосрочной SEO-стратегии.

Практические примеры

Практических примеров для SEO нет. Ниже приведен пример работы функции, описанной в патенте.

Сценарий: Просмотр статьи и воспроизведение связанного видео

Ситуация: Пользователь читает на компьютере (Первое устройство) длинную статью о биографии Авраама Линкольна. У пользователя установлено соответствующее расширение браузера, и компьютер подключен к Google TV (Второе устройство).
Анализ: Расширение отправляет URL статьи на Backend System.
Обработка: Сервер определяет, что тематика статьи — Авраам Линкольн. Используя Entity Retriever (WebRef), он ищет связанные медиа-сущности.
Результат обнаружения: Сервер находит фильм «Линкольн» (Streaming media), документальную передачу о Гражданской войне (TV programming) и популярный обзор фильма на YouTube (Streaming media). Важно: эти материалы могли не упоминаться в самой статье, но связаны с ее тематикой.
Взаимодействие: Расширение в браузере показывает список этих трех медиа-сущностей.
Воспроизведение: Пользователь кликает на фильм «Линкольн». Компьютер отправляет команду на Google TV, который запускает соответствующее приложение (например, Netflix или Google Play Movies) и начинает воспроизведение фильма.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в Google?

Нет, этот патент не описывает алгоритмы ранжирования веб-поиска. Он описывает функциональность конкретного продукта, позволяющего пользователям находить медиаконтент, связанный с просматриваемой веб-страницей, и воспроизводить его на телевизоре (например, Google TV или Chromecast). Он не вводит новых факторов ранжирования для SEO.

Что такое Entity Retriever (WebRef), упомянутый в патенте?

Entity Retriever (с вероятным внутренним названием WebRef) — это компонент инфраструктуры Google, отвечающий за извлечение и аннотирование сущностей в документах. Он анализирует контент, чтобы понять его тематику, идентифицировать упомянутые сущности (люди, места, фильмы, события) и связать их с Графом Знаний (Knowledge Graph). В контексте этого патента он используется для поиска медиа, связанного с темой просматриваемой страницы.

Может ли система найти связанное медиа, если на моей странице нет ссылок на него?

Да. В Claims 1 и 18 особо подчеркивается, что система идентифицирует медиа-сущности, связанные с тематикой (Subject) документа, даже если они не связаны ссылками или не включены в сам документ. Это означает, что система полагается на общее понимание темы страницы, а не только на анализ исходящих ссылок или встроенных объектов.

Что означает, что система может анализировать «исходный код» (Source Code) документа?

Это означает, что клиентский модуль (расширение браузера) может отправить на сервер не только URL страницы, но и ее полный HTML-код. Это полезно, если страница недоступна для публичного сканирования роботами Google (например, находится в интранете, за paywall или требует авторизации). Анализируя предоставленный пользователем код, система может понять содержание страницы.

Есть ли польза для SEO от этого патента?

Прямой пользы для повышения позиций нет. Косвенная польза заключается в понимании того, насколько глубоко Google анализирует семантику контента. Это подтверждает важность создания четко структурированного контента и использования микроразметки для помощи системам Google (таким как WebRef) в правильной интерпретации тематики ваших страниц.

Как система определяет, какие сущности являются «медиа», а какие нет?

После того как Entity Retriever находит все связанные сущности, в работу вступает Content Filter. Он использует заранее определенные критерии (Filtering Criteria) для классификации сущностей по типам. Сущности типа «Книга», «Человек» или «Место» отфильтровываются, а сущности типа «ТВ-программа», «Потоковое видео» или «Локальный медиафайл» возвращаются пользователю.

К какому этапу поиска относится этот патент?

Патент не относится к этапам ранжирования (Ranking) или переранжирования (Reranking). Он полностью зависит от данных, собранных на этапе Индексирования (Indexing), в частности, от работы систем извлечения признаков и сущностей. Сама функциональность работает поверх индекса как отдельное приложение.

Актуален ли этот патент, если Google TV больше не существует?

Google TV эволюционировал в Android TV и функциональность Chromecast. Концепция, описанная в патенте — обнаружение контента на одном устройстве и воспроизведение на другом — остается крайне актуальной в современных экосистемах стриминга. Технология может быть адаптирована для работы с новыми устройствами.

Нужно ли мне оптимизировать сайт специально под эту функцию?

Нет, специальная оптимизация под эту функцию не требуется. Стандартные лучшие практики SEO по созданию качественного контента и использованию семантической разметки (Schema.org) обеспечат достаточно контекста для работы систем извлечения сущностей, которые лежат в основе этой технологии.

Может ли эта система помочь в продвижении моего видеоконтента?

Теоретически, если ваш видеоконтент является авторитетным и хорошо индексируется Google (например, на YouTube или на вашем сайте с разметкой VideoObject), он может быть обнаружен этой системой как связанное медиа при просмотре пользователями релевантных веб-страниц. Это может привести к дополнительным просмотрам, но только среди пользователей, активно использующих эту функцию.