Google использует механизм, который анализирует медиаконтент (фильмы, шоу), потребляемый пользователем на устройстве (например, телевизоре). Система извлекает контекст (актеры, объекты, сцены, диалоги) в реальном времени и использует его для автоматического дополнения последующих поисковых запросов пользователя. Это позволяет уточнить неоднозначные запросы и предоставить более релевантные результаты, связанные с просматриваемым контентом, даже если поиск выполняется на другом устройстве (например, смартфоне).
Описание
Какую задачу решает
Патент решает проблему неоднозначности и недостаточной точности поисковых запросов, которые пользователи вводят во время или сразу после потребления медиаконтента (например, просмотра ТВ-шоу или фильма). Пользователи часто ищут информацию, связанную с тем, что они видят на экране, но их запросы могут быть короткими или двусмысленными. Изобретение улучшает понимание истинного намерения пользователя, автоматически связывая его запрос с непосредственным контекстом медиапотребления.
Что запатентовано
Запатентована система, которая идентифицирует контент, воспроизводимый на устройстве в определенный момент времени, и использует его как контекст для поиска. Система извлекает contextual information (контекстную информацию: объекты, аудио, метаданные) и генерирует content identifier timestamp (метку времени идентификатора контента). Эта информация используется для автоматического augmenting (дополнения) последующих поисковых запросов пользователя для предоставления кастомизированных и более релевантных результатов.
Как это работает
Система работает путем анализа медиапотока в реальном времени:
- Анализ контента: Компонент управления поиском (Search Management Component) анализирует контент на медиаустройстве (например, ТВ), используя распознавание образов (Pattern Recognition), аудио (Audio Recognition) и связанные данные (метаданные, субтитры).
- Извлечение контекста: Идентифицируется Contextual Information (сущности, объекты, диалоги) в конкретный момент времени.
- Генерация метки: Создается Content Identifier Timestamp, связывающий контекст и время просмотра.
- Дополнение запроса (Query Augmentation): Когда пользователь выполняет поиск, система проверяет, может ли недавний контекст улучшить запрос. Если да, она модифицирует исходный запрос, создавая Augmented Search Query (например, запрос «enforcer» дополняется до «enforcer ‘Clint Eastwood’ movie»).
- Кросс-девайсность: Контекст может передаваться между сопряженными (paired) устройствами (например, с ТВ на смартфон).
Актуальность для SEO
Высокая. Контекстный поиск, понимание пользователя на разных устройствах (кросс-девайсные экосистемы) и персонализация являются ключевыми направлениями развития поиска. С ростом числа смарт-ТВ и подключенных устройств (например, Google TV, Android), использование контекста потребления медиа для уточнения поиска крайне актуально. Патент является продолжением заявки 2012 года, что указывает на долгосрочную стратегическую важность этой технологии.
Важность для SEO
Патент имеет существенное значение (7.5/10), особенно для SEO в сферах медиа, развлечений и электронной коммерции. Он напрямую не описывает алгоритмы ранжирования, но критически важен для этапа Понимания Запросов (Query Understanding). Он демонстрирует, как Google интерпретирует интент пользователя под влиянием медиа. Для SEO это подчеркивает важность оптимизации видеоконтента, использования точных метаданных и обеспечения четкого распознавания сущностей (продуктов, людей) внутри видео для видимости в таких контекстно-зависимых поисках.
Детальный разбор
Термины и определения
- Augmented Search Query (Дополненный поисковый запрос)
- Исходный запрос пользователя, модифицированный системой путем добавления релевантной Contextual Information для уточнения интента.
- Communication Device (Коммуникационное устройство)
- Устройство, отображающее контент (например, ТВ, IPTV, приставка) или устройство, используемое для поиска (например, смартфон, планшет, электронные очки).
- Content Identifier Timestamp (Метка идентификатора контента)
- Структура данных, генерируемая системой, которая связывает идентифицированную Contextual Information с конкретным моментом времени (timestamp) ее отображения в медиаконтенте.
- Contextual Information (Контекстуальная информация)
- Данные, идентифицированные внутри или связанные с частью отображаемого контента. Включает объекты, людей, бренды, названия сущностей (шоу/фильма), диалоги, тексты песен, метаданные, субтитры (closed-caption information), географическое положение, эпоху и т.д.
- Pairing (Сопряжение)
- Процесс ассоциации двух устройств. Может быть прямым (direct pairing) через общий аккаунт или протокол, или косвенным (indirect pairing) по близости (proximity) или общей сети.
- Pattern Recognizer Component / Audio Recognizer Component (Компоненты распознавания образов / аудио)
- Модули, использующие техники распознавания для идентификации визуальной или аудиоинформации в потоке контента.
- Search Management Component (Компонент управления поиском)
- Модуль, отвечающий за идентификацию контекста, генерацию Content Identifier Timestamp и дополнение поисковых запросов.
Ключевые утверждения (Анализ Claims)
Анализ основан на формуле изобретения патента US12019695B2. Важно отметить, что этот патент является продолжением (continuation) более ранних заявок, и его Claims сфокусированы на специфическом кросс-девайсном сценарии.
Claim 1 (Независимый пункт): Описывает медиасистему (устройство, воспроизводящее контент или связанный с ним сервер), которая организует процесс поиска на другом коммуникационном устройстве.
- Медиасистема получает поисковый запрос, содержащий несколько поисковых терминов.
- Определяется, улучшает ли (enhances) контекстная информация (связанная с контентом, воспроизводимым на этой медиасистеме) какой-либо из поисковых терминов.
- Если ДА:
- Медиасистема инициирует (causes) передачу этих контекстных терминов на communication device (второе устройство).
- Медиасистема инициирует (causes) модификацию запроса на этом втором устройстве путем добавления (appending) контекстных терминов, которые указывают идентификатор (identifier) медиаконтента.
- Медиасистема инициирует (causes) отображение результатов поиска (полученных по модифицированному запросу) на этом втором устройстве.
Ядром изобретения в данном конкретном патенте является механизм оркестрации: устройство воспроизведения (например, ТВ) активно управляет процессом модификации запроса и отображения результатов на другом устройстве (например, смартфоне), используя контекст из воспроизводимого контента.
Claim 5 и 6 (Зависимые): Уточняют условия связи устройств.
Связь может быть установлена через общую коммуникационную сеть (Claim 5) или на основе физической близости (defined proximity) устройств (Claim 6).
Claim 7 (Зависимый): Уточняет механизм корреляции.
Система генерирует Content Identifier Timestamp, который используется для установления корреляции между контентом и активностью пользователя (user activity).
Где и как применяется
Изобретение в первую очередь функционирует на этапе QUNDERSTANDING, используя контекстные сигналы, получаемые в реальном времени из активности пользователя (потребление медиа).
QUNDERSTANDING – Понимание Запросов
- Контекстуализация (Contextualization): Это основное применение. Система динамически определяет непосредственный контекст пользователя (что он смотрит/слушает) в реальном времени.
- Извлечение признаков из контента: Применяются технологии NLP, распознавания образов и аудио для извлечения сущностей и контекста из медиапотока.
- Дополнение/Переписывание запроса (Query Augmentation/Rewriting): Перед ранжированием запрос дополняется контекстуальными терминами, извлеченными из медиаконтента (Augmented Search Query).
- Устранение неоднозначности (Disambiguation): Контекст используется для устранения неоднозначности поисковых терминов (например, различая сериал «House» и шоу о ремонте «Flip That House»).
INDEXING – Индексирование (Косвенно)
Система полагается на способность распознавать сущности в медиаконтенте. Это подразумевает, что медиаконтент должен быть проиндексирован и проанализирован (заранее или в реальном времени) для извлечения этих признаков и их связи с Knowledge Graph.
Входные данные:
- Поток медиаконтента (видео/аудио).
- Связанные данные: метаданные, субтитры (closed-caption), телепрограмма (TV listings).
- Поисковый запрос пользователя.
- Информация об устройстве (статус сопряжения, местоположение, профиль пользователя/история просмотров и поиска).
Выходные данные:
- Content Identifier Timestamp (контекст, связанный со временем).
- Augmented Search Query.
На что влияет
- Типы контента: В первую очередь влияет на поиск, связанный с медиаконтентом (фильмы, ТВ-шоу, музыка, реклама, игры) и сущностями внутри них (продукты, актеры, локации).
- Специфические запросы: Сильно влияет на неоднозначные или короткие запросы, где намерение тесно связано с потребляемым медиа.
- Ниши: Развлечения, медиа и электронная коммерция (product placement).
Когда применяется
- Условия активации: Активируется, когда пользователь выполняет поиск во время или вскоре после потребления идентифицируемого медиаконтента.
- Требования к релевантности: Система должна определить, что идентифицированный контекст улучшает (enhance) или уточняет поисковый запрос на основе определенных критериев.
- Кросс-девайсное применение: Применяется, когда устройство поиска совпадает с медиаустройством или когда устройства сопряжены (напрямую через аккаунт или косвенно по близости/сети).
Пошаговый алгоритм
Процесс А: Идентификация Контекста (Фоновый режим)
- Мониторинг контента: Search Management Component отслеживает контент, воспроизводимый на Communication Device (например, ТВ).
- Анализ фрагмента контента: В определенный момент времени анализируется текущий фрагмент контента.
- Извлечение информации: Используются компоненты распознавания образов и аудио, а также анализируются метаданные и субтитры.
- Идентификация контекста: Определяются элементы Contextual Information (например, «Clint Eastwood», «The Enforcer», «Alcatraz»).
- Генерация метки: Создается Content Identifier Timestamp, включающий контекст и время.
- Хранение/Передача: Метка сохраняется и/или передается сопряженным устройствам.
Процесс Б: Обработка и Дополнение Запроса (Реальное время)
- Получение запроса: Пользователь вводит запрос (например, «enforcer») на устройстве поиска.
- Анализ запроса: Система идентифицирует термины в запросе.
- Поиск релевантного контекста: Система ищет в недавних Content Identifier Timestamps контекстуальную информацию, которая может улучшить запрос.
- Принятие решения о дополнении: Определяется, поможет ли контекст в устранении неоднозначности или фокусировке поиска.
- Аугментация: Если контекст релевантен, генерируется Augmented Search Query. Например, «enforcer ‘Clint Eastwood’ movie».
- Выполнение поиска: Дополненный запрос отправляется в Search Engine для получения кастомизированных результатов.
Какие данные и как использует
Данные на входе
Патент описывает использование широкого спектра данных для определения контекста просмотра.
- Мультимедиа факторы:
- Видео: Видеопоток анализируется для распознавания образов (объекты, люди, локации, бренды).
- Аудио: Аудиопоток анализируется для распознавания диалогов, музыки, текстов песен.
- Контентные/Структурные факторы (Связанные данные):
- Метаданные, связанные с медиаконтентом.
- Информация из субтитров (closed-caption information).
- Телепрограмма/описания (TV listings).
- Пользовательские факторы:
- Информация профиля пользователя (user profile).
- История просмотра контента (historical content viewing history).
- История поиска (search history).
- Информация о сопряжении устройств (pairing).
- Географические факторы: Местоположение коммуникационного устройства(в).
Какие метрики используются и как они считаются
Патент не детализирует конкретные метрики для оценки релевантности, но описывает используемые механизмы и методы:
- Распознавание образов (Pattern Recognition) и Аудио (Audio Recognition): Используются для идентификации визуальных и аудио объектов в медиапотоке.
- Анализ текста (NLP): Анализ метаданных и субтитров для извлечения контекстуальных терминов.
- Определение релевантности/улучшения (Enhancement): Система оценивает связь между поисковыми терминами пользователя и извлеченной Contextual Information, чтобы решить, является ли аугментация полезной (например, для устранения неоднозначности).
- Фильтрация (Временная): Система может использовать фильтры для учета только недавней истории просмотра/поиска (defined recent time period, например, за последние 24 часа), чтобы гарантировать актуальность контекста.
Выводы
- Контекст просмотра как сигнал интента в реальном времени: Google активно использует потребляемый пользователем медиаконтент как мощный источник данных о его текущих намерениях. Это механизм Query Understanding, направленный на уточнение интента до этапа ранжирования.
- Автоматическая аугментация запросов: Система автоматически дополняет запросы пользователя (Augmented Search Query) сущностями из медиаконтента. Это снижает усилия пользователя и позволяет разрешать неоднозначность запросов.
- Критичность распознавания сущностей в медиа: Эффективность системы зависит от способности Google глубоко анализировать видео и аудио контент (распознавание объектов, лиц, речи). Это подчеркивает важность технологий типа Google Lens и глубокого индексирования видео.
- Кросс-девайсное взаимодействие: Патент (особенно Claims US12019695B2) уделяет значительное внимание сценариям, где контекст с одного устройства (ТВ) влияет на поиск на другом (телефон). Это подчеркивает важность интегрированных экосистем и механизмов сопряжения (pairing).
- Зависимость от метаданных и субтитров: Помимо анализа аудио/видео потока, система активно использует метаданные и субтитры (closed captioning) как важные источники контекстной информации.
Практика
Best practices (это мы делаем)
Хотя патент описывает инфраструктуру понимания контекста Google, он имеет важное практическое значение для создателей контента, специалистов по Video SEO и e-commerce.
- Оптимизация видео для ясности сущностей: При создании видеоконтента убедитесь, что ключевые сущности (продукты, люди, локации) четко представлены визуально и аудиально. Это помогает компонентам распознавания извлекать точную Contextual Information.
- Использование точных и полных метаданных и субтитров: Предоставляйте исчерпывающие метаданные, описания и субтитры для всего медиаконтента. Патент явно упоминает использование метаданных и closed-caption information как источников контекста.
- Стратегия для E-commerce и Product Placement: При продвижении товаров через видеоконтент необходимо обеспечить оптимизацию карточек товаров под связку «Продукт + Медиаконтекст». Система может дополнять общие запросы (например, «кроссовки») конкретными названиями брендов и названиями фильмов/шоу, извлеченными из видео, которое смотрит пользователь.
- Укрепление присутствия в Knowledge Graph: Убедитесь, что медиа-сущности (шоу, фильмы, актеры, бренды, продукты) хорошо представлены в Knowledge Graph и связаны между собой, так как это облегчает процесс идентификации и дополнения запросов.
- Насыщение контента связанными сущностями: Убедитесь, что веб-страницы содержат полный набор связанных сущностей. Например, страница о фильме должна включать актеров, персонажей, локации, ключевые объекты, чтобы соответствовать потенциально дополненным запросам.
Worst practices (это делать не надо)
- Неоднозначные или отсутствующие метаданные: Предоставление неточных или неполных метаданных для медиаконтента затрудняет извлечение полезного контекста, что приводит к упущенным возможностям для видимости в контекстно-зависимых поисках.
- Низкое качество аудио и видео: Контент с плохим звуком или нечетким изображением снижает эффективность автоматического извлечения контекста с помощью Audio/Pattern Recognition.
- Игнорирование медиа-контекста в SEO-стратегии: Недооценка того, что потребление медиа активно формирует поисковое намерение пользователя в реальном времени и может изменять формулировку запроса, обрабатываемого поисковой системой.
- Создание изолированного контента без контекста: Фокусировка только на прямых ключевых словах без учета связанных сущностей. Такой контент вряд ли будет соответствовать дополненным запросам (Augmented Search Queries).
Стратегическое значение
Патент подтверждает стратегию Google на глубокое понимание контекста пользователя и его окружения (Ambient Computing). Это не просто персонализация на основе истории, а адаптация к немедленной ситуации пользователя. Для SEO это означает, что оптимизация должна двигаться от ключевых слов к сценариям потребления контента, сущностям (Entities) и их взаимосвязям. Стратегически важно строить контент таким образом, чтобы он мог служить ответом на запрос, который был неявно уточнен медиаконтентом.
Практические примеры
Сценарий 1: Оптимизация для E-commerce (Магазин электроники)
- Контекст: Пользователь смотрит ТВ-шоу «House», система идентифицирует контекст: «TV show», «House», «Hugh Laurie», «motorcycle» (Модель Х).
- Запрос пользователя: Пользователь ищет на смартфоне (сопряженном с ТВ) «мотоцикл».
- Действие системы: Система дополняет запрос до «мотоцикл модель Х сериал House».
- SEO-действие: Магазин оптимизирует страницу Модели Х, упоминая ее появление в сериале «House» и используя микроразметку для связи продукта с сущностью сериала.
- Результат: Страница магазина имеет высокие шансы появиться в выдаче по автоматически дополненному запросу, перехватывая высокомотивированный трафик.
Сценарий 2: Оптимизация для медиа-ресурса (Кинопортал)
- Контекст: Пользователь смотрит фильм «The Enforcer», система идентифицирует контекст: «Movie», «Clint Eastwood», «Alcatraz».
- Запрос пользователя: Пользователь ищет на планшете «где это снимали».
- Действие системы: Система дополняет запрос до «The Enforcer места съемок Alcatraz».
- SEO-действие: Кинопортал обеспечивает наличие на странице фильма «The Enforcer» структурированного раздела о местах съемок с явным упоминанием Алькатраса.
- Результат: Кинопортал получает трафик по специфическому запросу, который пользователь не вводил полностью вручную.
Вопросы и ответы
Как именно система определяет, что смотрит пользователь?
Система использует несколько методов. Она анализирует визуальный контент с помощью распознавания образов (Pattern Recognition) для идентификации объектов и людей. Она использует распознавание аудио (Audio Recognition) для анализа диалогов или музыки. Кроме того, система активно использует связанные данные, такие как метаданные контента, субтитры (closed-caption information) и информацию из телепрограммы (TV listings).
Влияет ли этот патент только на поиск на телевизорах (Smart TV)?
Нет, это ключевой момент патента. Система разработана для работы как на самом устройстве воспроизведения, так и на «втором экране» (смартфон, планшет). Если ваше второе устройство сопряжено (Pairing) с телевизором (например, через общий аккаунт Google, общую сеть или физическую близость), контекст с телевизора используется для дополнения запросов на этом втором устройстве.
Что такое Content Identifier Timestamp и зачем он нужен?
Content Identifier Timestamp — это структура данных, которая фиксирует, ЧТО было на экране (контекстная информация: актеры, объекты, сцена) и КОГДА это было (временная метка). Это позволяет системе точно знать, что именно видел пользователь непосредственно перед поиском, обеспечивая высокую точность аугментации запроса.
Как система решает, какие именно контекстуальные термины добавить к запросу?
Система анализирует исходный запрос и сравнивает его с доступной Contextual Information. Цель — улучшить (enhance) запрос, часто путем устранения неоднозначности (disambiguate). Если пользователь ищет «enforcer», а смотрит фильм «The Enforcer», система добавит термины, которые фокусируют поиск именно на фильме (например, «Clint Eastwood» или «movie»).
Как это влияет на SEO для видеоконтента (например, YouTube)?
Это делает оптимизацию видео еще более важной. Чтобы ваш контент служил источником контекста или появлялся в результатах дополненных запросов, он должен быть понятен для Google. Это означает необходимость использования четких метаданных, точных субтитров/транскриптов и структурированных данных, чтобы помочь системам распознавания идентифицировать сущности внутри вашего видео.
Как долго сохраняется контекст после просмотра контента?
Патент не указывает точных сроков, но упоминает использование фильтров (Filter Component) для ограничения истории просмотров определенным недавним периодом времени (например, последние 24 часа, неделя). Это гарантирует, что используемый контекст является актуальным для текущего намерения пользователя.
Может ли система использовать историю просмотров или поиска как контекст?
Да, патент упоминает, что система может использовать историю просмотра контента (historical content viewing history) и историю поиска (search history), сохраненные в профиле пользователя, как дополнительную контекстную информацию для дополнения запросов.
Как SEO-специалисту использовать знание этого патента для продвижения товаров (E-commerce)?
Если ваш товар появляется в медиаконтенте, этот механизм облегчает его поиск. Необходимо убедиться, что связь между товаром и медиаконтентом четко прослеживается на вашем сайте и в Knowledge Graph. Это помогает гарантировать, что при автоматическом дополнении запроса (например, «куртка» -> «куртка из фильма X») ваш сайт будет в приоритете.
Насколько агрессивно система дополняет запрос?
Судя по примерам в патенте, дополнение может быть весьма значительным и включать несколько ключевых сущностей из контента. Цель — максимально сфокусировать поиск на том, что пользователь только что видел, что может радикально изменить поисковую выдачу по сравнению с исходным запросом.
Является ли это формой персонализации поиска?
Да, это продвинутая форма контекстной персонализации в реальном времени. Она основана не столько на долгосрочных интересах пользователя, сколько на его сиюминутной активности (потреблении медиаконтента), что позволяет очень точно определить текущее поисковое намерение.