
Google использует систему для автоматического уточнения запросов, заданных во время просмотра мультимедиа (например, «Кто это?»). Система определяет сущности (людей, объекты), присутствующие на экране в момент запроса, используя временные метки и анализ истории поисковых запросов (N-грамм). Затем она переписывает запрос, добавляя релевантный контекст, чтобы предоставить точный ответ без прерывания просмотра.
Патент решает проблему неоднозначности и нехватки контекста в запросах, которые пользователи задают во время потребления мультимедийного контента (например, потокового видео). Когда пользователь спрашивает «Что это за машина?» или «Кто этот человек?», он не предоставляет контекст в самом запросе. Изобретение автоматизирует добавление этого контекста, извлекая его из контента, воспроизводимого в данный момент, что улучшает точность поиска и пользовательский опыт, устраняя необходимость прерывать просмотр.
Запатентована система и метод для контекстного переписывания запросов (Query Rewrite) при поиске по мультимедийному контенту. Система извлекает сущности (Entities) из контента и связанных данных, определяет их релевантность в момент запроса и генерирует кандидатов на уточненный запрос. Ключевым механизмом является двухэтапная оценка: сначала оцениваются сущности на основе временных меток (timestamps) и анализа истории запросов (N-grams), а затем оцениваются сгенерированные кандидаты на основе качества их поисковой выдачи.
Система работает в несколько этапов:
N-grams в Query Repository).Query Rewrite Candidates. Эти кандидаты отправляются в поисковую систему.Высокая. Технология крайне актуальна в эпоху доминирования видеоконтента (YouTube, стриминговые сервисы) и развития голосовых ассистентов (Google Assistant, Smart TV). Способность понимать контекст внутри видео и реагировать на запросы в реальном времени является ключевой функцией для улучшения UX.
Патент имеет минимальное влияние на традиционное SEO веб-сайтов, но высокое значение для Video SEO (VSEO). Он демонстрирует, что Google стремится понять содержание видео на гранулярном, посекундном уровне. Для обеспечения видимости контента в таких контекстуальных поисках критически важно предоставлять четкие сигналы (метаданные, временные метки, транскрипты), позволяющие системе точно извлекать и идентифицировать сущности внутри видео.
N-grams.Claim 1 (Независимый пункт): Описывает основной метод контекстного поиска по мультимедийному контенту.
Entities) из мультимедийного контента.Query Rewrite Candidates). Генерация включает ключевой механизм (ядро патента): Scoring) извлеченных сущностей. Оценка базируется на одном или нескольких факторах: (a) Времени, когда сущности аннотированы в контенте (временная релевантность), ИЛИ (b) Совместной встречаемости N-grams в репозитории запросов (вероятностная релевантность на основе истории поиска).Изобретение защищает двухэтапный процесс оценки. Сначала оценивается релевантность самих сущностей (с учетом времени И/ИЛИ истории запросов), а затем оценивается качество результатов, которые генерируют переписанные запросы.
Claim 2 (Зависимый от 1): Уточняет критерии оценки кандидатов (Шаг 5).
Характеристики наборов результатов, используемые для оценки, включают: количество результатов, релевантность результатов терминам запроса и разнообразие (diversity) результатов (например, наличие текста, видео, аудио).
Claim 18 (Независимый пункт): Описывает систему, реализующую метод в конкретном сценарии.
Система получает запрос, относящийся к потоковому мультимедийному контенту. Уточняется, что запрос может быть предоставлен через голосовой ввод во время потребления. Процесс генерации и оценки аналогичен Claim 1. Система предоставляет результаты без прерывания потребления контента. Этот пункт подчеркивает важность бесшовной интеграции поиска в процесс просмотра.
Изобретение затрагивает несколько этапов поиска, связывая понимание контента с пониманием и переписыванием запроса.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка мультимедийного контента. Entity Extractor анализирует контент, метаданные, комментарии и аннотации для извлечения сущностей и их временных меток (timestamps). Также происходит анализ Query Repository для построения моделей N-grams.
QUNDERSTANDING – Понимание Запросов
Основной этап применения патента. Когда пользователь задает запрос во время просмотра, система в реальном времени использует контекст (время просмотра) для извлечения релевантных сущностей. Происходит оценка этих сущностей (с использованием времени и N-grams) и генерация Query Rewrite Candidates. Это пример глубокой контекстуализации запроса.
RANKING / METASEARCH – Ранжирование / Метапоиск
Система выполняет предварительные поиски по сгенерированным кандидатам и анализирует характеристики полученных SERP (количество, разнообразие), чтобы выбрать лучший переписанный запрос. Финальные результаты отображаются пользователю.
Входные данные:
Query Repository (история поисковых запросов).Выходные данные:
Процесс А: Предварительная обработка (Офлайн / Индексирование)
Query Repository для определения совместной встречаемости N-grams.Процесс Б: Обработка запроса (Реальное время)
Query Repository для определения вероятности того, что термины запроса относятся к типу данной сущности.Query Rewrite Candidates.Система использует следующие типы данных:
timestamps).user generated content), используемые для извлечения сущностей.Query Repository – логи предыдущих поисковых запросов, используемые для анализа N-grams.В патенте описаны две основные стадии оценки:
1. Entity Score (Оценка Сущности)
Метрика, определяющая релевантность извлеченной сущности к текущему контексту и запросу. Рассчитывается на основе:
Query Repository. Определяет, насколько вероятно, что данная сущность или ее тип совместно встречается с терминами из запроса пользователя в исторических данных.2. Query Rewrite Candidate Score (Оценка Кандидата на Переписывание)
Метрика, определяющая качество переписанного запроса. Рассчитывается на основе характеристик набора результатов, полученных при отправке кандидата в поисковую систему:
timestamps) для разрешения неоднозначности запросов. Релевантность сущности напрямую зависит от того, присутствует ли она на экране в момент запроса.N-grams), а затем валидируется качество результатов, которые генерируют переписанные запросы. Это обеспечивает высокую точность.N-grams в Query Repository позволяет системе предсказать, о каком типе сущности спрашивает пользователь, даже если запрос расплывчат.Рекомендации направлены на оптимизацию видеоконтента (VSEO), чтобы помочь системе корректно извлекать и аннотировать сущности.
Temporal Relevance Score).Патент подтверждает стратегический курс Google на интеграцию поиска в мультимедийный опыт и глубокое понимание контента за пределами текста. Для VSEO это означает, что оптимизация переходит на уровень структурирования самого содержания и его временной структуры. Способность Google понимать контент на гранулярном уровне (сущность + время) открывает новые возможности для видимости контента через контекстные и голосовые запросы. Стратегии должны фокусироваться на максимальной ясности и структурированности мультимедиа для машинного понимания.
Сценарий: Оптимизация видеообзора продукта для контекстного поиска
Ситуация: Публикация видеообзора нового смартфона «PhoneModel X».
Temporal Relevance Score).Какое значение этот патент имеет для Video SEO на YouTube?
Он имеет высокое значение. Патент показывает, что для захвата трафика из контекстных (включая голосовые) запросов во время просмотра видео необходимо, чтобы Google мог легко идентифицировать сущности (продукты, людей) в вашем видео и знать точное время их появления. Это достигается за счет качественных метаданных, временных меток (глав) и транскриптов.
Как система определяет, какая сущность самая важная в данный момент?
Используется оценка сущностей (Entity Scoring), основанная на двух ключевых факторах. Первый — временная релевантность: насколько близко по времени сущность аннотирована к моменту запроса. Второй — анализ N-grams: система проверяет историю поисковых запросов, чтобы понять, насколько вероятно, что запрос пользователя относится к типу данной сущности.
Что такое оценка на основе совместной встречаемости N-грамм (co-occurrences of n-grams)?
Это статистический анализ истории поисковых запросов (Query Repository). Например, если пользователи часто вводят запросы, содержащие фразу «следующая игра» вместе с названиями спортивных команд, то при получении запроса «Когда следующая игра?» система повысит приоритет сущностей типа «Спортивная команда», присутствующих в видео в этот момент.
Откуда система берет сущности для анализа?
В патенте упоминается извлечение сущностей из самого мультимедийного контента, его метаданных (название, описание), а также из пользовательского контента (UGC), такого как комментарии и аннотации. Качественные субтитры или транскрипты также являются важным источником.
Как система убеждается, что переписанный запрос лучше исходного?
Система проводит валидацию. Она генерирует несколько кандидатов на переписывание (Query Rewrite Candidates), отправляет их в поисковую систему и оценивает качество полученных результатов. Оценка основывается на количестве, разнообразии (diversity) и релевантности результатов. Используется кандидат, давший наилучшую выдачу.
Работает ли это, если пользователь задает запрос голосом?
Да. В патенте (Claim 18) явно упоминается возможность получения запроса через голосовой ввод во время потребления потокового мультимедийного контента. Это ключевой сценарий для голосовых ассистентов и Smart TV.
Что делать создателям контента, чтобы оптимизировать видео под этот механизм?
Ключевая рекомендация — структурировать данные вашего видео. Используйте точные временные метки (например, YouTube Chapters) для разметки ключевых моментов и упоминания сущностей. Загружайте качественные транскрипты (субтитры) и предоставляйте подробные метаданные.
Насколько важны комментарии (UGC) для работы этого механизма?
Они важны. Патент указывает (Claim 8), что пользовательский контент является одним из источников для извлечения сущностей. Если пользователи упоминают в комментариях объекты или людей из видео, это помогает системе лучше понять контекст и содержание.
Влияет ли этот патент на ранжирование моего сайта в обычном поиске Google?
Напрямую нет. Этот патент описывает механизм улучшения понимания запросов в контексте потребления мультимедийного контента. Он не описывает алгоритмы ранжирования стандартной веб-выдачи, но может влиять на видимость вашего видеоконтента в специализированных интерфейсах.
Требуется ли прерывать просмотр видео для получения ответа?
Нет. Одной из главных целей изобретения является предоставление результатов поиска без прерывания потребления мультимедийного контента. Результаты обычно отображаются в виде оверлея, всплывающего окна или озвучиваются ассистентом.

Персонализация
Семантика и интент
Поведенческие сигналы

Мультимедиа
Семантика и интент

Семантика и интент

Мультимедиа
Семантика и интент
Индексация

Мультимедиа
SERP
Семантика и интент

Knowledge Graph
Семантика и интент
Ссылки

Ссылки
Индексация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Индексация
Структура сайта

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
EEAT и качество

Ссылки
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Персонализация

Local SEO
Семантика и интент
Поведенческие сигналы
