Google патентует систему для глубокого анализа видеоконтента во время его создания. Система синхронизирует несколько потоков: видео докладчика, демонстрацию экрана, аннотации и транскрипцию в реальном времени. Это позволяет индексировать содержание видео, …
Мультимедиа
Google анализирует контент интерактивных сессий (например, обучающих видео), чтобы определить, какие инструменты и материалы необходимы для выполнения конкретной задачи. Система классифицирует их как "обязательные" или "опциональные" на основе частоты использования …
Google использует этот механизм для улучшения поиска, особенно по картинкам. Если пользователь вводит описательный запрос (например, «коричневая собака-пловец»), система распознает конкретные сущности в найденных результатах (например, «Чесапик-бей-ретривер») и отображает их …
Google использует систему классификации изображений, чтобы определить, соответствует ли текст, связанный с изображением (например, alt-текст или окружающий контент), его визуальному содержанию. Система обучается распознавать объекты на основе визуальных признаков. Если …
Google использует естественный язык (например, разговоры с Ассистентом) для идентификации значимых событий. Система анализирует фотографии, сделанные в этот период, и использует поведенческие сигналы (время просмотра, редактирование, пересылка) и распознавание объектов, …
Google улучшает понимание содержания изображений, распространяя семантические метки (labels) между ними. Если два изображения связаны не визуальными признаками (сняты в одно время, в одном месте, или сгруппированы в один альбом), …
Google разрабатывает систему мультимодального поиска по видео. Когда пользователь задает вопрос во время просмотра, специальная ИИ-модель (Router Model) анализирует запрос и контекст (таймкод), выделяет релевантный видеоклип и определяет, какая специализированная …
Google анализирует акустические сигналы (например, ударение) и грамматическую структуру в последующих голосовых запросах, чтобы понять, к чему относятся местоимения (например, «он», «это») или неоднозначные фразы из предыдущих поисковых сессий. Это …
Google разрабатывает технологию, позволяющую автоматизированным ассистентам (например, Google Assistant) самостоятельно взаимодействовать с веб-сайтами для выполнения транзакций (покупки, бронирования). Система анализирует визуальный и геометрический контекст элементов (кнопки, формы), создавая устойчивые идентификаторы …
Google использует метод надежного хеширования для идентификации почти дублирующихся медиафайлов (изображений, видео, аудио), даже если они были обрезаны или изменены. Система генерирует устойчивую гистограмму признаков файла, а затем применяет взвешенное …
Google разрабатывает систему мультимодального поиска, позволяющую пользователям записывать видео и одновременно задавать вопрос голосом или записывать звук. Система использует продвинутые ML-модели для генерации видео-эмбеддингов, анализа временной информации и аудиосигнатур. Это …
Патент описывает систему оценки изображений на предмет нежелательного (например, взрослого) контента. Система анализирует не только само изображение и страницу, на которой оно размещено, но и агрегированные статистические данные по другим …
Google анализирует, как объекты движутся и трансформируются в видео (траектории), чтобы понять, что визуально разные состояния (например, открытый и закрытый глаз) семантически являются одним и тем же объектом. Эта технология …
Google отслеживает прямые эфиры (ТВ, радио, стримы) и извлекает из них ключевые темы и сущности. Система использует эту информацию для повышения в реальном времени релевантных поисковых подсказок (Autocomplete), адаптируя их …
Google использует базу данных 3D-моделей для глубокого анализа объектов в поисковых запросах, особенно в изображениях. Система сопоставляет объект с его эталонной 3D-моделью, чтобы определить точный контекст: ориентацию, масштаб, освещение и …
Google использует механизм валидации для выбора наилучшей текстовой метки (label) для изображения. Система генерирует кандидатов в метки, использует их как поисковые запросы и проверяет, сколько качественных веб-результатов действительно содержат исходное …
Google использует технологию для анализа изображений (например, фотографий меню или постеров). Система распознает текст на картинке и позволяет пользователю выбрать его для поиска. Ключевой механизм — классификация контекста всего изображения. …
Google группирует поисковые запросы в Image Search, основываясь на том, насколько визуально похожи их результаты (анализ на уровне пикселей). Для каждого такого кластера («визуального концепта») система создает отдельную функцию ранжирования …
Патент Google описывает, как системы распознавания речи (ASR) автоматически адаптируются к новым словам и трендам. Система анализирует частотность слов в текстовых поисковых запросах и изучает произношение из медиа с субтитрами. …
Google использует систему для связи медиаконтента (например, видео на YouTube) со структурированными данными из Базы Знаний (Knowledge Graph). Описывается, как создаются ассоциации между видео и сущностями путем анализа метаданных, что …