Мультимедиа

Google анализирует контент фотографий, размещенных в интернете или загруженных пользователями, используя автоматические метки и данные о геолокации/времени. Это позволяет системе создавать детальные описания территорий, определять точки интереса (POI), отслеживать события …
Система Google для визуального поиска товаров, которая анализирует изображения, извлекая глобальные и локальные признаки (цвет, форма, текстура). Патент описывает, как это позволяет пользователям искать похожие товары, выделяя конкретные части объекта …
Google использует продвинутые статистические модели (глубокие сверточные нейронные сети) для анализа изображений фасадов бизнеса (например, Street View или фото пользователей). Система автоматически определяет множественные иерархические категории (например, «Пиццерия» → «Ресторан» …
Google использует систему для оценки того, насколько визуальное содержание изображения соответствует теме веб-страницы, на которой оно размещено. Система независимо определяет темы страницы (из текста) и темы изображения (используя компьютерное зрение) …
Google использует систему для улучшения визуального поиска (например, Google Lens), которая сначала определяет семантическое значение исходного изображения (например, «собор» или «автомобиль»). Вместо применения универсальной формулы схожести, система создает индивидуальную метрику …
Google использует интерфейс для поиска медиаконтента, объединяющий прокручиваемый список результатов и специальную «область фокуса» для автоматического воспроизведения превью. Система анализирует жесты пользователя (свайпы, касания) в реальном времени, используя персонализированное машинное …
Google патентует механизмы интерфейса для мобильных платформ (например, YouTube), направленные на улучшение обнаружения контента. Система активно показывает превью скрытых видео в виде анимированных плавающих элементов (Floatables) или компактных плиток (Chips) …
Google использует механизм для понимания содержания изображения, когда оно используется в качестве запроса (например, в Google Lens). Система находит визуально похожие изображения в индексе и анализирует связанные с ними текстовые …
Google использует систему для автоматического анализа фотографий, сделанных пользователями на мобильных устройствах. Система сопоставляет место съемки с базой данных POI, анализирует содержание изображения и сравнивает его с семантическими дескрипторами местоположения. …
Google разработал систему для глубокого анализа видео, особенно коротких форматов. Система генерирует мультимодальные эмбеддинги, объединяя визуальные, аудио и текстовые сигналы с помощью трансформеров. Это позволяет Google точно характеризовать контент, оценивать …
Google использует систему постобработки для результатов классификации изображений, полученных от нейронных сетей. Патент описывает, как исходные оценки (raw scores) корректируются с учетом иерархических (subsumption) и исключающих (exclusion) отношений между объектами …
Google использует персонализированный алгоритм для ранжирования поставщиков медиаконтента (фильмов, сериалов). Система учитывает наличие у пользователя подписок, установленных приложений, историю взаимодействий, стоимость контента, поддержку глубоких ссылок и популярность сервиса, чтобы определить, …
Google использует систему обнаружения дубликатов видео в реальном времени при загрузке контента. С помощью аудио и видео отпечатков система определяет, является ли новое видео копией существующего, учитывая временную синхронизацию и …
Google анализирует, как часто видео появляются вместе в одних и тех же плейлистах (статистика совместного появления), чтобы формировать рекомендации на YouTube. Этот метод позволяет рекомендовать даже малопопулярные видео. Ранжирование основано …
Google анализирует контент на экране мобильного устройства (или данные с камеры), распознает сущности (люди, места, объекты), определяет наиболее важные из них на основе истории поисковых запросов и предоставляет пользователю "Карточки …
Google использует систему для обогащения пользовательского медиаконтента (например, видео) структурированными метаданными. Система позволяет зрителям предлагать или подтверждать данные (теги в формате ключ-значение), извлекая их также из комментариев. На основе агрегированных …
Google анализирует визуальные характеристики изображений и строит граф сходства. Релевантные ключевые слова распространяются от размеченных изображений к похожим, но неразмеченным или плохо размеченным изображениям. Это позволяет поисковой системе понять реальное …
Google использует механизм, который анализирует медиаконтент (фильмы, шоу), потребляемый пользователем на устройстве (например, телевизоре). Система извлекает контекст (актеры, объекты, сцены, диалоги) в реальном времени и использует его для автоматического дополнения …
Google анализирует временные метки (таймкоды) в комментариях к видео для определения популярных сегментов. Система кластеризует близкие метки, ранжирует сегменты по популярности и выполняет их предварительную загрузку (prefetching). Это позволяет пользователям …
Google анализирует визуальные запросы (изображения) для распознавания сущностей (продукты, логотипы, текст, здания). Система находит связанную информацию в индексе (номера телефонов, адреса, URL) и генерирует «действенные результаты» — интерактивные кнопки, позволяющие …