Мультимедиа

Google использует систему для классификации изображений, объединяющую пиксельные данные, метаданные (время, место) и контекстуальную информацию (включая личные данные пользователя или контекст веб-страницы). Патент раскрывает формулу ранжирования изображений, основанную на уверенности …
Анализ патента Google, описывающего гибридную систему поиска по изображению. Система обучается понимать визуальное сходство на основе оценок людей (Similarity Feedback). Она уточняет семантику изображения, анализируя текстовые метки визуально похожих картинок …
Google использует технологию для автоматического определения и маркировки специфических объектов или действий (называемых "объемами") внутри видео. Система анализирует визуальные характеристики, сегментирует видео на пространственно-временные части и использует существующие метаданные всего …
Google улучшает свои возможности визуального поиска, анализируя изображения, загружаемые пользователями (query images). Система автоматически добавляет уверенно распознанные пользовательские изображения в свою обучающую базу данных, чтобы лучше распознавать вариации известных объектов. …
Google применяет многоуровневую систему анализа изображений, комбинируя метаданные (GPS, время), первичное распознавание объектов (Primary Annotation) и вторичные метки, полученные через семантическое и иерархическое расширение (Label Expansion). Это позволяет системе строить …
Google может анализировать активные нетекстовые данные (изображения или видео), отображаемые на устройстве пользователя в момент ввода запроса. Если запрос неоднозначен (например, содержит местоимения или общие фразы), система извлекает из визуального …
Google повышает точность геолокации, используя систему компьютерного зрения для сравнения изображений с веб-сайтов (например, сайтов недвижимости или бизнеса) с изображениями Street View. Если объекты визуально совпадают, координаты адреса уточняются. Кроме …
Патент Google описывает систему для интерактивного ТВ, которая идентифицирует просматриваемую программу путем захвата экрана и применения оптического распознавания символов (OCR) к информационным оверлеям (например, ТВ-гиду). Система анализирует извлеченный текст, выделяет …
Патент Google, описывающий технологию интеграции интерактивных 3D-моделей непосредственно в страницу результатов поиска (SERP) и другие веб-страницы. Система использует семантическую информацию для идентификации объекта и встраивает 3D-просмотрщик в специальный блок выдачи …
Google использует двухэтапный процесс для ответа на описательные запросы о медиаконтенте (например, по сюжету или персонажам). Сначала система выполняет веб-поиск по запросу. Затем она анализирует топовые веб-страницы, чтобы определить, какие …
Google использует механизм для улучшения навигации при уточнении запросов, особенно в визуальном поиске. Система генерирует визуальные превью результатов для подсказок (Query Suggestion Groupings). Ключевая особенность: подсказка отображается, только если ее …
Google использует многоступенчатую систему для определения, ищет ли пользователь медиа-контент. Система анализирует результаты из товарного индекса, поисковые подсказки (Candidate Queries) и списки ключевых слов. Если эти сигналы указывают на медиа-интент, …
Google использует технологию визуального поиска для идентификации текста в изображениях (визуальных запросах). Система оценивает качество распознанного текста (OCR), находит соответствующие строки в своей базе канонических документов (например, веб-страниц или книг) …
Google разработал механизм для улучшения точности поиска визуальных концепций. Система анализирует текстовый запрос и определяет слова с «визуальным интентом» (например, описание узора или цвета). Пользователю предлагается заменить эти слова конкретным …
Google разработал систему для улучшения визуального поиска путем стандартизации входных изображений. Анализируя свою базу, Google определяет оптимальный ракурс («канонический вид») для разных объектов. Эти виды предоставляются как шаблоны (наложения) в …
Google анализирует метаданные (GPS, ориентация устройства, данные акселерометра) и визуальные характеристики (края, цвет, текстура) фотографии, сделанной на мобильном устройстве. Эта система позволяет быстро классифицировать, изображено ли на ней "место" (например, …
Google применяет механизм кросс-язычного поиска (CLIR) для улучшения выдачи изображений и видео. Система автоматически переводит запрос пользователя на другие языки, выбирая наиболее подходящий на основе частотности терминов (IDF) в его …
Google использует технологию распознавания объектов на изображениях для обогащения своей Базы Знаний (Knowledge Graph). Система анализирует наборы изображений, определяет, какие сущности часто появляются вместе (например, «Медведь Гризли» и «Рыба»), и …
Google использует сверточные нейронные сети (CNN) для анализа пикселей видео и автоматического создания аннотаций. Система применяет двухканальный подход, анализируя как общий контекст (в низком разрешении), так и центральную область фокуса …
Google может локально анализировать окружающий звук через микрофон устройства, чтобы определить, какой медиаконтент (ТВ-шоу, фильм) воспроизводится поблизости. Для этого система заранее загружает персонализированный набор аудио-отпечатков. При совпадении этот контекст используется …