Мультимедиа

Патент Google описывает систему автоматического анализа мультимедийного контента (видео и аудио) для идентификации срочных новостей. Система использует распознавание образов, аудио и текста для извлечения сущностей и событий. Определив новостной характер …
Google использует передовые технологии OCR для точного извлечения текста из изображений, включая низкокачественные фото с мобильных устройств. Система применяет масштабирование (Super-resolution), многоуровневый анализ (Multi-scale OCR) и контекстно-зависимые языковые модели (например, …
Патент описывает механизм бесшовного визуального поиска прямо в браузере. Пользователь может выделить любую область на веб-странице (изображение, часть видео), которая автоматически фиксируется как изображение и отправляется в качестве поискового запроса. …
Google использует технологию "отпечатков контента" для идентификации того, что пользователь смотрит или слушает на первом устройстве. Система автоматически генерирует связанный поисковый запрос и отправляет на второе устройство "динамические текущие результаты". …
Google использует технологию для анализа видеоконтента, автоматического обнаружения и распознавания лиц. Система создает "закладки" (временные метки), указывающие, когда конкретный человек появляется и исчезает из кадра. Для идентификации используются данные социального …
Патент Google описывает систему для автоматической идентификации и группировки видео, загруженных разными пользователями, которые фиксируют одно и то же реальное событие. Система анализирует метаданные (время, местоположение, направление съемки) и содержимое …
Google проверяет автоматически сгенерированные теги изображений, основанные на местоположении (GPS). Система использует распознавание изображений (Computer Vision), чтобы определить, что на самом деле изображено на фотографии, и сравнивает это с тегами, …
Google повышает точность поиска по картинкам для запросов, указывающих ракурс (например, «вид сбоку»). Система генерирует более широкий запрос (например, «автомобиль вид сбоку») и использует эти результаты как эталонный набор. Это …
Google использует систему для идентификации веб-страниц, основным контентом которых являются изображения (страницы-галереи). Система анализирует количество, размер, расположение изображений и их структуру в DOM-дереве, исключая рекламу и шаблонные элементы. Если страница …
Google использует этот механизм для организации выдачи в поиске по картинкам. Система анализирует визуальное сходство между уже ранжированными изображениями и объединяет их в иерархические кластеры. Для каждого кластера выбирается каноническое …
Google использует автоматизированную систему для создания индекса логотипов. Система анализирует логи поисковых запросов, содержащих слово «логотип», собирает соответствующие изображения из выдачи, кластеризует их по визуальному сходству и выбирает лучшее «репрезентативное …
Google использует систему для повышения визуального разнообразия в поиске по картинкам. Система заранее (офлайн) анализирует визуальное сходство изображений и объединяет их в группы. Если в результатах поиска появляются два изображения …
Google использует систему для автоматической классификации видео, которая объединяет знания из двух доменов. Сначала из текстовых веб-документов извлекаются иерархические отношения между общими категориями и конкретными примерами. Затем эти данные комбинируются …
Google патентует систему визуального поиска с распознаванием лиц и логотипов. Доступ к результатам строго ограничивается на основе настроек конфиденциальности субъекта изображения. Патент также описывает механизм автоматического оповещения пользователей или компаний …
Google динамически корректирует базовую языковую модель распознавания речи, учитывая контекст пользователя в момент запроса. Система повышает вероятность распознавания слов и фраз, связанных с текущим местоположением пользователя, временем суток, погодой, актуальными …
Google патентует интерфейс для уточнения визуального поиска. Пользователь загружает изображение, видит результаты и специальное поле для ввода текстового уточнения. Система объединяет изображение и текст в единый мультимодальный запрос (Multimodal Search …
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические …
Google использует этот механизм для выбора наиболее качественной и авторитетной веб-страницы в качестве целевой (Landing Page) для результатов поиска по картинкам. Если изображение или его близкие копии присутствуют на нескольких …
Google анализирует геоданные и временные метки фотографий, загруженных пользователями, чтобы отличить туристов от местных жителей. На основе скопления "туристических" фотографий система определяет популярные достопримечательности и создает тепловые карты (heat areas). …
Google может получать от пользователя одновременно текстовый запрос и изображение (например, фото с камеры). Система сначала находит каноническое изображение, соответствующее текстовому запросу, а затем ищет этот объект на фотографии пользователя. …