Google использует систему для классификации изображений, объединяющую пиксельные данные, метаданные (время, место) и контекстуальную информацию (включая личные данные пользователя или контекст веб-страницы). Патент раскрывает формулу ранжирования изображений, основанную на уверенности …
Мультимедиа
Анализ патента Google, описывающего гибридную систему поиска по изображению. Система обучается понимать визуальное сходство на основе оценок людей (Similarity Feedback). Она уточняет семантику изображения, анализируя текстовые метки визуально похожих картинок …
Google использует технологию для автоматического определения и маркировки специфических объектов или действий (называемых "объемами") внутри видео. Система анализирует визуальные характеристики, сегментирует видео на пространственно-временные части и использует существующие метаданные всего …
Google улучшает свои возможности визуального поиска, анализируя изображения, загружаемые пользователями (query images). Система автоматически добавляет уверенно распознанные пользовательские изображения в свою обучающую базу данных, чтобы лучше распознавать вариации известных объектов. …
Google применяет многоуровневую систему анализа изображений, комбинируя метаданные (GPS, время), первичное распознавание объектов (Primary Annotation) и вторичные метки, полученные через семантическое и иерархическое расширение (Label Expansion). Это позволяет системе строить …
Google может анализировать активные нетекстовые данные (изображения или видео), отображаемые на устройстве пользователя в момент ввода запроса. Если запрос неоднозначен (например, содержит местоимения или общие фразы), система извлекает из визуального …
Google повышает точность геолокации, используя систему компьютерного зрения для сравнения изображений с веб-сайтов (например, сайтов недвижимости или бизнеса) с изображениями Street View. Если объекты визуально совпадают, координаты адреса уточняются. Кроме …
Патент Google описывает систему для интерактивного ТВ, которая идентифицирует просматриваемую программу путем захвата экрана и применения оптического распознавания символов (OCR) к информационным оверлеям (например, ТВ-гиду). Система анализирует извлеченный текст, выделяет …
Патент Google, описывающий технологию интеграции интерактивных 3D-моделей непосредственно в страницу результатов поиска (SERP) и другие веб-страницы. Система использует семантическую информацию для идентификации объекта и встраивает 3D-просмотрщик в специальный блок выдачи …
Google использует двухэтапный процесс для ответа на описательные запросы о медиаконтенте (например, по сюжету или персонажам). Сначала система выполняет веб-поиск по запросу. Затем она анализирует топовые веб-страницы, чтобы определить, какие …
Google использует механизм для улучшения навигации при уточнении запросов, особенно в визуальном поиске. Система генерирует визуальные превью результатов для подсказок (Query Suggestion Groupings). Ключевая особенность: подсказка отображается, только если ее …
Google использует многоступенчатую систему для определения, ищет ли пользователь медиа-контент. Система анализирует результаты из товарного индекса, поисковые подсказки (Candidate Queries) и списки ключевых слов. Если эти сигналы указывают на медиа-интент, …
Google использует технологию визуального поиска для идентификации текста в изображениях (визуальных запросах). Система оценивает качество распознанного текста (OCR), находит соответствующие строки в своей базе канонических документов (например, веб-страниц или книг) …
Google разработал механизм для улучшения точности поиска визуальных концепций. Система анализирует текстовый запрос и определяет слова с «визуальным интентом» (например, описание узора или цвета). Пользователю предлагается заменить эти слова конкретным …
Google разработал систему для улучшения визуального поиска путем стандартизации входных изображений. Анализируя свою базу, Google определяет оптимальный ракурс («канонический вид») для разных объектов. Эти виды предоставляются как шаблоны (наложения) в …
Google анализирует метаданные (GPS, ориентация устройства, данные акселерометра) и визуальные характеристики (края, цвет, текстура) фотографии, сделанной на мобильном устройстве. Эта система позволяет быстро классифицировать, изображено ли на ней "место" (например, …
Google применяет механизм кросс-язычного поиска (CLIR) для улучшения выдачи изображений и видео. Система автоматически переводит запрос пользователя на другие языки, выбирая наиболее подходящий на основе частотности терминов (IDF) в его …
Google использует технологию распознавания объектов на изображениях для обогащения своей Базы Знаний (Knowledge Graph). Система анализирует наборы изображений, определяет, какие сущности часто появляются вместе (например, «Медведь Гризли» и «Рыба»), и …
Google использует сверточные нейронные сети (CNN) для анализа пикселей видео и автоматического создания аннотаций. Система применяет двухканальный подход, анализируя как общий контекст (в низком разрешении), так и центральную область фокуса …
Google может локально анализировать окружающий звук через микрофон устройства, чтобы определить, какой медиаконтент (ТВ-шоу, фильм) воспроизводится поблизости. Для этого система заранее загружает персонализированный набор аудио-отпечатков. При совпадении этот контекст используется …