Патент описывает комплексную систему для анализа содержимого изображений. Google может распознавать лица, текст на объектах (OCR) и характеристики одежды/аксессуаров. Эта информация индексируется, позволяя пользователям искать изображения не только по тексту, …
Мультимедиа
Google использует технологию Structure from Motion (SfM) для создания 3D-моделей местности и точного определения ракурса каждой фотографии. Это позволяет системе ранжировать изображения для точек интереса (POI). При выборе учитывается контекст …
Анализ патента, описывающего комплексный подход к пониманию изображений. Система обнаруживает и распознает лица, одежду, текст на объектах (OCR) и другие объекты. Для повышения точности используются комбинации признаков (лицо + одежда) …
Google использует технологию для интерпретации неоднозначных запросов (например, голосовой команды «Что это?»), анализируя текущий контент на экране устройства. Система распознает ключевое изображение (Specific Sub-image) и окружающий его текст (OCR), генерирует …
Google использует метод автоматической группировки изображений на основе визуального сходства. Система идентифицирует ключевые точки (interest-points), описывает регионы вокруг них и строит граф, связывая похожие регионы в разных изображениях и пересекающиеся …
Google использует модель машинного обучения для ранжирования рекомендуемого контента, смещая фокус с вероятности клика на прогнозируемое время потребления. Система учитывает не только время просмотра конкретного видео, но и время просмотра …
Google использует систему для автоматического создания описательного текста для изображений, изучая структуру веб-сайта. Система анализирует известные качественные описания ("начальные дескрипторы") и определяет их расположение относительно изображения в HTML-коде. На основе …
Google использует систему для автоматического выбора наилучшего изображения, представляющего содержание статьи или веб-страницы. Система анализирует все изображения на странице, оценивая их характеристики (размер, формат, расположение, контекст) и присваивая им оценку …
Google использует гибридную технику компьютерного зрения для оценки возраста людей на изображениях. Комбинируя результаты нескольких простых бинарных классификаторов возраста (например, «ребенок или взрослый») с помощью регрессора, Google генерирует конкретные оценки …
Google использует систему неконтролируемого обучения для автоматического распознавания достопримечательностей (Landmarks). Анализируя текст, визуальное сходство, геоданные и информацию об авторах в больших коллекциях фотографий, система определяет надежные названия объектов (N-граммы). На …
Google анализирует, какие изображения предпочитают пользователи из разных регионов и говорящие на разных языках. Если предпочтения локальной группы сильно отличаются от глобальных трендов для данного запроса, Google переранжирует выдачу по …
Google использует систему для идентификации событий (спорт, концерты) в запросах и генерации «Интегрированного представления события» (Integrated Event View). Эта система агрегирует фактические данные, результаты веб-поиска и контент из социальных сетей. …
Google использует систему для автоматического определения событий в видео (например, "езда на велосипеде"). Она анализирует заголовки и описания с помощью NLP (POS-анализ), чтобы найти комбинации "глагол+существительное", и фильтрует их через …
Патент Google, описывающий систему организации результатов поиска по картинкам. Google группирует похожие изображения в кластеры на основе визуальных и семантических признаков. Система использует двухуровневый скоринг: Image Score определяет позицию изображения …
Google использует механизм для улучшения результатов поиска по картинкам. Система анализирует набор изображений, найденных по запросу, и сравнивает их визуальные характеристики (цвет, текстуру, формы). Изображения, которые визуально похожи на большинство …
Google использует этот механизм для управления интерактивной рекламой (Shoppable Ads). Система анализирует изображение, содержащее несколько товаров (например, фото интерьера), и вычисляет релевантность (Product Relevance Score) и заметность (Prominence Score) каждого …
Google использует этот механизм для организации результатов визуального поиска (Query by Image). Система анализирует изображения и текстовые метки, загруженные пользователями (UGC). При получении запроса в виде картинки, система находит похожие …
Google использует систему для персонализации отображения геолоцированных изображений в картографических сервисах. Система анализирует предпочтения пользователя (явные и автоматические) и ранжирует доступные фото и панорамы для конкретной локации. Учитываются такие факторы, …
Google использует систему автоматического распознавания лиц для идентификации людей в видео. Система самостоятельно создает базу данных моделей лиц, анализируя изображения и тексты из интернета. Затем она отслеживает лица в видеопотоке, …
Google использует систему для автоматического обнаружения, отслеживания и распознавания лиц в видеоконтенте. Это позволяет индексировать видео не только по метаданным, но и по конкретным людям, присутствующим в кадре. Система может …