Мультимедиа

Как Google использует распознавание объектов, метаданные и семантическое расширение для глубокого понимания и организации изображений

2015 • Мультимедиа

US11138476B2 2021-10-05 2015-12-28

Google применяет многоуровневую систему аннотирования изображений. Она объединяет метаданные (EXIF), первичное распознавание объектов и контекста (Primary Annotation), а также семантическое расширение меток (Label Expansion). Это позволяет системе понимать сложные запросы …

Как Google автоматически распознает товары в видео и создает интерактивные каталоги для шопинга

2011 • Мультимедиа

US9213989B2 2015-12-15 2011-10-10

Патент описывает, как Google может анализировать медиаконтент (фильмы, ТВ-шоу, видео) для автоматической идентификации показанных в нем товаров или услуг, используя распознавание изображений, речи и текста (субтитров). Система создает динамический каталог, …

Как Google использует существующие пользовательские плейлисты для генерации автоматических «Миксов» по широким запросам

2015 • Мультимедиа

US10635676B2 2020-04-28 2015-05-07

Google анализирует существующие плейлисты, созданные пользователями, которые релевантны широкому поисковому запросу (например, жанру или теме). Система оценивает качество этих плейлистов на основе их популярности и свежести, а затем агрегирует эти …

Как Google использует сегментацию изображений для быстрого распознавания и локализации объектов

2011 • Мультимедиа

US10061999B1 2018-08-28 2011-11-17

Google использует метод обнаружения объектов, основанный на сегментации изображений. Система обучается связывать визуальные фрагменты (сегменты) с расположением всего объекта (Bounding Box). При анализе нового изображения система быстро определяет, какие объекты …

Как Google идентифицирует и отображает изображения лиц людей рядом с результатами поиска

2008 • Knowledge Graph • Индексация • Мультимедиа

US9411827B1 2016-08-09 2008-07-24

Google использует систему для улучшения поисковой выдачи по запросам, содержащим имена людей. Система анализирует релевантные веб-страницы, обнаруживает наличие лиц (Face Detection) и определяет личность человека на фото, используя текстовые сигналы …

Как Google объединяет дубликаты изображений в кластеры и индексирует их как единое целое для улучшения визуального поиска

2012 • Индексация • Мультимедиа

US8923626B1 2014-12-30 2012-06-25

Google оптимизирует визуальный поиск, группируя почти идентичные изображения (измененный размер, обрезка) в единый кластер. Система индексирует не отдельные картинки, а совокупность всех визуальных признаков ("визуальных слов") из всех вариантов в …

Как Google использует фоновую музыку и историю просмотра для изменения поисковых подсказок (Autocomplete) в реальном времени

2015 • Мультимедиа • Персонализация

US9984075B2 2018-05-29 2015-10-06

Google использует историю потребления медиаконтента пользователем (музыка, фильмы, шоу) и фоновое аудио, захваченное микрофоном устройства во время ввода запроса, для персонализации поисковых подсказок (Autocomplete). Система идентифицирует сущности из недавно потребленного …

Как Google использует векторы визуальных признаков и блочные суммы для эффективного анализа и сравнения изображений

2011 • Мультимедиа

US8411962B1 2013-04-02 2011-11-28

Google использует высокоэффективный метод для сравнения и выравнивания изображений. Система выбирает ключевые участки (Tiles) с высокой детализацией, быстро вычисляет суммы пикселей в различных областях (Block Sums) с помощью технологии Summed …

Как Google использует визуальные подсказки и интерактивные превью для уточнения запросов в Image Search

2012 • Мультимедиа

US20150370833A1 2015-12-24 2012-11-28

Google использует механизм визуальных уточнений в поиске по изображениям. Когда пользователь вводит общий запрос, система предлагает связанные уточненные запросы, сопровождая их репрезентативным изображением. Это позволяет пользователю предварительно оценить результаты уточнения …

Как Google вычисляет оценку качества продакшена (Production Quality Score) для видео и мультимедиа

2012 • Мультимедиа

US9009083B1 2015-04-14 2012-02-15

Google автоматически оценивает техническое качество мультимедиа (видео, аудио, изображений) с помощью Production Quality Score. Система обучается на основе относительных сравнений асессоров и анализирует технические признаки (визуальные, аудио, метаданные, качество текста). …

Как Google использует совместную встречаемость визуальных элементов для распознавания объектов на изображениях

2011 • Мультимедиа

US8768048B1 2014-07-01 2011-11-18

Google анализирует изображения, разбивая их на визуальные сегменты (области схожего цвета/текстуры). Система изучает, какие сегменты обычно появляются вместе (контекст), и создает базу данных (Codebook). При анализе нового изображения, если его …

Как Google использует структурные разрывы (смены сцен и тишину) для идентификации дубликатов видео и организации видео-поиска

2007 • Индексация • Мультимедиа

US8611422B1 2013-12-17 2007-06-19

Google использует систему фингерпринтинга видео, которая анализирует не пиксели, а временные метки структурных разрывов — смены сцен (shot boundaries) и моменты тишины (silent points). Это позволяет идентифицировать дубликаты или похожий …

Как Google классифицирует изображения по сезонам и времени суток на основе визуальных признаков и использует это в поиске

2012 • Gal Chechik • Индексация • Мультимедиа

US8995716B1 2015-03-31 2012-07-12

Google использует модели машинного обучения для анализа визуальных характеристик изображений (цвет, текстура, освещение) и определения вероятного времени их съемки (сезон, месяц, время суток), даже если метаданные отсутствуют. Это позволяет фильтровать …

Как Google использует распознавание лиц и кластеризацию для очистки и переранжирования выдачи в Поиске по Картинкам

2014 • SERP • Мультимедиа

US9268793B2 2016-02-23 2014-03-12

Google применяет технологию компьютерного зрения для улучшения поиска изображений по именам людей. Система анализирует топ выдачи, распознает лица и группирует похожие изображения. Определив доминирующий кластер (искомого человека), система переранжирует результаты: …

Как Google динамически расширяет результаты поиска на SERP, добавляя превью и контент из других источников

2012 • Мультимедиа

US9201925B2 2015-12-01 2012-11-08

Анализ патента Google, описывающего механизм пользовательского интерфейса (UI), позволяющий пользователям взаимодействовать с результатом поиска (например, свайпом) для отображения «Расширенного контента» прямо на SERP. Этот контент может включать предварительный просмотр страниц …

Как Google использует транскрибацию и динамическую вставку контента для индексации и монетизации подкастов

2007 • Индексация • Мультимедиа

US20080256109A1 2008-10-16 2007-04-13

Патент описывает платформу для автоматизации подкастинга, которая динамически вставляет аудиоконтент (например, рекламу) в момент загрузки подкаста пользователем. Система также включает механизм преобразования речи в текст (Speech-to-Text) для создания транскриптов, что …

Как Google использует «слуховые образы» и разреженные признаки для понимания и поиска аудиоконтента по текстовым запросам

2010 • Gal Chechik • Мультимедиа

US8463719B2 2013-06-11 2010-03-11

Патент описывает систему поиска аудиофайлов (и аудиодорожек видео) по текстовым запросам. Google преобразует звук в "слуховой образ", имитируя человеческое ухо (кохлеарная модель), извлекает из него разреженные признаки (sparse features) и …

Как Google итеративно генерирует запросы из метаданных контента для поиска «Похожих Видео» (на примере YouTube)

2008 • Мультимедиа

US8078632B1 2011-12-13 2008-02-15

Google (в частности, YouTube, упомянутый в патенте) использует итеративный процесс для генерации списков связанного контента. Система анализирует метаданные (заголовок, описание, теги) просматриваемого элемента и создает упорядоченный список ключевых слов. Затем …

Как Google использует машинное обучение для распознавания изображений и создания неявных связей между документами

2009 • Shumeet Baluja • Мультимедиа

US8315465B1 2012-11-20 2009-12-31

Google использует комбинацию алгоритмов машинного обучения (AdaBoost и Hillclimbing) для точного отделения изображений от текста на сканированных страницах. Система анализирует локальные визуальные признаки (например, SIFT), чтобы классифицировать контент и находить …

Как Google создает и показывает интерактивные 3D-модели и видео локаций в Поиске и Картах

2021 • Мультимедиа

US20240135658A1 2024-04-25 2021-04-12

Google разрабатывает систему для показа интерактивных 3D-моделей или видеороликов конкретных мест (например, достопримечательностей) в ответ на запросы о локациях. Система извлекает модель конкретного объекта из глобальной 3D-реконструкции мира и может …