Google применяет многоуровневую систему аннотирования изображений. Она объединяет метаданные (EXIF), первичное распознавание объектов и контекста (Primary Annotation), а также семантическое расширение меток (Label Expansion). Это позволяет системе понимать сложные запросы …
Мультимедиа
Патент описывает, как Google может анализировать медиаконтент (фильмы, ТВ-шоу, видео) для автоматической идентификации показанных в нем товаров или услуг, используя распознавание изображений, речи и текста (субтитров). Система создает динамический каталог, …
Google анализирует существующие плейлисты, созданные пользователями, которые релевантны широкому поисковому запросу (например, жанру или теме). Система оценивает качество этих плейлистов на основе их популярности и свежести, а затем агрегирует эти …
Google использует метод обнаружения объектов, основанный на сегментации изображений. Система обучается связывать визуальные фрагменты (сегменты) с расположением всего объекта (Bounding Box). При анализе нового изображения система быстро определяет, какие объекты …
Google использует систему для улучшения поисковой выдачи по запросам, содержащим имена людей. Система анализирует релевантные веб-страницы, обнаруживает наличие лиц (Face Detection) и определяет личность человека на фото, используя текстовые сигналы …
Google оптимизирует визуальный поиск, группируя почти идентичные изображения (измененный размер, обрезка) в единый кластер. Система индексирует не отдельные картинки, а совокупность всех визуальных признаков ("визуальных слов") из всех вариантов в …
Google использует историю потребления медиаконтента пользователем (музыка, фильмы, шоу) и фоновое аудио, захваченное микрофоном устройства во время ввода запроса, для персонализации поисковых подсказок (Autocomplete). Система идентифицирует сущности из недавно потребленного …
Google использует высокоэффективный метод для сравнения и выравнивания изображений. Система выбирает ключевые участки (Tiles) с высокой детализацией, быстро вычисляет суммы пикселей в различных областях (Block Sums) с помощью технологии Summed …
Google использует механизм визуальных уточнений в поиске по изображениям. Когда пользователь вводит общий запрос, система предлагает связанные уточненные запросы, сопровождая их репрезентативным изображением. Это позволяет пользователю предварительно оценить результаты уточнения …
Google автоматически оценивает техническое качество мультимедиа (видео, аудио, изображений) с помощью Production Quality Score. Система обучается на основе относительных сравнений асессоров и анализирует технические признаки (визуальные, аудио, метаданные, качество текста). …
Google анализирует изображения, разбивая их на визуальные сегменты (области схожего цвета/текстуры). Система изучает, какие сегменты обычно появляются вместе (контекст), и создает базу данных (Codebook). При анализе нового изображения, если его …
Google использует систему фингерпринтинга видео, которая анализирует не пиксели, а временные метки структурных разрывов — смены сцен (shot boundaries) и моменты тишины (silent points). Это позволяет идентифицировать дубликаты или похожий …
Google использует модели машинного обучения для анализа визуальных характеристик изображений (цвет, текстура, освещение) и определения вероятного времени их съемки (сезон, месяц, время суток), даже если метаданные отсутствуют. Это позволяет фильтровать …
Google применяет технологию компьютерного зрения для улучшения поиска изображений по именам людей. Система анализирует топ выдачи, распознает лица и группирует похожие изображения. Определив доминирующий кластер (искомого человека), система переранжирует результаты: …
Анализ патента Google, описывающего механизм пользовательского интерфейса (UI), позволяющий пользователям взаимодействовать с результатом поиска (например, свайпом) для отображения «Расширенного контента» прямо на SERP. Этот контент может включать предварительный просмотр страниц …
Патент описывает платформу для автоматизации подкастинга, которая динамически вставляет аудиоконтент (например, рекламу) в момент загрузки подкаста пользователем. Система также включает механизм преобразования речи в текст (Speech-to-Text) для создания транскриптов, что …
Патент описывает систему поиска аудиофайлов (и аудиодорожек видео) по текстовым запросам. Google преобразует звук в "слуховой образ", имитируя человеческое ухо (кохлеарная модель), извлекает из него разреженные признаки (sparse features) и …
Google (в частности, YouTube, упомянутый в патенте) использует итеративный процесс для генерации списков связанного контента. Система анализирует метаданные (заголовок, описание, теги) просматриваемого элемента и создает упорядоченный список ключевых слов. Затем …
Google использует комбинацию алгоритмов машинного обучения (AdaBoost и Hillclimbing) для точного отделения изображений от текста на сканированных страницах. Система анализирует локальные визуальные признаки (например, SIFT), чтобы классифицировать контент и находить …
Google разрабатывает систему для показа интерактивных 3D-моделей или видеороликов конкретных мест (например, достопримечательностей) в ответ на запросы о локациях. Система извлекает модель конкретного объекта из глобальной 3D-реконструкции мира и может …