Мультимедиа

Google использует паттерны просмотра пользователей внутри социальных сетей для классификации контента. Система строит граф, где связи показывают, кто просматривал чей профиль или контент. Если пользователи, которые смотрят известный контент категории …
Google автоматически анализирует видео для поиска клипов, где слово (n-gram) четко произносится в правильном контексте. Система рассчитывает оценку пригодности (SDUE), сравнивая ручные субтитры с автоматической расшифровкой (ASR) для оценки качества …
Google может определять, какую ТВ-программу или потоковое видео смотрит пользователь, сопоставляя его поисковые запросы с контентом, доступным в его локации в это же время. Если корреляция найдена, система модифицирует исходный …
Google использует гибридную систему для оценки контента, содержащего изображения (например, рекламных баннеров). Система автоматически анализирует изображения (распознает текст, объекты, определяет наличие обнаженной натуры) и агрегирует эти данные с оценками людей-эвалуаторов …
Google использует систему для распознавания запросов, связанных с медиа (фильмы, сериалы). Если запрос идентифицирован как медийный, система автоматически расширяет его, добавляя семантически связанные термины (например, похожие шоу, актеров, жанры), найденные …
Google использует данные окружающей среды (фоновый звук, изображения), чтобы понять контекст неоднозначных голосовых запросов. Если пользователь спрашивает "Кто это поет?", система анализирует фоновую музыку, идентифицирует песню и внутренне переформулирует запрос …
Google использует модель глубокого обучения для анализа изображений, которая не только извлекает визуальные признаки (дескрипторы), но и оценивает их важность с помощью механизма внимания. Это позволяет системе фокусироваться на самых …
Google использует систему параллельных поисковых движков (OCR, распознавание лиц, объектов, продуктов) для анализа визуального запроса (изображения). Система создает интерактивный документ, накладывая на исходное изображение визуальные идентификаторы (например, рамки или метки) …
Google использует систему для ранжирования рекомендуемых (дополнительных) видео на платформах типа YouTube. Система учитывает не только релевантность и потенциал монетизации видео, но и «экспериментальные данные» о том, как пользователи взаимодействуют …
Google использует систему интерактивного поиска внутри видеоконтента. Пользователь может остановить видео, и система автоматически распознает объекты и людей в кадре. Используя визуальные индикаторы (например, цветные рамки), система показывает статус идентификации …
Google использует алгоритм CRANE, чтобы понять, какая именно часть медиафайла (например, видео) соответствует тегу, даже если тег неточен. Система сравнивает сегменты медиафайла с тысячами негативных примеров, чтобы выделить истинный объект …
Патент Google, описывающий механизм пользовательского интерфейса (UI) для медиаплатформ. Система отображает интерактивные карточки (Media Interfaces) для текущего контента и динамически подгружает карточки для связанного контента (видео или плейлистов) на основе …
Google использует несколько механизмов для определения музыкального интента. Система анализирует состав поисковой выдачи на предмет наличия авторитетных музыкальных сайтов, сверяет запрос со специализированным индексом текстов песен и использует заранее сформированные …
Google проверяет точность перевода фраз, сравнивая визуальное сходство результатов поиска по картинкам и видео для исходной фразы и ее перевода. Если топовые визуальные результаты похожи и показывают высокое качество взаимодействия, …
Google использует модель машинного обучения для улучшения ранжирования в поиске по картинкам. Система определяет различные смыслы (senses) неоднозначного запроса (например, "Jaguar" как автомобиль и как животное), проецирует изображения в многомерное …
Google обучает классификаторы для автоматической оценки качества видеоконтента, используя данные от людей-асессоров, которые сравнивают пары видеороликов в определенной категории. Система извлекает аудиовизуальные и текстовые признаки и учится предсказывать, какие видео …
Патент Google, описывающий механизм, который позволяет пользователям ассоциировать ("привязывать") один тип контента (например, веб-статью) с конкретной позицией в индексированном контенте (например, таймкодом в видео). При просмотре видео другие пользователи увидят …
Патент Google описывает систему анализа потокового контента (видео, аудио). Система конвертирует поток в текст и использует методы IR/NLP (TF-IDF, стемминг) для извлечения тем и генерации запросов. Ключевыми особенностями являются явная …
Google использует механизм мультимодального поиска, объединяющий данные с камеры и микрофона устройства. Если пользователь задает неоднозначный голосовой запрос (например, "Сколько это стоит?"), система распознает объект в поле зрения камеры и …
Google использует технологию для создания цифровых отпечатков медиаконтента (аудио, изображений, видео), которые устойчивы к различным трансформациям, таким как изменение скорости воспроизведения или соотношения сторон. Система анализирует относительное расположение ключевых маркеров …