Мультимедиа

Google использует систему для анализа повторного использования аудио и видеофрагментов между видеороликами. На основе этих данных строится "граф видео", который позволяет вычислить оценки схожести между целыми каналами. Эти оценки используются …
Патент Google описывает систему модификации поисковой выдачи для улучшения видимости "Каналов" (коллекций контента из общего источника или темы). Система использует два механизма: гарантирует присутствие минимального количества Каналов в топе выдачи …
Google применяет механизм для глубокой персонализации результатов поиска в вертикалях цифрового контента (например, Google Play). Система комбинирует стандартные оценки релевантности с персонализированными оценками, основанными на «сигналах предпочтений пользователя». Эти сигналы …
Патент Google описывает механизм для улучшения ранжирования в поиске по картинкам. Если для конкретного запроса нет обученной модели визуальной релевантности, система использует модель от похожего запроса. Оценка релевантности (Boost) корректируется …
Google использует механизм мультимодального поиска, позволяющий пользователям дополнять текстовые запросы визуальным вводом (например, фотографией). Система анализирует изображение с помощью моделей машинного обучения для распознавания объектов и генерации семантической информации. Эта …
Google патентует систему мультимодального поиска для носимых устройств (например, XR-очков). Система объединяет запрос пользователя (голос/текст) с контекстом реального мира, полученным с камер и сенсоров (изображения, взгляд, жесты, местоположение) и историей …
Google использует анализ личных медиафайлов (фото, видео) для построения профиля интересов пользователя. Объекты, распознанные в этих файлах (часто локально на устройстве), используются для определения релевантных тем с учетом их четкости …
Патент Google, раскрывающий механизм ранжирования видеорекламы (Promoted Video Programs). Система рассчитывает Quality Factor (QF) видео, учитывая релевантность контента (CF), детальные метрики вовлеченности зрителей (PWF), а также физические характеристики ролика, такие …
Google использует систему анализа слоев пользовательского интерфейса для точного определения, какие элементы контента реально видны пользователю, а какие скрыты перекрывающими элементами (меню, уведомлениями). Это позволяет отфильтровывать ложные сигналы вовлеченности (клики, …
Google использует многоступенчатый процесс для улучшения аннотаций изображений. Система сначала генерирует набор меток на основе визуальных характеристик (Content Feature Values). Затем она использует базу семантических связей (Semantic Database/Граф знаний), чтобы …
Google использует систему для обработки мультимодальных запросов (текст + изображение), позволяя LLM отвечать на вопросы об изображениях. Система анализирует изображение с помощью вспомогательных моделей (распознавание объектов, VQA) и выполняет обратный …
Google использует систему для идентификации "spoofy" изображений (сатирических, юмористических или оскорбительных модификаций, таких как мемы). Система сравнивает пары визуально похожих изображений, игнорирует артефакты сжатия и изменения размера, и точно локализует …
Google использует многоступенчатую систему для выбора наиболее авторитетного изображения (например, официального портрета) для человека. Система оценивает качество веб-страниц, на которых размещено изображение (используя сигналы, не зависящие от контента), и анализирует, …
Система Google для анализа информации, захваченной из различных источников (вводимый текст, изображения документов, аудиопотоки) в реальном времени. Система автоматически распознает контент, выделяет ключевые фрагменты, формирует поисковые запросы и мгновенно предоставляет …
Google использует технологию цифровых отпечатков для автоматической идентификации пользовательских фото, видео и аудио, записанных на живых мероприятиях. Система внедряет незаметные сигналы (аудио, визуальные, световые) непосредственно во время события. При загрузке …
Google использует систему для глубокого концептуального анализа видео. Она определяет объекты, их взаимосвязи (через Графы Знаний) и визуальную значимость этих концепций в кадре (Presence Share). На основе этого формируется Concept …
Этот патент описывает фундаментальную архитектуру мобильного визуального поиска Google (например, Google Lens). Он детализирует, как изображение с телефона анализируется несколькими специализированными движками (объекты, текст, лица). Критически важно, что система использует …
Google использует систему для сбора и обновления информации о точках интереса (POI), таких как локальный бизнес. Система принимает изображения (фотографии интерьера, визитки, вывески), извлекает из них текст с помощью OCR …
Google использует систему unsupervised learning для распознавания объектов внутри видео и изображений в масштабе. Система использует существующие метаданные (теги, описания) как исходные обучающие данные, а затем итеративно уточняет визуальные модели …
Google анализирует фотографии, загружаемые пользователями (например, в социальные сети), для выявления трендовых событий в реальном времени. Система распознает объекты на фото, определяет тематику и местоположение, а затем ищет кластеры похожих …