Google использует мультимодальную систему для идентификации продуктов в контенте (например, видео). Система анализирует метаданные (заголовок, описание, субтитры) и визуальные данные (кадры видео) с помощью отдельных моделей. Затем Fusion Model объединяет …
Мультимедиа
Патент Google описывает, как голосовые ассистенты на устройствах с экраном (смартфоны, смарт-дисплеи) определяют, предназначена ли им последующая фраза, даже если пользователь не произнес активационное слово ("Ok Google"). Система анализирует, связана …
Google использует систему для отображения прямых трансляций (Live Events) в результатах поиска. Система предварительно фильтрует трансляции, рассчитывая Quality Score на основе авторитетности организатора (Organizer Score), популярности связанных сущностей (Entity Score) …
Google использует автоматизированную систему для выбора наиболее репрезентативных изображений бизнеса с его официального сайта. Система предпочитает локальные сайты филиалов, а не общие сайты сетей. Она анализирует структуру сайта для поиска …
Патент Google описывает систему агрегации товарных предложений от разных продавцов в единый каталог продуктов (например, Google Shopping). Система использует анализ "почти дубликатов" изображений и данные о совместном появлении товаров в …
Google использует масштабируемый конвейер для автоматического создания мультимедийного контента (Web Stories) о живых событиях в реальном времени. Система обнаруживает важные события, запрашивает медиаданные у поставщиков, персонализирует контент для разных групп …
Google анализирует структуру сайтов для автоматического определения «Visual Leaf Pages» (например, карточек товаров или рецептов), где изображение является основным контентом. Система находит «Hub Pages» (например, категории), которые ссылаются на них, …
Анализ патента Google, лежащего в основе системы «Поиск по картинке» (Search by Image). Описан метод генерации компактных цифровых подписей (хэшей) изображений с помощью вейвлет-преобразований для эффективного поиска почти дубликатов. Также …
Этот патент описывает архитектуру поисковой системы (на примере 3D-моделей), которая критически важна для понимания современного веб-поиска. Google применяет векторный поиск (ANN) для быстрого отбора кандидатов (L1) и многоэтапное ранжирование (L2/L3), …
Google обрабатывает голосовые запросы, идентифицируя стандартный результат (ссылка и сниппет) и одновременно находя или синтезируя прямой ответ в форме законченного предложения. Этот ответ адаптируется под контекст пользователя (например, местоположение), конвертируется …
Google объединяет визуальный запрос (изображение) с приблизительными данными GPS для точного определения местоположения и направления взгляда пользователя (Enhanced Location Information). Если местоположение определено точно, приоритет в ранжировании отдается ближайшим объектам …
Google обучает отдельные модели машинного обучения для каждого уникального запроса в Поиске по картинкам. Эти модели учатся определять визуальную релевантность, основываясь на признаках (цвет, текстура) изображений, на которые пользователи часто …
Google использует систему компьютерного зрения для определения точной геолокации объектов на фото и видео. Сравнивая визуальные признаки (Feature Points) загруженного контента с обширной базой гео-тегов, система идентифицирует местоположение. Для повышения …
Google использует систему для обработки визуальных запросов (изображений). Изображение одновременно отправляется в несколько специализированных поисковых систем (распознавание лиц, OCR, распознавание объектов, штрих-кодов и т.д.). Система агрегирует, ранжирует результаты и может …
Google использует автоматизированную систему для наполнения детских интерфейсов безопасным и интересным контентом. Система определяет темы, интересующие детей, через Knowledge Graph и внешние источники, рассчитывает «Оценку детской близости» (Children's Affinity Score) …
Патент описывает комплексную систему Google для визуального поиска товаров. Система автоматически обрабатывает изображения: отделяет объект от фона (сегментация), выравнивает его, извлекает визуальные признаки (цвет, форма, текстура) и создает цифровые подписи …
Google анализирует видеоконтент для выявления сущностей (терминов, концепций), которые пользователи, вероятно, захотят найти в поиске. Система использует ML, обученное на реальных поисковых запросах, возникающих во время просмотра видео. Когда сущность …
Google разрабатывает инфраструктуру для индексации данных напрямую из блокчейнов, фокусируясь на NFT. Система извлекает описания, историю транзакций и сами цифровые активы, следуя по ссылкам в блокчейне. Она оценивает качество и …
Система использует технологию визуального поиска для анализа изображения товара или рекламы («seed content item»), извлекая его визуальные характеристики (цвет, форма, текстура) и генерируя «визуальную подпись» (Signature). Затем выполняется поиск по …
Google обучает передовые нейронные сети (Image Embedding Functions) с использованием «триплетов изображений» для отображения картинок в математическое пространство (эмбеддинги). Это позволяет системе понимать нюансы и тонкие визуальные сходства — например, …