Google использует систему для динамического выбора thumbnail для видео в результатах поиска. Система анализирует запрос пользователя и содержание каждого кадра видео, преобразуя их в числовые векторы в общем семантическом пространстве. …
Мультимедиа
Google использует систему для определения точного местоположения изображения путем анализа и сверки трех источников: визуального распознавания объектов (Landmark), текстовых подписей/тегов (Caption) и GPS-данных из файла (Metadata). Система разрешает конфликты, используя …
Google определяет, какие бизнесы (POI) показывать на Картах, анализируя реальные изображения местности (например, Street View). Система использует распознавание образов (OCR) для чтения вывесок, подтверждая существование и местоположение бизнеса. Точки интереса …
Патент описывает комплексную систему для визуального поиска. Google может анализировать изображения на удаленных (сторонних) веб-страницах, распознавать объекты (например, одежду на человеке), извлекать их визуальные характеристики (цвет, форму, текстуру) и делать …
Патент Google описывает систему глубокого анализа изображений для распознавания лиц, одежды и текста на объектах. Система генерирует уникальные "сигнатуры распознавания" и создает индекс на их основе, что позволяет искать изображения …
Google использует технологию для идентификации и маркировки «пространственно-временных объемов» (spatio-temporal volumes) внутри видео, которые соответствуют конкретным объектам или действиям (например, «бегущая кошка»). Это позволяет системе индексировать контент на гранулярном уровне, …
Google использует технологию, позволяющую инициировать поиск жестами (например, обведением объекта на экране). Система анализирует выбранный контент (текст, изображения, видео), извлекает ключевые темы, учитывает контекст страницы и пользователя (местоположение, время), взвешивает …
Google патентует систему для улучшения понимания видеоконтента. Используя машинное обучение, система анализирует транскрипцию видео и прогнозирует, какие сущности зрители, скорее всего, захотят найти в поиске. Когда такая сущность упоминается, система …
Google анализирует контекст запроса медиаконтента (например, видео), определяя источник перехода (referral source). Система сканирует исходную страницу, чтобы найти другой контент, размещенный на ней (например, другие встроенные видео), и использует эту …
Патент Google, описывающий архитектуру системы визуального поиска. Изображение, используемое как запрос, одновременно отправляется в несколько специализированных систем (распознавание текста, лиц, объектов, штрихкодов). Результаты агрегируются и могут быть представлены в виде …
Google патентует систему, которая позволяет пользователям создавать изображения желаемых товаров с помощью генеративного ИИ, используя структурированные подсказки или текст. Полученное изображение используется как визуальный запрос для поиска реальных товаров. Система …
Google использует механизм "Token Table" для анализа логической структуры веб-страницы. Это позволяет системе вычислять логическое расстояние между текстом и изображениями для оценки их релевантности друг другу (Relatedness). Также система определяет, …
Google улучшает поиск по картинкам, находя дубликаты или похожие изображения на разных сайтах. Система собирает все текстовые метки (из alt-текста, заголовков, окружающего текста), связанные с каждой копией изображения, объединяет их …
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим …
Google использует этот механизм для автоматического создания структурированных визуальных туров (например, фототуров) для сложных или географических сущностей. Система анализирует взаимосвязи в Графе Знаний, определяет наиболее важные подсущности (например, достопримечательности в …
Google автоматически разделяет видео, в частности инструкции ("how-to"), на смысловые сегменты. Система использует обязательную комбинацию анализа текстовой транскрипции и технического анализа видеоряда (Motion Flow и Gradient Flow), чтобы определить точные …
Google использует систему для определения того, следует ли показывать блок с изображениями в поисковой выдаче. Вместо анализа только текста запроса, система анализирует характеристики контента (например, плотность изображений, соотношение изображений к …
Google использует механизм для понимания неоднозначных запросов (например, «Что это?»), анализируя то, что пользователь видит на экране своего устройства. Система определяет основное изображение, распознает объекты на нем и анализирует окружающий …
Google разработал систему для эффективного понимания содержания видео. Вместо анализа каждого кадра система выбирает ключевые кадры и использует Vision-Language Model для создания их текстового описания. Когда пользователь задает вопрос о …
Система Google для автоматического выбора лучшего (репрезентативного) изображения для локального бизнеса. Анализируя коллекции гео-тегированных фото (например, Street View или пользовательские), система распознает текст на изображениях (OCR) и сопоставляет его с …