Мультимедиа

Как Google определяет главный объект на изображении, анализируя его размер, центральное положение и видимость

2011 • SERP • Индексация • Мультимедиа

US9135305B2 2015-09-15 2011-03-23

Google использует систему компьютерного зрения для определения основного предмета на изображении, содержащем несколько объектов. Система ранжирует распознанные объекты, отдавая предпочтение тем, которые крупнее по размеру, расположены ближе к центру кадра …

Как Google синхронизирует онлайн-новости с телевизионным эфиром, используя кластеризацию статей, TF-IDF и анализ субтитров

2013 • Мультимедиа

US9544650B1 2017-01-10 2013-12-11

Патент описывает технологию Google для "второго экрана", которая идентифицирует просматриваемую телепередачу и в реальном времени находит соответствующие ей онлайн-новости. Система агрегирует новостные статьи, кластеризует их по темам, извлекает ключевые слова …

Как Google анализирует одежду на изображениях для визуального поиска, игнорируя лица и фон

2013 • Google Shopping • Мультимедиа

US8873838B2 2014-10-28 2013-03-14

Google использует систему для визуального поиска похожих товаров. Система обнаруживает лицо на изображении, удаляет фон и участки кожи, чтобы изолировать предмет одежды. Затем, используя размер лица для нормализации масштаба, извлекаются …

Как Google использует распознавание лиц для маркировки неразмеченных изображений известных сущностей

2006 • Knowledge Graph • Индексация • Мультимедиа

US9552511B2 2017-01-24 2006-12-01

Google идентифицирует известные сущности (например, знаменитостей) из поисковых логов и веб-документов. Система извлекает изображения, уже связанные с ними (например, через метаданные), и использует распознавание лиц для поиска наиболее репрезентативного лица. …

Как Google автоматически определяет ключевые моменты (Highlights) в видео с помощью анализа аудиовизуальных событий

2011 • SERP • Индексация • Мультимедиа

US11556743B2 2023-01-17 2011-12-08

Google использует систему машинного обучения для автоматического определения ключевых моментов (Highlights) в видео. Система анализирует низкоуровневые признаки (цвет, движение, звук) для выявления повторяющихся паттернов (событий). На основе частоты и последовательности …

Как Google использует микрофоны смартфонов для определения атмосферы и музыки в заведениях для Локального Поиска

2014 • Мультимедиа • Персонализация

US20170235825A1 2017-08-17 2014-06-25

Google патентует систему для сбора и анализа окружающих звуков (музыка, шум) через микрофоны пользовательских устройств. Эта информация используется для определения акустической атмосферы (например, "тихо", "шумно", жанр музыки) конкретных заведений. Эти …

Как Google использует репрезентативные наборы и Min-Hash для дедупликации видео и аудио в результатах поиска

2014 • Мультимедиа

US10152479B1 2018-12-11 2014-08-01

Google использует масштабируемую систему для борьбы с дублированным и частично дублированным медиаконтентом (видео, аудио). Вместо сравнения всех файлов между собой, система создает компактные «репрезентативные наборы» для каждого элемента, используя фингерпринтинг …

Как Google использует аудио-фингерпринтинг (ACR) для автоматической генерации поисковых запросов на основе контекста ТВ, радио и видео

2010 • Мультимедиа

US10509815B2 2019-12-17 2010-05-19

Google использует систему автоматического распознавания контента (ACR) для идентификации медиа (ТВ-шоу, реклама, стриминг), которое потребляет пользователь. Система не просто определяет название, но извлекает контекст в реальном времени (субтитры, EPG, анализ …

Как Google автоматически создает описания для видео и аудио, перенося подписи из похожих изображений

2022 • Мультимедиа

US20250209794A1 2025-06-26 2022-02-04

Google использует метод кросс-модального переноса для автоматического создания текстовых описаний (captioning) для видео и аудио. Система находит видеокадры, визуально похожие на уже размеченные изображения из существующих датасетов, и переносит качественные …

Как Google использует визуальный анализ для переранжирования поиска по картинкам для редких (long-tail) запросов

2013 • Мультимедиа

US9218366B1 2015-12-22 2013-12-31

Google улучшает поиск изображений по редким (long-tail) запросам, когда данных о кликах недостаточно. Система анализирует визуальные характеристики топовых и нижних результатов исходной выдачи, чтобы создать «визуальную подпись» запроса. Затем все …

Как Google повышает в поиске оригинальные видео, понижая их авторизованные копии

2013 • SERP • Индексация • Мультимедиа

US9613101B2 2017-04-04 2013-03-15

Google использует систему для управления ранжированием медиаконтента, защищенного авторским правом. Система идентифицирует оригинальную (авторитетную) версию контента и активно продвигает ее в результатах поиска выше, чем пользовательские копии, даже если эти …

Как Google использует компактные дескрипторы и пространственное кодирование для выявления и удаления почти дубликатов изображений из поиска

2013 • Индексация • Мультимедиа

US9063954B2 2015-06-23 2013-03-15

Google использует систему для эффективного обнаружения изображений-почти дубликатов (измененный размер, обрезка, сжатие). Система анализирует локальные особенности контента ("визуальные слова") и их точное пространственное расположение ("тайлы"), чтобы создать компактные дескрипторы. Сравнивая …

Как Google использует параметры кодирования видео (I-Frames) для автоматического определения границ сцен и генерации Key Moments

2013 • Индексация • Мультимедиа

US9071814B1 2015-06-30 2013-08-15

Google использует низкоуровневые технические параметры кодирования видео для эффективного анализа контента. Система автоматически определяет смену сцен, анализируя расположение ключевых кадров (I-frames), которые вставляются при значительном изменении изображения, и отфильтровывает технические …

Как Google обучает модели компьютерного зрения для оценки визуального сходства изображений

2012 • SERP • Индексация • Мультимедиа

US9275310B2 2016-03-01 2012-03-27

Google использует двухэтапный процесс машинного обучения для создания моделей визуального сходства. Сначала модель обучается на неразмеченных данных, анализируя расстояния между векторами признаков, извлеченных нейронными сетями (автоэнкодерами). Затем модель уточняется с …

Как Google распознает объекты и лица на изображениях, преодолевая искажения, ракурсы и частичное перекрытие

2007 • Мультимедиа

US8630493B2 2014-01-14 2007-03-12

Патент Google описывает фундаментальные технологии компьютерного зрения для точного распознавания объектов. Система использует вероятностные модели для Регистрации — точного определения ключевых точек объекта, даже если он повернут или частично скрыт. …

Как Google агрегирует данные из разных индексов для создания специализированной выдачи по медиазапросам (Фильмы, Сериалы)

2007 • Knowledge Graph • Мультимедиа

US8533761B1 2013-09-10 2007-04-30

Google использует архитектуру для обработки медиазапросов (фильмы, сериалы). Система определяет, что запрос связан с медиа, и одновременно отправляет запросы в разные корпусы данных (структурированные данные, веб-индекс, картинки, расписания). Затем результаты …

Как Google создает тематические анимированные превью для SERP, анализируя и кластеризируя изображения на странице

2016 • SERP • Мультимедиа

US10503803B2 2019-12-10 2016-11-23

Google использует систему для генерации анимированных сниппетов (например, GIF) в результатах поиска. Система анализирует страницу, идентифицирует постоянные изображения (исключая рекламу и иконки), оценивает их расположение и качество, и группирует их …

Как Google использует геймифицированные сравнения изображений для сбора данных о предпочтениях пользователей и ранжирования мест

2012 • Мультимедиа

US20140149310A1 2014-05-29 2012-11-28

Google использует метод сбора данных о предпочтениях пользователей в формате игры. Пользователям показывают пары изображений, представляющих разные группы мест (например, ресторанов). Выбирая предпочтительное изображение, пользователь итеративно сужает список кандидатов. Собранные …

Как Google использует модульную архитектуру (Fetcher/Scorer/Pooler) и мультимодальные данные для поиска семантически похожих изображений

2018 • Мультимедиа

US11126649B2 2021-09-21 2018-07-11

Патент Google раскрывает продвинутую систему поиска похожих изображений. Используя гибкую архитектуру (Fetchers, Scorers, Poolers), система оценивает подобие по множеству признаков, а не только по визуальному совпадению. Она интегрирует мультимодальные данные …

Как Google позволяет пользователям переключаться между ключевыми моментами (Хуками) в VOD-контенте на основе анализа видео и внешних сигналов

2016 • Мультимедиа

US20180302680A1 2018-10-18 2016-12-16

Google разработал систему для улучшения навигации по VOD-контенту (Video-on-Demand). Вместо просмотра видео с начала, пользователи могут искать конкретные типы сцен («хуки»). Система идентифицирует эти моменты, используя анализ видео (Video Image …