Мультимедиа

Как Google структурирует видеоконтент с помощью синхронизации транскриптов, аннотаций и ключевых идей для улучшения поиска по видео

2021 • SERP • Мультимедиа • Семантика и интент

US20220374585A1 2022-11-24 2021-05-19

Google патентует систему для глубокого анализа видеоконтента во время его создания. Система синхронизирует несколько потоков: видео докладчика, демонстрацию экрана, аннотации и транскрипцию в реальном времени. Это позволяет индексировать содержание видео, …

Как Google анализирует обучающие видео, чтобы понять, какие инструменты и материалы нужны для выполнения задачи

2013 • Индексация • Мультимедиа • Семантика и интент

US20140324581A1 2014-10-30 2013-04-29

Google анализирует контент интерактивных сессий (например, обучающих видео), чтобы определить, какие инструменты и материалы необходимы для выполнения конкретной задачи. Система классифицирует их как "обязательные" или "опциональные" на основе частоты использования …

Как Google распознает сущности в результатах поиска по описательным запросам и предлагает их для уточнения поиска

2013 • Knowledge Graph • Мультимедиа • Семантика и интент

US9418121B2 2016-08-16 2013-03-12

Google использует этот механизм для улучшения поиска, особенно по картинкам. Если пользователь вводит описательный запрос (например, «коричневая собака-пловец»), система распознает конкретные сущности в найденных результатах (например, «Чесапик-бей-ретривер») и отображает их …

Как Google использует машинное зрение для подтверждения текстовых описаний изображений и повышения их в поиске

2009 • SERP • Мультимедиа • Семантика и интент

US9183226B2 2015-11-10 2009-07-17

Google использует систему классификации изображений, чтобы определить, соответствует ли текст, связанный с изображением (например, alt-текст или окружающий контент), его визуальному содержанию. Система обучается распознавать объекты на основе визуальных признаков. Если …

Как Google использует диалоги с Ассистентом и поведение пользователей для глубокого понимания контекста изображений

2019 • Knowledge Graph • Мультимедиа • Семантика и интент

US11836183B2 2023-12-05 2019-04-01

Google использует естественный язык (например, разговоры с Ассистентом) для идентификации значимых событий. Система анализирует фотографии, сделанные в этот период, и использует поведенческие сигналы (время просмотра, редактирование, пересылка) и распознавание объектов, …

Как Google распространяет метки между изображениями, используя не визуальные данные (время, место, контекст)

2011 • SERP • Мультимедиа • Семантика и интент

US8938449B1 2015-01-20 2011-09-02

Google улучшает понимание содержания изображений, распространяя семантические метки (labels) между ними. Если два изображения связаны не визуальными признаками (сняты в одно время, в одном месте, или сгруппированы в один альбом), …

Как Google использует ИИ-оркестратор (Router Model) для анализа конкретных фрагментов видео и ответов на запросы пользователей

2023 • SERP • Мультимедиа • Семантика и интент

US20250190503A1 2025-06-12 2023-12-11

Google разрабатывает систему мультимодального поиска по видео. Когда пользователь задает вопрос во время просмотра, специальная ИИ-модель (Router Model) анализирует запрос и контекст (таймкод), выделяет релевантный видеоклип и определяет, какая специализированная …

Как Google понимает контекст и неоднозначность в последовательных голосовых запросах

2013 • Knowledge Graph • Мультимедиа • Семантика и интент

US10635860B1 2020-04-28 2013-02-22

Google анализирует акустические сигналы (например, ударение) и грамматическую структуру в последующих голосовых запросах, чтобы понять, к чему относятся местоимения (например, «он», «это») или неоднозначные фразы из предыдущих поисковых сессий. Это …

Как Google обучает автоматизированных ассистентов визуально понимать и использовать сайты для выполнения задач без API

2019 • Google Shopping • Мультимедиа • Семантика и интент

US20240232272A1 2024-07-11 2019-05-09

Google разрабатывает технологию, позволяющую автоматизированным ассистентам (например, Google Assistant) самостоятельно взаимодействовать с веб-сайтами для выполнения транзакций (покупки, бронирования). Система анализирует визуальный и геометрический контекст элементов (кнопки, формы), создавая устойчивые идентификаторы …

Как Google создает устойчивые к изменениям «цифровые отпечатки» для обнаружения дубликатов изображений и видео

2009 • Антиспам • Мультимедиа

US8965859B1 2015-02-24 2009-09-29

Google использует метод надежного хеширования для идентификации почти дублирующихся медиафайлов (изображений, видео, аудио), даже если они были обрезаны или изменены. Система генерирует устойчивую гистограмму признаков файла, а затем применяет взвешенное …

Как Google использует одновременный ввод видео и аудио (Multimodal Search) для понимания сложных запросов

2023 • Индексация • Мультимедиа • Семантика и интент

US20240403362A1 2024-12-05 2023-05-31

Google разрабатывает систему мультимодального поиска, позволяющую пользователям записывать видео и одновременно задавать вопрос голосом или записывать звук. Система использует продвинутые ML-модели для генерации видео-эмбеддингов, анализа временной информации и аудиосигнатур. Это …

Как Google использует контекст всего сайта для выявления и фильтрации нежелательного контента (SafeSearch)

2006 • Антиспам • Безопасный поиск • Мультимедиа

US8989450B1 2015-03-24 2006-01-13

Патент описывает систему оценки изображений на предмет нежелательного (например, взрослого) контента. Система анализирует не только само изображение и страницу, на которой оно размещено, но и агрегированные статистические данные по другим …

Как Google использует анализ движения в видео (Motion Manifolds) для понимания семантической связи между визуально непохожими объектами

2012 • Мультимедиа • Семантика и интент

US9373040B2 2016-06-21 2012-01-09

Google анализирует, как объекты движутся и трансформируются в видео (траектории), чтобы понять, что визуально разные состояния (например, открытый и закрытый глаз) семантически являются одним и тем же объектом. Эта технология …

Как Google в реальном времени перестраивает поисковые подсказки (Autocomplete) на основе прямых эфиров и трансляций

2013 • Lev Finkelstein • Мультимедиа • Свежесть контента • Семантика и интент

US20150149482A1 2015-05-28 2013-03-14

Google отслеживает прямые эфиры (ТВ, радио, стримы) и извлекает из них ключевые темы и сущности. Система использует эту информацию для повышения в реальном времени релевантных поисковых подсказок (Autocomplete), адаптируя их …

Как Google использует 3D-модели объектов для понимания контекста изображений и переписывания поисковых запросов

2013 • Google Shopping • Мультимедиа • Семантика и интент

US9529826B2 2016-12-27 2013-12-26

Google использует базу данных 3D-моделей для глубокого анализа объектов в поисковых запросах, особенно в изображениях. Система сопоставляет объект с его эталонной 3D-моделью, чтобы определить точный контекст: ориентацию, масштаб, освещение и …

Как Google определяет лучшее текстовое описание для изображения, проверяя его через веб-поиск (Механизм Веб-консенсуса)

2012 • EEAT и качество • Индексация • Мультимедиа

US9396413B2 2016-07-19 2012-06-01

Google использует механизм валидации для выбора наилучшей текстовой метки (label) для изображения. Система генерирует кандидатов в метки, использует их как поисковые запросы и проверяет, сколько качественных веб-результатов действительно содержат исходное …

Как Google использует контекст изображения для уточнения поисковых запросов, инициированных текстом на картинке

2017 • Мультимедиа • Семантика и интент

US20250013351A1 2025-01-09 2017-09-13

Google использует технологию для анализа изображений (например, фотографий меню или постеров). Система распознает текст на картинке и позволяет пользователю выбрать его для поиска. Ключевой механизм — классификация контекста всего изображения. …

Как Google кластеризует запросы в поиске по картинкам на основе визуального сходства результатов и адаптирует ранжирование для каждого кластера

2012 • SERP • Мультимедиа • Семантика и интент

US9424338B2 2016-08-23 2012-05-29

Google группирует поисковые запросы в Image Search, основываясь на том, насколько визуально похожи их результаты (анализ на уровне пикселей). Для каждого такого кластера («визуального концепта») система создает отдельную функцию ранжирования …

Как Google использует текстовые поисковые тренды и медиа для обновления систем распознавания речи в реальном времени

2006 • Shumeet Baluja • Мультимедиа • Мультиязычность • Семантика и интент

US10410627B2 2019-09-10 2006-04-03

Патент Google описывает, как системы распознавания речи (ASR) автоматически адаптируются к новым словам и трендам. Система анализирует частотность слов в текстовых поисковых запросах и изучает произношение из медиа с субтитрами. …

Как Google связывает медиаконтент (видео) с Графом Знаний для улучшения поиска и автоматического тегирования

2013 • Knowledge Graph • Мультимедиа • Семантика и интент

US9189528B1 2015-11-17 2013-03-15

Google использует систему для связи медиаконтента (например, видео на YouTube) со структурированными данными из Базы Знаний (Knowledge Graph). Описывается, как создаются ассоциации между видео и сущностями путем анализа метаданных, что …