Мультимедиа

Как Google комбинирует визуальный анализ, контекст и популярность для классификации и ранжирования изображений

2013 • SERP • Мультимедиа • Семантика и интент

US9760803B2 2017-09-12 2013-11-08

Google использует систему для классификации изображений, объединяющую пиксельные данные, метаданные (время, место) и контекстуальную информацию (включая личные данные пользователя или контекст веб-страницы). Патент раскрывает формулу ранжирования изображений, основанную на уверенности …

Как Google комбинирует визуальное сходство, семантику и человеческие оценки для ранжирования в Поиске по Картинкам (Query by Image)

2010 • SERP • Мультимедиа • Семантика и интент

US9053115B1 2015-06-09 2010-04-20

Анализ патента Google, описывающего гибридную систему поиска по изображению. Система обучается понимать визуальное сходство на основе оценок людей (Similarity Feedback). Она уточняет семантику изображения, анализируя текстовые метки визуально похожих картинок …

Как Google идентифицирует и маркирует конкретные объекты и действия внутри видео, используя метаданные всего ролика

2012 • Индексация • Мультимедиа • Семантика и интент

US8983192B2 2015-03-17 2012-08-31

Google использует технологию для автоматического определения и маркировки специфических объектов или действий (называемых "объемами") внутри видео. Система анализирует визуальные характеристики, сегментирует видео на пространственно-временные части и использует существующие метаданные всего …

Как Google использует изображения пользователей для автоматического обучения и расширения своих возможностей визуального распознавания объектов

2011 • Google Shopping • Мультимедиа • Семантика и интент

US9020246B2 2015-04-28 2011-07-12

Google улучшает свои возможности визуального поиска, анализируя изображения, загружаемые пользователями (query images). Система автоматически добавляет уверенно распознанные пользовательские изображения в свою обучающую базу данных, чтобы лучше распознавать вариации известных объектов. …

Как Google использует распознавание объектов, метаданные и расширение меток для глубокого понимания и индексации изображений

2015 • Knowledge Graph • Мультимедиа • Семантика и интент

US20170185670A1 2017-06-29 2015-12-28

Google применяет многоуровневую систему анализа изображений, комбинируя метаданные (GPS, время), первичное распознавание объектов (Primary Annotation) и вторичные метки, полученные через семантическое и иерархическое расширение (Label Expansion). Это позволяет системе строить …

Как Google использует изображения и видео на экране пользователя для уточнения неоднозначных поисковых запросов

2014 • Мультимедиа • Персонализация • Семантика и интент

US9830391B1 2017-11-28 2014-06-24

Google может анализировать активные нетекстовые данные (изображения или видео), отображаемые на устройстве пользователя в момент ввода запроса. Если запрос неоднозначен (например, содержит местоимения или общие фразы), система извлекает из визуального …

Как Google использует компьютерное зрение для сопоставления изображений, уточнения координат и извлечения данных о бизнесе из Street View

2009 • EEAT и качество • Local SEO • Мультимедиа

US9286545B1 2016-03-15 2009-04-28

Google повышает точность геолокации, используя систему компьютерного зрения для сравнения изображений с веб-сайтов (например, сайтов недвижимости или бизнеса) с изображениями Street View. Если объекты визуально совпадают, координаты адреса уточняются. Кроме …

Как Google использует OCR и анализ текста (NLP) для идентификации ТВ-контента и генерации связанных поисковых запросов

2013 • Knowledge Graph • Мультимедиа • Семантика и интент

US11917242B2 2024-02-27 2013-03-14

Патент Google описывает систему для интерактивного ТВ, которая идентифицирует просматриваемую программу путем захвата экрана и применения оптического распознавания символов (OCR) к информационным оверлеям (например, ТВ-гиду). Система анализирует извлеченный текст, выделяет …

Как Google встраивает интерактивные 3D-модели непосредственно в результаты поиска и веб-страницы

2013 • SERP • Мультимедиа • Семантика и интент

US9183672B1 2015-11-10 2013-05-15

Патент Google, описывающий технологию интеграции интерактивных 3D-моделей непосредственно в страницу результатов поиска (SERP) и другие веб-страницы. Система использует семантическую информацию для идентификации объекта и встраивает 3D-просмотрщик в специальный блок выдачи …

Как Google использует результаты веб-поиска для понимания описательных запросов о фильмах и сериалах

2013 • Knowledge Graph • Мультимедиа • Семантика и интент

US20230394048A1 2023-12-07 2013-03-15

Google использует двухэтапный процесс для ответа на описательные запросы о медиаконтенте (например, по сюжету или персонажам). Сначала система выполняет веб-поиск по запросу. Затем она анализирует топовые веб-страницы, чтобы определить, какие …

Как Google фильтрует и визуализирует поисковые подсказки (Query Suggestion Groupings) для обеспечения разнообразия выдачи

2013 • Мультимедиа • Персонализация • Семантика и интент

US10846346B2 2020-11-24 2013-04-16

Google использует механизм для улучшения навигации при уточнении запросов, особенно в визуальном поиске. Система генерирует визуальные превью результатов для подсказок (Query Suggestion Groupings). Ключевая особенность: подсказка отображается, только если ее …

Как Google классифицирует запросы как медиа-контент (фильмы, книги, музыку), используя данные товарного поиска, подсказки и обязательную верификацию через распознавание имен

2012 • Индексация • Мультимедиа • Семантика и интент

US9251262B1 2016-02-02 2012-04-13

Google использует многоступенчатую систему для определения, ищет ли пользователь медиа-контент. Система анализирует результаты из товарного индекса, поисковые подсказки (Candidate Queries) и списки ключевых слов. Если эти сигналы указывают на медиа-интент, …

Как Google использует OCR и канонические документы для улучшения результатов визуального поиска

2011 • Индексация • Мультимедиа • Семантика и интент

US9176986B2 2015-11-03 2011-12-01

Google использует технологию визуального поиска для идентификации текста в изображениях (визуальных запросах). Система оценивает качество распознанного текста (OCR), находит соответствующие строки в своей базе канонических документов (например, веб-страниц или книг) …

Как Google определяет визуальный интент в текстовом запросе и предлагает заменить слова изображением для мультимодального поиска

2022 • Мультимедиа • Семантика и интент

US20250124075A1 2025-04-17 2022-10-18

Google разработал механизм для улучшения точности поиска визуальных концепций. Система анализирует текстовый запрос и определяет слова с «визуальным интентом» (например, описание узора или цвета). Пользователю предлагается заменить эти слова конкретным …

Как Google использует «Канонические виды» (Шаблоны) для стандартизации и повышения точности визуального поиска (например, Google Lens)

2012 • Мультимедиа • Семантика и интент

US9805292B2 2017-10-31 2012-10-24

Google разработал систему для улучшения визуального поиска путем стандартизации входных изображений. Анализируя свою базу, Google определяет оптимальный ракурс («канонический вид») для разных объектов. Эти виды предоставляются как шаблоны (наложения) в …

Как Google использует данные сенсоров и визуальный анализ, чтобы классифицировать изображение как «Место» в Визуальном Поиске

2009 • Local SEO • Мультимедиа • Семантика и интент

US8798378B1 2014-08-05 2009-12-07

Google анализирует метаданные (GPS, ориентация устройства, данные акселерометра) и визуальные характеристики (края, цвет, текстура) фотографии, сделанной на мобильном устройстве. Эта система позволяет быстро классифицировать, изображено ли на ней "место" (например, …

Как Google использует IDF и CTR для выбора языка перевода запросов в поиске по картинкам и видео (CLIR)

2009 • Мультимедиа • Мультиязычность • Семантика и интент

US8577910B1 2013-11-05 2009-06-09

Google применяет механизм кросс-язычного поиска (CLIR) для улучшения выдачи изображений и видео. Система автоматически переводит запрос пользователя на другие языки, выбирая наиболее подходящий на основе частотности терминов (IDF) в его …

Как Google извлекает факты из изображений для наполнения Knowledge Graph

2016 • Knowledge Graph • Мультимедиа • Семантика и интент

US10534810B1 2020-01-14 2016-02-29

Google использует технологию распознавания объектов на изображениях для обогащения своей Базы Знаний (Knowledge Graph). Система анализирует наборы изображений, определяет, какие сущности часто появляются вместе (например, «Медведь Гризли» и «Рыба»), и …

Как Google использует глубокое обучение (CNN) для анализа пикселей видео и автоматической генерации аннотаций

2014 • Индексация • Мультимедиа • Семантика и интент

US9330171B1 2016-05-03 2014-01-22

Google использует сверточные нейронные сети (CNN) для анализа пикселей видео и автоматического создания аннотаций. Система применяет двухканальный подход, анализируя как общий контекст (в низком разрешении), так и центральную область фокуса …

Как Google использует фоновое аудио (например, ТВ-шоу), чтобы понять контекст пользователя и адаптировать поисковую выдачу и подсказки

2014 • Мультимедиа • Семантика и интент

US11924507B2 2024-03-05 2014-06-12

Google может локально анализировать окружающий звук через микрофон устройства, чтобы определить, какой медиаконтент (ТВ-шоу, фильм) воспроизводится поблизости. Для этого система заранее загружает персонализированный набор аудио-отпечатков. При совпадении этот контекст используется …