Мультимедиа

Как Google выбирает главное изображение для сущности, анализируя тематичность веб-страниц и визуальные характеристики картинки

2013 • Knowledge Graph • Мультимедиа • Семантика и интент

US9110943B2 2015-08-18 2013-01-31

Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на …

Как Google использует визуальное сходство (VisualRank) для проверки и ранжирования текстовых меток в поиске по картинкам

2008 • Shumeet Baluja • Индексация • Мультимедиа • Семантика и интент

US8326091B1 2012-12-04 2008-06-30

Google использует механизм (VisualRank) для улучшения качества поиска по картинкам, анализируя визуальное содержимое изображений. Система не полагается исключительно на окружающий текст. Она сравнивает визуальные характеристики изображения с другими в индексе …

Как Google управляет мультимодальными ответами в голосовом поиске и оптимизирует подбор контента для URL

2017 • Мультимедиа • Персонализация • Семантика и интент

US10735552B2 2020-08-04 2017-05-24

Анализ патента Google, описывающего систему для голосового поиска, которая определяет первичный аудиоответ и одновременно выбирает связанный вторичный цифровой контент. Система оценивает различные форматы контента («канонические цифровые компоненты») на основе релевантности …

Как Google использует выделение деталей на изображении для уточнения визуального поиска и комбинирования результатов

2022 • Индексация • Мультимедиа • Семантика и интент

US12072925B2 2024-08-27 2022-03-18

Google использует технологию, позволяющую пользователям уточнять визуальные запросы путем произвольного выделения конкретных деталей на изображении (например, обводя или закрашивая элемент). Система интерпретирует это действие для понимания истинного намерения пользователя. Используя …

Как Google использует несколько изображений в одном запросе для уточнения визуального поиска через общие атрибуты и проекции эмбеддингов

2023 • Индексация • Мультимедиа • Семантика и интент

US12271417B2 2025-04-08 2023-04-24

Google использует механизм поиска, принимающий на вход два или более изображения. Система анализирует их для выявления общих атрибутов (стиль, цвет, тип объекта) и генерирует векторные представления (эмбеддинги). Если изображения вводятся …

Как Google переранжирует и выбирает изображения для Featured Snippets, требуя релевантности и вопросу, и ответу

2013 • Gal Chechik • SERP • Мультимедиа • Семантика и интент

US9336318B2 2016-05-10 2013-12-31

Google использует специальный алгоритм для выбора изображений в блоках с ответами. Система проверяет, что изображение релевантно одновременно и заданному вопросу, и предоставленному ответу. Для этого анализируются метки (Labels) и распознанные …

Как Google связывает изображения с семантическими сущностями для устранения неоднозначности в поиске по картинкам

2013 • Knowledge Graph • Мультимедиа • Семантика и интент

US9171018B2 2015-10-27 2013-01-16

Google использует систему для понимания того, что именно изображено на картинке, связывая ее с конкретной семантической сущностью (например, статьей в Wikipedia или Freebase). Это позволяет устранить неоднозначность (понимать разницу между …

Как Google идентифицирует конкретные видео (фильмы, клипы, эпизоды) на веб-страницах, анализируя окружающий текст

2012 • Индексация • Мультимедиа • Семантика и интент

US8983945B1 2015-03-17 2012-01-03

Google использует библиографические данные (название, актеры, длина) для поиска и идентификации конкретных видео на веб-страницах. Система анализирует текст, расположенный рядом с видеоплеером («associated text»), и вычисляет «оценку совпадения» (Occurrence Score), …

Как Google понимает содержание видео, вычисляя вероятность присутствия и центральность сущностей в каждом кадре

2015 • Индексация • Мультимедиа • Семантика и интент

US12141199B2 2024-11-12 2015-08-11

Google использует сложные модели машинного обучения для анализа видеоконтента кадр за кадром. Система определяет, какие сущности (объекты, концепции) присутствуют в кадре, и вычисляет вероятность того, насколько они являются центральной темой …

Как Google использует визуальные превью и обратную связь пользователей для улучшения связанных запросов в Поиске по картинкам

2011 • Мультимедиа • Поведенческие сигналы

US9727587B2 2017-08-08 2011-11-03

Патент Google, описывающий интерфейс для Поиска по картинкам, где связанные запросы сопровождаются превью-изображениями. Система позволяет пользователям отклонять нерелевантные предложения (Dismissal Element) и предварительно просматривать результаты (Hovercard). Google фиксирует эти отказы …

Как Google использует камеру для предсказания текстовых запросов и запуска мультимодального поиска в реальном времени

2024 • Мультимедиа • Семантика и интент

US12321401B1 2025-06-03 2024-06-10

Google использует систему для анализа живого потока с камеры (например, в Google Lens), распознавания объектов в кадре и мгновенного предложения релевантных текстовых запросов или действий. Выбор подсказки формирует мультимодальный запрос …

Как Google использует «Визуальные Синсеты» (Visual Synsets) для аннотирования изображений и поиска похожих картинок

2011 • Индексация • Мультимедиа • Семантика и интент

US9589208B2 2017-03-07 2011-06-17

Google использует технологию «Визуальных Синсетов» (Visual Synsets) для понимания содержания изображений. Система кластеризует миллиарды картинок сначала по семантическим концепциям (на основе связанных запросов), а затем по визуальному сходству. Каждому кластеру …

Как Google интеллектуально уточняет запросы из изображений, предсказывая намерения пользователя и исправляя ошибки OCR

2023 • Мультимедиа • Семантика и интент

US20250217412A1 2025-07-03 2023-12-28

Google совершенствует визуальный поиск (например, Google Lens), анализируя текст на изображениях (OCR) и предсказывая задачу пользователя (например, перевод, покупка). Если результаты поиска по исходному тексту не решают эту задачу, система …

Как Google объединяет изображения и текст в мультимодальном поиске для уточнения визуальных запросов

2022 • Мультимедиа • Персонализация • Семантика и интент

US20240370487A1 2024-11-07 2022-11-04

Google использует модель уточнения запросов для мультимодального поиска (например, в Google Lens). Система принимает эмбеддинг исходного изображения и текстовое уточнение от пользователя. Модель генерирует новый, уточненный эмбеддинг изображения, который объединяет …

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи

2009 • SERP • Мультимедиа • Семантика и интент

US9836482B2 2017-12-05 2009-12-29

Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, …

Как Google использует машинное обучение для распознавания и маркировки контента (изображений, видео, текста)

2007 • Безопасный поиск • Мультимедиа • Семантика и интент

US8788503B1 2014-07-22 2007-10-17

Google использует метод машинного обучения для автоматического понимания и маркировки контента, такого как изображения, видео или текст. Система анализирует обучающий набор данных, выделяет схожие признаки (кластеры) и определяет, какие комбинации …

Как Google индексирует контент изображений, распознавая лица, одежду и текст для улучшения поиска по картинкам

2005 • Индексация • Мультимедиа • Семантика и интент

US8897505B2 2014-11-25 2005-10-07

Анализ патента Google, описывающего фундаментальные технологии распознавания контента внутри изображений. Система обнаруживает и идентифицирует людей (используя комбинацию лиц, одежды, времени и местоположения), текст (OCR) и другие объекты. Эта информация индексируется, …

Как Google автоматически и непрерывно A/B тестирует внешний вид результатов поиска и рекламы для оптимизации CTR

2013 • Google Shopping • Мультимедиа • Поведенческие сигналы

US20180365295A1 2018-12-20 2013-11-04

Патент описывает систему автоматизированного тестирования визуальных элементов контента (результатов поиска или рекламы). Google может случайным образом изменять параметры отображения (цвет ссылок, размер шрифта, отступы) в пределах заданного диапазона. Система отслеживает …

Как Google использует данные о поведении пользователей для определения тематики и ранжирования видеоканалов и плейлистов

2015 • Мультимедиа • Персонализация • Семантика и интент

US10390085B2 2019-08-20 2015-06-05

Google патентует систему для автоматической категоризации видеоканалов и плейлистов. Система определяет тематику канала, анализируя не только метаданные, но и то, какие видео пользователи смотрят чаще всего и сколько времени проводят …

Как поисковые системы используют мультимодальный анализ и кластеризацию для понимания контента и поведения пользователей

Индексация • Мультимедиа • Семантика и интент

US6564202B1 2003-05-13 1999-10-19

Анализ фундаментального патента Xerox PARC, описывающего методы Information Retrieval. Патент раскрывает, как различные типы данных (текст, изображения, ссылки, поведение пользователей) преобразуются в векторы для мультимодальной кластеризации. Описаны концепции анализа пользователей …