Google патентует новый тип интерфейса для "нелинейного браузинга". Вместо списка ссылок пользователь перемещается по массиву карточек (tiles) в разных направлениях (вверх/вниз, влево/вправо). Каждое направление представляет собой отдельное тематическое путешествие (например, …
Мультимедиа
Google использует поведенческие сигналы для определения похожих видео на платформах типа YouTube. Система анализирует, какие видео пользователи смотрят одно за другим в течение короткого времени (ко-просмотры). Если пользователи положительно взаимодействуют …
Система прогнозирует «сетевой эффект» контента — его способность генерировать каскад последующих взаимодействий (репосты, комментарии) в онлайн-сервисах (например, Google Discover, YouTube). При расчете используется граф причинно-следственных связей и дисконтирующий фактор для …
Google использует гетерогенный граф для анализа взаимосвязей между пользователями, видео, группами и рекламой в социальных сетях (например, YouTube). Система итеративно распространяет "метки интереса" (labels) через эти связи, используя алгоритмы типа …
Google использует комплексный подход к визуальному поиску. Система строит персональный Граф Визуальных Интересов пользователя для персонализации выдачи и проактивных рекомендаций. Она анализирует композицию кадра и контекст (например, окружающий текст), чтобы …
Google использует систему для выполнения одного запроса сразу по нескольким категориям (вертикалям) поиска, таким как Веб, Новости, Товары или Картинки. Система оценивает релевантность не только отдельных результатов, но и целых …
Google использует передовые методы для интерпретации изображений, содержащих диаграммы (например, задачи по геометрии, физике, химии). Система преобразует визуальную информацию либо в формальное языковое представление, либо в мультимодальный эмбеддинг для генерации …
Google разработал систему, позволяющую использовать изображения с мобильных устройств в качестве поисковых запросов. Система распознает объекты на изображении (продукты, здания, текст, лица), преобразует их в символьное описание (текстовый запрос) и …
Патент Google описывает механизм Визуального поиска (например, Google Lens). Система анализирует входное изображение, распознает объекты и сущности (используя общие и детальные метки). Затем она генерирует список потенциальных текстовых запросов, связанных …
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение …
Патент Google, описывающий архитектуру Визуального Поиска (Google Lens). Система индексирует «цифровые дополнения» (информацию, отзывы, AR-модели, ссылки на покупку), связанные с объектами реального мира. Описаны процессы структурирования данных, обработки визуальных запросов …
Google патентует систему, которая создает детальную историю потребления медиаконтента пользователем (фильмы, музыка, ТВ) из разных источников (чеки, история просмотров, распознавание аудио). Эта история используется для персонализации результатов поиска по сущностям …
Google использует механизм для улучшения рекомендаций на контент-платформах (например, YouTube). Когда пользователь проявляет интерес к конкретной песне в просматриваемом видео (явно или неявно), система идентифицирует другие видео, содержащие альтернативные версии …
Система мультимодального поиска Google, которая одновременно обрабатывает визуальные данные с камеры и аудиоданные с микрофона. Система извлекает визуальные признаки, транскрибирует речь и анализирует звуковые сигнатуры. Это позволяет пользователям задавать контекстные …
Google использует систему машинного обучения для анализа визуальных характеристик изображения (цвета, текстуры, формы) и определения наиболее релевантных текстовых запросов. Система сопоставляет характеристики изображения с тысячами моделей релевантности. Каждая модель обучена …
Google автоматически генерирует семантически обогащенные структурированные документы из видео и изображений, объединяя транскрипцию аудио (ASR), текст с экрана (OCR) и данные о спикерах. Большие Языковые Модели (LLM) используют эти документы …
Google использует механизм для оценки качества и авторитетности изображений, даже если на них нет прямых ссылок. Система создает "виртуальные ссылки" между изображениями на основе их визуального сходства, данных о кликах …
Google использует систему рекомендаций, анализирующую элементы (людей, объекты, места), отмеченные тегами непосредственно внутри видео. Система находит связанный контент, содержащий те же элементы. Если в видео отмечен человек, система может рекомендовать …
Google применяет комплексную систему для чтения текста на изображениях (например, вывесок в Street View). Патент описывает методы улучшения качества размытых изображений путем объединения нескольких кадров (Superresolution), распознавания текста (OCR) и …
Google разработал систему для повышения доверия к данным о точках интереса (POI). Система извлекает фактическую информацию (адреса, часы работы, услуги) из изображений (Street View, фото пользователей) с помощью компьютерного зрения …