Мультимедиа

Как Google предлагает нелинейный способ браузинга контента с помощью многоосевого интерфейса и автоматических запросов

2020 • Knowledge Graph • Мультимедиа • Поведенческие сигналы

US20210311611A1 2021-10-07 2020-12-15

Google патентует новый тип интерфейса для "нелинейного браузинга". Вместо списка ссылок пользователь перемещается по массиву карточек (tiles) в разных направлениях (вверх/вниз, влево/вправо). Каждое направление представляет собой отдельное тематическое путешествие (например, …

Как Google (YouTube) использует последовательность просмотров и общее время просмотра для определения и ранжирования похожих видео

2008 • Мультимедиа • Персонализация • Поведенческие сигналы

US9088808B1 2015-07-21 2008-02-08

Google использует поведенческие сигналы для определения похожих видео на платформах типа YouTube. Система анализирует, какие видео пользователи смотрят одно за другим в течение короткого времени (ко-просмотры). Если пользователи положительно взаимодействуют …

Как Google ранжирует контент в лентах рекомендаций, прогнозируя «Сетевой Эффект» (виральность) и каскадное вовлечение

2015 • Мультимедиа • Персонализация • Поведенческие сигналы

US10296642B1 2019-05-21 2015-06-05

Система прогнозирует «сетевой эффект» контента — его способность генерировать каскад последующих взаимодействий (репосты, комментарии) в онлайн-сервисах (например, Google Discover, YouTube). При расчете используется граф причинно-следственных связей и дисконтирующий фактор для …

Как Google использует графы социальных связей и поведения пользователей для генерации рекомендаций видео и рекламы (на примере YouTube)

2007 • Shumeet Baluja • Мультимедиа • Персонализация • Поведенческие сигналы

US8533236B1 2013-09-10 2007-11-01

Google использует гетерогенный граф для анализа взаимосвязей между пользователями, видео, группами и рекламой в социальных сетях (например, YouTube). Система итеративно распространяет "метки интереса" (labels) через эти связи, используя алгоритмы типа …

Как Google использует графы визуальных интересов, контекст и композицию кадра для понимания интента в Визуальном поиске (Google Lens)

2020 • Мультимедиа • Персонализация • Семантика и интент

US12339896B2 2025-06-24 2020-09-18

Google использует комплексный подход к визуальному поиску. Система строит персональный Граф Визуальных Интересов пользователя для персонализации выдачи и проактивных рекомендаций. Она анализирует композицию кадра и контекст (например, окружающий текст), чтобы …

Как Google определяет и ранжирует вертикали поиска (Web, Картинки, Новости) для Универсальной выдачи и ответов Ассистента

2003 • EEAT и качество • Google Shopping • Мультимедиа

US11314822B2 2022-04-26 2003-12-31

Google использует систему для выполнения одного запроса сразу по нескольким категориям (вертикалям) поиска, таким как Веб, Новости, Товары или Картинки. Система оценивает релевантность не только отдельных результатов, но и целых …

Как Google использует мультимодальные модели и парсинг диаграмм для понимания визуальных запросов и решения задач по фото

2023 • Knowledge Graph • Мультимедиа • Семантика и интент

US20240152546A1 2024-05-09 2023-11-06

Google использует передовые методы для интерпретации изображений, содержащих диаграммы (например, задачи по геометрии, физике, химии). Система преобразует визуальную информацию либо в формальное языковое представление, либо в мультимодальный эмбеддинг для генерации …

Как Google заложил основу визуального поиска (Google Lens), превращая изображения с камеры в поисковые запросы

2004 • Knowledge Graph • Мультимедиа • Семантика и интент

US8421872B2 2013-04-16 2004-02-20

Google разработал систему, позволяющую использовать изображения с мобильных устройств в качестве поисковых запросов. Система распознает объекты на изображении (продукты, здания, текст, лица), преобразует их в символьное описание (текстовый запрос) и …

Как Google преобразует изображения в текстовые поисковые запросы, используя сущности и контекст пользователя

2016 • Google Shopping • Matthew Sharifi • Мультимедиа • Семантика и интент

US12298985B2 2025-05-13 2016-04-18

Патент Google описывает механизм Визуального поиска (например, Google Lens). Система анализирует входное изображение, распознает объекты и сущности (используя общие и детальные метки). Затем она генерирует список потенциальных текстовых запросов, связанных …

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)

2012 • Мультимедиа • Поведенческие сигналы

US8898150B1 2014-11-25 2012-09-10

Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение …

Как Google индексирует и ранжирует цифровой контент и AR-элементы для Визуального Поиска (Google Lens)

2019 • EEAT и качество • Индексация • Мультимедиа

JP2024112912A 2024-08-21 2019-06-21

Патент Google, описывающий архитектуру Визуального Поиска (Google Lens). Система индексирует «цифровые дополнения» (информацию, отзывы, AR-модели, ссылки на покупку), связанные с объектами реального мира. Описаны процессы структурирования данных, обработки визуальных запросов …

Как Google использует историю просмотра фильмов и прослушивания музыки для персонализации поиска и ответов на контекстные запросы

2013 • Matthew Sharifi • Мультимедиа • Персонализация • Поведенческие сигналы

US20240248927A1 2024-07-25 2013-10-07

Google патентует систему, которая создает детальную историю потребления медиаконтента пользователем (фильмы, музыка, ТВ) из разных источников (чеки, история просмотров, распознавание аудио). Эта история используется для персонализации результатов поиска по сущностям …

Как Google (YouTube) динамически приоритизирует каверы и альтернативные версии песен в блоке рекомендаций

2016 • Мультимедиа • Персонализация • Поведенческие сигналы

US10345998B2 2019-07-09 2016-11-10

Google использует механизм для улучшения рекомендаций на контент-платформах (например, YouTube). Когда пользователь проявляет интерес к конкретной песне в просматриваемом видео (явно или неявно), система идентифицирует другие видео, содержащие альтернативные версии …

Как Google объединяет изображение с камеры и одновременный аудиовход (речь и звуки) для выполнения сложных мультимодальных поисковых запросов

2023 • Мультимедиа • Персонализация • Семантика и интент

US12346386B2 2025-07-01 2023-04-25

Система мультимодального поиска Google, которая одновременно обрабатывает визуальные данные с камеры и аудиоданные с микрофона. Система извлекает визуальные признаки, транскрибирует речь и анализирует звуковые сигнатуры. Это позволяет пользователям задавать контекстные …

Как Google переводит изображения в ключевые слова с помощью моделей релевантности, обученных на поведении пользователей

2012 • Google Shopping • Мультимедиа • Семантика и интент

US9372920B2 2016-06-21 2012-08-08

Google использует систему машинного обучения для анализа визуальных характеристик изображения (цвета, текстуры, формы) и определения наиболее релевантных текстовых запросов. Система сопоставляет характеристики изображения с тысячами моделей релевантности. Каждая модель обучена …

Как Google использует LLM для глубокого понимания видео и изображений через интеграцию ASR и OCR

2023 • Индексация • Мультимедиа • Семантика и интент

US20250094491A1 2025-03-20 2023-03-02

Google автоматически генерирует семантически обогащенные структурированные документы из видео и изображений, объединяя транскрипцию аудио (ASR), текст с экрана (OCR) и данные о спикерах. Большие Языковые Модели (LLM) используют эти документы …

Как Google использует «Виртуальные ссылки» и визуальное сходство для ранжирования изображений (Visual PageRank)

2008 • EEAT и качество • Shumeet Baluja • Индексация • Мультимедиа

US9977816B1 2018-05-22 2008-04-08

Google использует механизм для оценки качества и авторитетности изображений, даже если на них нет прямых ссылок. Система создает "виртуальные ссылки" между изображениями на основе их визуального сходства, данных о кликах …

Как Google использует теги внутри видео, социальные связи и одобрения для генерации персонализированных рекомендаций

2014 • Justin Lewis • Мультимедиа • Персонализация • Поведенческие сигналы

US9639634B1 2017-05-02 2014-01-28

Google использует систему рекомендаций, анализирующую элементы (людей, объекты, места), отмеченные тегами непосредственно внутри видео. Система находит связанный контент, содержащий те же элементы. Если в видео отмечен человек, система может рекомендовать …

Как Google использует OCR, Superresolution и GPS-интерполяцию для индексации текста в Street View и Image Search

2006 • EEAT и качество • SERP • Мультимедиа

US9760781B2 2017-09-12 2006-06-29

Google применяет комплексную систему для чтения текста на изображениях (например, вывесок в Street View). Патент описывает методы улучшения качества размытых изображений путем объединения нескольких кадров (Superresolution), распознавания текста (OCR) и …

Как Google использует визуальные доказательства из изображений для подтверждения информации о местах (POI) и повышения доверия к данным

2020 • EEAT и качество • Мультимедиа • Свежесть контента

US20230044871A1 2023-02-09 2020-12-29

Google разработал систему для повышения доверия к данным о точках интереса (POI). Система извлекает фактическую информацию (адреса, часы работы, услуги) из изображений (Street View, фото пользователей) с помощью компьютерного зрения …