Мультимедиа

Как Google динамически выбирает лучший кадр из видео (thumbnail) и точку воспроизведения под конкретный запрос пользователя

2015 • SERP • Мультимедиа • Семантика и интент

US20160378863A1 2016-12-29 2015-06-24

Google использует систему для динамического выбора thumbnail для видео в результатах поиска. Система анализирует запрос пользователя и содержание каждого кадра видео, преобразуя их в числовые векторы в общем семантическом пространстве. …

Как Google определяет местоположение и репрезентативность (Topicality) изображений, комбинируя визуальный анализ, текст и метаданные

2013 • Индексация • Мультимедиа • Семантика и интент

US9069794B1 2015-06-30 2013-10-11

Google использует систему для определения точного местоположения изображения путем анализа и сверки трех источников: визуального распознавания объектов (Landmark), текстовых подписей/тегов (Caption) и GPS-данных из файла (Metadata). Система разрешает конфликты, используя …

Как Google использует анализ изображений (Street View) для верификации локального бизнеса и определения его приоритета на Картах

2012 • EEAT и качество • Local SEO • Мультимедиа

US20150117796A1 2015-04-30 2012-03-05

Google определяет, какие бизнесы (POI) показывать на Картах, анализируя реальные изображения местности (например, Street View). Система использует распознавание образов (OCR) для чтения вывесок, подтверждая существование и местоположение бизнеса. Точки интереса …

Как Google использует распознавание изображений для превращения объектов на сторонних сайтах в визуальные поисковые запросы

2007 • Google Shopping • Мультимедиа • Семантика и интент

US8712862B2 2014-04-29 2007-07-13

Патент описывает комплексную систему для визуального поиска. Google может анализировать изображения на удаленных (сторонних) веб-страницах, распознавать объекты (например, одежду на человеке), извлекать их визуальные характеристики (цвет, форму, текстуру) и делать …

Как Google анализирует и индексирует содержимое изображений (лица, текст, объекты) для визуального поиска и интерактивного взаимодействия

2005 • Индексация • Мультимедиа • Семантика и интент

US9430719B2 2016-08-30 2005-10-07

Патент Google описывает систему глубокого анализа изображений для распознавания лиц, одежды и текста на объектах. Система генерирует уникальные "сигнатуры распознавания" и создает индекс на их основе, что позволяет искать изображения …

Как Google идентифицирует, индексирует и ищет конкретные объекты и действия внутри видеоконтента

2012 • Индексация • Мультимедиа • Семантика и интент

US9087242B2 2015-07-21 2012-10-01

Google использует технологию для идентификации и маркировки «пространственно-временных объемов» (spatio-temporal volumes) внутри видео, которые соответствуют конкретным объектам или действиям (например, «бегущая кошка»). Это позволяет системе индексировать контент на гранулярном уровне, …

Как Google использует жесты на экране (например, «Circle to Search») для генерации мультимодальных поисковых запросов

2013 • Мультимедиа • Персонализация • Семантика и интент

US9916396B2 2018-03-13 2013-02-19

Google использует технологию, позволяющую инициировать поиск жестами (например, обведением объекта на экране). Система анализирует выбранный контент (текст, изображения, видео), извлекает ключевые темы, учитывает контекст страницы и пользователя (местоположение, время), взвешивает …

Как Google использует машинное обучение для автоматического определения и объяснения ключевых сущностей во время просмотра видео

2022 • Knowledge Graph • Мультимедиа • Семантика и интент

US20240370494A1 2024-11-07 2022-12-30

Google патентует систему для улучшения понимания видеоконтента. Используя машинное обучение, система анализирует транскрипцию видео и прогнозирует, какие сущности зрители, скорее всего, захотят найти в поиске. Когда такая сущность упоминается, система …

Как Google анализирует страницу-источник перехода для формирования рекомендаций медиаконтента

2012 • Мультимедиа • Персонализация • Ссылки

US9563627B1 2017-02-07 2012-09-12

Google анализирует контекст запроса медиаконтента (например, видео), определяя источник перехода (referral source). Система сканирует исходную страницу, чтобы найти другой контент, размещенный на ней (например, другие встроенные видео), и использует эту …

Как Google обрабатывает визуальные запросы (Google Lens), используя параллельные системы распознавания объектов, лиц и текста

2010 • Google Shopping • Мультимедиа • Семантика и интент

US20190012334A1 2019-01-10 2010-08-04

Патент Google, описывающий архитектуру системы визуального поиска. Изображение, используемое как запрос, одновременно отправляется в несколько специализированных систем (распознавание текста, лиц, объектов, штрихкодов). Результаты агрегируются и могут быть представлены в виде …

Как Google использует генеративный ИИ для создания и модификации визуальных запросов в поиске товаров

2023 • Google Shopping • Мультимедиа • Семантика и интент

US20240394768A1 2024-11-28 2023-03-31

Google патентует систему, которая позволяет пользователям создавать изображения желаемых товаров с помощью генеративного ИИ, используя структурированные подсказки или текст. Полученное изображение используется как визуальный запрос для поиска реальных товаров. Система …

Как Google анализирует структуру страницы (Token Table) для определения галерей изображений и оценки релевантности текста к картинкам

2004 • EEAT и качество • SERP • Мультимедиа

US20150161179A1 2015-06-11 2004-06-21

Google использует механизм "Token Table" для анализа логической структуры веб-страницы. Это позволяет системе вычислять логическое расстояние между текстом и изображениями для оценки их релевантности друг другу (Relatedness). Также система определяет, …

Как Google объединяет текстовые описания с разных сайтов для улучшения поиска по картинкам

2004 • Shumeet Baluja • Индексация • Мультимедиа • Семантика и интент

US7460735B1 2008-12-02 2004-09-28

Google улучшает поиск по картинкам, находя дубликаты или похожие изображения на разных сайтах. Система собирает все текстовые метки (из alt-текста, заголовков, окружающего текста), связанные с каждой копией изображения, объединяет их …

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования

2015 • EEAT и качество • SERP • Мультимедиа

US9858295B2 2018-01-02 2015-06-23

Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим …

Как Google автоматически создает визуальные туры для сущностей, объединяя изображения их ключевых подсущностей

2014 • Knowledge Graph • Мультимедиа • Семантика и интент

US9471695B1 2016-10-18 2014-12-02

Google использует этот механизм для автоматического создания структурированных визуальных туров (например, фототуров) для сложных или географических сущностей. Система анализирует взаимосвязи в Графе Знаний, определяет наиболее важные подсущности (например, достопримечательности в …

Как Google использует мультимодальный анализ (текст и движение в кадре) для автоматической сегментации видео (Key Moments)

2013 • Индексация • Мультимедиа • Семантика и интент

US12271420B1 2025-04-08 2013-06-26

Google автоматически разделяет видео, в частности инструкции ("how-to"), на смысловые сегменты. Система использует обязательную комбинацию анализа текстовой транскрипции и технического анализа видеоряда (Motion Flow и Gradient Flow), чтобы определить точные …

Как Google определяет намерение поиска изображений, анализируя контент топовых веб-результатов

2013 • SERP • Мультимедиа • Семантика и интент

US9195717B2 2015-11-24 2013-03-13

Google использует систему для определения того, следует ли показывать блок с изображениями в поисковой выдаче. Вместо анализа только текста запроса, система анализирует характеристики контента (например, плотность изображений, соотношение изображений к …

Как Google использует контент на экране пользователя для понимания и переписывания неоднозначных запросов

2017 • Мультимедиа • Персонализация • Семантика и интент

US10565256B2 2020-02-18 2017-03-20

Google использует механизм для понимания неоднозначных запросов (например, «Что это?»), анализируя то, что пользователь видит на экране своего устройства. Система определяет основное изображение, распознает объекты на нем и анализирует окружающий …

Как Google использует Vision-Language и Генеративные модели для анализа ключевых кадров видео и ответов на вопросы пользователей

2023 • Индексация • Мультимедиа • Семантика и интент

US20250190488A1 2025-06-12 2023-12-11

Google разработал систему для эффективного понимания содержания видео. Вместо анализа каждого кадра система выбирает ключевые кадры и использует Vision-Language Model для создания их текстового описания. Когда пользователь задает вопрос о …

Как Google использует OCR и геолокацию для выбора главной фотографии локального бизнеса

2011 • EEAT и качество • Local SEO • Мультимедиа

US8811656B2 2014-08-19 2011-05-11

Система Google для автоматического выбора лучшего (репрезентативного) изображения для локального бизнеса. Анализируя коллекции гео-тегированных фото (например, Street View или пользовательские), система распознает текст на изображениях (OCR) и сопоставляет его с …