Google использует усовершенствованный алгоритм Min-Hash для создания цифровых сигнатур контента (веб-страниц, изображений, медиа). Условно используя вторичные перестановки, когда первичный хеш дает мало информации, Google генерирует более надежные и информативные сигнатуры. …
Патенты Google
Разборы патентов поисковой системы Google
Google использует систему для улучшения поисковой выдачи по запросам, содержащим имена людей. Система анализирует релевантные веб-страницы, обнаруживает наличие лиц (Face Detection) и определяет личность человека на фото, используя текстовые сигналы …
Google оптимизирует визуальный поиск, группируя почти идентичные изображения (измененный размер, обрезка) в единый кластер. Система индексирует не отдельные картинки, а совокупность всех визуальных признаков ("визуальных слов") из всех вариантов в …
Google использует инфраструктурный механизм для эффективного хранения похожих документов. Система группирует документы (часто с одного хоста, используя реверсированные URL) в кластеры и сжимает их, удаляя повторяющиеся последовательности токенов внутри кластера. …
Google автоматически определяет географические регионы, связанные с новостным событием. Если язык региона отличается от языка пользователя, система переводит ключевые слова сюжета, ищет релевантные локальные статьи и интегрирует их в выдачу …
Google использует систему для выбора дополнительного контента (например, рекламы или рекомендаций), который будет показан пользователю на просматриваемой странице. Система анализирует темы документа и тональность (sentiment) по отношению к этим темам. …
Google использует метод для эффективного сканирования контента, скрытого за веб-формами (Deep Web). Вместо перебора всех возможных комбинаций полей ввода система определяет, какие поля являются «информативными» — то есть, изменение каких …
Google использует централизованную систему (Host Load Server) для управления скоростью сканирования. Система динамически распределяет максимальную пропускную способность веб-хоста между конкурирующими краулерами (например, Новости, Картинки, Основной поиск) на основе их приоритетов. …
Google использует историю потребления медиаконтента пользователем (музыка, фильмы, шоу) и фоновое аудио, захваченное микрофоном устройства во время ввода запроса, для персонализации поисковых подсказок (Autocomplete). Система идентифицирует сущности из недавно потребленного …
Google использует высокоэффективный метод для сравнения и выравнивания изображений. Система выбирает ключевые участки (Tiles) с высокой детализацией, быстро вычисляет суммы пикселей в различных областях (Block Sums) с помощью технологии Summed …
Анализ инфраструктурного патента Google, описывающего метод повышения эффективности метапоиска. Система консолидирует результаты от разных алгоритмов, отправляя уникальные URL только один раз вместе с компактными «векторами позиций». Это позволяет пользователю переключать …
Google использует систему для автоматического перевода ключевых слов (например, для рекламы или тегирования контента), учитывая локальные особенности языка. Система переводит исходное слово, находит синонимы и проверяет, какие варианты чаще всего …
Патент описывает инфраструктуру Google для эффективного рендеринга веб-страниц в масштабах интернета. Система использует итеративный подход: если во время рендеринга обнаруживается отсутствующий ресурс (например, CSS или JS), процесс останавливается, ресурс ставится …
Google использует механизм визуальных уточнений в поиске по изображениям. Когда пользователь вводит общий запрос, система предлагает связанные уточненные запросы, сопровождая их репрезентативным изображением. Это позволяет пользователю предварительно оценить результаты уточнения …
Google использует систему группировки поисковых подсказок (автозаполнения) в интерфейсах карт. Система определяет основной термин запроса (например, «отели») и группирует связанные уточнения (например, «рядом с Oakland» или «люкс»). Ключевая особенность — …
Google автоматически оценивает техническое качество мультимедиа (видео, аудио, изображений) с помощью Production Quality Score. Система обучается на основе относительных сравнений асессоров и анализирует технические признаки (визуальные, аудио, метаданные, качество текста). …
Google использует механизм для улучшения пользовательского опыта при обработке неоднозначных опечаток. Система предлагает несколько вариантов исправления, включая «агрессивные» (сильно отличающиеся от оригинала). При выборе варианта результаты поиска обновляются динамически, часто …
Google использует механизм для стабилизации индекса при обработке дубликатов в условиях неравномерного сканирования (Crawl Skew). Если страница не была пересканирована, система принудительно связывает ее с предыдущим каноническим URL (Previous Representative). …
Google анализирует изображения, разбивая их на визуальные сегменты (области схожего цвета/текстуры). Система изучает, какие сегменты обычно появляются вместе (контекст), и создает базу данных (Codebook). При анализе нового изображения, если его …
Патент Google, описывающий дизайн пользовательского интерфейса для Q&A платформ и форумов. Система позволяет пользователям выполнять поиск (по вебу, картинкам и т.д.) прямо из формы ответа и одним кликом добавлять найденные …