Индексация

Google использует специализированную структуру индекса для быстрого поиска по частям слов (подстрокам) и запросам с подстановочными знаками (*, ?). Индекс хранит не только слова, но и их подстроки, связанные с …
Патент Google, описывающий архитектуру локальной поисковой системы (Desktop Search). Система отслеживает действия пользователя с медиафайлами на устройстве в реальном времени. Эти события ставятся в очередь и индексируются в фоновом режиме …
Патент Google, описывающий внутренний механизм оптимизации производительности баз данных (например, в облачной инфраструктуре). Система анализирует историю выполненных SQL-запросов (рабочую нагрузку) и итеративно определяет оптимальный набор индексов базы данных для хранения …
Патент описывает инфраструктурный механизм Google для эффективного удаления устаревших или измененных документов из распределенного индекса. Вместо опроса всех серверов система поддерживает главный список (Non-Key Master List), указывающий, где хранится каждый …
Патент описывает инфраструктурный процесс Google для оцифровки печатных изданий (например, Google Books). Система сканирует документ, ищет идентификаторы (ISBN, ISSN) на странице авторских прав или в штрихкоде, сверяет их с базами …
Патент Google, описывающий инфраструктурную оптимизацию баз данных для сопоставления медиа (видео/аудио). Система использует машинное обучение на тренировочных данных для выбора оптимальных ключей поиска. Цель — предотвратить "clumping" (когда один ключ …
Система Google оптимизирует обработку списков контроля доступа (ACL) для приватного контента. Для повышения производительности система балансирует между размером индекса и сложностью запроса, динамически решая, хранить ли разрешения для целой группы …
Google патентует систему, которая централизованно управляет чатами пользователя с разными службами поддержки. Система анализирует переписку, извлекает ключевые слова и обогащает их метаданными из внешних источников (почта, календарь). Все чаты индексируются, …
Анализ инфраструктурного патента Google, описывающего метод сжатия поискового индекса. Система кодирует списки идентификаторов документов (Posting Lists), динамически выбирая оптимальную фиксированную ширину (например, 1 байт) и обрабатывая переполнения. Это позволяет Google …
Патент Google, описывающий инфраструктурный механизм для эффективного индексирования коррелированных групп данных, таких как списки ТВ-каналов от разных провайдеров. Вместо хранения каждой конфигурации отдельно, система идентифицирует часто встречающиеся наборы каналов (кластеры) …
Патент описывает инфраструктуру индексирования для систем обмена сообщениями (например, Gmail), где коммуникации сгруппированы в беседы. Система идентифицирует цитируемый текст (повторяющийся из предыдущих сообщений) и индексирует его отдельно от нового, оригинального …
Патент Google, описывающий инфраструктурный механизм для эффективной сортировки данных (например, контактов или записей в базе данных) с учетом правил разных языков. Система создает единый многоязычный индекс сортировки и использует технику …
Патент Google, описывающий инфраструктурный метод повышения эффективности баз данных при сортировке одного и того же набора данных по правилам разных языков. Система создает вспомогательный индекс сортировки, генерируя ключи сортировки для …
Инфраструктурная технология индексирования Google, основанная на Log-Structured Merge Trees (LSM-деревьях) и позиционном индексировании. Система позволяет эффективно хранить множество версий данных (историю изменений) и быстро реконструировать состояние индекса на любой момент …
Этот патент описывает систему для локального поиска (Desktop Search). Для ускорения инкрементального поиска (по мере ввода) система использует два отдельных индекса: один для префиксов названий файлов/приложений, второй – только для …
Патент Google, описывающий инфраструктурный механизм сжатия (Gammal code или Gamma1) для эффективного хранения целых чисел в инвертированном индексе. Технология адаптируется к данным для экономии пространства и использует параллельную обработку (SIMD) …
Патент Google описывает инфраструктурный метод оптимизации поиска по тексту в больших хранилищах данных (например, BigQuery). Система использует инвертированный индекс для определения, в каких файлах содержатся искомые данные, и сканирует только …
Google использует внутренние технические методы для ускорения поиска по индексу. Патент описывает, как стандартное дерево запроса (Query Tree) оптимизируется путем "сплющивания" (Flattening) структуры и использования механизма Next-Match. Это позволяет минимизировать …
Google разработал метод для обработки поисковых запросов с устройств с ограниченным вводом, таких как кнопочные телефоны. Система создает вторичный "неоднозначный" индекс (например, числовой), который отражает раскладку клавиатуры устройства. Это позволяет …
Патент описывает архитектуру клиентского приложения (например, Google Desktop), которое индексирует локальные данные пользователя. Система перехватывает веб-запрос, параллельно выполняет поиск по локальному индексу и объединяет локальные результаты с результатами из глобального …