Индексация

Патент Google, описывающий инфраструктурную технологию хранения данных ("Interlaced Repository"), которая объединяет функции сжатого хранилища документов и инвертированного индекса. Эта структура позволяет системе быстро находить все вхождения термина и одновременно эффективно …
Патент описывает инфраструктуру Google для эффективной загрузки встроенных ресурсов (CSS, JavaScript, изображения) при рендеринге миллиардов веб-страниц. Система использует многоуровневое кэширование и интеллектуальную маршрутизацию запросов к хостам, чтобы ускорить процесс индексации …
Патент Google, описывающий инфраструктурный механизм для повышения эффективности поиска. Система использует итеративный битовый поиск по атрибутам документов (Sort Keys), таким как качество или дата, чтобы быстро найти заданное количество результатов …
Патент описывает архитектуру, позволяющую пользователям или организациям создавать собственные поисковые индексы (Custom Search Indexes) путем загрузки или указания контента. Система управляет доступом к этим индексам на основе правил, установленных владельцем, …
Анализ патента IBM, описывающего метод агрегации ранжирования (Rank Aggregation). Система сортирует один и тот же набор документов по разным критериям (например, по релевантности и по дате), а затем объединяет эти …
Патент Google описывает архитектуру для создания и ранжирования пользовательских индексов (Custom Search Index) отдельно от основного веб-поиска. Владельцы контента могут напрямую влиять на ранжирование в своем индексе, используя аннотации (указание …
Google фиксирует точное персонализированное и динамическое содержимое (например, ленты социальных сетей или корзины покупок), которое видит пользователь, и сохраняет его в приватном Персональном Кэше. Это позволяет пользователям искать и просматривать …
Патент Google, описывающий инфраструктуру поискового индекса, основанного на фразах, а не только на отдельных словах. Система распределяет индекс по разным уровням (Tiers) в зависимости от стоимости обработки фраз и разбивает …
Google использует механизм для точного определения момента, когда нативное мобильное приложение полностью загрузило и отобразило контент. Система последовательно отслеживает завершение всех внешних сетевых запросов и состояние бездействия (idle) внутренних потоков …
Патент описывает механизм, позволяющий владельцам сайтов загружать приватные структурированные данные, недоступные при обычном сканировании. Доступ к этим данным защищен ключом (API key). Авторизованные системы (например, Google Custom Search Engine или …
Google использует систему для определения «фактической свежести» (de facto fresh) кэшированного документа, анализируя историю его обновлений, а не полагаясь только на заголовки истечения срока действия. Если статистический анализ показывает, что …
Google использует метод квантования векторов для ускорения поиска и снижения потребления памяти. Этот метод разбивает большие векторы (например, эмбеддинги страниц и запросов) на части (субпространства) и аппроксимирует их значения с …
Патент описывает инфраструктуру Google для создания пользовательских поисковых индексов (Custom Search Indexes), отдельных от основного веб-индекса. Он фокусируется на методах защиты конфиденциального контента, включая шифрование результатов и индексирование только метаданных, …
Google использует инфраструктурный механизм «Эпох» для обновления поискового индекса в реальном времени. Система отслеживает активные поисковые запросы и гарантирует, что устаревшие данные (например, старые версии документов) удаляются только тогда, когда …
Этот патент описывает инфраструктурную оптимизацию поискового индекса Google. В нем представлена «гибридная структура данных», которая ускоряет извлечение информации (например, местоположение фраз в документах) путем объединения бинарных деревьев с таблицами поиска …
Патент описывает инфраструктурные оптимизации для поисковых систем, в частности, для поиска по исходному коду. Он включает два основных механизма: 1) Кэширование результатов для дорогих повторяющихся запросов с обновлением кэша в …
Этот патент описывает инфраструктуру, которую Google использует для крупномасштабных систем сопоставления медиа (таких как Content ID). В нем подробно рассказывается, как Google распределяет масштабную задачу сравнения пользовательских видео с защищенными …
Патент Google описывает инфраструктурный механизм для эффективного поиска дубликатов или похожих аудио- и видеофайлов в огромных базах данных. Система использует технику Locality Sensitive Hashing (LSH) и распределенную сортировку (например, MapReduce) …
Google использует систему для эффективного тестирования и оценки различных критериев отбора ресурсов для включения в индекс. Вместо затратного перестроения индекса для каждого эксперимента, система симулирует, как разные процессы отбора повлияют …
Google использует метод для организации больших объемов неструктурированных данных (например, отзывов клиентов или сообщений на форумах) в иерархическую таксономию. Система итеративно применяет стандартные алгоритмы кластеризации: сначала группирует документы, затем группирует …