Автор: Виктор Репин

Патент описывает инфраструктуру для хранения и обработки огромных объемов данных. Система разбивает таблицы данных на «фрагменты столбцов» (Column Chunks) и распределяет их по множеству серверов. Запросы обрабатываются динамически определяемой иерархией серверов, которые выполняют подзадачи параллельно и объединяют результаты.

Яндекс патентует систему для персонализированной рекомендации мобильных приложений. Система анализирует контекст пользователя (местоположение, историю поиска, установленные приложения, данные датчиков устройства) и параметры приложений (например, отзывы), чтобы определить, какие приложения «контекстуально соответствуют» пользователю в данный момент, и предложить их для скачивания или использования.

Google использует внутренние технические методы для ускорения поиска по индексу. Патент описывает, как стандартное дерево запроса (Query Tree) оптимизируется путем «сплющивания» (Flattening) структуры и использования механизма Next-Match. Это позволяет минимизировать количество внутренних вызовов функций и быстрее находить соответствующие документы.

Патент Google описывает систему для идентификации контента, воспроизводимого на одном устройстве (например, умной колонке), с помощью другого устройства (например, смартфона). Система объединяет локальные контекстные сигналы (такие как изображение колонки или аудиозапись) с данными другой модальности (например, историей воспроизведения аккаунта), чтобы точно определить контент и предоставить связанную информацию пользователю.

Патент Google, описывающий инфраструктуру для управления рекламными кампаниями с помощью иерархической узловой структуры. Система позволяет рекламодателям синхронизировать рекламную стратегию с динамическими бизнес-данными (например, инвентарем продуктов, маржинальностью) через фиды, автоматически обновляя ставки и контент объявлений в реальном времени.

Google может автоматически применять визуальные темы к странице результатов поиска (SERP). Тема выбирается на основе характеристик запроса (ключевые слова, время, местоположение) или по настройкам сайта-партнера (аффилиата), с которого пришел пользователь. Это изменяет внешний вид SERP и рекламы, но не влияет на алгоритмы ранжирования.

Патент Google, описывающий систему оптимизации показа рекламы на страницах с несколькими темами. Отслеживая поведение пользователя на стороне клиента (например, клики или наведение курсора) в определенных областях страницы, система определяет текущий тематический интерес пользователя и динамически корректирует оценки релевантных объявлений, обновляя отображаемую рекламу в реальном времени.

Патент описывает технический метод повышения точности систем идентификации медиаконтента (например, Content ID) в прямых трансляциях. Google применяет классический метод IDF (Inverse Document Frequency) к цифровым отпечаткам видео. Это позволяет снизить вес часто встречающихся аудиовизуальных паттернов (шум, стандартные заставки) и повысить вес уникальных совпадений, улучшая качество распознавания.

Патент описывает инфраструктурный механизм оптимизации индексов, используемых для сопоставления контента (например, аудио/видео). Система динамически регулирует длину хеш-значений (LSH bands). Если хеш слишком общий и имеет много совпадений, его длина увеличивается для повышения точности. Это повышает эффективность поиска совпадений, но не влияет на алгоритмы ранжирования.

Google разработал метод для обработки поисковых запросов с устройств с ограниченным вводом, таких как кнопочные телефоны. Система создает вторичный «неоднозначный» индекс (например, числовой), который отражает раскладку клавиатуры устройства. Это позволяет напрямую сопоставлять неоднозначный ввод пользователя (например, последовательность цифр) с терминами в индексе, не требуя уточнения каждой буквы.

Патент описывает архитектуру клиентского приложения (например, Google Desktop), которое индексирует локальные данные пользователя. Система перехватывает веб-запрос, параллельно выполняет поиск по локальному индексу и объединяет локальные результаты с результатами из глобального веб-индекса в едином интерфейсе, разделяя их по типам контента.

Патент Google, описывающий технологию для клиентских приложений (таких как Google Desktop Search). Система объединяет результаты поиска контактной информации из локального индекса пользователя (файлы, контакты) и глобальных каталогов (например, LDAP или адресные книги). Она также позволяет синхронизировать, обновлять и создавать новые записи контактов на основе найденной информации.

Google отслеживает статус авиарейсов пользователя. В случае задержки или отмены система определяет текущее географическое положение пользователя и предлагает альтернативные маршруты, исходя из этой локации, а не из первоначального пункта отправления или пересадки. Это позволяет находить релевантные варианты даже в середине пути.

Яндекс патентует инфраструктурный метод для повышения плотности сжатия и скорости распаковки инвертированного индекса. Вместо хранения параметров сжатия в каждом блоке данных система использует короткий указатель на предопределенный шаблон. Это экономит память и значительно ускоряет чтение индекса за счет использования оптимизированных процедур декодирования, адаптированных под параллельные инструкции процессора (SIMD).

Патент описывает инфраструктурный механизм Google для эффективного индексирования внутренних данных в формате Protocol Buffers (Protobuf). Система преобразует иерархические (древовидные) данные в универсальные пары «поле-значение» и создает обратный индекс. Это делает любые структурированные данные доступными для полнотекстового поиска и позволяет быстро идентифицировать совпавшие поля, независимо от изменений схемы данных.

Патент Google, описывающий механизм интерфейса для быстрого исправления неверных подсказок автозаполнения. Если система автоматически подставила неподходящее слово после нажатия пробела, пользователь может немедленно нажать клавишу удаления (Backspace). В ответ система заменит неверное слово на следующую по вероятности подсказку из списка кандидатов.

Этот патент описывает инфраструктурную оптимизацию для быстрого поиска данных. Система генерирует уникальные индексные ключи путем объединения извлеченных значений данных из документов. Эти ключи используются автоматизированным агентом для упреждающей выборки (pre-fetching) документов в локальную память до того, как они будут запрошены, что значительно сокращает задержку при извлечении.

Яндекс патентует двухэтапный метод идентификации аудиоконтента. Система создает короткие и длинные цифровые отпечатки (аудиосигнатуры). Сначала быстро сравниваются короткие отпечатки (используя «хромаслова») для выбора кандидатов, а затем проводится детальное побитовое сравнение длинных отпечатков для точного распознавания.

Система Google для управления персональными или корпоративными документами. Она преобразует изображения документов (сканы, PDF, JPEG) в текст с помощью OCR, назначает метаданные (вручную или через шаблоны) и сохраняет их в базу данных для последующего поиска и извлечения.

Яндекс патентует систему для эффективного поиска дубликатов аудиофайлов. Система использует двухэтапный подход: быстрая выборка кандидатов по коротким аудио-отпечаткам (Pruning) и детальная проверка по длинным отпечаткам (Validation). Также описана оптимизированная структура инвертированного индекса для ускорения поиска по компонентам отпечатков (Chroma Words).