Автор: Виктор Репин

2005 Краулинг Патенты Google

Как Google использует иерархию серверов и столбцовое хранение данных для обработки массивных наборов данных

Патент описывает инфраструктуру для хранения и обработки огромных объемов данных. Система разбивает таблицы данных на «фрагменты столбцов» (Column Chunks) и распределяет их по множеству серверов. Запросы обрабатываются динамически определяемой иерархией серверов, которые выполняют подзадачи параллельно и объединяют результаты.

2015 Патенты Яндекс Персонализация Поведенческие факторы Рекомендательные системы

Как Яндекс использует контекст пользователя (геолокацию, историю поиска и датчики устройства) для рекомендации мобильных приложений

Яндекс патентует систему для персонализированной рекомендации мобильных приложений. Система анализирует контекст пользователя (местоположение, историю поиска, установленные приложения, данные датчиков устройства) и параметры приложений (например, отзывы), чтобы определить, какие приложения «контекстуально соответствуют» пользователю в данный момент, и предложить их для скачивания или использования.

2012 Индексация Патенты Google

Как Google ускоряет выполнение запросов, оптимизируя и «сплющивая» деревья запросов

Google использует внутренние технические методы для ускорения поиска по индексу. Патент описывает, как стандартное дерево запроса (Query Tree) оптимизируется путем «сплющивания» (Flattening) структуры и использования механизма Next-Match. Это позволяет минимизировать количество внутренних вызовов функций и быстрее находить соответствующие документы.

2022 Мультимедиа Патенты Google

Как Google использует мультимодальные сигналы и контекст устройства для идентификации контента, воспроизводимого поблизости

Патент Google описывает систему для идентификации контента, воспроизводимого на одном устройстве (например, умной колонке), с помощью другого устройства (например, смартфона). Система объединяет локальные контекстные сигналы (такие как изображение колонки или аудиозапись) с данными другой модальности (например, историей воспроизведения аккаунта), чтобы точно определить контент и предоставить связанную информацию пользователю.

2013 Google Shopping Патенты Google

Как Google использует иерархические структуры и динамические бизнес-фиды для управления рекламными кампаниями

Патент Google, описывающий инфраструктуру для управления рекламными кампаниями с помощью иерархической узловой структуры. Система позволяет рекламодателям синхронизировать рекламную стратегию с динамическими бизнес-данными (например, инвентарем продуктов, маржинальностью) через фиды, автоматически обновляя ставки и контент объявлений в реальном времени.

2011 SERP Патенты Google

Как Google динамически меняет дизайн поисковой выдачи на основе запроса, времени, локации или сайта-партнера

Google может автоматически применять визуальные темы к странице результатов поиска (SERP). Тема выбирается на основе характеристик запроса (ключевые слова, время, местоположение) или по настройкам сайта-партнера (аффилиата), с которого пришел пользователь. Это изменяет внешний вид SERP и рекламы, но не влияет на алгоритмы ранжирования.

2003 Патенты Google Персонализация

Как Google динамически меняет рекламу на странице, отслеживая взаимодействие пользователя с контентом в реальном времени

Патент Google, описывающий систему оптимизации показа рекламы на страницах с несколькими темами. Отслеживая поведение пользователя на стороне клиента (например, клики или наведение курсора) в определенных областях страницы, система определяет текущий тематический интерес пользователя и динамически корректирует оценки релевантных объявлений, обновляя отображаемую рекламу в реальном времени.

2012 Matthew Sharifi Мультимедиа Патенты Google

Как Google использует IDF-взвешивание для повышения точности распознавания контента в прямых трансляциях

Патент описывает технический метод повышения точности систем идентификации медиаконтента (например, Content ID) в прямых трансляциях. Google применяет классический метод IDF (Inverse Document Frequency) к цифровым отпечаткам видео. Это позволяет снизить вес часто встречающихся аудиовизуальных паттернов (шум, стандартные заставки) и повысить вес уникальных совпадений, улучшая качество распознавания.

2013 Мультимедиа Патенты Google

Как Google оптимизирует индексы для распознавания контента с помощью хешей переменной длины

Патент описывает инфраструктурный механизм оптимизации индексов, используемых для сопоставления контента (например, аудио/видео). Система динамически регулирует длину хеш-значений (LSH bands). Если хеш слишком общий и имеет много совпадений, его длина увеличивается для повышения точности. Это повышает эффективность поиска совпадений, но не влияет на алгоритмы ранжирования.

Индексация Патенты Google

Как Google адаптировал поисковый индекс для обработки неоднозначных запросов с кнопочных телефонов (WAP/T9)

Google разработал метод для обработки поисковых запросов с устройств с ограниченным вводом, таких как кнопочные телефоны. Система создает вторичный «неоднозначный» индекс (например, числовой), который отражает раскладку клавиатуры устройства. Это позволяет напрямую сопоставлять неоднозначный ввод пользователя (например, последовательность цифр) с терминами в индексе, не требуя уточнения каждой буквы.

2003 Индексация Патенты Google

Как Google объединял локальные результаты (файлы, email) с веб-результатами на стороне клиента (Google Desktop)

Патент описывает архитектуру клиентского приложения (например, Google Desktop), которое индексирует локальные данные пользователя. Система перехватывает веб-запрос, параллельно выполняет поиск по локальному индексу и объединяет локальные результаты с результатами из глобального веб-индекса в едином интерфейсе, разделяя их по типам контента.

2004 Патенты Google Персонализация

Как Google объединяет и синхронизирует локальные данные пользователя с глобальными каталогами (на примере Desktop Search)

Патент Google, описывающий технологию для клиентских приложений (таких как Google Desktop Search). Система объединяет результаты поиска контактной информации из локального индекса пользователя (файлы, контакты) и глобальных каталогов (например, LDAP или адресные книги). Она также позволяет синхронизировать, обновлять и создавать новые записи контактов на основе найденной информации.

2014 Патенты Google Персонализация

Как Google использует текущее местоположение пользователя для предложения альтернативных авиарейсов при отменах или задержках

Google отслеживает статус авиарейсов пользователя. В случае задержки или отмены система определяет текущее географическое положение пользователя и предлагает альтернативные маршруты, исходя из этой локации, а не из первоначального пункта отправления или пересадки. Это позволяет находить релевантные варианты даже в середине пути.

2017 Вертикальный поиск Индексация Патенты Яндекс Ранжирование

Как Яндекс оптимизирует хранение и ускоряет чтение инвертированного индекса с помощью шаблонного сжатия

Яндекс патентует инфраструктурный метод для повышения плотности сжатия и скорости распаковки инвертированного индекса. Вместо хранения параметров сжатия в каждом блоке данных система использует короткий указатель на предопределенный шаблон. Это экономит память и значительно ускоряет чтение индекса за счет использования оптимизированных процедур декодирования, адаптированных под параллельные инструкции процессора (SIMD).

2022 Индексация Патенты Google

Как Google индексирует свои внутренние структурированные данные (Protobuf) для универсального и быстрого поиска

Патент описывает инфраструктурный механизм Google для эффективного индексирования внутренних данных в формате Protocol Buffers (Protobuf). Система преобразует иерархические (древовидные) данные в универсальные пары «поле-значение» и создает обратный индекс. Это делает любые структурированные данные доступными для полнотекстового поиска и позволяет быстро идентифицировать совпавшие поля, независимо от изменений схемы данных.

2013 Мультиязычность Патенты Google

Как Google ускоряет исправление ошибок автозаполнения при вводе текста на устройствах

Патент Google, описывающий механизм интерфейса для быстрого исправления неверных подсказок автозаполнения. Если система автоматически подставила неподходящее слово после нажатия пробела, пользователь может немедленно нажать клавишу удаления (Backspace). В ответ система заменит неверное слово на следующую по вероятности подсказку из списка кандидатов.

2005 Индексация Патенты Google

Как Google использует составные индексные ключи и упреждающую выборку для ускорения извлечения данных

Этот патент описывает инфраструктурную оптимизацию для быстрого поиска данных. Система генерирует уникальные индексные ключи путем объединения извлеченных значений данных из документов. Эти ключи используются автоматизированным агентом для упреждающей выборки (pre-fetching) документов в локальную память до того, как они будут запрошены, что значительно сокращает задержку при извлечении.

2017 Антиспам Индексация Патенты Яндекс Яндекс Музыка

Как Яндекс использует технологию аудио-отпечатков для быстрого распознавания музыки и аудиоконтента

Яндекс патентует двухэтапный метод идентификации аудиоконтента. Система создает короткие и длинные цифровые отпечатки (аудиосигнатуры). Сначала быстро сравниваются короткие отпечатки (используя «хромаслова») для выбора кандидатов, а затем проводится детальное побитовое сравнение длинных отпечатков для точного распознавания.

2006 Ashutosh Garg Мультимедиа Патенты Google

Как Google обрабатывает и индексирует отсканированные или нетекстовые документы для персонального архивирования и поиска

Система Google для управления персональными или корпоративными документами. Она преобразует изображения документов (сканы, PDF, JPEG) в текст с помощью OCR, назначает метаданные (вручную или через шаблоны) и сохраняет их в базу данных для последующего поиска и извлечения.

2016 Вертикальный поиск Индексация Патенты Яндекс Яндекс Музыка

Как Яндекс использует двухэтапный поиск и оптимизированный индекс для быстрого обнаружения дубликатов аудиофайлов

Яндекс патентует систему для эффективного поиска дубликатов аудиофайлов. Система использует двухэтапный подход: быстрая выборка кандидатов по коротким аудио-отпечаткам (Pruning) и детальная проверка по длинным отпечаткам (Validation). Также описана оптимизированная структура инвертированного индекса для ускорения поиска по компонентам отпечатков (Chroma Words).