
Патент Google, описывающий инфраструктурный механизм для эффективной сортировки данных (например, контактов или записей в базе данных) с учетом правил разных языков. Система создает единый многоязычный индекс сортировки и использует технику параллельной генерации ключей для его быстрого наполнения. Это позволяет системе быстро предоставлять отсортированные списки на любом поддерживаемом языке без избыточного потребления ресурсов.
Патент решает инфраструктурную проблему неэффективности и ресурсоемкости поддержки корректной сортировки (Collation) в базах данных, обслуживающих множество языков. Поскольку правила сортировки различаются (например, алфавитный порядок в немецком и шведском), традиционный подход требует создания отдельного индекса для каждого языка. Это приводит к значительному увеличению размера базы данных и снижению производительности. Патент направлен на оптимизацию хранения и скорости сортировки в многоязычной среде. Он не связан с улучшением ранжирования в веб-поиске или борьбой с SEO-манипуляциями.
Запатентована система для создания и использования многоязычного индекса сортировки (multi-language sorting index). Изобретение включает метод параллельной генерации всех возможных ключей сортировки (Sort Keys) для заданной строки на всех поддерживаемых языках за один проход. Эти ключи хранятся в единой вспомогательной таблице (Auxiliary Table), которая экономит место за счет устранения дубликатов, поскольку многие языки используют одинаковые ключи для одних и тех же строк.
Система функционирует следующим образом:
Combined Mapping Table (CMT), которая агрегирует правила сортировки (Collation Elements) всех поддерживаемых языков.Sort Keys для строки на всех языках.Sort Keys сохраняются в Auxiliary Table (индексе) со ссылкой на исходную запись.BETWEEN или ORDER BY), система использует Auxiliary Table для быстрого получения упорядоченного набора, а затем фильтрует его для обеспечения точности для запрошенного языка.Высокая (для инфраструктуры). Эффективность работы баз данных и корректная поддержка интернационализации (i18n) остаются критически важными задачами для любых глобальных систем и приложений, обрабатывающих большие объемы многоязычных данных.
(1/10). Патент имеет минимальное значение для SEO-стратегии. Он описывает внутренние инфраструктурные механизмы баз данных, предназначенные для эффективной сортировки (Collation), а не для ранжирования (Ranking) или определения релевантности контента. Патент описывает внутренние процессы Google без прямых рекомендаций для SEO.
Weights). Используется в алгоритмах сортировки, таких как Unicode Collation Algorithm.Sort Keys для нескольких языков в оптимизированном виде, обычно во вспомогательной таблице.multi-language sorting index. Содержит Sort Keys и ссылки на записи в основной таблице (primary table).Collation Elements для всех поддерживаемых языков.Collation Element, определяющие приоритет сортировки (например, Primary, Secondary, Tertiary).Claim 1 (Независимый пункт): Описывает метод создания многоязычного индекса сортировки (multi-language sorting index) с использованием параллельной генерации ключей.
Combined Mapping Table (CMT). CMT содержит отображения подстрок на Collation Elements для всех поддерживаемых языков.Collation Elements из CMT добавляются к последовательностям (Collation Element Sequences). Это включает построение последовательностей для каждого языка путем идентификации языков в CMT и добавления соответствующих элементов.Collation Element Sequence конвертируется в Sort Key.multi-language sorting index, включающий все ключи сортировки для строки на всех поддерживаемых языках. Индекс является единым, и несколько ключей генерируются за один проход.Claim 4 (Зависимый): Уточняет, что процесс генерации может создавать Degenerate Sort Key, который не применим ни к одному из поддерживаемых языков.
Claim 6 (Зависимый): Уточняет архитектуру хранения: строки хранятся в основной таблице (primary database table), а индекс сортировки хранится во вспомогательной таблице (auxiliary database table), которая также содержит ссылки на строки в основной таблице.
Этот патент не относится напрямую к стандартным этапам архитектуры поисковой системы Google Search (Crawling, Indexing, Ranking и т.д.), используемым для ранжирования веб-страниц. Он описывает инфраструктуру систем управления базами данных (СУБД) и алгоритмы для эффективной сортировки данных (Collation).
Применение: Технология используется в приложениях, где требуется сортировка текстовых данных в соответствии с правилами конкретного языка. Примеры: сортировка списка контактов в адресной книге (Google Contacts), сортировка названий файлов (Google Drive) или любая функция, где пользователь ожидает увидеть данные в алфавитном порядке, соответствующем его языку.
Входные данные:
Combined Mapping Table (правила сортировки для всех языков).Выходные данные:
Sort Keys для этой строки на всех поддерживаемых языках, сохраненный в Auxiliary Table.Алгоритм влияет исключительно на эффективность инфраструктуры:
SELECT...BETWEEN или ORDER BY).Патент не влияет на ранжирование в поисковой выдаче, специфические ниши (YMYL) или типы запросов.
Sort Keys для обновления Auxiliary Table.Процесс А: Параллельная генерация ключей сортировки
Combined Mapping Table (CMT). Процесс начинается с нулевого смещения в строке.Collation Elements (для разных языков), процесс разветвляется для обработки каждого варианта параллельно.Collation Elements к текущей формируемой последовательности.Sort Key. Это делается путем объединения весов (Weights) разных уровней (первичных, вторичных, третичных), разделенных специальными сепараторами.Degenerate Sort Keys. Они могут быть удалены или сохранены.Процесс Б: Использование многоязычного индекса сортировки
SELECT BETWEEN startString AND endString).startSortKey и endSortKey) для границ диапазона на языке запроса.Auxiliary Table все записи, чьи Sort Keys находятся между startSortKey и endSortKey.Патент фокусируется исключительно на обработке строк и правил сортировки.
Combined Mapping Table, содержащая правила Collation и Collation Elements для всех поддерживаемых языков.В патенте не упоминаются ссылочные, поведенческие, временные или географические факторы ранжирования.
Патент не описывает метрики ранжирования или оценки качества поиска. Он оперирует метриками сортировки.
Патент описывает внутренние процессы Google, связанные с инфраструктурой баз данных, без прямых рекомендаций для SEO.
Collation). Это не алгоритм ранжирования (Ranking).Sort Keys для строки на разных языках за один проход с использованием Combined Mapping Table. Это достигается за счет сложного рекурсивного алгоритма.multi-language sorting index позволяет значительно экономить место, поскольку хранятся только уникальные Sort Keys, устраняя дублирование для языков с одинаковыми правилами сортировки.Патент является инфраструктурным и не дает практических выводов для SEO.
Патент не содержит информации, которая могла бы повлиять на лучшие практики SEO. Он не подтверждает и не опровергает существующие SEO-стратегии.
Патент не содержит информации, которая указывала бы на неэффективные или опасные SEO-тактики. Он не направлен против каких-либо SEO-манипуляций.
Стратегическое значение для SEO отсутствует. Патент важен для инженеров баз данных и специалистов по интернационализации (i18n), но не предоставляет инсайтов для специалистов по поисковой оптимизации.
Практических примеров для SEO нет. Патент описывает механизмы сортировки в базах данных.
Пример работы (не SEO): Сортировка контактов
Sort Keys (примеры из патента): Auxiliary Table со ссылкой на контакт "Töch".Влияет ли этот патент на ранжирование сайтов в Google Поиске?
Нет, этот патент не влияет на ранжирование в поиске. Он описывает, как Google может эффективно сортировать данные в своих базах данных (например, имена контактов) в соответствии с алфавитными правилами разных языков. Это инфраструктурный патент, не связанный с определением релевантности или качества веб-страниц.
Что такое Collation и чем она отличается от Ranking?
Collation — это процесс упорядочивания строк в соответствии с установленными правилами, обычно алфавитным порядком конкретного языка. Ranking (Ранжирование) — это процесс упорядочивания документов в соответствии с их релевантностью запросу пользователя и показателями качества. SEO-специалисты работают над улучшением Ranking, тогда как этот патент описывает оптимизацию Collation.
Что такое "Ключ сортировки" (Sort Key)?
Это техническое представление текстовой строки в виде последовательности байтов. Оно создается таким образом, что при сравнении этих байтовых последовательностей результаты будут соответствовать правилам сортировки определенного языка. Это позволяет базам данных быстро сортировать текст, просто сравнивая эти ключи.
Зачем Google нужна параллельная генерация ключей сортировки?
Для эффективности и экономии ресурсов. Вместо того чтобы генерировать ключ сортировки для каждого языка по отдельности (что требовало бы N проходов для N языков), система генерирует все уникальные ключи за один проход. Это значительно ускоряет процесс индексации данных в многоязычных базах данных.
Что такое Combined Mapping Table (CMT)?
Это структура данных, которая объединяет правила сортировки из всех поддерживаемых языков в одну таблицу. Она позволяет системе быстро определить, какие веса (Weights) соответствуют определенной подстроке в разных языках. Использование этой таблицы является основой для алгоритма параллельной генерации ключей.
Как система экономит место, если она генерирует ключи для всех языков?
Экономия достигается за счет хранения только уникальных ключей во вспомогательной таблице (Auxiliary Table). Поскольку многие языки имеют одинаковые правила сортировки для большинства строк, система не дублирует эти ключи. Вместо создания отдельного индекса для каждого языка используется один общий индекс.
Где на практике может применяться эта технология?
Она применяется в любых приложениях, где требуется сортировка по имени или названию с учетом языка пользователя. Это могут быть адресные книги (Google Contacts), списки файлов (Google Drive) или любые внутренние базы данных Google, требующие эффективной многоязычной сортировки.
Что такое "Вырожденные ключи сортировки" (Degenerate Sort Keys)?
Это побочный продукт алгоритма параллельной генерации. Поскольку алгоритм комбинирует части правил из разных языков в одном проходе, он может создать ключ сортировки, который технически возможен по таблице, но фактически не используется ни в одном из поддерживаемых языков.
Связан ли этот патент с Unicode Collation Algorithm (UCA)?
Да, патент тесно связан с UCA. Он использует концепции, описанные в стандарте Unicode, такие как Collation Elements и веса разных уровней. По сути, патент предлагает способ эффективной реализации, генерации и хранения результатов UCA для множества языков одновременно.
Какие практические действия должен предпринять SEO-специалист на основе этого патента?
Никаких. Патент не содержит информации, которая могла бы повлиять на стратегию или тактику поисковой оптимизации сайтов. Это чисто технический, инфраструктурный патент, не имеющий отношения к факторам ранжирования.

Индексация
Мультиязычность

Мультиязычность
Индексация
Семантика и интент

Мультиязычность
Поведенческие сигналы
Персонализация

Индексация

SERP
Свежесть контента
Индексация

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Ссылки

Local SEO
Семантика и интент
Поведенческие сигналы

Ссылки

Персонализация
Семантика и интент
Поведенческие сигналы
