Как Google адаптировал поисковый индекс для обработки неоднозначных запросов с кнопочных телефонов (WAP/T9)

Google разработал метод для обработки поисковых запросов с устройств с ограниченным вводом, таких как кнопочные телефоны. Система создает вторичный «неоднозначный» индекс (например, числовой), который отражает раскладку клавиатуры устройства. Это позволяет напрямую сопоставлять неоднозначный ввод пользователя (например, последовательность цифр) с терминами в индексе, не требуя уточнения каждой буквы.

Описание

Какую задачу решает

Патент решает проблему сложности и неэффективности ввода текста на устройствах с ограниченным интерфейсом, актуальную на момент подачи заявки (2000 год). Речь идет о мобильных телефонах (например, WAP-устройствах) с цифровыми клавиатурами, где одна клавиша соответствует нескольким буквам (например, «2» для A, B, C). Традиционный ввод (мультитап) требует многократных нажатий для выбора одной буквы, что делает поиск медленным и неудобным. Изобретение призвано упростить ввод, позволяя пользователю нажимать каждую клавишу только один раз.

Что запатентовано

Запатентована система обработки неоднозначных поисковых запросов (Ambiguous Search Query) путем создания модифицированного (вторичного) индекса. Суть изобретения заключается в том, чтобы не пытаться разрешить неоднозначность запроса пользователя на лету, а вместо этого заранее создать индекс, который «неоднозначен» (ambiguated) таким же образом, как и ввод пользователя. Этот вторичный индекс генерируется с использованием информации о раскладке устройства (Mapping Information).

Как это работает

Система работает следующим образом:

Генерация стандартного индекса: Создается обычный буквенно-цифровой индекс (Alphanumeric Index).
Трансляция терминов: Термины в индексе преобразуются в неоднозначный формат. Используя стандартную раскладку телефонной клавиатуры, слова «car» и «bar» преобразуются в одну и ту же числовую последовательность «227».
Генерация модифицированного индекса: Создается второй индекс (Numeric Index), где эти числовые последовательности («227») связаны с документами, содержащими исходные слова («car» или «bar»).
Обработка запроса: Когда пользователь вводит неоднозначный запрос (например, нажимает «227»), система ищет эту последовательность напрямую в модифицированном индексе и возвращает все соответствующие документы.

Актуальность для SEO

Низкая. Патент подан в 2000 году и направлен на решение проблем интерфейсов кнопочных телефонов (эпоха T9 и WAP). В 2025 году доминирующими способами ввода являются полноценные виртуальные QWERTY-клавиатуры на смартфонах и голосовой ввод. Конкретная техническая проблема, описанная в патенте, практически утратила актуальность.

Важность для SEO

(1/10. Минимальное/Инфраструктура). Патент описывает чисто инфраструктурные процессы Google, связанные с обработкой специфического и ныне устаревшего типа пользовательского ввода. Он не содержит информации о факторах ранжирования, оценке качества контента (E-E-A-T) или методах определения релевантности. Практическая ценность для современных SEO-стратегий отсутствует.

Детальный разбор

Термины и определения

Ambiguous Search Query (Неоднозначный поисковый запрос): Запрос, введенный на устройстве, где одно действие пользователя (например, нажатие клавиши) может соответствовать нескольким символам. Пример: последовательность цифр с телефонной клавиатуры.
First Index (Первый индекс): Стандартный поисковый индекс. В основном примере это Alphanumeric Index (Алфавитно-цифровой индекс), который связывает текстовые термины с документами.
Second Index / Modified Index (Второй / Модифицированный индекс): Индекс, созданный путем преобразования терминов из Первого индекса. В основном примере это Numeric Index (Числовой индекс). Этот индекс является неоднозначным (ambiguated).
Mapping Information (Информация о соответствии / Раскладка): Правила, определяющие трансляцию между типами информации. Например, раскладка стандартной телефонной клавиатуры (standard telephone keypad), где A, B, C соответствуют клавише 2.
First/Second type of information (Первый/Второй тип информации): Типы данных. В основном примере: буквенно-цифровой и числовой. Патент также упоминает фонетическую (phonetic), аудио (audio) и визуальную (visual) информацию как возможные типы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обработки запроса с использованием двух индексов.

Генерация First Index, связывающего информацию первого типа с документами.
Трансляция (translating) информации первого типа в информацию второго типа на основе Mapping Information.
Генерация Second Index, связывающего информацию второго типа с теми же документами.
Получение поискового запроса второго типа.
Генерация результатов поиска путем сравнения (comparing) запроса со Second Index.

Ядром изобретения является предварительное вычисление амбигуизированного индекса (Second Index), который отражает неоднозначность устройства ввода. Вместо того чтобы пытаться дезамбигуизировать запрос пользователя, система адаптирует индекс в амбигуизированный формат и выполняет поиск непосредственно в этом формате.

Claim 6 (Зависимый от 5, который зависит от 1): Уточняет типы информации.

Первый тип — алфавитно-цифровой (Alphanumeric Index), второй тип — числовой (Numeric Index).

Claim 7 (Зависимый от 6): Уточняет источник Mapping Information.

Она основана на стандартной телефонной клавиатуре.

Claims 8, 9, 10 (Зависимые от 5): Расширяют применение метода на другие типы данных.

Второй тип информации может быть фонетическим, аудио или визуальным.

Claim 18 (Независимый пункт): Описывает альтернативный метод создания индекса.

Получение информации первого типа из документа.
Трансляция этой информации во второй тип с использованием Mapping Information.
Генерация записи индекса, связывающей информацию второго типа с документом.

Этот вариант предполагает, что система может генерировать Second Index напрямую при обработке документов, минуя создание отдельного First Index.

Где и как применяется

Патент описывает внутренние процессы Google без прямых рекомендаций для SEO. Изобретение затрагивает этапы индексирования и обработки запросов для поддержки специфических устройств ввода.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит создание модифицированного индекса. Это может быть выполнено путем трансляции существующего First Index (офлайн-процесс) или путем прямой генерации Second Index во время сканирования документов (как в Claim 18). Это инфраструктурная задача.

QUNDERSTANDING – Понимание Запросов
Система обработки запросов должна распознать, что входящий запрос является неоднозначным (например, числовая последовательность с мобильного устройства), и направить его к соответствующему индексу (Second Index).

RANKING – Ранжирование (L1 Retrieval)
На этапе отбора кандидатов (Retrieval) система использует Second Index для быстрого поиска документов, соответствующих неоднозначному запросу. Поиск выполняется в модифицированном индексе вместо стандартного.

Входные данные:

Коллекция документов (или First Index).
Mapping Information (например, раскладка клавиатуры).
Неоднозначный запрос пользователя (например, последовательность цифр).

Выходные данные:

Набор результатов поиска, соответствующих неоднозначному запросу.

На что влияет

Специфические устройства: Влияет исключительно на обработку запросов, поступающих с устройств с ограниченными возможностями ввода (кнопочные телефоны).
Типы данных: Хотя основной пример использует числовой ввод, патент (Claims 8-10) упоминает возможность применения метода к другим типам информации (фонетической, аудио, визуальной), если существует соответствующий маппинг.
Точность поиска: В патенте отмечается, что результаты могут быть менее точными (less precise), так как неоднозначность сохраняется (например, поиск по «227» вернет результаты и для «car», и для «bar»).

Патент не содержит информации о влиянии на ранжирование, качество контента или специфические тематики (YMYL).

Когда применяется

Условие активации: Пользователь использует устройство ввода, для которого система сгенерировала модифицированный индекс на основе соответствующей Mapping Information.
Триггер: Входящий запрос имеет формат, соответствующий модифицированному индексу (например, числовой запрос вместо текстового).

Пошаговый алгоритм

Основной вариант реализации (Claim 1):

Процесс А: Генерация индексов (Офлайн)

Генерация первого индекса: Система создает стандартный Alphanumeric Index, анализируя документы и связывая термины с документами.
Трансляция терминов: Система перебирает все термины в Alphanumeric Index и преобразует их во второй формат (например, числовой), используя Mapping Information (раскладку клавиатуры). Например, «car» -> «227», «bar» -> «227».
Генерация второго индекса: Система создает Numeric Index. В этом индексе преобразованные термины связываются с документами из первого индекса. Например, «227» связывается с документами, содержащими «car» ИЛИ «bar».

Процесс Б: Обработка запроса (В реальном времени)

Получение запроса: Система получает неоднозначный запрос (Ambiguous Search Query) от пользователя, например, «227».
Сравнение с индексом: Система сравнивает полученный запрос напрямую со вторым индексом (Numeric Index).
Генерация результатов: Система идентифицирует все документы, связанные с этим термином в Numeric Index.
Предоставление результатов: Найденные документы предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на механизме сопоставления ввода и не детализирует факторы ранжирования.

Контентные факторы: Текст документов. Используется для генерации индексов (как первого, так и второго).
Системные данные: Mapping Information. Критически важные данные, определяющие правила трансляции между типами информации (например, соответствие букв цифрам на клавиатуре).

Ссылочные, поведенческие, временные или другие факторы ранжирования в патенте не упоминаются.

Какие метрики используются и как они считаются

Патент не описывает никаких метрик для оценки качества, релевантности или ранжирования. Он описывает только механизм сопоставления (matching/retrieval).

Метод трансляции: Детерминированное преобразование строк на основе Mapping Information.
Метод сравнения: Используется прямое сравнение (comparison) неоднозначного запроса (например, числовой строки) с терминами в модифицированном индексе.

Выводы

Патент чисто технический и инфраструктурный: Он описывает внутренние процессы Google для поддержки устаревшего метода ввода данных (кнопочные телефоны). Патент не содержит прямых рекомендаций для SEO.
Адаптация индекса, а не запроса: Ключевая идея патента — предварительная модификация (амбигуация) поискового индекса для соответствия неоднозначности пользовательского ввода. Это позволяет избежать необходимости «разгадывать» (дезамбигуировать) ввод пользователя на лету.
Отсутствие влияния на ранжирование: Механизм описывает только этап поиска совпадений (Retrieval). Он не затрагивает вопросы качества контента, релевантности или алгоритмов ранжирования найденных результатов.
Исторический контекст и устаревание: В контексте 2025 года, с доминированием смартфонов, описанная технология имеет историческое, а не практическое значение для SEO.
Ранние идеи мультимодальности: Упоминание фонетических, аудио- и визуальных индексов (Claims 8-10) демонстрирует раннюю концептуализацию создания специализированных индексов для разных типов данных, что является основой мультимодального поиска.

Практика

ВАЖНО: Патент является инфраструктурным, описывает устаревшую технологию ввода и не дает практических выводов для современных SEO-стратегий.

Best practices (это мы делаем)

Не применимо. Патент не дает оснований для рекомендаций по оптимизации контента, ссылочного профиля или технических аспектов сайта с целью улучшения ранжирования.

Worst practices (это делать не надо)

Не применимо. Патент не направлен против каких-либо SEO-тактик или манипуляций; он решает проблему пользовательского ввода.

Стратегическое значение

Для современного SEO стратегическое значение отсутствует. Патент представляет исключительно исторический интерес, показывая, как Google решал проблемы пользовательского интерфейса на ранних этапах развития мобильного поиска (с участием Сергея Брина и других ключевых инженеров). Он не влияет на долгосрочную SEO-стратегию.

Практические примеры

Практических примеров для SEO нет. Ниже приведен пример работы описанной технологии (не пример SEO-оптимизации), основанный на тексте патента.

Сценарий: Поиск на кнопочном телефоне (пример из патента)

Задача пользователя: Найти информацию по запросу «ben smith».
Стандартный метод ввода (Мультитап): Пользователю нужно ввести: 22(b) 33(e) 66(n) 0(space) 7777(s) 6(m) 444(i) 8(t) 44(h). Всего 18 нажатий.
Метод из патента: Пользователь нажимает каждую клавишу один раз: 2 3 6 0 7 6 4 8 4. Всего 9 нажатий.
Обработка Google: Система получает неоднозначный запрос «236076484».
Поиск: Система ищет эту последовательность в своем Numeric Index, который был заранее сгенерирован и связывает эту последовательность с документами, содержащими «ben smith» (и любые другие комбинации букв, соответствующие этому числу).
Результат: Пользователь получает результаты поиска, затратив вдвое меньше усилий на ввод.

Вопросы и ответы

Актуален ли этот патент для современного SEO в 2025 году?

Нет. Патент был подан в 2000 году для решения проблемы ввода текста на кнопочных телефонах (WAP/T9). Поскольку современные смартфоны используют полноценные QWERTY-клавиатуры или голосовой ввод, описанная технология практически не актуальна для современного поиска и не влияет на SEO-стратегии.

Влияет ли описанный механизм на ранжирование сайтов?

Нет. Патент описывает только метод сопоставления (matching) неоднозначного запроса с индексом на этапе отбора кандидатов (Retrieval). Он не содержит информации об алгоритмах ранжирования, факторах релевантности или оценке качества контента.

Что такое «Модифицированный индекс» (Modified Index) в контексте патента?

Это вторичный индекс, созданный путем преобразования терминов из стандартного индекса в формат, который отражает неоднозначность ввода пользователя. Например, Alphanumeric Index преобразуется в Numeric Index, где буквенные термины заменены числовыми последовательностями в соответствии с раскладкой телефонной клавиатуры.

Пытается ли система угадать, какое слово имел в виду пользователь?

Нет, в этом ключевая особенность изобретения. Вместо того чтобы угадывать (дезамбигуировать) запрос пользователя на лету, система заранее создает индекс, который является таким же неоднозначным (амбигуированным), как и ввод. Поиск ведется напрямую по этому неоднозначному индексу.

Чем этот подход отличается от предиктивного ввода (например, T9)?

Подход принципиально отличается. T9 работает на устройстве пользователя и пытается угадать слово, используя словари. Описанный в патенте метод работает на сервере Google, не пытается угадать слово, а вместо этого ищет все возможные совпадения в специально подготовленном неоднозначном индексе.

Как система обеспечивает точность, если индекс и запрос неоднозначны?

Точность (Precision) может снижаться. Например, если слова «car» и «bar» оба преобразуются в «227», то запрос «227» вернет документы по обеим темам. Это компромисс: система жертвует точностью ради удобства и скорости ввода на ограниченных устройствах.

Почему система создает второй индекс вместо того, чтобы переводить запрос пользователя на лету?

Перевод неоднозначного запроса пользователя во все возможные слова и последующий поиск каждого из них в стандартном индексе может быть вычислительно затратным в реальном времени. Создание предварительно рассчитанного неоднозначного индекса (офлайн) позволяет выполнить поиск гораздо быстрее, так как требуется только одно прямое сопоставление с этим индексом.

Может ли этот патент быть связан с голосовым поиском (Voice Search)?

Концептуально да. Патент упоминает (Claims 8, 9), что метод может применяться к фонетической или аудиоинформации. Идея создания специализированного индекса (например, фонетического) для обработки неоднозначного ввода перекликается с задачами голосового поиска, хотя конкретная реализация в патенте сосредоточена на клавиатурном вводе.

Требует ли этот метод создания двух отдельных индексов?

Патент описывает два варианта. Первый (Claim 1) предполагает создание стандартного индекса, а затем его трансляцию во второй, модифицированный индекс. Второй вариант (Claim 18) описывает возможность создания модифицированного индекса напрямую при обработке документов.

Какова основная ценность анализа этого патента для SEO-специалиста?

Практическая ценность для SEO минимальна. Анализ полезен в основном для понимания исторического контекста развития мобильного поиска Google и подтверждения того, что инфраструктура индексирования может быть адаптирована для поддержки различных форматов данных и способов ввода (мультимодальность).