Google использует частотность текстовых запросов из своих логов для разрешения неоднозначности при вводе текста с цифровой клавиатуры (например, на старых мобильных телефонах). Система определяет наиболее вероятное слово, соответствующее введенной числовой последовательности, основываясь на популярности этого слова среди всех пользователей.
Описание
Какую задачу решает
Патент решает проблему неоднозначности ввода текста на устройствах с ограниченными клавиатурами, таких как цифровые клавиатуры мобильных телефонов, где одной кнопке соответствует несколько букв (например, кнопка «2» соответствует «ABC»). Это устраняет необходимость в сложных методах ввода (вроде triple-tap) и повышает точность преобразования введенной числовой последовательности (Numeric Query) в предполагаемый пользователем текст.
Что запатентовано
Запатентована система серверного преобразования числовых запросов в текстовые. Ключевым элементом является использование накопленных логов текстовых запросов (Query Logs) для статистического анализа частотности слов. Система определяет наиболее вероятный текстовый эквивалент для неоднозначного числового ввода, основываясь на том, как часто этот текст запрашивается другими пользователями.
Как это работает
Система работает в двух режимах:
- Фоновый режим: Система анализирует логи текстовых запросов. Каждый текстовый запрос преобразуется в его числовой эквивалент (Numerically Equivalent Query) согласно стандарту клавиатуры (Keypad Standard). Затем система группирует все текстовые запросы, имеющие одинаковый числовой эквивалент, и ранжирует их по частоте использования (Frequency Ranking). Наиболее частотный вариант становится основным (Primary Mapping).
- Реальное время: При получении числового запроса от пользователя система обращается к базе соответствий и выбирает Primary Mapping. Этот текст используется для генерации результатов поиска, которые возвращаются пользователю.
Актуальность для SEO
Низкая. Патент подан в 2006 году (дата приоритета) и описывает решение проблемы, актуальной для эры кнопочных мобильных телефонов. В 2025 году доминируют смартфоны с полноценными виртуальными QWERTY-клавиатурами, голосовым вводом и продвинутыми методами предиктивного набора текста. Описанный метод ввода (использование числовой последовательности в качестве поискового запроса) практически устарел.
Важность для SEO
Минимальное влияние (1/10). Патент описывает инфраструктуру обработки специфического типа ввода данных (числового), который практически не используется в настоящее время. Он не касается алгоритмов ранжирования, оценки качества контента, E-E-A-T или ссылочного профиля. Он влияет исключительно на то, как интерпретируется запрос, введенный с цифровой клавиатуры.
Детальный разбор
Термины и определения
- Numeric Query (Числовой запрос)
- Поисковый запрос, состоящий из числовой последовательности, обычно вводимый с цифровой клавиатуры устройства, где пользователь нажимает клавишу один раз для ввода любой из букв, назначенных этой клавише.
- Text Query (Текстовый запрос)
- Стандартный поисковый запрос, состоящий из букв и символов.
- Mapped Text Query / Associated Text Query (Сопоставленный текстовый запрос)
- Текстовый запрос, который система определила как эквивалент полученного числового запроса.
- Numerically Equivalent Query (Числовой эквивалент запроса)
- Числовая последовательность, получаемая путем преобразования текстового запроса с использованием стандарта клавиатуры.
- Keypad Standard (Стандарт клавиатуры)
- Набор правил, определяющих соответствие между буквами и цифровыми клавишами (например, Mobile 1, International Standard).
- Query Logs (Логи запросов)
- Хранилище ранее выполненных текстовых запросов, используемое для анализа частотности.
- Frequency Ranking (Ранжирование по частоте)
- Порядок текстовых запросов, соответствующих одному и тому же числовому эквиваленту, основанный на частоте их встречаемости в Query Logs.
- Primary Mapping (Основное сопоставление)
- Текстовый запрос, имеющий наивысший Frequency Ranking для данного числового эквивалента. Считается наиболее вероятным намерением пользователя.
- Search Profiles (Поисковые профили)
- Данные о паттернах поисковых запросов конкретного пользователя, которые могут использоваться для персонализации разрешения неоднозначности.
- DTMF (Dual-tone multi-frequency)
- Сигналы, генерируемые при нажатии клавиш на телефоне. Система может принимать их как ввод и преобразовывать в ASCII эквиваленты.
Ключевые утверждения (Анализ Claims)
Анализ основан на Claims, представленных в публикации заявки US20110276558A1. Пункты 1-23 отменены (canceled).
Claim 24 (Независимый пункт): Описывает основной метод обработки запроса на сервере.
- Система получает информацию о неоднозначном пользовательском вводе (ambiguous user input) с удаленного устройства, который представляет собой поисковый запрос.
- Система сопоставляет два или более текстовых поисковых запроса с этим неоднозначным вводом.
- Система определяет, что первый из этих текстовых запросов является наиболее вероятным разрешением (most probable resolution) неоднозначности.
- Система генерирует первый набор результатов поиска в ответ на первый текстовый запрос без ожидания подтверждения пользователя о корректности этого разрешения.
- Система передает первый набор результатов поиска на удаленное устройство.
Claim 29 (Зависимый от 24): Уточняет метод определения «наиболее вероятного разрешения».
Определение основано на выявлении текстового запроса, имеющего наивысшую частоту встречаемости (highest frequency of occurrence) в коллекции текстовых запросов, ранее отправленных поисковой системе.
Claim 30 (Зависимый от 24): Уточняет условие для генерации результатов без подтверждения.
Система определяет, что частота встречаемости первого текстового запроса превышает частоту встречаемости второго текстового запроса на заданную величину (predetermined amount). Генерация результатов происходит в ответ на это определение (т.е. если система достаточно уверена).
Claim 31 (Зависимый от 24): Уточняет тип ввода.
Неоднозначный пользовательский ввод представляет собой ввод с цифровой клавиатуры (ambiguous numeric keypad input) на удаленном портативном устройстве.
Где и как применяется
Изобретение применяется на этапе интерпретации ввода пользователя, до основного процесса ранжирования.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система получает неоднозначный ввод (числовой) и преобразует его в структурированный запрос (текстовый). Query Processor и Numeric-to-Text Converter отвечают за этот процесс. Система должна определить истинное намерение пользователя, скрытое за числовой последовательностью, используя статистические данные.
Фоновые процессы (Сбор и анализ данных)
Хотя это не является стандартным этапом CRAWLING/INDEXING веб-контента, система выполняет аналогичный процесс для Query Logs. Query Mapping Module (включая Numeric Query Generator и Text Query Frequency Calculator) в фоновом режиме обрабатывает логи, вычисляет частоты и создает базу соответствий (Numeric-to-Text Query Mappings).
RANKING – Ранжирование
На этот этап система передает уже преобразованный текстовый запрос (Associated Text Query). Сам механизм из патента на ранжирование не влияет, но определяет, по какому именно запросу оно будет производиться.
Входные данные:
- Numeric Query (числовая последовательность от пользователя) или DTMF-сигналы.
- Query Logs (для фонового процесса).
- Keypad Standard (правила преобразования).
- (Опционально) Search Profiles (для персонализации).
Выходные данные:
- Associated Text Query (Основной текстовый вариант).
- (Опционально) Additional Text Queries (Дополнительные варианты).
- Search Results (Результаты поиска по основному варианту).
На что влияет
- Типы устройств: Влияет исключительно на обработку запросов, введенных с помощью цифровых клавиатур на мобильных устройствах (сотовых телефонах, КПК), где применяется метод неоднозначного ввода.
- Типы запросов: Влияет только на числовые запросы (Numeric Queries). Не влияет на стандартные текстовые запросы, введенные с QWERTY-клавиатур или с помощью голоса.
- Языковые и географические ограничения: Система может повышать точность, используя корпус текстовых запросов (Query Logs) для определенного языка, основанный на местоположении пользователя.
Когда применяется
- Триггер активации: Получение запроса в числовом формате или в виде DTMF-сигналов от клиентского устройства.
- Условия работы: Алгоритм разрешения неоднозначности активируется, когда полученная числовая последовательность может соответствовать более чем одному текстовому запросу в базе соответствий.
- Исключения: Если числовая последовательность уникальна и соответствует только одному текстовому запросу, система использует его напрямую. Если соответствий в логах нет, система может использовать стандартные языковые модели, не основанные на логах запросов.
Пошаговый алгоритм
Процесс А: Генерация базы соответствий (Офлайн/Фоновый режим)
- Выборка данных: Выбирается сохраненный текстовый запрос из Query Log.
- Нормализация (Опционально): Запрос может быть разбит на составные слова, которые обрабатываются как отдельные текстовые запросы.
- Генерация числового эквивалента: Для текстового запроса генерируется Numerically Equivalent Query с использованием Keypad Standard.
- Итерация: Процесс повторяется для всех текстовых запросов в логе.
- Группировка: Все текстовые запросы, соответствующие одному и тому же числовому эквиваленту, связываются с ним.
- Расчет частоты: Определяется частота встречаемости (Frequency of Occurrence) каждого из связанных текстовых запросов в Query Log.
- Определение основного соответствия: Наиболее популярный (частотный) текстовый запрос назначается как Primary Mapping для данного числового эквивалента. При расчете может учитываться свежесть запросов (более свежие имеют больший вес).
- Определение дополнительных соответствий (Опционально): Дополнительные текстовые запросы также могут быть сопоставлены, если их частота превышает заданный порог.
- Сохранение: Данные сохраняются в базе Numeric-to-Text Query Mappings с указанием Frequency Ranking.
Процесс Б: Обработка числового запроса (Реальное время)
- Получение ввода: Система получает Numeric Query от пользователя.
- Поиск соответствия: Система проверяет, есть ли текстовый запрос, сопоставленный со всем числовым вводом в базе Numeric-to-Text Query Mappings.
- Парсинг (Опционально): Если соответствие не найдено, числовой запрос разбивается на отдельные термины или комбинации терминов, которые обрабатываются как отдельные числовые запросы.
- Выбор основного соответствия: Для числового запроса (или термина) выбирается текстовый запрос, являющийся Primary Mapping (имеющий наивысший Frequency Ranking).
- Выбор дополнительных соответствий (Опционально): Выбираются дополнительные текстовые запросы.
- Итерация и Конкатенация: Шаги 4-5 повторяются для всех терминов. Соответствующие текстовые запросы объединяются в единый текстовый запрос.
- Генерация результатов: Генерируются результаты поиска с использованием основного сопоставленного текстового запроса. Согласно Claim 24 и 30, это происходит без ожидания подтверждения пользователя, если уверенность в интерпретации высока (частота первого варианта значительно превышает частоту второго).
- (Опционально) Подтверждение и Коррекция: Если уверенность низкая, система может отправить текстовый запрос пользователю для подтверждения. Пользователь может внести исправления или выбрать другой вариант из списка.
- Передача данных: Основной текстовый запрос, (опционально) дополнительные запросы и результаты поиска передаются пользователю.
Какие данные и как использует
Данные на входе
Патент фокусируется на обработке ввода и использует следующие типы данных:
- Поведенческие факторы:
- Query Logs: Логи текстовых запросов от всех пользователей. Это основной источник данных для определения частотности слов и фраз.
- Search Profiles: История и паттерны запросов конкретного пользователя. Могут использоваться для персонализации разрешения неоднозначности (например, если пользователь часто ищет автомобили, то для него «227» скорее будет «CAR», чем «BAR»).
- Технические факторы:
- Numeric Query: Введенная пользователем числовая последовательность.
- DTMF-сигналы: Тональные сигналы с телефона, преобразуемые в числовой ввод.
- Временные факторы: Свежесть запросов в логах.
Какие метрики используются и как они считаются
- Frequency of Occurrence (Частота встречаемости): Подсчет количества раз, когда конкретный текстовый запрос появлялся в Query Logs за определенный период.
- Frequency Ranking (Ранжирование по частоте): Сортировка всех текстовых запросов, соответствующих одному числовому эквиваленту, на основе их Frequency of Occurrence.
- Primary Mapping: Метрика, обозначающая текстовый запрос с наивысшим рангом (Rank 1).
- Весовые коэффициенты: Система может применять веса к частоте встречаемости. Упоминается, что недавно полученные текстовые запросы могут иметь больший вес, чем более старые, даже если общая частота старых выше.
- Пороговые значения:
- Predetermined occurrence threshold: Минимальный порог частоты, необходимый для того, чтобы текстовый запрос был включен в базу соответствий или предложен пользователю как альтернатива.
- Predetermined amount (Claim 30): Заданная разница в частоте между первым и вторым вариантом, при превышении которой система может вернуть результаты поиска без ожидания подтверждения пользователя.
Выводы
- Инфраструктурное решение для устаревшего метода ввода: Патент описывает техническое решение проблемы, которая была актуальна во времена доминирования кнопочных телефонов. Для современного SEO, ориентированного на пользователей смартфонов, патент не несет практической ценности.
- Использование массовых поведенческих данных: Основная ценность патента заключается в демонстрации подхода Google к использованию огромных массивов поведенческих данных (Query Logs) для разрешения лингвистических и интерфейсных неоднозначностей.
- Принцип «Мудрости толпы»: Система полагается на предположение, что наиболее часто запрашиваемый вариант текста является наиболее вероятным намерением пользователя при вводе соответствующей числовой последовательности.
- Динамическая адаптация к трендам: Механизм предусматривает динамическое обновление базы соответствий и возможность взвешивания более свежих запросов выше, что позволяет системе адаптироваться к меняющимся трендам и популярности терминов.
- Персонализация на этапе ввода: Подтверждается использование персонализированных данных (Search Profiles) для корректировки интерпретации запроса еще до начала ранжирования.
Практика
Best practices (это мы делаем)
Патент скорее инфраструктурный и описывает устаревшую технологию ввода. Прямых практических выводов для современных SEO-стратегий нет.
- Использование общепринятой терминологии: Единственный косвенный вывод — патент подчеркивает важность частотности запросов. Система предпочитает термины, которые чаще используются в поиске. Это подтверждает необходимость использования в контенте той терминологии и формулировок, которые активно используются целевой аудиторией.
Worst practices (это делать не надо)
Не применимо. Патент не направлен против каких-либо SEO-тактик или манипуляций с выдачей.
Стратегическое значение
Низкое. Патент интересен с исторической точки зрения развития мобильного поиска и методов интерпретации пользовательского ввода. Он не влияет на долгосрочные SEO-стратегии в 2025 году, так как описываемый метод ввода (Numeric Query) практически исчез с распространением смартфонов с QWERTY-клавиатурами и голосовым поиском.
Практические примеры
Практических примеров для современного SEO нет. Однако можно привести исторический пример работы механизма.
Сценарий (Исторический контекст): Разрешение неоднозначности ввода с мобильного телефона.
- Ввод пользователя: Пользователь хочет найти информацию о фильме «CASES» и вводит на своем кнопочном телефоне последовательность цифр «22737».
- Неоднозначность: Последовательность «22737» соответствует как слову «CASES», так и слову «ACRES».
- Обработка на сервере: Система обращается к базе Numeric-to-Text Query Mappings.
- Анализ частотности: Система проверяет Query Logs. Предположим, что за последний период слово «ACRES» искали 100,000 раз, а «CASES» — 20,000 раз.
- Выбор Primary Mapping: Слово «ACRES» имеет более высокий Frequency Ranking и выбирается в качестве основного соответствия.
- Результат: Поскольку частота «ACRES» значительно выше (превышен порог уверенности), система генерирует результаты поиска для запроса «ACRES» и отправляет их пользователю, не дожидаясь подтверждения. Слово «CASES» может быть предложено как альтернатива.
Вопросы и ответы
Влияет ли этот патент на ранжирование сайтов?
Нет, этот патент не описывает алгоритмы ранжирования. Он описывает исключительно процесс интерпретации пользовательского ввода — как преобразовать неоднозначную числовую последовательность, введенную с цифровой клавиатуры, в конкретный текстовый запрос. Ранжирование происходит уже после того, как текст запроса определен.
Актуален ли этот патент для современных смартфонов (iOS/Android)?
Нет. Современные смартфоны используют полноценные виртуальные QWERTY-клавиатуры, голосовой ввод и продвинутые системы предиктивного текста (swipe, автокоррекция). Метод ввода поискового запроса в виде числовой последовательности (где 2=ABC, 3=DEF и т.д.) практически устарел.
Что такое Numeric Query в контексте патента?
Это последовательность цифр, введенная пользователем на устройстве с ограниченной клавиатурой (например, старом мобильном телефоне). Например, чтобы ввести «CAR», пользователь нажимает «227». Это и есть Numeric Query, который система должна преобразовать обратно в текст.
Как система определяет, какой текст выбрать, если цифры одинаковые (например, 227 может быть CAR или BAR)?
Система использует статистику из своих логов текстовых запросов (Query Logs). Она проверяет, какой из вариантов («CAR» или «BAR») чаще запрашивается пользователями в обычном текстовом поиске. Вариант с наибольшей частотой (Frequency Ranking) выбирается как основной (Primary Mapping).
Учитывает ли система персональную историю поиска?
Да, в патенте упоминается возможность использования Search Profiles. Если история запросов пользователя указывает на определенные интересы (например, автомобили), система может скорректировать выбор основного соответствия в пользу терминов из этой тематики, даже если глобальная частотность другого варианта выше.
Зачем генерировать результаты без подтверждения пользователя (Claim 24)?
Для ускорения поиска и улучшения пользовательского опыта на медленных мобильных соединениях (актуальных на момент подачи патента). Если система с высокой степенью уверенности определяет текстовый запрос (например, если его частотность значительно превышает альтернативы), она сразу показывает результаты, не тратя время на дополнительный цикл запрос-ответ для подтверждения текста.
Что такое Keypad Standard?
Это стандарт, определяющий, какие буквы соответствуют каким цифрам на клавиатуре телефона. Например, в большинстве стандартов «2» соответствует «ABC», но существуют разные международные и региональные стандарты (Mobile 1, UK Classic и т.д.), которые система может поддерживать.
Может ли этот патент использоваться для разрешения неоднозначности в обычном тексте?
Патент сфокусирован именно на преобразовании числового ввода в текст. Хотя базовый принцип (использование частотности из логов запросов для разрешения неоднозначности) применяется Google и в других системах (например, в автокоррекции или понимании естественного языка), данный патент описывает его применение строго в контексте Numeric-to-Text конверсии.
Как часто обновляются данные о популярности слов?
Патент указывает, что обновления могут происходить в реальном времени или периодически. Также упоминается возможность придавать больший вес недавно полученным запросам, что позволяет системе быстро реагировать на тренды и изменения в популярности терминов.
Какова основная польза этого патента для SEO-специалиста?
Практическая польза для современных SEO-стратегий минимальна из-за устаревания технологии ввода. Патент полезен для понимания того, как глубоко Google анализирует логи запросов и использует поведенческие данные для интерпретации намерений пользователей, даже в самых сложных интерфейсных сценариях.