
Google использует механизм для улучшения работы словарных и переводческих сервисов. Когда пользователь вводит частичный запрос на одном языке, система предсказывает полные варианты запроса на основе исторических данных поиска. Одновременно система получает переводы этих предсказаний на другой язык и показывает пользователю список автодополнения, где рядом с каждым вариантом сразу отображается его перевод или краткое определение.
Патент решает проблему неэффективности традиционных онлайн-словарей и переводчиков, которые обычно требуют ввода полного слова или фразы перед предоставлением перевода. Это улучшает пользовательский опыт, ускоряя процесс поиска нужного термина и предоставляя мгновенный контекст (перевод) еще на этапе ввода запроса.
Запатентована система предоставления поисковых подсказок (автодополнения), которая одновременно показывает и предсказанный полный запрос, и его перевод. Система получает частичный запрос, прогнозирует полные запросы на основе исторических данных поиска (previously submitted complete queries) на том же языке, получает переводы этих предсказаний на другой язык и возвращает оба набора данных клиенту для одновременного отображения.
Механизм работает следующим образом:
partial search query) в интерфейсе (например, сервиса перевода).Prediction Assistant) отправляет частичный запрос на сервер.Prediction Server для прогнозирования полных запросов. Это делается путем сопоставления частичного запроса с заранее подготовленной базой данных (Prediction Database), состоящей из Chunk Table (для частичных запросов) и Token Table (для полных запросов, их частотности и кратких переводов).Высокая. Описанный механизм является стандартом де-факто для современных сервисов перевода, таких как Google Translate. Автодополнение с мгновенным показом перевода значительно улучшает UX. Технологии прогнозирования запросов на основе исторических данных остаются фундаментальными для всех систем автодополнения Google.
Влияние на SEO – среднее (6/10). Патент не описывает алгоритмы ранжирования, но критически важен для понимания того, как работает Автодополнение (Autocomplete/Query Suggestions), особенно в международном контексте. Автодополнение формирует поисковое поведение пользователей. Понимание того, что подсказки основаны на реальных исторических запросах и их частотности, помогает SEO-специалистам определять приоритетные и популярные формулировки запросов в разных языках.
partial queries) и указатели (pointers) на соответствующие записи в Token Table. Используется для быстрого поиска предсказаний по мере ввода текста пользователем.Token Table и для предоставления полных результатов поиска.Token Table и для расчета их частотности (Frequency).Chunk Table.Chunk Table и Token Table, оптимизированная для быстрого предоставления подсказок.Token Table и отображаемый вместе с подсказкой. Также может включать синонимы или полные формы аббревиатур.Terms), их частотность (Frequency) и краткие определения/переводы (Short Definition). Генерируется на основе Historical Query Log и Dictionary Database.Claim 1 (Независимый пункт): Описывает основной метод на стороне сервера.
Claim 14 (Зависимый от 1): Детализирует механизм прогнозирования.
Прогнозирование включает сопоставление частичного запроса с записью в Chunk Table. Chunk Table содержит указатели на записи в Token Table. Token Table содержит записи с запросами и соответствующими переводами.
Claim 15 (Зависимый от 1): Описывает обработку аббревиатур.
Если предсказанный запрос является аббревиатурой или сокращенным термином, система получает его завершение (полную форму) или синоним. При этом и предсказанный запрос, и его полная форма/синоним находятся на одном языке.
Claim 18 (Независимый пункт): Описывает основной метод на стороне клиента.
Изобретение применяется в основном на этапе понимания запроса и использует данные, подготовленные на этапе индексирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных (офлайн) для создания Prediction Database. Система анализирует Historical Query Log и Dictionary Database. Применяются фильтры для удаления нежелательных терминов или терминов без перевода. Создаются Token Table (с терминами, частотностью и краткими переводами) и Chunk Table (с частичными запросами и указателями на Token Table).
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента в реальном времени (компонент Автодополнения). Когда пользователь вводит запрос в сервисе (например, Google Translate):
Prediction Assistant на клиенте фиксирует ввод и отправляет его на сервер.Prediction Server использует Mapping Function для быстрого поиска в Chunk Table и извлечения указателей на Token Table.Token Table извлекаются полные запросы и их переводы.Входные данные:
Prediction Database (Chunk Table, Token Table).Выходные данные:
Short Definitions) для этих запросов.Процесс А: Офлайн-генерация базы данных прогнозирования (Prediction Database Builder)
Historical Query Log и Dictionary Database.Token Table. Для каждого термина рассчитывается частотность (Frequency) на основе логов и извлекается краткое определение/перевод (Short Definition) из словаря.Token Table разбирается на составляющие частичные запросы (например, "bank" -> "b", "ba", "ban", "bank").Chunk Table Builder создает Chunk Table, где каждый частичный запрос связывается указателями с соответствующими полными терминами в Token Table.Chunk Table.Процесс Б: Обработка запроса в реальном времени (Client-Server Interaction)
Prediction Assistant отслеживает ввод пользователя в текстовом поле.Mapping Function используется для поиска соответствующей записи в Chunk Table.Chunk Table к записям в Token Table.Prediction Assistant получает данные и отображает их пользователю в виде списка подсказок с переводами.Патент фокусируется на использовании данных о поведении пользователей и словарных данных.
Historical Query Log является критически важным источником. Он определяет, какие запросы будут предложены и с какой вероятностью (частотностью).Dictionary Database используется для подтверждения существования термина и предоставления его перевода (Short Definition).Token Table. Рассчитывается как количество или нормализованное количество появлений полного запроса в Historical Query Log. Используется для ранжирования и выбора наиболее популярных подсказок.Predicted Complete Queries) генерируются не только на основе словаря, но и фильтруются и взвешиваются с использованием Historical Query Log. Это означает, что Google предлагает то, что люди реально ищут.Frequency), с которой запрос ранее вводился пользователями, является ключевым фактором для определения того, какие подсказки будут показаны и в каком порядке.Chunk Table и Token Table) позволяет системе быстро обрабатывать частичные запросы в реальном времени, несмотря на огромный объем данных. Большая часть работы выполняется офлайн.Хотя патент описывает инфраструктуру словарных сервисов, он дает важные инсайты о том, как Google использует данные о запросах (Autocomplete), что применимо к SEO-стратегии.
Historical Query Log, они отражают реальный спрос и частотность.Frequency).Historical Query Log.Патент подтверждает стратегию Google по использованию агрегированных данных о поведении пользователей для формирования поисковой выдачи и подсказок. Для SEO это означает, что соответствие реальному языку и спросу пользователей (отраженному в исторических логах) имеет первостепенное значение. В контексте международного SEO патент показывает, как Google связывает запросы между языками, что подчеркивает важность точной и последовательной терминологии при локализации контента.
Сценарий: Исследование запросов для интернет-магазина электроники, выходящего на рынок Кореи.
Dictionary Database. Популярность этого варианта в подсказках подтверждается Historical Query Log.На чем основаны предсказания в этом патенте?
Предсказания основаны на комбинации двух ключевых источников данных. Во-первых, это Historical Query Log – реальные запросы, которые пользователи вводили ранее. Это определяет популярность и частотность (Frequency) подсказки. Во-вторых, это Dictionary Database, которая подтверждает существование термина и предоставляет его краткий перевод или определение (Short Definition).
Описывает ли этот патент работу основного Google Search Autocomplete?
Патент описывает работу автодополнения конкретно в контексте словарных или переводческих сервисов (например, Google Translate), где ключевой особенностью является одновременный показ перевода подсказки. Однако базовые механизмы – использование исторических логов запросов, расчет частотности и применение эффективных структур данных (Chunk Table, Token Table) для быстрого поиска подсказок – являются общими и для стандартного Google Search Autocomplete.
Как система определяет, в каком порядке показывать подсказки?
Патент предлагает несколько методов упорядочивания. Основными являются упорядочивание по частотности (Frequency), то есть наиболее популярные исторические запросы показываются выше. Также упоминается лексикографический (алфавитный) порядок. Дополнительно может использоваться персонализация, основанная на предыдущем поведении пользователя.
Что такое Chunk Table и Token Table?
Это две взаимосвязанные структуры данных для быстрого поиска подсказок. Token Table хранит полные запросы, их частотность и переводы. Chunk Table хранит все возможные частичные запросы (фрагменты) и содержит указатели на соответствующие полные запросы в Token Table. Это позволяет системе мгновенно находить все релевантные полные запросы для любого введенного фрагмента.
Как система обрабатывает аббревиатуры?
Патент предусматривает специальную обработку аббревиатур и сокращенных терминов. Вместо перевода или в дополнение к нему система может показать полную форму (completion) или синоним аббревиатуры на том же языке. Например, для ввода "USA" система может показать в подсказке "United States of America".
Как система определяет язык ввода и язык перевода?
Языковая пара может быть явно выбрана пользователем (например, через выпадающее меню). Однако патент также описывает возможность автоматического прогнозирования языковой пары. Это может быть сделано на основе анализа символов Юникода в частичном запросе, IP-адреса клиента или статистики по ранее отправленным запросам.
Может ли этот механизм помочь в международном SEO?
Да, он очень полезен для исследования ключевых слов в международном SEO. Используя Google Translate с этой функцией, можно быстро увидеть, какие формулировки наиболее популярны (основаны на исторических данных) на целевом языке и как Google интерпретирует (переводит) ключевые термины вашей ниши. Это помогает в выборе правильных терминов для локализации.
Происходит ли генерация подсказок в реальном времени?
Сама генерация базы данных подсказок (Prediction Database) происходит офлайн путем анализа логов и словарей. Однако процесс поиска релевантных подсказок по частичному вводу пользователя происходит в реальном времени. Система оптимизирована так, чтобы запрос и ответ часто укладывались в одну транзакцию между клиентом и сервером.
Удаляет ли Google какие-либо термины из подсказок?
Да, патент явно упоминает процесс фильтрации. На этапе создания Token Table система удаляет запросы, которых нет в Dictionary Database. Также предусмотрено удаление предопределенного набора терминов, например, слов, которые могут считаться нежелательными (objectionable).
Что происходит, если пользователь вводит текст в неправильной раскладке?
Патент описывает механизм для обработки таких ситуаций. Chunk Table Builder может заранее генерировать романизированные версии частичных запросов (например, для корейского языка). Если пользователь вводит текст, соответствующий нажатиям клавиш на другом языке, но в английской раскладке, система все равно сможет найти соответствующие подсказки, используя эти романизированные версии.

Персонализация
Семантика и интент

Семантика и интент

Персонализация
Семантика и интент


Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Семантика и интент
Ссылки
Knowledge Graph

Поведенческие сигналы
Ссылки
SERP

Семантика и интент
EEAT и качество

Персонализация
SERP
Ссылки

Персонализация
EEAT и качество
Поведенческие сигналы

EEAT и качество
Поведенческие сигналы
SERP

Мультимедиа
EEAT и качество
Семантика и интент

Поведенческие сигналы
SERP
