Как Google в Autocomplete динамически выбирает между показом общих категорий и конкретных подсказок в зависимости от «завершенности запроса»

Google анализирует «меру завершенности запроса» (Measure of Query Completeness) по мере ввода текста пользователем. Если намерение неясно и существует много вариантов продолжения (низкая завершенность, высокая энтропия), система предлагает общие категории (например, «Регионы», «Бизнесы»). Если намерение становится ясным (высокая завершенность, низкая энтропия), система переключается на конкретные подсказки или сущности.

Описание

Какую задачу решает

Патент решает проблему предоставления полезных поисковых подсказок (Autocomplete/Search Suggest) в ситуациях, когда введенная пользователем строка поиска (search string) является короткой или неоднозначной. Если существует слишком много равновероятных вариантов завершения запроса, показ стандартного набора самых популярных конкретных подсказок может быть неэффективным, так как вероятность выбора одного из них мала. Изобретение улучшает пользовательский опыт, адаптируя тип подсказок к уровню определенности намерения пользователя.

Что запатентовано

Запатентована система динамического выбора типа поисковых подсказок. Система рассчитывает «меру завершенности запроса» (Measure of Query Completeness) для введенной строки на основе анализа вероятностей возможных продолжений, используя исторические данные. На основе этой метрики система принимает решение: показывать «общие варианты запросов» (General Query Suggestions), такие как категории, или «конкретные варианты запросов» (Specific Query Suggestions), такие как названия сущностей или полные запросы.

Как это работает

Ключевым механизмом является расчет Measure of Query Completeness. Система анализирует все возможные завершения введенной строки (кандидаты) и их вероятности, основываясь на исторических данных (Query Log).

Оценка вероятностей: Для каждого кандидата рассчитывается вероятность того, что он станет итоговым запросом.
Расчет завершенности: Вычисляется агрегированная метрика. Это может быть сумма вероятностей ТОП-N кандидатов или расчет энтропии (entropy) распределения. Низкая энтропия или высокая суммарная вероятность ТОП-N указывают на высокую завершенность (ясное намерение).
Принятие решения: Если завершенность выше порога, показываются Specific Query Suggestions. Если ниже порога (высокая неопределенность), система определяет категории, к которым относятся топовые кандидаты, и показывает их как General Query Suggestions.

Актуальность для SEO

Высокая. Функционал автозаполнения (Autocomplete) является критически важной частью интерфейса современных поисковых систем. Описанный механизм адаптации подсказок к уровню неопределенности пользователя напрямую влияет на эффективность формирования запроса и актуален для улучшения пользовательского опыта, особенно в мобильном и локальном поиске (примеры в патенте основаны на приложении карт).

Важность для SEO

Влияние на SEO — умеренное (6/10). Патент не описывает алгоритмы ранжирования, но критически важен для понимания того, как формируются поисковые подсказки (Autocomplete Optimization). Это влияет на этап формирования запроса (Query Formulation) — как пользователи обнаруживают сущности (включая бренды и локации) и какие именно запросы они в итоге отправляют в поисковую систему.

Детальный разбор

Термины и определения

Measure of Query Completeness (Мера завершенности запроса): Ключевая метрика патента. Отражает степень уверенности системы в том, какой именно запрос намеревается ввести пользователь. Рассчитывается на основе распределения вероятностей кандидатов.
Specific Query Suggestions (Конкретные варианты запросов): Подсказки, которые предоставляются, когда мера завершенности высокая. Это конкретные сущности, локации или полные формулировки запросов (например, «New York, NY»).
General Query Suggestions (Общие варианты запросов): Подсказки, которые предоставляются, когда мера завершенности низкая. Обычно это категории (например, «Страны», «Регионы», «Бизнесы»), к которым относятся потенциальные конкретные подсказки.
Candidate Query Suggestions (Кандидаты в варианты запросов): Набор конкретных запросов, которые являются потенциальным завершением введенной пользователем строки поиска.
Query Log (Журнал запросов): База данных исторических запросов пользователей. Используется для расчета вероятностей различных завершений запроса на основе частоты их использования в прошлом.
Entropy (Энтропия): Метрика для измерения неопределенности. В контексте патента, энтропия распределения вероятностей кандидатов используется для расчета меры завершенности. Высокая энтропия означает высокую неопределенность (низкую завершенность).
Threshold Measure of Query Completeness (Пороговое значение меры завершенности): Значение, с которым сравнивается рассчитанная мера завершенности для принятия решения о типе показываемых подсказок.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления подсказок.

Система получает строку поиска (search string).
Выбирается набор кандидатов (candidate query suggestions).
Для каждого кандидата рассчитывается вероятность на основе частоты его использования в Query Log (сравнивается частота кандидата с суммарной частотой всех кандидатов).
Определяется Measure of Query Completeness на основе агрегации этих вероятностей. Конкретно указано: определение вероятности получения N наиболее вероятных подсказок (N > 0).
Мера завершенности сравнивается с порогом.
Если мера ВЫШЕ порога: предоставляются Specific Query Suggestions.
Если мера НИЖЕ порога: предоставляются General Query Suggestions.

Ядром изобретения является использование агрегированной вероятности ТОП-N кандидатов как меры завершенности для динамического переключения между общими и конкретными подсказками.

Claim 4 (Зависимый от 1): Уточняет сравнение.

Сравнение меры завершенности с порогом включает сравнение вероятности того, что пользователь выберет одну из N наиболее вероятных подсказок, с пороговой вероятностью.

Claim 5 (Зависимый от 1): Описывает альтернативный метод расчета меры завершенности (Энтропия).

Для каждого кандидата вычисляется произведение его вероятности (P) на логарифм этой вероятности (log(P)).
Эти произведения суммируются для всех кандидатов.

Эта сумма (или число, основанное на ней) представляет собой энтропию распределения и используется как мера завершенности.

Claim 8 и 9 (Зависимые от 1): Детализируют механизм предоставления общих подсказок.

Specific Query Suggestions хранятся в репозитории (query suggestion repository), который также содержит информацию о соответствии каждой конкретной подсказки определенной общей категории (general category). У каждой категории есть связанная с ней General Query Suggestion (например, текстовый лейбл).

Процесс предоставления General Query Suggestions включает:

Определение набора Specific Query Suggestions (например, ТОП-N).
Определение общих категорий, связанных с этими конкретными подсказками.
Предоставление General Query Suggestions, соответствующих этим категориям.

Где и как применяется

Изобретение применяется на этапе взаимодействия пользователя с поисковой строкой, до отправки финального запроса.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента, конкретно в подсистеме генерации подсказок (Autocomplete/Suggest) и формирования запроса (Query Formulation).

Анализ в реальном времени: Система анализирует search string по мере ввода символов.
Расчет метрик: Query Completeness Engine рассчитывает Measure of Query Completeness. Для этого используются данные из Query Log или предварительно рассчитанные вероятности (Query Probabilities).
Выбор типа подсказок: Query Suggest Engine использует результат расчета для выбора между общими и конкретными подсказками из Query Repository.

Входные данные:

Введенная пользователем строка поиска (search string).
Исторические данные о частоте запросов (Query Log).
Репозиторий запросов с данными о соответствии конкретных сущностей и общих категорий.

Выходные данные:

Список Specific Query Suggestions ИЛИ список General Query Suggestions для отображения в интерфейсе автозаполнения.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на короткие запросы (Head Terms) и неоднозначные запросы, где намерение пользователя неясно. Для длинных и специфичных запросов мера завершенности почти всегда будет высокой.
Конкретные типы контента и ниши: Хотя патент акцентирует внимание на картографических приложениях (локальный поиск), где сущности (локации, бизнесы) четко категоризированы, механизм применим к любым поисковым системам, включая интернет-поиск, поиск по базам данных и т.д. Влияние заметно в нишах с четкой иерархией (например, E-commerce).
Обнаружение сущностей: Влияет на то, как быстро пользователи находят конкретные бренды или сущности. При низкой завершенности система может сначала направить пользователя через выбор категории.

Когда применяется

Временные рамки: В реальном времени, при вводе каждого символа в строку поиска (до отправки запроса).
Триггеры активации: Механизм активируется при каждом изменении Search String. Активация показа General Query Suggestions происходит, когда рассчитанная Measure of Query Completeness падает ниже установленного порога (или энтропия поднимается выше порога).
Условия работы: Алгоритм работает, когда необходимо предоставить пользователю варианты автозаполнения.

Пошаговый алгоритм

Процесс обработки введенной строки поиска

Получение данных: Система получает строку поиска (search string) от пользовательского устройства.
Выбор кандидатов: Система идентифицирует набор Candidate Query Suggestions (например, все сохраненные запросы из Query Log, которые начинаются с введенной строки).
Расчет вероятностей: Для каждого кандидата система определяет вероятность того, что он будет отправлен как финальный запрос. Это делается путем анализа Query Log: $P(Candidate) = \frac{Count(Candidate)}{Count(All Candidates)}$
Расчет завершенности: Система рассчитывает Measure of Query Completeness.
Вариант А (Вероятность ТОП-N): Суммируются вероятности N наиболее вероятных кандидатов.
Вариант Б (Энтропия): Рассчитывается сумма произведений $P \cdot log(P)$ для всех кандидатов.
Сравнение с порогом: Рассчитанная мера завершенности сравнивается с пороговым значением.
Предоставление подсказок:
- Если завершенность высокая (выше порога или низкая энтропия): Система предоставляет Specific Query Suggestions (например, ТОП-N наиболее вероятных кандидатов).
- Если завершенность низкая (ниже порога или высокая энтропия): Система определяет Specific Query Suggestions, затем находит связанные с ними общие категории в репозитории и предоставляет соответствующие General Query Suggestions.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании статистических данных о поведении пользователей и структурированных данных о сущностях.

Поведенческие факторы: Критически важные данные. Query Log используется для определения частоты и популярности всех возможных завершений запроса. Эти данные лежат в основе расчета вероятностей.
Структурные данные (Данные о сущностях/Категоризация): Система использует данные из Query Repository, которые связывают конкретные подсказки (сущности, локации) с их общими категориями. Это необходимо для генерации General Query Suggestions.

Какие метрики используются и как они считаются

Probability of Candidate Query Suggestion (Вероятность кандидата): Рассчитывается как отношение частоты использования данного кандидата к суммарной частоте использования всех кандидатов для данной строки поиска (на основе Query Log).
Measure of Query Completeness (Мера завершенности запроса): Агрегированная метрика, рассчитываемая двумя основными способами:
1. Сумма вероятностей ТОП-N: Вероятностная масса, сосредоточенная в N наиболее популярных кандидатах.
2. Entropy (Энтропия): Мера неопределенности распределения вероятностей. Рассчитывается через сумму $P \cdot log(P)$ .

Выводы

Адаптация к неопределенности: Google имеет сложный механизм для динамической адаптации поисковых подсказок, который не просто показывает самые популярные запросы, а оценивает степень уверенности в намерении пользователя (Measure of Query Completeness).
Математическое обоснование уверенности: Уверенность системы имеет четкое математическое обоснование, основанное на анализе Query Log. Патент выделяет энтропию и сумму вероятностей Топ-N кандидатов как ключевые методы расчета. Низкая энтропия = высокая уверенность.
Приоритет категорий при двусмысленности: Если введенная строка неоднозначна (низкая завершенность, высокая энтропия), Google предпочитает не угадывать конкретную сущность, а предлагает пользователю выбрать категорию (General Query Suggestions) для уточнения намерения.
Зависимость от исторических данных (Search Volume): Вероятность появления конкретной подсказки напрямую зависит от того, как часто пользователи выбирали этот запрос в прошлом. Это подчеркивает важность реального объема поискового спроса для Autocomplete Optimization.
Важность категоризации сущностей: Для работы механизма необходимо, чтобы конкретные подсказки были связаны с общими категориями в базе данных (например, Knowledge Graph). Это подчеркивает важность Entity-based SEO и правильной классификации.

Практика

Best practices (это мы делаем)

Обеспечение корректной категоризации сущностей: Для брендов, продуктов и особенно локальных бизнесов критически важно быть правильно категоризированными в базах данных Google (Knowledge Graph, Google Business Profile) и на собственном сайте (Schema.org, структура сайта). Это гарантирует, что ваша сущность будет связана с правильными General Query Suggestions, увеличивая шансы на обнаружение при неоднозначных запросах.
Построение популярности бренда и запросов (Query Popularity): Поскольку вероятности основаны на Query Log, увеличение реального объема поиска по брендовым или специфическим запросам (через маркетинг, PR) повышает вероятность того, что они станут доминирующими кандидатами. Это увеличивает Measure of Query Completeness и шансы на показ в качестве Specific Query Suggestion.
Анализ Autocomplete для оценки интента: Изучайте подсказки по коротким (Head Terms) запросам в вашей нише. Если Google показывает общие категории (General Suggestions), это указывает на высокую неопределенность (низкую завершенность) и необходимость оптимизации под эти категории. Если доминируют конкретные запросы, нужно конкурировать по популярности.

Worst practices (это делать не надо)

Манипуляции с Autocomplete (Накрутка подсказок): Попытки искусственно накрутить частотность запросов, чтобы повлиять на Query Log. Это рискованная тактика. Кроме того, попытки продвинуть конкретную подсказку для очень неоднозначного запроса могут быть неэффективны, так как при высокой энтропии система может переключиться на показ категорий.
Игнорирование структуры категорий: Создание сайта без четкой иерархии и категоризации усложняет Google задачу идентификации релевантных General Query Suggestions, которые могли бы направить пользователя к вашему контенту.

Стратегическое значение

Патент подтверждает, что Google активно управляет процессом формирования запроса и использует категоризацию как инструмент для разрешения неопределенности. Стратегическое значение для SEO заключается в понимании того, что видимость в подсказках напрямую коррелирует с реальной популярностью и однозначностью запроса. Необходимо смещать акцент с попыток доминировать в подсказках по отдельным запросам на необходимость быть правильно классифицированным и авторитетным в рамках более широких категорий.

Практические примеры

Сценарий 1: Высокая неопределенность (Низкая завершенность)

Ввод пользователя: «New» (в приложении Карт).
Анализ системы: В Query Log много популярных вариантов: «New York», «New Zealand», «New Balance». Распределение вероятностей широкое, энтропия высокая. Measure of Query Completeness низкая.
Действие системы: Предоставить General Query Suggestions.
Результат: Пользователь видит категории: «Страны», «Регионы», «Города», «Бизнесы».

Сценарий 2: Низкая неопределенность (Высокая завершенность)

Ввод пользователя: «New Y» (в приложении Карт).
Анализ системы: Подавляющее большинство пользователей ищут варианты, связанные с Нью-Йорком. Вероятность этих кандидатов высока, энтропия снизилась. Measure of Query Completeness высокая.
Действие системы: Предоставить Specific Query Suggestions.
Результат: Пользователь видит: «New York, NY», «New York Plaza, NY», «New York Penn Station, NY».

Вопросы и ответы

Что такое «Мера завершенности запроса» (Measure of Query Completeness) простыми словами?

Это показатель уверенности Google в том, что именно пользователь собирается искать дальше. Если пользователь ввел «Нью-Й», система очень уверена, что он ищет «Нью-Йорк» — завершенность высокая. Если он ввел «Как с», вариантов тысячи (как сделать, как скачать) — завершенность низкая. Эта мера определяет, пора ли показывать конкретные предсказания или лучше предложить уточняющие категории.

Что такое Энтропия (Entropy) в контексте этого патента и как она влияет на подсказки?

Энтропия измеряет неопределенность. Если для введенной строки существует много равновероятных завершений (например, для «new»), энтропия высока. Если есть один доминирующий вариант (например, для «amazo»), энтропия низкая. Высокая энтропия (низкая завершенность) заставляет систему показывать общие категории (General Suggestions), а низкая энтропия — конкретные подсказки (Specific Suggestions).

Как рассчитывается вероятность подсказки?

Вероятность рассчитывается на основе исторических данных из Query Log. Если из 1000 человек, начавших вводить «велосипед к», 800 человек в итоге отправили запрос «велосипед купить», то вероятность этой подсказки составляет 80% (800/1000) для данной строки ввода. Система использует эти данные для всех возможных продолжений.

Влияет ли этот патент на ранжирование сайтов в поиске?

Нет, этот патент не описывает алгоритмы ранжирования. Он влияет исключительно на работу поисковых подсказок (Google Autocomplete). Однако он косвенно влияет на трафик, поскольку определяет, какие запросы будут предложены пользователю и как будет сформирован его финальный поисковый запрос (Query Formulation).

Что такое General Query Suggestions и откуда они берутся?

Это общие варианты запросов, часто представляющие собой названия категорий (например, «Смартфоны», «Регионы»). Они берутся из репозитория (например, Knowledge Graph), где конкретные сущности или запросы заранее связаны с этими категориями. Когда система определяет низкую завершенность запроса, она показывает эти категории, чтобы помочь пользователю сузить область поиска.

Как SEO-специалист может использовать знание об этом патенте на практике?

Главное применение — это анализ интента, оптимизация категоризации и работа над популярностью запросов. Наблюдая, когда Google переключается с общих категорий на конкретные подсказки, вы понимаете уровень неоднозначности в нише. Это также подчеркивает важность четкой структуры сайта и использования микроразметки для правильной классификации вашего контента.

Как можно повлиять на то, чтобы мой бренд показывался как Specific Suggestion, а не скрывался за категорией?

Ключевым фактором является популярность (Search Volume). Метрики рассчитываются на основе Query Log. Чем чаще пользователи ищут ваш бренд (через маркетинг, рекламу, PR), тем выше вероятность того, что он станет доминирующим кандидатом для определенной строки ввода. Это повысит Measure of Query Completeness и увеличит шансы на показ в качестве Specific Suggestion.

Использует ли Google только энтропию для определения завершенности запроса?

Нет, патент описывает два метода. Первый — это расчет энтропии распределения. Второй — это агрегация вероятностей N наиболее популярных подсказок. Если Топ-5 подсказок покрывают, например, 90% всех вероятных продолжений, система может считать запрос достаточно завершенным, не прибегая к расчету энтропии всего распределения.

Какое значение этот патент имеет для локального SEO?

Очень высокое. Примеры в патенте основаны на картографическом приложении. В локальном поиске часто встречаются неоднозначные запросы. Этот механизм помогает пользователям уточнить поиск через категории (например, «Рестораны», «Магазины»), что подчеркивает важность правильной настройки категорий в Google Business Profile и общей категоризации бизнеса.

Применим ли этот патент только к Google Картам?

Хотя примеры в патенте взяты из интерфейса картографического приложения (mapping application), в тексте указано, что технология является общей. Она применима к любому поисковому интерфейсу, который предоставляет подсказки по мере ввода, включая основной поиск Google, поиск по товарам, книгам и так далее.