Как Google предлагает поисковые запросы до того, как пользователь начал печатать (Zero-Query Suggestions), используя контекстные кластеры

Патент описывает, как Google использует контекст пользователя (местоположение, время, интересы), чтобы предсказать его информационные потребности и предложить «Контекстные кластеры» запросов еще до ввода текста. Система анализирует исторические данные, группирует схожие запросы, заданные в схожих обстоятельствах, и предлагает наиболее вероятные варианты для текущего контекста.

Описание

Какую задачу решает

Патент решает задачу повышения удобства и скорости поиска, особенно на мобильных устройствах, путем устранения необходимости ручного ввода текста. Система стремится предсказать информационную потребность пользователя на основе его текущего контекста и предложить релевантные варианты запросов до того, как он начнет печатать (Zero-Input Queries или Zero-Character Queries).

Что запатентовано

Запатентована система для генерации и предоставления предиктивных поисковых подсказок, основанных на контексте. Система анализирует исторические данные о запросах (Log Data) и обстоятельствах их ввода (Input Context), таких как местоположение, время и интересы пользователя. Запросы группируются в «Контекстные кластеры» (Context Clusters). Когда пользователь инициирует поиск, система оценивает его текущий контекст и предлагает наиболее вероятные кластеры или запросы из них.

Как это работает

Механизм работает в двух режимах: офлайн-обработка и онлайн-предоставление.

Офлайн: Система анализирует логи запросов. Запросы группируются в Context Clusters на основе двух факторов: схожести обстоятельств ввода (одинаковое местоположение, время) и схожести контента/темы запроса. Для каждого кластера рассчитывается вероятность (Context Cluster Probability).
Онлайн: Когда пользователь совершает User Event (например, открывает страницу поиска), система получает его текущий контекст. Она сравнивает этот контекст с данными кластеров и выбирает те, чья вероятность превышает порог. Пользователю предлагаются эти кластеры. При выборе кластера пользователю предлагаются конкретные запросы из него.

Актуальность для SEO

Высокая. Предиктивный поиск является ключевым элементом стратегии Google, особенно в мобильных интерфейсах (например, подсказки в Google App до начала ввода). Учитывая, что изобретателем является Jakob Uszkoreit (один из ключевых разработчиков NLP и AI в Google, включая архитектуру Transformer), этот патент описывает фундаментальные механизмы предсказания намерений пользователя на основе контекста.

Важность для SEO

Влияние на SEO значительно (8/10). Этот патент описывает механизм, который генерирует трафик без явного ввода ключевых слов пользователем. Он подчеркивает критическую важность контекстуальных сигналов: локализации (Local SEO), временной релевантности (Temporal Relevance) и персонализации (User Interests). Для попадания в эти предиктивные подсказки контент должен максимально соответствовать ожидаемому интенту в конкретной ситуации, месте и времени.

Детальный разбор

Термины и определения

Context Cluster (Контекстный кластер): Группа из одного или нескольких исторических запросов, объединенных на основе схожести их Input Context (обстоятельств ввода) и схожести контента (темы или ключевых слов) самих запросов.
Context Cluster Probability (Вероятность контекстного кластера): Агрегированная вероятность того, что пользователь выберет хотя бы один запрос из данного кластера в определенном контексте. Рассчитывается путем суммирования вероятностей отдельных запросов, принадлежащих кластеру.
Input Context (Контекст ввода): Обстоятельства, окружающие ввод запроса, которые не зависят от содержания самого запроса. Включают местоположение устройства, дату и время, а также предпочтения и интересы пользователя (явные или неявные).
Log Data (Данные журналов): Хранилище исторических поисковых запросов и связанных с ними Input Contexts.
User Event (Пользовательское событие): Действие пользователя, указывающее на начало процесса ввода поискового запроса (например, открытие веб-страницы поисковой системы). Это триггер для активации системы подсказок до ввода текста.

Ключевые утверждения (Анализ Claims)

Примечание: Claims в данном документе (US20240330277A1, который является продолжением (continuation) более ранних патентов) сформулированы с точки зрения действий, выполняемых пользовательским устройством (клиентская сторона).

Claim 1 (Независимый пункт): Описывает основной процесс взаимодействия устройства с поисковой системой для получения предиктивных подсказок.

Пользовательское устройство отправляет поисковой системе данные, указывающие на: (а) доступ пользователя к поисковому ресурсу (User Event), (б) местоположение устройства, (в) предпочтения пользователя (user preferences).
Устройство получает от поисковой системы набор предлагаемых запросов (plurality of query inputs). Эти запросы определяются системой на основе отправленных местоположения и предпочтений.
Устройство отображает эти предлагаемые запросы. Ключевой момент: отображение происходит до того, как пользователь ввел какой-либо текст запроса (prior to the user providing a query input).

Claim 2 (Зависимый): Детализирует иерархический процесс (соответствует выбору кластера, а затем конкретного запроса).

Устройство отправляет данные о выборе пользователем одного из предложенных на Шаге 1 запросов (который может представлять собой Context Cluster).
В ответ устройство получает набор дополнительных предлагаемых запросов (конкретные запросы внутри кластера).
Устройство отображает эти дополнительные запросы.

Claims 5 и 6 (Зависимые): Определяют источники данных о предпочтениях пользователя.

Предпочтения могут основываться на темах интересов, указанных в профиле пользователя (явные данные) (Claim 5).
Предпочтения могут быть выведены из контента, потребленного пользователем (неявные данные) (Claim 6).

Claims 7 и 8 (Зависимые): Указывают, что определение предлагаемых запросов поисковой системой также основывается на дате доступа к поисковому ресурсу.

Где и как применяется

Изобретение затрагивает этапы индексирования данных о пользователях и понимания запросов для формирования модели предсказаний.

INDEXING – Индексирование и извлечение признаков
На этом этапе система собирает и обрабатывает данные, необходимые для работы механизма. Это включает логирование поисковых запросов (Log Data), фиксацию контекста (местоположение, время) и определение интересов и предпочтений пользователей.

QUNDERSTANDING – Понимание Запросов (Офлайн-процесс)
Основная логика формирования модели происходит здесь, в офлайн-режиме. Context Cluster System анализирует Log Data, определяет схожесть контекстов и контента запросов, формирует Context Clusters и рассчитывает Context Cluster Probabilities. Результаты сохраняются в Context Cluster Data.

QUNDERSTANDING / RANKING (Онлайн-процесс)
Применение в реальном времени. Когда происходит User Event, система получает текущий контекст пользователя. Context Cluster Processor использует этот контекст для запроса к Context Cluster Data, определяет релевантные кластеры и ранжирует их на основе вероятности для данного контекста. Это процесс ранжирования потенциальных запросов (интентов), а не документов.

Входные данные (Офлайн):

Журналы запросов (Log Data).
Input Context для каждого запроса (местоположение, время, данные о пользователе).

Входные данные (Онлайн):

Индикация User Event.
Текущий контекст пользователя (местоположение, время, предпочтения/интересы, история запросов).

Выходные данные (Онлайн):

Набор предлагаемых Context Clusters для отображения пользователю.
При выборе кластера — набор конкретных запросов из этого кластера.

На что влияет

Конкретные ниши и тематики (Local SEO): Критическое влияние на локальный поиск. Система активно использует местоположение для предсказания потребностей, связанных с близлежащими объектами (рестораны, магазины, кинотеатры).
Специфические запросы (Информационные/Транзакционные): Влияет на запросы, которые сильно зависят от времени и места (например, «расписание сеансов», «меню ресторана», «часы работы магазина»).
Пользовательские устройства: Наибольшее влияние на мобильные устройства, где контекст (особенно местоположение) легко доступен, а ввод текста затруднен.

Когда применяется

Триггеры активации: Алгоритм активируется при наступлении User Event, который указывает на намерение пользователя начать поиск (например, открытие приложения Google, активация строки поиска).
Условие применения: Система применяется до того, как пользователь ввел какие-либо символы в строку поиска (Zero-Input).
Пороговые значения: Кластеры предлагаются, только если их Context Cluster Probability для текущего контекста пользователя превышает определенный порог. Также может быть ограничено максимальное количество отображаемых предложений (например, топ-4).

Пошаговый алгоритм

Процесс А: Офлайн-генерация контекстных кластеров

Сбор данных: Доступ к Log Data, содержащим исторические запросы и их Input Context (местоположение, время, интересы пользователя).
Анализ схожести контекста: Определение уровня схожести Input Context между различными запросами (например, запросы из одного и того же места в одно и то же время). Используются пороги схожести.
Анализ схожести контента: Для запросов со схожим контекстом определяется уровень схожести их содержания (темы, ключевые слова). Используются пороги схожести контента.
Группировка: Запросы, удовлетворяющие порогам схожести как по контексту, так и по контенту, группируются в Context Clusters.
Расчет вероятностей: Для каждого кластера рассчитывается Context Cluster Probability путем агрегации вероятностей ввода отдельных запросов, входящих в кластер, для данного контекста.
Сохранение: Данные о кластерах и их вероятностях сохраняются в Context Cluster Data.

Процесс Б: Онлайн-предоставление подсказок

Обнаружение триггера: Получение индикации о User Event от пользовательского устройства.
Получение контекста: Получение текущего контекста устройства (местоположение, время, предпочтения пользователя).
Сопоставление и оценка: Система сопоставляет текущий контекст с данными в Context Cluster Data и определяет вероятности кластеров для этого контекста. Могут использоваться меры схожести и весовые коэффициенты. История запросов пользователя может использоваться для бустинга вероятностей.
Выбор кластеров: Выбираются Context Clusters, чья вероятность превышает установленный порог. Если таких кластеров много, выбирается Топ-N.
Предоставление подсказок (Уровень 1): Данные, вызывающие отображение выбранных кластеров (например, «Фильмы», «Рестораны»), отправляются на устройство.
Обработка выбора кластера: Если пользователь выбирает кластер, система получает индикацию выбора.
Предоставление подсказок (Уровень 2): Система выбирает конкретные запросы из выбранного кластера (на основе их индивидуальных вероятностей) и отправляет их на устройство для отображения (например, «Расписание сеансов», «Трейлеры фильмов»).

Какие данные и как использует

Данные на входе

Система полагается исключительно на контекстуальные и поведенческие данные, а не на контент веб-страниц.

Географические факторы: Местоположение пользовательского устройства в момент ввода запроса (исторически) и в момент User Event (в реальном времени). Это ключевой элемент Input Context.
Временные факторы: Дата и время ввода запроса. Система может группировать запросы по часовым слотам и дням недели.
Пользовательские и Поведенческие факторы:
- Предпочтения и интересы пользователя (user preferences): Могут быть указаны явно (в профиле) или выведены неявно (на основе потребленного контента).
- История запросов пользователя: Используется для персонализации и бустинга вероятностей (например, если пользователь часто ищет расписание фильмов по пятницам).
Контентные факторы (Запросов): Текст исторических запросов используется для определения тематической схожести при формировании кластеров.

Какие метрики используются и как они считаются

Context Similarity (Схожесть контекста): Мера, определяющая, насколько похожи обстоятельства ввода двух запросов (местоположение, время, интересы пользователей).
Content Similarity (Схожесть контента): Мера, определяющая тематическую или лексическую схожесть текстов двух запросов.
Probability of Entry (Вероятность ввода запроса): Вероятность того, что конкретный запрос будет введен в определенном контексте.
Context Cluster Probability (Вероятность контекстного кластера): Агрегированная метрика. Рассчитывается как сумма Probabilities of Entry всех запросов, входящих в кластер, для данного контекста.
Thresholds (Пороги): Используются на нескольких этапах: пороги схожести для формирования кластеров; пороговая вероятность для выбора кластеров, которые будут показаны пользователю.

Выводы

Контекст определяет предиктивный поиск: Патент демонстрирует, что для генерации подсказок до начала ввода (Zero-Input Queries) Google полагается исключительно на контекст: местоположение, время и персонализацию (интересы пользователя). Ключевые слова пользователя не требуются.
Кластеризация по контексту И теме: Для формирования релевантных подсказок недостаточно только схожести контекста. Система группирует запросы, которые были заданы в схожих обстоятельствах и которые относятся к одной теме (Content Similarity). Это предотвращает смешивание нерелевантных запросов, случайно заданных в одном месте.
Агрегация вероятностей повышает видимость нишевых запросов: Ключевое преимущество механизма Context Clusters в том, что он позволяет показывать запросы, чья индивидуальная вероятность низка. Если агрегированная вероятность кластера (темы) высока в данном контексте, то запросы внутри него получают шанс быть показанными.
Критичность Локального и Временного факторов: Местоположение и время являются первичными сигналами для этого механизма. Это подтверждает стратегическую важность оптимизации под локальные и своевременные интенты.
Персонализация как часть контекста: Интересы пользователя и его история поиска активно используются для определения и ранжирования предлагаемых кластеров, что делает выдачу подсказок высоко персонализированной.

Практика

Best practices (это мы делаем)

Усиление Локальной оптимизации (Local SEO): Местоположение является ключевым контекстным сигналом. Для бизнесов с физическими точками критически важно обеспечить полное и точное присутствие в локальных индексах (Google Business Profile) и создавать контент, отвечающий на запросы, которые пользователи могут задавать, находясь рядом (часы работы, меню, наличие товара, расписание).
Оптимизация под временные интенты (Temporal Relevance): Создавайте и обновляйте контент, который релевантен в определенное время суток, дни недели или сезоны. Если ваш бизнес зависит от событий или расписаний, эта информация должна быть актуальной и легко доступной, чтобы соответствовать временному контексту пользователя.
Фокус на точном соответствии интенту в кластере: Анализируйте, какие типы запросов могут формировать Context Clusters в вашей нише. Убедитесь, что ваш контент является лучшим ответом на эти конкретные запросы. Например, если система предлагает кластер «Рестораны», она затем предложит «Меню» или «Бронирование». Ваш сайт должен быть оптимизирован именно под эти интенты.
Построение тематического авторитета для персонализации: Поскольку интересы пользователя (User Preferences) являются частью контекста, важно развивать сайт как авторитетный ресурс по определенным темам. Это увеличивает вероятность того, что система свяжет интересы пользователя с вашим контентом и предложит соответствующие кластеры.

Worst practices (это делать не надо)

Игнорирование контекста: Фокусироваться только на общих высокочастотных ключевых словах без учета того, где и когда пользователи их ищут. Этот механизм продвигает контент, релевантный ситуации, а не только теме.
Пренебрежение локальными сигналами: Отсутствие локальной оптимизации для релевантного бизнеса фактически исключает его из участия в подсказках, основанных на местоположении.
Создание только «вечнозеленого» контента: Если ниша подразумевает временную зависимость (новости, события, расписания), отсутствие актуального контента снижает вероятность попадания в предиктивные подсказки, зависящие от времени.

Стратегическое значение

Патент подтверждает стратегический курс Google на развитие предиктивного и контекстно-зависимого поиска, минимизирующего усилия пользователя (Proactive Search). Для SEO это означает, что оптимизация должна выходить за рамки традиционного подбора ключевых слов и учитывать полный сценарий поведения пользователя: его местоположение, время и предполагаемые интересы. Понимание того, как пользователи ведут себя в конкретных ситуациях, становится ключом к получению трафика из Zero-Input Queries.

Практические примеры

Сценарий: Оптимизация для ресторана рядом с кинотеатром

Анализ контекста: Пользователи часто ищут, где поесть до или после сеанса. Контекст: Местоположение (рядом с кинотеатром), Время (вечер пятницы/выходные).
Предсказание системы: Пользователь открывает поиск. Система определяет контекст и предлагает Context Clusters: «Фильмы» и «Рестораны».
Выбор пользователя: Пользователь выбирает «Рестораны».
Конкретные подсказки: Система предлагает запросы из кластера: «Итальянская кухня рядом», «Быстрый ужин», «Меню [Название ресторана]».
Действия SEO для ресторана:
- Оптимизировать GBP с указанием релевантных категорий.
- Создать страницу на сайте «Ужин перед кинотеатром» или предлагать соответствующее быстрое меню.
- Убедиться, что актуальное меню легко индексируется и размечено.
Результат: Ресторан появляется в предиктивных подсказках и получает трафик от пользователей, которые даже не начинали вводить запрос.

Вопросы и ответы

Что такое «Input Context» и какие данные он включает?

Input Context — это обстоятельства, при которых был введен запрос, не зависящие от содержания самого запроса. Согласно патенту, он включает три основных компонента: местоположение пользовательского устройства, дату и время ввода запроса, а также предпочтения и интересы пользователя (User Preferences).

Как система определяет интересы пользователя для персонализации подсказок?

Патент указывает на два способа определения предпочтений и интересов. Во-первых, это явные данные (Explicit), когда пользователь указывает темы интересов в своем профиле. Во-вторых, это неявные данные (Implicit), которые выводятся из контента, потребляемого пользователем, и его истории поисковых запросов.

Чем этот механизм отличается от стандартных автодополнений (Autocomplete)?

Стандартные автодополнения активируются после того, как пользователь начал вводить символы, и пытаются завершить текущий запрос на основе введенного префикса. Описанный механизм (Zero-Input Queries) активируется до начала ввода и предлагает запросы или целые кластеры запросов, основываясь исключительно на текущем контексте пользователя (местоположение, время, интересы).

Как формируются «Context Clusters»?

Кластеры формируются в офлайн-режиме путем анализа исторических логов запросов. Система ищет запросы, которые удовлетворяют двум критериям: они имеют высокую степень схожести Input Context (были заданы в похожем месте и времени) и высокую степень схожести контента (относятся к одной теме или содержат похожие ключевые слова).

Почему система предлагает кластеры, а не сразу конкретные запросы?

Предложение кластеров (например, «Фильмы») позволяет избежать перегрузки интерфейса слишком большим количеством конкретных подсказок. Кроме того, это позволяет агрегировать вероятности. Несколько отдельных запросов могут иметь низкую вероятность, но их общая тема (кластер) может иметь высокую вероятность в данном контексте. Выбор кластера позволяет затем показать эти нишевые запросы.

Какое значение этот патент имеет для Local SEO?

Критическое. Местоположение является одним из основных компонентов Input Context. Система активно предсказывает потребности пользователя, связанные с его текущим местонахождением. Это означает, что оптимизация под локальные интенты и обеспечение видимости бизнеса в локальном контексте являются необходимыми условиями для получения трафика из этих предиктивных подсказок.

Влияет ли этот механизм на ранжирование в основном поиске?

Патент описывает систему ранжирования и выбора предлагаемых запросов, а не ранжирования документов в поисковой выдаче. Однако он влияет на то, какие запросы пользователи в итоге отправляют. Если система активно предлагает определенные формулировки запросов, это может косвенно влиять на общий объем трафика по этим запросам.

Как можно оптимизировать сайт, чтобы попасть в эти предиктивные подсказки?

Необходимо максимально соответствовать ожидаемому поведению пользователей в конкретных контекстах. Это включает оптимизацию под локальные интенты (если применимо), обеспечение актуальности информации для временных запросов (расписания, события) и развитие тематического авторитета, чтобы соответствовать интересам пользователей (персонализация).

Использует ли система иерархическую структуру кластеров?

Да, патент описывает возможность использования иерархической структуры. Например, кластер «Фильмы» может содержать подкластеры «Трейлеры фильмов» и «Расписание сеансов». Пользователь может перемещаться по этой иерархии, уточняя свой интент без ручного ввода текста.

Связан ли этот механизм с Google Discover?

Хотя и этот механизм, и Google Discover являются формами предиктивного поиска, они решают несколько разные задачи. Discover предлагает контент на основе интересов пользователя без явного намерения искать. Описанный механизм активируется, когда пользователь демонстрирует намерение искать (открывает строку поиска), и предлагает не контент, а запросы, основываясь на текущем местоположении, времени и интересах.