Как Google генерирует подсказки для следующего поиска прямо в браузере на основе контента просматриваемой страницы

Патент описывает систему, работающую на стороне клиента (в браузере), которая анализирует контент текущей веб-страницы. Система идентифицирует ключевые термины («триггеры запросов»), ранжирует их по значимости (учитывая форматирование, частоту и популярность) и предлагает пользователю готовые поисковые запросы для дальнейшего изучения темы.

Описание

Какую задачу решает

Патент решает проблему сложности формулирования пользователем последующих поисковых запросов при изучении контента на веб-странице. Пользователи часто хотят узнать больше по теме, но тратят время на ручной подбор и уточнение эффективных поисковых фраз. Изобретение автоматизирует этот процесс, предлагая релевантные подсказки, основанные непосредственно на содержании просматриваемого ресурса.

Что запатентовано

Запатентована система для генерации предложений поисковых запросов, которая работает полностью на стороне клиента (client device), например, в браузере, тулбаре или плагине. Система использует локальный словарь (Dictionary) для идентификации Query Triggers (популярные термины, сущности) в контенте страницы. Эти триггеры ранжируются локально на основе их заметности на странице (частота, форматирование) и предварительно рассчитанных оценок популярности, после чего пользователю показываются готовые поисковые подсказки.

Как это работает

Механизм работает следующим образом на стороне клиента:

Загрузка словаря: Клиентское устройство периодически загружает с сервера Dictionary, содержащий Query Triggers, правила и оценки.
Сканирование контента: Когда пользователь открывает веб-страницу (resource), система сканирует ее контент на наличие Query Triggers.
Ранжирование триггеров: Найденные триггеры ранжируются на клиенте. Учитываются локальные атрибуты (частота, контекст форматирования, длина) и глобальные оценки из словаря (популярность).
Генерация подсказок: Для топовых триггеров генерируются поисковые подсказки. Могут использоваться сами триггеры, их расширения (Expansion Terms) или шаблоны (Query Templates, например, «[триггер] новости»).
Отображение: Подсказки отображаются пользователю, например, в поисковой строке тулбара или внизу страницы.

Актуальность для SEO

Средняя. Основная концепция предложения связанных запросов на основе просматриваемого контента актуальна (например, функции «Touch to Search» на мобильных устройствах). Однако специфическая реализация, описанная в патенте (обработка на стороне клиента с загружаемым словарем, часто упоминаются тулбары/плагины), может отличаться от современных подходов Google, которые чаще полагаются на серверные вычисления и интеграцию в Chrome. Тем не менее, патент раскрывает факторы, которые Google считает важными для определения релевантных тем на странице.

Важность для SEO

Патент имеет минимальное прямое влияние на алгоритмы ранжирования основного поиска. Он не описывает, как Google ранжирует документы в выдаче. Однако его стратегическое значение заметно (4/10). Он описывает механизм влияния на поисковое поведение пользователя, исходя из контента, который он потребляет. Оптимизируя контент так, чтобы он содержал и выделял релевантные Query Triggers (популярные сущности и темы), SEO-специалисты могут влиять на последующие поисковые запросы пользователей.

Детальный разбор

Термины и определения

Client History Score (Оценка истории клиента): Метрика, рассчитываемая на стороне клиента на основе недавней истории браузера (immediate browsing history) и поисковых запросов. Используется для персонализации предложений.
Context (Контекст): Атрибут триггера запроса, определяемый форматом отображения на странице (например, жирный шрифт, курсив, подчеркивание, заголовок, размер шрифта).
Dictionary (Словарь): Локальная база данных на клиентском устройстве, загружаемая с сервера. Содержит Query Triggers, правила (Rules), оценки (Scores) и шаблоны.
Document Frequency Score / Page Frequency Score (Оценка частоты документа/страницы): Метрика из словаря, показывающая, насколько часто термин встречается в общем корпусе документов (индексе). Используется для оценки релевантности триггера.
Expansion Terms (Термины расширения): Синонимы или связанные запросы (например, на основе совместной встречаемости в сессиях – query co-occurrence), хранящиеся в словаре.
Popularity Score (Оценка популярности): Метрика из словаря, отражающая популярность триггера в качестве поискового запроса среди всех пользователей поисковой системы.
Query History Score (Оценка истории запросов): Метрика из словаря, отражающая частоту, с которой пользователи выбирают подсказку, сгенерированную на основе данного триггера (selection rate так называемых assisted queries).
Query Template (Шаблон запроса): Предопределенная структура для генерации подсказок, хранящаяся в словаре. Состоит из переменной (для триггера или расширения) и строки (например, шаблон «%trigger% news»).
Query Trigger (Триггер запроса): Один или несколько терминов из словаря, идентификация которых в контенте запускает процесс генерации подсказок. Обычно это популярные запросы (Popular Queries) или именованные сущности (Named Entities).
Rank Score (Оценка ранжирования): Числовое значение, рассчитываемое на клиенте для каждого найденного триггера на основе его атрибутов (Query Trigger Attributes). Определяет, какие подсказки будут показаны.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс генерации подсказок, выполняемый полностью на стороне клиента.

Клиентское устройство получает Dictionary, определяющий Query Triggers.
Система идентифицирует Query Triggers в ресурсе (веб-странице), отображаемом на клиенте. Ресурс является non-query resource (т.е. не поисковым запросом). Это включает сканирование ресурса на наличие триггеров из словаря.
Для каждого найденного триггера на клиенте рассчитывается Rank Score на основе атрибутов триггера.
Триггеры ранжируются на клиенте по этим оценкам.
На клиенте генерируются предложения поисковых запросов на основе этих триггеров.
Предложения представляются пользователю в соответствии с рангом триггеров.

Ключевой аспект изобретения — все этапы анализа контента и генерации подсказок происходят локально на устройстве пользователя.

Claim 2 (Зависимый): Уточняет, что Query Triggers включают Expansion Terms. Генерация подсказок может использовать эти термины расширения вместо самого триггера, найденного на странице.

Claim 3 (Зависимый): Вводит понятие Query Templates. Словарь содержит шаблоны, состоящие из переменной и строки. Система генерирует подсказку, подставляя триггер или его расширение в переменную шаблона.

Claim 6 (Зависимый): Определяет ключевые атрибуты для расчета Rank Score:

Context (формат отображения триггера на странице).
Frequency of occurrence (частота встречаемости триггера в ресурсе).

Rank Score является функцией этих двух атрибутов.

Claim 7 (Зависимый): Добавляет к атрибутам из Claim 6 Popularity Score триггера, хранящийся в словаре. Rank Score теперь является функцией контекста, частоты и популярности.

Claim 10 (Зависимый): Вводит использование локальной истории поиска клиента (client history data). Система рассчитывает Client History Score для триггеров. Rank Score также зависит от этого показателя, что обеспечивает локальную персонализацию предложений.

Где и как применяется

Этот патент описывает архитектуру, которая функционирует преимущественно вне стандартной инфраструктуры поиска Google. Это механизм на стороне клиента, реализованный, например, как плагин для браузера, тулбар или интегрированная функция браузера.

Взаимодействие с поисковой системой:

INDEXING / QUNDERSTANDING (Офлайн, подготовка данных)
Поисковая система должна выполнить предварительную работу для создания Dictionary:

Анализ Query Logs и Click Logs для идентификации Popular Queries, Named Entities и связанных запросов (Expansion Terms).
Расчет глобальных оценок (Popularity Score, Query History Score, Document Frequency).
Сборка и отправка Dictionary на клиентские устройства.

CLIENT-SIDE EXECUTION (Основное применение)
Алгоритм активируется во время сеанса просмотра пользователем веб-страницы.

Сканирование (Scanner): Анализ контента ресурса (например, через DOM-дерево).
Ранжирование (Query Trigger Ranker): Оценка найденных триггеров с использованием локальных и глобальных атрибутов. Это не ранжирование документов в SERP, а ранжирование потенциальных запросов внутри документа.
Генерация (Suggestion Generator): Создание финальных подсказок.

Входные данные (на клиенте):

Dictionary (триггеры, оценки популярности, шаблоны).
Контент отображаемого ресурса (текст и DOM-структура веб-страницы).
Локальная история браузера клиента (Client history data).

Выходные данные (на клиенте):

Список ранжированных предложений поисковых запросов (Search Query Suggestions), отображаемых в интерфейсе пользователя.

На что влияет

Поведение пользователя: Основное влияние оказывается на следующий поисковый запрос, который пользователь отправит. Система направляет дальнейшее исследование информации.
Типы контента: Наиболее релевантно для информационного контента (статьи, новости, блоги), где вероятно дальнейшее изучение темы.
Специфические запросы: Влияет на генерацию информационных и уточняющих запросов, часто связанных с сущностями, так как Named Entities явно указаны как тип Query Triggers.
Форматы контента: Влияет на контент, где используется структурирование и форматирование, так как эти элементы учитываются при ранжировании триггеров (Context).

Когда применяется

Триггер активации: Алгоритм активируется в ответ на рендеринг ресурса (rendering the resource) в приложении веб-браузера на клиентском устройстве.
Условия работы: Требуется наличие установленной системы предложений (например, плагина или функции браузера) и загруженного Dictionary. Работает, когда в контенте обнаруживаются триггеры из словаря.

Пошаговый алгоритм

Процесс А: Предварительная подготовка (Серверная сторона, Офлайн)

Анализ данных: Поисковая система анализирует Query Logs и Click Logs.
Идентификация триггеров: Определяются Popular Queries и Named Entities.
Расчет оценок: Рассчитываются Popularity Score, Query History Score и Document Frequency Score.
Определение расширений и шаблонов: Определяются синонимы и совместно встречающиеся запросы (Expansion Terms), создаются Query Templates.
Формирование словаря: Все данные компилируются в Dictionary.
Распространение: Dictionary отправляется на клиентские устройства.

Процесс Б: Обработка в реальном времени (Клиентская сторона, Онлайн)

Рендеринг ресурса: Пользователь открывает веб-страницу.
Сканирование контента: Сканер (Scanner) на клиенте анализирует контент ресурса (например, через DOM-дерево) на наличие Query Triggers из словаря.
Идентификация атрибутов: Для найденных триггеров определяются локальные атрибуты:
- Частота встречаемости (Frequency).
- Контекст (Context) — форматирование (bold, italics), расположение в заголовках (title, headings).
- Длина термина (Term Length).
- Оценка истории клиента (Client History Score).
Расчет Rank Score: Ранкер (Query Trigger Ranker) рассчитывает итоговый Rank Score для каждого триггера, используя локальные атрибуты и оценки из словаря (Popularity, Document Frequency).
Ранжирование: Триггеры сортируются по Rank Score, выбирается Топ-N.
Генерация подсказок: Генератор (Suggestion Generator) создает поисковые подсказки для топовых триггеров, применяя Expansion Terms или Query Templates.
Фильтрация: Система может отфильтровать или изменить подсказки, которые пользователь недавно уже использовал (на основе локальной истории).
Отображение: Подсказки представляются пользователю (например, последовательно в тулбаре или списком внизу страницы).

Какие данные и как использует

Данные на входе

Система использует комбинацию данных, рассчитанных на сервере (и переданных через словарь), и данных, анализируемых на клиенте в реальном времени.

Контентные факторы: Текст ресурса, заголовки. Анализируются на клиенте для поиска Query Triggers и определения частоты (Frequency).
Структурные и Технические факторы (Контекст): Формат отображения текста (жирный, курсив, подчеркивание, размер шрифта), расположение в DOM-дереве (например, в заголовках Hx). Используется для определения атрибута Context.
Поведенческие факторы (Глобальные): Хранятся в словаре.
- Popularity Score: Насколько часто триггер ищут пользователи.
- Query History Score: Как часто выбирают подсказки на основе этого триггера.
Пользовательские / Поведенческие факторы (Локальные): Анализируются на клиенте.
- Недавняя история просмотров и поисковых запросов клиента (используется для расчета Client History Score и фильтрации дубликатов).
Системные данные (Лингвистические): Document/Page Frequency Score (частота термина в индексе). Хранится в словаре.

Какие метрики используются и как они считаются

Rank Score: Итоговая оценка для ранжирования триггеров. Рассчитывается на клиенте как функция нескольких атрибутов. Патент приводит пример функции (в описании, не в Claims): Rank score = f(f, TL, [CW], df).
- f = Frequency (Частота встречаемости триггера в документе).
- TL = Term Length (Длина триггера; более длинные триггеры считаются более специфичными/важными).
- [CW] = Context Weights (Веса, связанные с контекстом форматирования и расположения).
- df = Document Frequency (Частота документа).
Методы вычислений: Функция f может быть линейной или нелинейной, агрегирующей функцией или произведением значений атрибутов и связанных с ними весов.
Дополнительные метрики в расчете Rank Score: В расчет также включаются Popularity Score, Query History Score и Client History Score.

Выводы

Фокус на клиентской стороне: Ключевая особенность патента — перенос анализа контента и генерации предложений на устройство пользователя. Это делается для обеспечения конфиденциальности (история просмотров не отправляется на сервер для этого анализа) и позволяет анализировать даже неиндексированный контент.
Управление поисковым путем пользователя (User Journey): Это механизм не ранжирования, а влияния на следующий шаг пользователя. Система пытается предсказать и направить дальнейшее исследование темы на основе текущего контекста.
Важность заметности контента (Prominence): Атрибуты Context (форматирование, заголовки) и Frequency (частота) явно используются для определения того, какие темы на странице являются основными. Это имеет прямые последствия для SEO-копирайтинга и структуры контента.
Приоритет сущностей и популярных тем: Dictionary формируется из Named Entities и Popular Queries. Это подтверждает важность ориентации контента на реальные сущности и темы, которые уже популярны среди пользователей.
Многофакторная оценка релевантности подсказок: Ранжирование подсказок учитывает локальные сигналы (как это выглядит на странице), глобальные сигналы (насколько это популярно в поиске) и персональные сигналы (Client History Score).

Практика

Best practices (это мы делаем)

Хотя патент не влияет напрямую на ранжирование в SERP, он дает ценное понимание того, как системы интерпретируют важность контента на странице.

Выделение ключевых сущностей и тем: Используйте структурное и визуальное выделение для наиболее важных терминов. Патент явно указывает, что Context (жирный шрифт, курсив, заголовки) и Frequency являются атрибутами для ранжирования Query Triggers. Это повышает вероятность того, что именно эти термины станут основой для следующего поиска пользователя.
Ориентация на популярные запросы (Topical Authority): Поскольку словарь состоит из Popular Queries, контент должен быть aligned с тем, что пользователи уже ищут. Создание авторитетного контента вокруг популярных тем увеличивает плотность потенциальных Query Triggers на странице.
Насыщение контента именованными сущностями: Включайте релевантные Named Entities (имена, названия организаций, локации), так как они являются важной частью словаря триггеров.
Проектирование пути пользователя (User Journey): Стратегически размещайте и выделяйте те триггеры, которые соответствуют наиболее ценному следующему шагу пользователя. Убедитесь, что триггеры, ведущие к следующему этапу воронки, имеют наибольшую заметность (Prominence).

Worst practices (это делать не надо)

Использование обскурной или нестандартной терминологии: Если термины не являются Popular Queries или известными Named Entities, они, вероятно, не войдут в Dictionary и не смогут сгенерировать подсказки через этот механизм.
«Простыни текста» без форматирования: Отсутствие структурного и визуального выделения ключевых терминов снижает их оценку Context, уменьшая вероятность их выбора для генерации подсказок и затрудняя анализ контента.
Игнорирование связанных тем и расширений: Фокус только на основном ключевом слове без учета связанных сущностей и тем ограничивает возможности системы по генерации разнообразных и полезных подсказок для дальнейшего изучения.

Стратегическое значение

Этот патент подчеркивает, что SEO не ограничивается ранжированием по первичному запросу. Важно также оптимизировать контентный опыт таким образом, чтобы направлять последующее поведение пользователя. Патент подтверждает важность сочетания технической оптимизации (структура, форматирование) и контент-стратегии (выбор тем, использование сущностей) для максимизации вовлеченности. Факторы, которые он использует для определения важных тем на странице (частота, контекст, длина термина, популярность), являются универсальными индикаторами релевантности.

Практические примеры

Сценарий: Оптимизация статьи в блоге о путешествиях для генерации последующих запросов.

Статья: «Путеводитель по Риму»

Идентификация триггеров: SEO-специалист определяет ключевые Named Entities (Колизей, Ватикан, Фонтан Треви) и Popular Queries (лучшие рестораны Рима, отели в Риме).
Оптимизация контента (Действие):
- Названия достопримечательностей оформляются как подзаголовки (H2/H3) – это усиливает сигнал Context.
- В тексте ключевые термины периодически выделяются жирным шрифтом – это также усиливает сигнал Context.
- Обеспечивается достаточная частота упоминания этих терминов (Frequency).
Ожидаемый результат (Как это работает): Когда пользователь читает статью, клиентская система идентифицирует «Ватикан» как высокоранговый триггер из-за его наличия в H2 и выделения жирным.
Генерация подсказки: Система применяет шаблон из словаря (например, «%trigger% часы работы») и предлагает пользователю в тулбаре запрос «Ватикан часы работы».
Итог: Пользователь получает полезную подсказку для следующего шага, а контент страницы был успешно оптимизирован для направления пользователя на дальнейшее изучение темы.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в Google?

Нет, прямого влияния на ранжирование в основном поиске этот патент не оказывает. Он описывает, как генерируются предложения для следующего поискового запроса на основе контента, который пользователь просматривает в данный момент. Это механизм управления поведением пользователя на стороне клиента, а не алгоритм ранжирования.

Как узнать, какие термины являются «Query Triggers»?

Патент указывает, что Dictionary триггеров составляется на основе Popular Queries (популярных запросов, частота которых превышает порог) и Named Entities (именованных сущностей, таких как имена людей, места, организации). Для SEO это означает фокус на терминах, которые уже имеют высокую частотность в поиске и четко идентифицируются как сущности.

Поможет ли выделение текста жирным шрифтом в контексте этого патента?

Да, это напрямую поможет. Патент явно указывает, что Context, определяемый форматом отображения (жирный, курсив, подчеркивание, размер шрифта, заголовки), является атрибутом, используемым для расчета Rank Score триггера. Более заметные триггеры имеют больше шансов стать основой для подсказки.

Где именно пользователь видит эти подсказки?

Патент предлагает несколько вариантов реализации. Подсказки могут последовательно отображаться в поисковой строке тулбара (toolbar search box) браузера. Также они могут быть показаны в виде списка гиперссылок внизу просматриваемой страницы. Современные реализации могут включать всплывающие окна или функции типа «Touch to Search».

Что означает обработка «на стороне клиента» для SEO?

Это означает, что анализ контента происходит непосредственно в браузере пользователя, используя код страницы (DOM) в том виде, в котором он был отрендерен. Также это подразумевает, что для персонализации используется только локальная история браузера (Client History Score), обеспечивая конфиденциальность пользователя, так как данные не отправляются на сервер для этого анализа.

Что такое «Expansion Terms» и как они используются?

Expansion Terms — это синонимы или тесно связанные запросы (например, определенные по совместной встречаемости в сессиях). Система может найти на странице триггер А, но использовать связанный с ним термин расширения Б для генерации подсказки. Например, найдя «Обама», система может предложить запрос «Президент США», если эта связь есть в словаре.

Как длина термина (Term Length) влияет на генерацию подсказок?

Патент утверждает, что более длинные триггеры (большее количество слов или символов) обычно получают более высокий Rank Score. Это связано с тем, что более длинные фразы, как правило, являются более специфичными и менее общеупотребительными (индикатор обратной частоты документа), что повышает их ценность как основы для уточняющего поиска.

Могу ли я контролировать, какие именно подсказки будут сгенерированы с моей страницы?

Вы можете влиять на это, но не контролировать полностью. Вы контролируете, какие триггеры присутствуют на странице и насколько они заметны (частота, форматирование). Однако то, какие именно шаблоны (Query Templates) или расширения (Expansion Terms) будут применены, определяется содержанием Dictionary, который управляется Google.

Используется ли этот механизм, если у пользователя не установлен Google Toolbar?

Патент описывает технологию в общем виде, упоминая тулбары и плагины как возможные реализации. Эта функциональность может быть встроена непосредственно в браузер (например, Google Chrome) или реализована другими способами. Для работы механизма необходимо, чтобы на клиенте присутствовала система генерации предложений (Query Suggestion System).

Работает ли эта система для контента, который еще не проиндексирован Google?

Да. Поскольку анализ контента происходит на стороне клиента в момент просмотра страницы, система может генерировать подсказки даже для совершенно новых или неиндексируемых страниц (например, во внутренней сети). Это одно из преимуществ клиентской реализации, упомянутых в патенте.