Анализ патента Google, описывающего, как система Autocomplete ранжирует поисковые подсказки, используя данные о поведении пользователей (клики и время пребывания на сайте). Система отдает приоритет запросам, которые ранее приводили к удовлетворению пользователей («длинным кликам»). Также описан механизм предоставления альтернативных наборов подсказок по запросу пользователя с использованием разных критериев (например, персонализированных и общих).
Описание
Какую задачу решает
Патент решает задачу повышения релевантности и качества поисковых подсказок (Autocomplete). Цель — уйти от простого сопоставления префиксов или общей частотности запросов к более точному прогнозированию намерений пользователя. Это достигается за счет интеграции поведенческих сигналов, связанных с успехом предыдущих поисковых сессий, в процесс генерации и ранжирования подсказок. Также решается задача предоставления разнообразных подсказок путем динамической смены критериев ранжирования.
Что запатентовано
Запатентована система генерации и ранжирования подсказок автодополнения (predicted queries), которая использует данные о поведении пользователей (search requestor behavior), такие как click data и время пребывания на документе (dwell time). Ключевым аспектом изобретения является механизм предоставления последующих наборов подсказок по запросу пользователя (user-initiated activity) на основе критериев (second criteria), отличных от первоначальных (first criteria), с обязательным использованием поведенческих данных хотя бы в одном из наборов.
Как это работает
Система работает в двух режимах:
- Офлайн (Сбор и Моделирование): Компонент отслеживания (Tracking Component) фиксирует взаимодействие пользователей с SERP (запрос, клик, время просмотра) и сохраняет их в логах (Result Selection Logs). Клики классифицируются по времени просмотра (например, Long Click, Short Click) и взвешиваются. Эти данные агрегируются в поведенческую модель (Model).
- Онлайн (Генерация подсказок): Когда пользователь вводит частичный запрос (partial query), система генерирует подсказки, используя данные из модели. Подсказки ранжируются на основе комбинации популярности, персонализации и поведенческих оценок (запросы, ведущие к Long Clicks, получают повышение).
- Динамические наборы: Если пользователь запрашивает дополнительные варианты (например, нажатием клавиши), система генерирует второй набор подсказок, используя другие критерии ранжирования (например, переключаясь с персонализированных данных на общие), и удаляет дубликаты из первого набора.
Актуальность для SEO
Высокая. Autocomplete является фундаментальной функцией поиска. Использование поведенческих данных, персонализации и контекста для ранжирования подсказок является стандартной практикой в современных поисковых системах. Акцент на dwell time и качестве кликов полностью соответствует фокусу Google на удовлетворенности пользователей (Helpful Content).
Важность для SEO
Влияние на SEO значительное (7.5/10). Autocomplete формирует поисковый спрос и направляет трафик еще до показа SERP. Патент подтверждает, что удовлетворенность пользователей результатами поиска (поведенческие сигналы) напрямую влияет на ранжирование подсказок. Если контент генерирует Long Clicks по определенному запросу, эта формулировка с большей вероятностью будет показана в качестве подсказки другим пользователям.
Детальный разбор
Термины и определения
- Click Data (Данные о кликах)
- Информация о взаимодействии пользователя с результатами поиска. Включает запрос (Q), документ (D), время просмотра (T), язык (L) и страну (C).
- Dwell Time (Время пребывания)
- Время, которое пользователь проводит за просмотром документа после клика по результату поиска и до возвращения на страницу выдачи.
- First Criteria / Second Criteria (Первые / Вторые критерии)
- Различные наборы правил и данных для ранжирования подсказок. Используются для генерации последовательных наборов подсказок по запросу пользователя (например, персонализированные vs. общие).
- Long Click / Short Click (Длинный клик / Короткий клик)
- Классификация кликов на основе Dwell Time. Long Click интерпретируется как признак релевантности документа, Short Click — как признак отсутствия релевантности.
- Model (Модель данных)
- База данных, агрегирующая информацию о поведении пользователей по каждому запросу и документу. Хранит взвешенные данные о кликах.
- Predicted Queries (Предсказанные запросы)
- Предложения автозаполнения (Autocomplete suggestions), генерируемые системой.
- Result Selection Logs (Логи выбора результатов)
- Хранилище записанной информации о взаимодействии пользователей с ранжированной выдачей.
- Search Assistant (Поисковый ассистент)
- Компонент (часто на стороне клиента), который отслеживает ввод пользователя, отправляет частичные запросы и отображает предсказания.
- User-initiated activity (Действие, инициированное пользователем)
- Событие (например, нажатие клавиши Tab или стрелки), которое служит триггером для запроса дополнительного набора подсказок (второго набора).
- Weighted Views (Взвешенные просмотры)
- Метод оценки, при котором кликам присваивается разный вес в зависимости от их продолжительности (Dwell Time).
Ключевые утверждения (Анализ Claims)
Патент US9740780B1 является продолжением (continuation) более ранних заявок. Основные Claims сосредоточены на механизме предоставления нескольких наборов подсказок с использованием различных критериев и поведенческих данных.
Claim 1 (Независимый пункт): Описывает метод предоставления дополнительных подсказок по запросу пользователя.
- Система получает частичный запрос от пользователя.
- Выбирается первый набор предсказанных запросов на основе first criteria (отличных от текста запроса).
- Первый набор предоставляется пользователю.
- Система получает запрос на дополнительные предсказания в ответ на действие пользователя (user-initiated activity).
- В ответ система выбирает второй набор предсказанных запросов на основе second criteria. Эти критерии отличаются от first criteria и от текста запроса.
- Ключевое условие: По крайней мере один из наборов критериев (первый или второй) основан на поведении пользователя (behavior of the user) в отношении документов, предоставленных в ответ на предыдущие запросы этого пользователя.
- Система идентифицирует дубликаты между первым и вторым наборами.
- Дубликаты удаляются из второго набора.
- Второй (очищенный) набор предоставляется пользователю.
Ядро изобретения заключается в возможности динамически изменять критерии ранжирования подсказок по запросу пользователя и в обязательном использовании поведенческих данных пользователя хотя бы в одном из этих наборов.
Claim 3 (Зависимый от 1): Уточняет разницу в критериях.
First criteria могут включать специфичные для пользователя критерии (персонализация), а second criteria могут включать критерии, основанные на данных множества пользователей (общая популярность/поведение сообщества). Это описывает сценарий переключения между персонализированным и общим автозаполнением.
Где и как применяется
Изобретение применяется на стыке взаимодействия с пользователем и понимания запросов, используя данные, собранные после этапа ранжирования.
QUNDERSTANDING – Понимание Запросов (Основное применение)
Система работает в реальном времени, до того, как основной запрос полностью сформирован. Она использует частичный ввод (partial query) и поведенческую модель, чтобы предсказать финальный запрос. Это основная фаза работы Autocomplete.
INDEXING (Предварительные вычисления)
На этом этапе происходит обработка и агрегация поведенческих данных. Система анализирует Result Selection Logs, рассчитывает метрики (Dwell Time, взвешенные клики) для пар запрос-документ и строит Model, доступную для системы автозаполнения.
Входные данные:
- Частичный запрос (Partial Query).
- Контекст пользователя (Язык, Страна).
- Данные для персонализации (история поиска пользователя).
- Агрегированные поведенческие данные из Model.
- Сигнал о запросе дополнительных подсказок (User-initiated activity).
Выходные данные:
- Упорядоченные наборы предсказанных запросов (predicted queries).
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на запросы с неоднозначными префиксами, где поведенческие данные и персонализация помогают различить намерения (например, «Java» как кофе или как язык программирования).
- Языковые и географические ограничения: Патент явно указывает, что данные о языке (L) и стране (C) собираются и используются. Подсказки сильно адаптированы к местоположению и языку пользователя.
Когда применяется
- Триггеры активации (Первый набор): Алгоритм активируется, когда пользователь вводит запрос. Активация может произойти после ввода определенного количества символов (Claim 4), ввода разделителя или паузы при вводе (Claim 5).
- Триггеры последующих наборов (Второй набор): Генерируется, если пользователь инициирует запрос на дополнительные варианты (user-initiated activity, например, нажимает клавишу «Tab» или стрелку). Также в описании патента упоминается возможность активации по таймауту (если пользователь не выбрал ничего из первого набора).
Пошаговый алгоритм
Процесс А: Построение Модели (Офлайн)
- Сбор данных: Tracking Component отслеживает клики пользователей на SERP. Записываются данные: Запрос (Q), Документ (D), Время пребывания (T), Язык (L), Страна (C).
- Логирование: Данные сохраняются в Result Selection Logs.
- Классификация кликов: Время пребывания (T) анализируется для классификации кликов (например, Short Click, Medium Click, Long Click, Last Click).
- Взвешивание: Каждому клику присваивается вес в зависимости от его классификации (например, Long Click = 1.0, Short Click = -0.1).
- Агрегация: Взвешенные клики агрегируются для каждой пары Запрос-Документ.
- Хранение: Агрегированные данные сохраняются в Model.
Процесс Б: Генерация подсказок (Real-time)
- Мониторинг ввода: Search Assistant отслеживает ввод пользователя и идентифицирует partial query.
- Передача данных: Частичный запрос и контекстные данные отправляются на сервер.
- Генерация и Ранжирование (Набор 1): Сервер генерирует кандидатов и ранжирует их с использованием first criteria (например, персонализация + поведенческие данные из Model).
- Передача и отображение: Упорядоченный первый набор отправляется клиенту и отображается.
- Ожидание реакции: Система ожидает выбора или триггера для дополнительных подсказок.
- Запрос последующего набора: Если пользователь инициирует запрос (user-initiated activity).
- Генерация и Ранжирование (Набор 2): Генерируется второй набор с использованием second criteria (отличных от первых, например, только общие данные сообщества).
- Дедупликация: Удаляются подсказки, уже показанные в первом наборе.
- Отображение Набора 2.
Какие данные и как использует
Данные на входе
Система использует обширный набор поведенческих и контекстных данных.
- Поведенческие факторы (Ключевые):
- Click data (факт клика на результат).
- Dwell time (T) (время, проведенное на документе после клика).
- История предыдущих запросов пользователя и сообщества.
- Информация о кликах до и после текущего клика в сессии.
- Позиции кликов в интерфейсе.
- Пользовательские и Географические факторы:
- Язык интерфейса (L).
- Страна пользователя (C).
- User Personalization Information (интересы пользователя, выведенные из истории поиска/браузинга).
- IP-адрес, user agent браузера, cookie и возраст cookie.
- Временные факторы:
- Частота отправки запроса (frequency of submission).
- Время последнего отправления запроса (свежесть).
Какие метрики используются и как они считаются
- Классификация Dwell Time: Время просмотра классифицируется по категориям. Патент не указывает точные пороги, но приводит примеры: Short Click, Medium Click, Long Click, Last Click (пользователь не вернулся на выдачу).
- Weighted Views / Weighted Clicks (Взвешенные просмотры/клики): Применяется функция взвешивания (непрерывная или дискретная). Пример дискретного взвешивания из описания патента:
- Short Click: -0.1
- Medium Click: 0.5
- Long Click: 1.0
- Last Click: 0.9 (или 0.3, если ему предшествовал другой клик).
- Score (Оценка подсказки): Может рассчитываться путем суммирования взвешенных кликов на документы, связанные с этим запросом. Подсказки упорядочиваются по этой оценке.
- Ranking Criteria (First/Second): Наборы правил, определяющие, как комбинировать метрики. Например, Критерий 1 фокусируется на персонализации, Критерий 2 — на общих данных сообщества.
Выводы
- Поведенческие сигналы напрямую влияют на Autocomplete: Ранжирование подсказок зависит не только от частотности запроса, но и от качества взаимодействия пользователей с результатами поиска по этому запросу (Click Data и Dwell Time).
- Удовлетворенность пользователя повышает видимость запроса: Запросы, которые приводят к результатам, удовлетворяющим пользователей (измеряется через Long Clicks), с большей вероятностью будут показаны в качестве подсказок. Качество контента косвенно влияет на видимость в Autocomplete.
- Сложная оценка кликов: Система использует сложную модель взвешивания кликов (Short, Medium, Long, Last), где негативный опыт (Short Clicks) может иметь отрицательный вес.
- Динамическая смена критериев ранжирования: Ключевая часть патента — способность системы предоставлять последующие наборы подсказок, используя другие критерии ранжирования (например, переключение между персонализацией и общими трендами) по запросу пользователя.
- Сильная персонализация и локализация: Подсказки адаптируются на основе истории поиска, поведения конкретного пользователя, а также его языка и страны.
Практика
Best practices (это мы делаем)
- Оптимизация под удовлетворенность пользователя (Post-Click Optimization): Это ключевая стратегия. Поскольку Long Clicks и высокий Dwell Time повышают рейтинг связанного запроса в Autocomplete, необходимо гарантировать, что контент полностью удовлетворяет интент пользователя и минимизирует возврат на выдачу («pogo-sticking»).
- Таргетинг на формулировки из Autocomplete: Анализируйте подсказки как индикатор качественного спроса (запросы, подтвержденные успешным пользовательским опытом). Обеспечивайте максимальное соответствие контента и высокий уровень удовлетворенности именно для этих формулировок.
- Учет локализации при исследовании ключевых слов: Поскольку язык (L) и страна (C) явно используются для ранжирования подсказок, важно анализировать Autocomplete и оптимизировать контент с учетом локальных поведенческих паттернов.
- Улучшение общего UX сайта: Работа над скоростью загрузки, читаемостью и навигацией способствует увеличению dwell time и вероятности Last Click, что является сильным положительным сигналом для связанных запросов.
Worst practices (это делать не надо)
- Использование кликбейта и вводящих в заблуждение заголовков: Тактики, направленные на получение клика, но не удовлетворяющие интент, приведут к Short Clicks. Согласно патенту, это имеет низкий или отрицательный вес и может негативно повлиять на видимость связанных запросов в Autocomplete.
- Попытки манипуляции автозаполнением через ботов: Искусственное увеличение частоты запросов не будет эффективным, если эти поиски не сопровождаются естественным положительным поведением (Long Clicks). Система устойчива к простым накруткам частотности благодаря учету поведенческих факторов.
- Игнорирование поведенческих метрик: Фокус только на объеме трафика без анализа его качества (время на сайте, возврат на выдачу) является проигрышной стратегией, так как система использует эти данные для оценки релевантности запросов.
Стратегическое значение
Патент подтверждает, что Autocomplete — это не просто список популярных запросов, а сложная система ранжирования, основанная на качестве пользовательского опыта. Поведенческие факторы интегрированы в поиск на самых ранних этапах. Стратегически это означает, что качество контента и удовлетворенность пользователя (E-E-A-T, Helpful Content) влияют не только на ранжирование сайтов, но и на формирование поискового спроса через подсказки.
Практические примеры
Сценарий 1: Повышение видимости запроса через оптимизацию контента
- Ситуация: Компания хочет повысить видимость запроса «как выбрать робот-пылесос для шерсти» в Autocomplete.
- Анализ по патенту: Видимость зависит от частоты и агрегированной оценки удовлетворенности (Long Clicks) по этому запросу.
- Действие: Создать лучшую страницу ответа на этот запрос (детальный гайд, сравнения, видео). Оптимизировать ее для удержания пользователя, чтобы максимизировать Dwell Time и генерировать Long Clicks или Last Clicks.
- Ожидаемый результат: Улучшение поведенческих метрик по запросу повышает его общую оценку качества в модели Google, что приводит к более высокому ранжированию этой подсказки в Autocomplete.
Сценарий 2: Управление репутацией (ORM)
- Проблема: При вводе названия бренда появляется негативная подсказка (например, «Бренд Х обман»).
- Анализ по патенту: Эта подсказка появляется, потому что пользователи часто ее ищут И/ИЛИ проводят значительное время (Dwell Time) на страницах с негативом, найденных по этому запросу.
- Решение: Необходимо создать качественный контент, отвечающий на этот интент (например, официальный ответ, разбор ситуации), и добиться, чтобы пользователи проводили на нем больше времени, чем на сторонних негативных ресурсах. Изменение паттерна Dwell Time может со временем повлиять на ранжирование подсказки.
Вопросы и ответы
Как Google определяет порядок подсказок в Autocomplete?
Порядок определяется на основе комбинации факторов: частотность запроса, его свежесть, локализация (страна и язык), персонализация (история поиска пользователя), и, что критически важно, поведенческие данные. Запросы, которые в прошлом приводили к удовлетворительным результатам (измеряемым через Long Clicks и Dwell Time), ранжируются выше.
Означает ли это, что Autocomplete показывает не самые популярные запросы?
Да, это не всегда самые популярные запросы по объему. Популярность является одним из факторов, но она корректируется поведенческими сигналами. Очень популярный запрос, который часто приводит к Short Clicks (пользователи быстро возвращаются в выдачу), может быть понижен в пользу менее популярного, но более релевантного запроса.
Что такое Long Click и Short Click в контексте этого патента?
Это классификация времени пребывания пользователя на сайте (Dwell Time). Long Click указывает на то, что пользователь нашел релевантную информацию и провел на странице много времени. Short Click указывает на быстрый возврат в выдачу. Патент предлагает присваивать разные веса этим событиям (например, Long=1.0, Short=-0.1) для оценки качества запроса.
Насколько сильно персонализированы подсказки автозаполнения?
Персонализация играет значительную роль. Патент описывает использование user personalization information. Более того, описан механизм (Claim 3), позволяющий переключаться между наборами подсказок, основанными на персонализированных критериях (user-specific criteria) и общих критериях (criteria based on multiple users).
Можно ли манипулировать подсказками Autocomplete?
Прямые манипуляции (например, накрутка частоты запросов ботами) стали значительно сложнее. Поскольку система учитывает качество взаимодействия (Dwell Time), искусственные запросы без последующего положительного поведения (Long Clicks) не дадут устойчивого результата. Влияние требует реального изменения поведения пользователей и улучшения качества контента.
Как использовать этот патент при исследовании ключевых слов?
Рассматривайте Autocomplete как источник данных о качественном спросе. Подсказки указывают на интенты, подтвержденные успешным пользовательским опытом. Обязательно учитывайте локализацию и потенциальную персонализацию при сборе данных.
Что означает механизм предоставления «второго набора подсказок»?
Это ключевая часть патента. Если пользователь не удовлетворен первым набором подсказок или активирует специальный триггер (например, нажимает клавишу), система может сгенерировать новый набор, используя другие критерии ранжирования (second criteria). Например, если первый набор был персонализированным, второй может быть основан на общих трендах сообщества, при этом дубликаты удаляются.
Влияет ли поведение на моем сайте на то, какие подсказки увидит пользователь?
Да, косвенно. Если ваш сайт предоставляет качественный ответ на запрос «А», и пользователи, приходящие по этому запросу, генерируют Long Clicks, это увеличивает общую оценку качества запроса «А». В результате запрос «А» может начать ранжироваться выше в автозаполнении для будущих пользователей.
Используется ли эта система для подсказок URL в адресной строке?
Да, в описании патента упоминается, что механизмы применимы как для поисковых запросов, так и для ввода URL (Uniform Resource Locator). Поведенческие данные (например, частота посещения и время, проведенное на сайте) также могут использоваться для ранжирования предсказанных URL.
Как этот патент связан с E-E-A-T и Helpful Content?
Существует прямая связь. Контент, соответствующий принципам E-E-A-T и Helpful Content, с большей вероятностью удовлетворит пользователя и приведет к Long Clicks. Этот положительный поведенческий сигнал затем используется системой автозаполнения для повышения видимости запросов, связанных с этим качественным контентом.