Как Google анализирует последовательность действий пользователя (паттерны поведения) для оценки качества результатов поиска и рекламы

Google оценивает удовлетворенность пользователя, кодируя последовательность его онлайн-действий (поиски, клики, свайпы) в символьные строки. Анализируя эти паттерны, система классифицирует сессии как положительные или отрицательные, не полагаясь на ненадежные метрики вроде продолжительности клика (Dwell Time). Это позволяет корректировать показ рекламы и органических результатов на основе реального качества пользовательского опыта.

Описание

Какую задачу решает

Патент решает проблему ненадежности традиционной метрики click duration (продолжительность клика или Dwell Time) для оценки удовлетворенности пользователя. Метрики, основанные на времени, плохо работают для современных взаимодействий (например, click-to-call, загрузка файлов, свайпы), разных скоростей сети и разных задач (быстрый поиск факта vs. глубокое изучение). Изобретение предлагает метод оценки качества, основанный на анализе последовательности действий пользователя, а не времени между ними.

Что запатентовано

Запатентована система для оптимизации показа Digital Components (цифровых компонентов, включающих рекламу, органические результаты поиска, видео и т.д.) путем анализа паттернов поведения. Система кодирует действия пользователя в сессии в символьные строки (Encoded Session String). Затем эти паттерны классифицируются как положительные или отрицательные для конкретной пары Запрос/Компонент, и эти данные используются для корректировки вероятности показа компонента в будущем.

Как это работает

Система работает в несколько этапов:

Сбор данных: Логируются действия пользователя в сессии (Session Data).
Кодирование: Онлайн-активность преобразуется в строку символов. Например, Поиск (S), Клик по компоненту на мобильном (m@), Клик по другому результату (R) формируют строку «Sm@R».
Обучение и Классификация: Модель обучается определять, какие паттерны коррелируют с положительным или отрицательным опытом (используя данные от асессоров).
Нормализация: Вычисляется Normalized Pattern Score (NPS) для оценки качества паттерна относительно среднего уровня.
Применение: При получении нового запроса система предсказывает ожидаемую классификацию сессии. Если предсказывается негативная сессия, вероятность показа этого компонента снижается.

Актуальность для SEO

Высокая. Измерение удовлетворенности пользователей и использование поведенческих сигналов являются центральными задачами современного поиска. Этот патент предлагает надежный фреймворк для анализа поведения, который решает известные проблемы метрик, основанных на времени, и актуален как для платного поиска (PPC), так и для органического (SEO).

Важность для SEO

Патент имеет значительное влияние на SEO (8.5/10). Он предоставляет техническую основу того, как Google может оценивать поведение после клика (post-click behavior, например, pogo-sticking). Важно, что в тексте уточняется, что Digital Components включают и органические результаты поиска. Понимание того, какие паттерны Google считает негативными, критически важно для оптимизации контента с целью полного удовлетворения интента и предотвращения поведенческой пессимизации.

Детальный разбор

Термины и определения

Digital Component (DC) (Цифровой компонент): Контент, который динамически интегрируется в электронный документ. В патенте указано, что это может быть реклама, органические результаты поиска, видео, аудио или изображения.
Digital Component Distribution System (DCDS): Система, которая выбирает и предоставляет цифровые компоненты (например, рекламный сервер или система ранжирования).
Encoded Session String (Закодированная строка сессии): Строка символов, представляющая последовательность онлайн-активностей пользователя. Например, «Sm@R».
Fallback Session String (Резервная строка сессии): Укороченная версия Encoded Session String, созданная путем удаления символов с концов. Используется, если для полной строки недостаточно данных для статистически значимого анализа.
Normalized Pattern Score (NPS) (Нормализованная оценка паттерна): Метрика, представляющая уровень удовлетворенности, связанный с конкретным паттерном. Рассчитывается путем нормализации соотношения положительных/отрицательных классификаций для этого паттерна относительно общего соотношения во всех сессиях.
Query/Digital Component Pair (Пара Запрос/Компонент): Контекст, в котором оценивается паттерн: конкретный DC, показанный в ответ на конкретный запрос.
Session Data / Session Log (Данные сессии / Лог сессии): Необработанные данные о взаимодействиях пользователя (клики, свайпы, поиски, использование кнопки «Назад» и т.д.).
Sublinear Weighting (Сублинейное взвешивание): Техника обучения модели, которая уменьшает влияние очень частых пар Запрос/Компонент, чтобы предотвратить их доминирование в модели.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод оптимизации.

Система получает данные сессии.
Кодировщик обрабатывает активности, произошедшие после показа определенного DC:
1. Представляет последовательные активности символами.
2. Игнорирует (ignoring) активности, не выбранные для кодирования.
3. Генерирует encoded session string.
Сервер классифицирует сессию (положительная/отрицательная) на основе оценки этой строки.
Сервер агрегирует эту классификацию с другими сессиями, имеющими такую же строку и тот же контекст (показ того же DC).
Сервер корректирует будущее распределение: снижает частоту показа DC, если агрегированная классификация отрицательная.

Claim 3 (Зависимый): Описывает применение в реальном времени.

Система получает запрос на DC, содержащий поисковый запрос.
Идентифицируется подходящий DC.
Система получает прогнозируемую классификацию (predicted classification) ожидаемой сессии. Прогноз основан на исторических данных для этой пары Запрос/DC.
Снижается вероятность показа DC, если прогнозируется отрицательная сессия.

Claim 4 (Зависимый): Детализирует вычисление Normalized Pattern Score (NPS).

Система вычисляет NPS путем:

Подсчета положительных (G) и отрицательных (B) классификаций для этой строки.
Подсчета общего количества положительных (GT) и отрицательных (BT) классификаций для всех строк.
Вычисления общего соотношения (Total Session String Ratio = GT/BT).
Вычисления соотношения для паттерна (Pattern Ratio = G/B).
Вычисления нормализатора (Normalizer = Total Session String Ratio / Pattern Ratio).
Вычисления NPS на основе нормализатора.

Claim 6 (Зависимый): Описывает механизм Fallback Session String.

Определяется, что общее количество строк с определенным паттерном меньше заданного порога.
В ответ на это, символ удаляется с одного конца строки для создания fallback session string.
Процесс повторяется итеративно, пока общее количество резервных строк не достигнет порога (статистической значимости).

Где и как применяется

Изобретение затрагивает этапы, связанные с анализом поведения и принятием решений о ранжировании.

INDEXING – Индексирование и извлечение признаков (Офлайн-анализ)
На этом этапе происходит обработка данных офлайн: хранение Session Logs, кодирование сессий, обучение модели классификатора, вычисление и сохранение Normalized Pattern Scores, привязанных к паттернам и парам Запрос/DC.

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение в реальном времени. Digital Component Distribution System (DCDS) использует механизм для корректировки выбора и ранжирования компонентов (рекламы или органических результатов).

Получение запроса и идентификация компонентов-кандидатов.
Прогнозирование: Система получает predicted classification ожидаемой сессии для кандидата, используя исторические данные (NPS) для этой пары Запрос/DC.
Корректировка: Ranking Score или вероятность показа компонента корректируется. Если прогноз негативный, вероятность снижается.

Входные данные:

Session Data (логи активностей).
Данные классификации для обучения (например, от асессоров).
Запрос в реальном времени (запрос, тип устройства и т.д.).

Выходные данные:

Encoded Session Strings и их Normalized Pattern Scores.
Скорректированное решение о ранжировании/показе DC.

На что влияет

Типы контента: Влияет на любой контент, определенный как Digital Component. Патент явно включает рекламу и органические результаты поиска.
Специфические ниши: Особенно важно в нишах, где удовлетворенность сложно измерить временем (быстрый поиск фактов, скачивание контента, мобильный поиск с частыми свайпами и звонками).
Типы устройств: Патент явно учитывает тип устройства (мобильный, десктоп) при кодировании строки (например, ‘m@’ для мобильного клика), что означает разную интерпретацию паттернов для разных устройств.

Когда применяется

Офлайн (Обучение): Постоянный анализ логов, вычисление NPS и обучение модели классификации.
Онлайн (Применение): В реальном времени при каждом запросе на показ DC для прогнозирования качества сессии и корректировки ранжирования.
Условия: Требуется достаточное количество данных для анализа паттерна. Если данных мало, активируется механизм Fallback Session String.

Пошаговый алгоритм

Процесс А: Обработка сессии и Кодирование (Офлайн)

Доступ к данным: Система получает доступ к Session Log.
Идентификация и Фильтрация активностей: Система парсит лог, идентифицируя активности для кодирования (Поиск, Клик, Свайп и т.д.) и игнорируя невыбранные действия.
Кодирование: Каждая активность заменяется символом, учитывая контекст (связанная/несвязанная задача) и тип устройства.
Генерация строки: Символы объединяются в последовательность, формируя Encoded Session String (например, Sm@R).

Процесс Б: Вычисление Normalized Pattern Score (Офлайн)

Подсчет для паттерна: Идентифицируется количество положительных (Gi) и отрицательных (Bi) экземпляров данной строки сессии i.
Общий подсчет: Идентифицируется общее количество положительных (GT) и отрицательных (BT) сессий во всем наборе данных.
Вычисление общего соотношения (TSSR): Рассчитывается TSSR = GT / BT.
Вычисление соотношения паттерна (PRi): Рассчитывается PRi = Gi / Bi.
Вычисление нормализатора (Ni): Рассчитывается Ni = TSSR / PRi.
Вычисление NPS (NPSi): Рассчитывается Normalized Pattern Score на основе нормализатора (например, NPSi = 1 / (1 + Ni)).

Процесс В: Механизм Fallback (Офлайн)

Проверка порога: Определяется, что количество экземпляров строки (например, SRSRm@RSSR) меньше заданного порога.
Создание резервной строки: Удаляется символ с одного конца (например, получается RSRm@RSSR).
Итерация: Шаги 1 и 2 повторяются (например, получается RSRm@RSS), пока не будет достигнут порог статистической значимости.

Процесс Г: Применение в реальном времени (Онлайн)

Получение запроса и идентификация подходящего DC.
Получение прогноза: Система получает прогнозируемую классификацию ожидаемой сессии на основе исторических NPS для этой пары Запрос/DC.
Корректировка распределения: Если прогнозируется негативная сессия, вероятность показа этого DC снижается.

Какие данные и как использует

Данные на входе

Система полагается преимущественно на поведенческие и контекстные данные.

Поведенческие факторы: Ядро изобретения. Используются данные из Session Log о последовательности действий. Примеры из патента (Table 1):
- Поисковые запросы (Web Search, Voice Search).
- Клики (Search Result Click, Digital Component Click).
- Взаимодействия с интерфейсом (Back Button Interaction, Swipe or Scroll, Page Zoom).
- Обратная связь пользователя (Positive/Negative user feedback).
Пользовательские факторы (Контекст): Тип устройства (мобильный, десктоп) явно используется в процессе кодирования.
Временные факторы: Таймстампы используются для определения последовательности, но сама продолжительность (Click Duration) не является фактором в этой модели.

Какие метрики используются и как они считаются

Encoded Session String: Генерируется путем преобразования действий в символы.
Classification Score: Исходные данные для обучения (например, от асессоров), определяющие качество сессии (например, 0.0-1.0).
Total Session String Ratio (TSSR): Общее соотношение позитивных сессий к негативным. Формула: TSSR = GT / BT.
Pattern Ratio (PRi): Соотношение позитивных сессий к негативным для конкретного паттерна i. Формула: PRi = Gi / Bi.
Normalizer (Ni): Коэффициент нормализации. Формула: Ni = TSSR / PRi.
Normalized Pattern Score (NPSi): Итоговая оценка качества паттерна i. Основная формула: NPSi = 1 / (1 + Ni).
Sublinear Weighting: При обучении модели вклад частых пар Запрос/DC взвешивается сублинейно (например, с использованием ln(1+n)), чтобы они не доминировали в модели.

Выводы

Переход от Времени к Последовательности: Патент подтверждает отказ от использования click duration (Dwell Time) как основного индикатора удовлетворенности. Фокус смещается на анализ последовательности действий пользователя (поведенческих паттернов).
Поведенческие паттерны как сигнал качества: Система формализует оценку поведения, такого как pogo-sticking. Например, паттерн S@R (Поиск -> Клик по компоненту -> Клик по другому результату) может иметь низкий Normalized Pattern Score, указывая на неудовлетворенность.
Контекстная специфичность оценки: Оценка паттерна не универсальна. Она привязана к конкретной паре Query/Digital Component Pair и учитывает тип устройства (мобильный vs десктоп).
Применимость к органическому поиску: В патенте явно указано, что Digital Component может быть органическим результатом поиска. Это означает, что описанный механизм используется для оценки качества и корректировки ранжирования органической выдачи.
Сложные механизмы обеспечения качества модели: Система использует продвинутые техники (Normalization, Sublinear Weighting, Fallback Session Strings) для обеспечения статистической надежности, балансировки данных и работы с редкими паттернами.

Практика

Best practices (это мы делаем)

Фокус на полном удовлетворении интента (Task Completion): Ключевая стратегия — гарантировать, что контент полностью отвечает на запрос и не провоцирует негативные поведенческие паттерны. Необходимо минимизировать возврат пользователя на SERP для поиска альтернатив (pogo-sticking).
Анализ пути пользователя и устранение «разочарования»: Изучайте аналитику, чтобы понять, где пользователи испытывают трудности. Паттерны, вызванные медленной загрузкой, запутанной навигацией или нерелевантным контентом, будут интерпретированы как негативные.
Оптимизация мобильного опыта (Mobile Experience): Поскольку тип устройства явно учитывается при кодировании (например, ‘m@’), критически важно обеспечить отличный UX на мобильных. Паттерны поведения на разных устройствах оцениваются с учетом их специфики.
Стимулирование положительных паттернов: Создавайте контент, который стимулирует вовлеченность, соответствующую задаче. Цель – чтобы сессия пользователя завершилась на вашем сайте или перешла к несвязанной задаче, а не к продолжению поиска по той же теме.

Worst practices (это делать не надо)

Использование кликбейта и вводящих в заблуждение заголовков: Это приводит к классическому негативному паттерну: клик, быстрое разочарование и возврат на SERP (например, S@R или S@S). Такие паттерны получат низкий Normalized Pattern Score и приведут к пессимизации.
Создание поверхностного контента (Thin Content): Контент, который не решает задачу пользователя, заставит его вернуться к поиску, формируя негативный паттерн.
Игнорирование технических проблем (Скорость, CLS): Технические проблемы, вызывающие фрустрацию, могут приводить к быстрым отказам или хаотичным взаимодействиям, которые система закодирует и классифицирует как негативный опыт.
Попытки манипулировать Dwell Time: Если пользователь проводит много времени на странице из-за того, что он запутался или ждет загрузки, это не поможет. Система анализирует паттерн действий, а не затраченное время.

Стратегическое значение

Этот патент подчеркивает стратегическую важность анализа пользовательского опыта за пределами стандартных метрик. Google обладает сложными инструментами для интерпретации поведения пользователей на уровне последовательности действий. Долгосрочная SEO-стратегия должна быть сосредоточена на подлинном удовлетворении пользователя и завершении его задачи (Task Completion), поскольку система способна выявлять и пессимизировать результаты, которые систематически приводят к негативным поведенческим паттернам.

Практические примеры

Сценарий: Оценка качества результата по информационному запросу

Запрос: «Как почистить серебряную цепочку».
Результат А (Низкое качество): Пользователь кликает (Сайт А), не находит нужного, возвращается на SERP, кликает на Результат Б.
- Паттерн для Результата А: S@R (Search -> Click A -> Click Result B).
Результат В (Высокое качество): Пользователь кликает (Сайт В), изучает руководство, и его сессия завершается или он переходит к несвязанному запросу (например, «погода»).
- Паттерн для Результата В: S@s (Search -> Click B -> unrelated search).
Анализ: Система определяет, что паттерн S@R систематически имеет более низкий Normalized Pattern Score (указывает на неудовлетворенность), чем S@s для этого интента.
Результат: Ранжирование Результата А снижается для этого запроса, так как он прогнозирует негативную сессию.

Вопросы и ответы

Заменяет ли этот патент метрику Dwell Time (время на сайте)?

Да, этот патент описывает механизм, созданный для замены или существенного дополнения метрик, основанных на времени (click duration). В патенте прямо указано, что продолжительность клика является ненадежным индикатором удовлетворенности. Вместо времени система анализирует последовательность действий пользователя.

Применяется ли этот механизм к органическому поиску или только к рекламе?

Он применяется к обоим. В патенте термин Digital Component определяется широко и включает как рекламу, так и органические результаты поиска. Механизм позволяет Google оценивать качество любого элемента в выдаче на основе того, что пользователь делает после клика на него.

Что такое Encoded Session String и как она выглядит?

Это строка символов, кодирующая действия пользователя. Например, «Sm@R» может означать: S (Search — Поиск), m@ (main component click on mobile — Клик по компоненту на мобильном), R (Result click — Клик по другому результату). Это кодированное представление поведения, такого как pogo-sticking.

Как система определяет, является ли паттерн положительным или отрицательным?

Модель обучается на данных, где сессии уже размечены (вероятно, асессорами) как положительные или отрицательные. Затем система вычисляет Normalized Pattern Score (NPS), чтобы определить, насколько конкретный паттерн коррелирует с положительным или отрицательным исходом по сравнению со средними показателями.

Что означает «Нормализация» (Normalization) в этом патенте?

Нормализация корректирует оценку паттерна с учетом общих тенденций. Она сравнивает соотношение позитив/негатив для конкретного паттерна (Pattern Ratio) с общим соотношением во всех данных (Total Session String Ratio). Это помогает изолировать качество самого паттерна от внешних факторов и базового уровня удовлетворенности.

Что такое Fallback Session String и зачем она нужна?

Это укороченная версия паттерна. Если для длинного, специфичного паттерна недостаточно данных для статистически значимого анализа, система «обрезает» его с концов, пока не найдет более короткий паттерн, для которого данных достаточно. Это обеспечивает максимальный охват анализа.

Влияет ли тип устройства (мобильный/десктоп) на анализ паттернов?

Да, влияет. Патент описывает включение типа устройства в процесс кодирования (например, ‘m@’ для мобильного, ‘d@’ для десктопа). Это позволяет Google учитывать различия в поведении пользователей на разных устройствах и адаптировать модели оценки соответственно.

Что такое Sublinear Weighting и как это влияет на SEO?

Это техника, предотвращающая доминирование очень популярных запросов или сайтов при обучении модели. Вклад частых пар Запрос/Компонент искусственно занижается. Для SEO это означает, что модель стремится быть точной как для высокочастотных, так и для низкочастотных (long-tail) запросов.

Как SEO-специалисту использовать эти знания на практике?

Основной фокус должен быть на полном удовлетворении интента пользователя и предотвращении pogo-sticking. Убедитесь, что ваш контент быстро загружается, удобен и полностью решает задачу пользователя, чтобы он не возвращался на SERP для поиска альтернатив. Возврат на SERP формирует негативный паттерн.

Может ли медленная загрузка сайта повлиять на оценку паттерна?

Да, может. Хотя система не измеряет время напрямую, медленная загрузка может вызвать фрустрацию и привести к быстрым отказам или хаотичным действиям. Эти действия формируют паттерн поведения, который, скорее всего, будет классифицирован как негативный опыт.