Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует поведение пользователей после клика (Session Features) для оценки качества результатов

    PREDICTING AD QUALITY (Прогнозирование качества рекламы)
    • US20070156887A1
    • Google LLC
    • 2007-07-05
    • 2005-12-30
    2005 Патенты Google Поведенческие сигналы

    Google использует статистическую модель, обученную на поведении пользователей (Session Features) после клика по результату. Анализируя такие сигналы, как время пребывания, последующие клики и запросы, система прогнозирует удовлетворенность пользователя. Хотя патент описывает систему рекламы, методология оценки качества через пост-клик сигналы критически важна для понимания органического ранжирования.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему ограниченности показателя CTR (Click-Through Rate) как метрики качества. CTR измеряет привлекательность сниппета (рекламного креатива), но не отражает удовлетворенность пользователя после перехода на целевую страницу (landing document). Система стремится оценить реальное качество результата и удовлетворенность пользователя, а не только вероятность клика, чтобы улучшить ранжирование.

    Что запатентовано

    Запатентована система для прогнозирования качества рекламы на основе анализа поведения пользователя после клика. Система использует статистическую модель, обученную на наблюдаемых действиях пользователя (Session Features) по объявлениям с известным рейтингом. Эти прогнозы агрегируются на основе характеристик запроса и объявления (Ad/Query Features) и используются для предсказания качества будущих показов.

    Как это работает

    Система работает в несколько этапов:

    • Обучение модели: На основе объявлений с известными рейтингами качества (rated ads) и журналов поведения пользователей строится статистическая модель (например, logistic regression). Она определяет корреляцию между Session Features (например, длительность визита, последующие действия) и качеством объявления.
    • Оценка качества клика: Для новых кликов фиксируются Session Features. Модель использует их для расчета Predictive Value – вероятности того, что это был качественный результат.
    • Агрегация и расчет шансов: Predictive Values агрегируются в базе данных на основе Ad/Query Features. Система рассчитывает, как каждый признак влияет на шансы качества (Odds).
    • Прогнозирование: При получении нового запроса система извлекает рассчитанные Odds для соответствующих Ad/Query Features и вычисляет итоговый прогноз качества для каждого объявления.

    Актуальность для SEO

    Высокая (Методологическая). Несмотря на дату подачи (2005), концепция использования пост-клик сигналов для измерения удовлетворенности пользователя является фундаментальной для современных поисковых систем и рекламных платформ (например, Quality Score в Google Ads). Методология оценки качества через поведение пользователей критически важна для SEO, хотя конкретные алгоритмы (например, logistic regression, boosted stumps) могли быть заменены более продвинутыми ML-моделями.

    Важность для SEO

    Патент имеет критическое методологическое значение для SEO (8/10). Он детально описывает, как Google измеряет удовлетворенность пользователя с помощью пост-клик сигналов (Session Features). Хотя патент сфокусирован на рекламе, он предоставляет ценнейший список поведенческих сигналов (время пребывания, индикаторы pogo-sticking, последний клик), которые с высокой вероятностью используются и в органическом поиске для оценки качества контента и удовлетворенности пользователя.

    Детальный разбор

    Термины и определения

    Ad/Query Features (Характеристики объявления/запроса)
    Признаки, связанные с конкретным объявлением или запросом. Используются для агрегации и извлечения оценок качества. Примеры: идентификатор рекламодателя (URL), целевое ключевое слово, слова в запросе, которые не были таргетированы.
    Boosted Stumps
    Техника машинного обучения. Статистическая модель, построенная путем последовательного улучшения слабых моделей (stump – простое бинарное правило).
    Logistic Regression (Логистическая регрессия)
    Статистический метод для прогнозирования вероятности события на основе независимых переменных (Session Features).
    Odds (Шансы)
    Статистическая мера вероятности события. Рассчитывается на основе агрегированных Predictive Values. Используется для финального прогнозирования качества. Связь с вероятностью (P): P = Odds / (Odds + 1).
    Odds Multiplier (Множитель шансов / Model Parameter M)
    Статистическое представление прогностической силы конкретного Ad/Query Feature.
    Predictive Value (Прогнозное значение)
    Оценка качества для одного конкретного события клика, рассчитанная статистической моделью на основе Session Features. Например, P(Good Ad | Ad Selection).
    Rated Ads (Оцененные объявления)
    Набор объявлений, для которых известна оценка качества (например, от асессоров – human raters). Используются для обучения статистической модели.
    Session Features (Характеристики сессии / Поведенческие сигналы)
    Наблюдаемое поведение пользователя до, во время и после клика. Служат индикаторами удовлетворенности. Примеры: длительность клика (dwell time), количество последующих запросов или кликов, индикатор последнего клика.
    Statistical Model (Статистическая модель)
    Математическая модель, которая изучает взаимосвязь между Session Features и качеством объявления.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает общий метод прогнозирования качества.

    1. Определение значений качества (quality values), связанных с выбором нескольких объявлений. Эти значения оценивают вероятность того, что объявления являются хорошими.
    2. Агрегирование этих значений качества.
    3. Использование агрегированных значений для прогнозирования будущей вероятности того, что другое объявление является хорошим.

    Ядро изобретения — использование агрегированных исторических данных о качестве кликов (оцененных моделью поведения) для прогнозирования качества будущих показов.

    Claim 9 (Независимый пункт): Описывает детальный процесс работы системы сбора данных и моделирования.

    1. Предоставление объявлений в ответ на поисковые запросы.
    2. Логирование поведения пользователей (user behavior / Session Features).
    3. Логирование характеристик (Ad/Query Features).
    4. Использование статистической модели и залогированного поведения для оценки показателей качества (quality scores).
    5. Агрегирование оценок качества.
    6. Прогнозирование качества другого объявления с использованием агрегированных оценок.

    Этот пункт подчеркивает роль статистической модели и логирования поведения как основы для генерации оценок качества.

    Claim 12 (Независимый пункт): Фокусируется на фазе прогнозирования в реальном времени.

    1. Получение поискового запроса и предоставление группы объявлений.
    2. Получение индикации выбора объявления пользователем (клика).
    3. Логирование (идентификация) характеристик (Ad/Query Features).
    4. Извлечение прошлых показателей качества (past quality scores, т.е. агрегированных данных или Odds) из памяти с использованием этих характеристик.
    5. Прогнозирование будущего качества выбранного объявления на основе извлеченных показателей.

    Этот пункт описывает, как система использует накопленные данные для генерации прогноза в момент показа/аукциона.

    Где и как применяется

    Важное замечание: Патент описывает исключительно систему онлайн-рекламы (аналог Google Ads), а не органический поиск. Применение описанных механизмов к органическому SEO является обоснованным предположением, основанным на общих принципах Information Retrieval.

    В контексте рекламной системы изобретение применяется на разных этапах:

    Офлайн-процессы (Подготовка данных)

    • Обучение модели: Система анализирует логи сессий и данные об оцененных объявлениях (rated ads) для построения Statistical Model.
    • Агрегация и расчет шансов: Система непрерывно обрабатывает логи кликов, применяет модель для получения Predictive Values, агрегирует их по Ad/Query Features и вычисляет Odds.

    Онлайн-процессы (Обработка запроса)

    RANKING (Рекламный аукцион)
    При получении запроса система идентифицирует релевантные объявления и их Ad/Query Features. На этом этапе извлекаются агрегированные данные (Odds) для прогнозирования качества (Predicted Ad Quality).

    RERANKING (Финальное ранжирование рекламы)
    Прогнозируемое качество (аналог Quality Score) используется для корректировки позиций в рекламной выдаче (часто в сочетании со ставками CPC).

    Сбор данных (Во время взаимодействия пользователя с выдачей)
    Система логирует Session Features в реальном времени после клика пользователя по объявлению для последующего использования в офлайн-процессах.

    Входные данные:

    • Для обучения: Данные о Rated Ads, журналы Session Features.
    • Для агрегации: Клик, измеренные Session Features, Ad/Query Features.
    • Для прогнозирования: Запрос, релевантные объявления и их Ad/Query Features, предварительно рассчитанные Odds.

    Выходные данные:

    • Statistical Model (веса признаков).
    • Predictive Values для каждого клика.
    • Odds (или Odds Multipliers) для каждого Ad/Query Feature.
    • Финальный прогноз качества объявления (Quality Parameter).

    На что влияет

    • Конкретные типы контента: Влияет исключительно на ранжирование, показ и ценообразование платных рекламных объявлений. Не влияет напрямую на органические результаты поиска.
    • Специфические запросы: Применяется ко всем запросам, по которым показывается реклама.

    Когда применяется

    • Сбор данных (Логирование): Каждый раз, когда пользователь кликает на рекламное объявление и взаимодействует с сайтом.
    • Прогнозирование: В реальном времени, каждый раз, когда происходит рекламный аукцион.
    • Обучение и расчет Odds: Периодически в офлайн-режиме.

    Пошаговый алгоритм

    Система состоит из трех основных процессов.

    Процесс А: Построение статистической модели (Обучение) (Офлайн)

    1. Сбор данных об оценках: Получение ratings data для набора rated ads (от асессоров).
    2. Сбор поведенческих данных: Получение Session Features, связанных с кликами по этим оцененным объявлениям (из логов).
    3. Построение модели: Использование статистических методов (например, logistic regression или boosted stumps) для вывода модели, которая определяет вероятность P(Good Ad | Ad Selection) как функцию от Session Features. Модель определяет, какие признаки коррелируют с качеством.

    Процесс Б: Агрегация данных и расчет шансов (Постоянный/Офлайн)

    1. Получение данных о клике: Фиксация клика по объявлению и связанных с ним Session Features и Ad/Query Features.
    2. Расчет прогнозного значения: Применение Statistical Model (из Процесса А) к Session Features для определения Predictive Value.
    3. Агрегация: Суммирование полученных Predictive Values с уже накопленными значениями в базе данных для каждого соответствующего Ad/Query Feature.
    4. Расчет шансов (Odds Estimation): Итеративный процесс пересчета шансов (Odds) или множителей шансов (Odds Multipliers) для каждого Ad/Query Feature на основе агрегированных данных. Это включает расчет self-excluding probability и использование доверительных интервалов (confidence intervals) для стабилизации оценок.

    Процесс В: Прогнозирование качества в реальном времени (Онлайн)

    1. Получение запроса и отбор кандидатов: Система получает запрос и определяет релевантные объявления.
    2. Идентификация характеристик: Для каждой пары запрос-объявление определяются все соответствующие Ad/Query Features (i).
    3. Извлечение шансов: Из базы данных извлекаются сохраненные Odds (ODDSi) (рассчитанные в Процессе Б) для каждой характеристики.
    4. Комбинирование шансов: Извлеченные Odds перемножаются для получения общего значения шансов (Total Odds, ODDSt): ODDSt = ODDS1 * ODDS2 * ODDS3…
    5. Расчет вероятности: Общее значение шансов конвертируется в итоговую вероятность (Quality Parameter P): P = ODDSt / (1 + ODDSt).

    Какие данные и как использует

    Данные на входе

    Ключевым элементом патента является использование обширного набора поведенческих факторов (Session Features).

    • Поведенческие факторы (Session Features): Основной источник данных для оценки удовлетворенности.
      • Длительность клика (Dwell Time): Время от клика до следующего действия пользователя («duration of the ad selection»). Также используются соотношения к средним значениям.
      • Индикаторы Pogo-sticking: Количество кликов по другим объявлениям или органическим результатам до/после данного клика.
      • Уточнение запросов: Количество поисковых запросов до/после данного клика; время до следующего запроса.
      • Активность в сессии: Общее количество просмотров страниц; количество запросов, показавших рекламу (индикатор коммерческого намерения).
      • Повторные клики: Количество повторных выборов того же объявления.
      • Индикаторы завершения задачи (Last Click): Являлся ли данный клик последним кликом (или последним кликом по рекламе) для данного запроса или сессии.
      • Конверсии: Была ли совершена конверсия после клика.
    • Системные факторы (Ad/Query Features): Используются для агрегации.
      • Идентификатор рекламодателя (URL).
      • Целевое ключевое слово и тип соответствия.
      • Слова в запросе, которые не были таргетированы.
    • Контекстные и Пользовательские факторы: Упоминаются как возможные Session Features для нормализации данных.
      • Скорость соединения пользователя.
      • Страна/регион пользователя.
    • Финансовые и Метрические факторы:
      • Предполагаемый CTR.
      • Ставка и фактическая цена CPC (Cost Per Click).

    Какие метрики используются и как они считаются

    • Statistical Model (Logistic Regression): Используется для определения вероятности качества. Формула предсказывает вероятность P на основе линейной комбинации признаков X и коэффициентов C: P = exp(y)/(1+exp(y)), где y=C0+C1*X1+C2*X2+….
    • Statistical Model (Boosted Stumps): Альтернативная модель ML, использующая последовательность бинарных правил для предсказания вероятности.
    • Predictive Value: Выход статистической модели для одного клика (P(Good Ad | Ad Selection)).
    • Odds Multiplier (M) / Model Parameter: Множитель шансов для конкретного Ad/Query Feature. Рассчитывается итеративно с использованием self-excluding probability и confidence intervals, чтобы определить статистически значимое влияние этого признака на качество.
    • Total Odds (ODDSt): Итоговые шансы качества объявления. Рассчитываются путем перемножения Odds Multipliers всех применимых Ad/Query Features: ODDSt = ODDS1 * ODDS2 * ODDS3….
    • Quality Parameter (P): Финальная прогнозируемая вероятность качества. Конвертация из Total Odds: P = ODDSt / (1 + ODDSt).

    Выводы

    1. Приоритет пост-клик поведения над CTR: Патент подтверждает, что удовлетворенность пользователя после клика является более надежной метрикой качества, чем сам факт клика (CTR). Система разработана для выявления и понижения результатов с высоким CTR, но низкой удовлетворенностью.
    2. Детализация поведенческих сигналов (Session Features): Патент предоставляет обширный список конкретных поведенческих сигналов, которые Google считает индикаторами удовлетворенности. Ключевые из них: длительность визита (Dwell Time), количество последующих действий (индикаторы Pogo-sticking) и индикаторы завершения задачи (Last Click).
    3. Сложное статистическое моделирование удовлетворенности: Google использует продвинутые статистические методы (logistic regression, boosted stumps), обученные на человеческих оценках, для определения веса и взаимосвязи различных поведенческих сигналов при оценке качества.
    4. Контекстная зависимость качества: Качество не является абсолютной величиной. Система агрегирует и извлекает оценки качества на основе конкретного контекста, определяемого Ad/Query Features (кто рекламодатель, какое ключевое слово, каков точный запрос).
    5. Методологическая значимость для органического SEO: Хотя патент описывает рекламную систему, используемая методология (оценка качества через анализ пост-клик поведения) и конкретные Session Features крайне важны для понимания того, как Google может оценивать качество органических результатов поиска.

    Практика

    Best practices (это мы делаем)

    Хотя патент относится к рекламе, его методология дает критически важные инсайты для органического SEO.

    • Оптимизация под удовлетворенность пользователя (Post-Click Experience): Ключевой фокус должен быть на качестве целевой страницы. Контент должен полностью удовлетворять интент пользователя, стоящий за запросом и обещанный в сниппете. Это напрямую влияет на Session Features.
    • Максимизация позитивных поведенческих сигналов: Стратегия должна быть направлена на увеличение времени пребывания на странице (Dwell Time) и достижение сценария «Последнего клика» (Last Click), когда пользователь находит ответ и завершает поиск. Это достигается глубиной контента, хорошим UX и вовлекающей структурой.
    • Минимизация негативных сигналов (Pogo-sticking): Необходимо предотвращать быстрое возвращение пользователя на SERP для клика по другим результатам или уточнения запроса. Это индикатор неудовлетворенности, описанный в патенте как ключевые Session Features (количество последующих кликов/запросов).
    • Анализ поведенческих метрик: Тщательно анализируйте Bounce Rate (в контексте возврата к SERP), Time on Page и пути пользователей как прокси для Session Features, чтобы понять, насколько хорошо страницы удовлетворяют интент.

    Worst practices (это делать не надо)

    • Использование кликбейта (Clickbait): Оптимизация Title и Description исключительно для повышения CTR без предоставления соответствующего качественного контента. Этот патент описывает механизм, который напрямую борется с такой практикой, анализируя поведение после клика.
    • Создание поверхностного контента (Shallow Content): Контент, который формально релевантен запросу, но не решает задачу пользователя, вынуждая его искать информацию в других источниках. Это генерирует негативные Session Features.
    • Игнорирование UX и скорости загрузки: Плохой пользовательский опыт или медленная загрузка (упомянутая в патенте как контекстуальный фактор «connection speed»), которые приводят к быстрому отказу от страницы, независимо от качества самого контента.

    Стратегическое значение

    Патент подтверждает фундаментальную важность сигналов пользовательского взаимодействия и удовлетворенности для алгоритмов ранжирования Google. Он демонстрирует, что оценка качества выходит далеко за рамки традиционных факторов (текст, ссылки) и фокусируется на реальном опыте пользователя на целевой странице. Долгосрочная SEO-стратегия должна быть сосредоточена на создании контента, который действительно решает задачи пользователей и генерирует позитивные поведенческие сигналы (Session Features).

    Практические примеры

    Сценарий: Оптимизация информационной статьи для улучшения поведенческих сигналов

    1. Проблема: Информационная статья имеет высокий CTR, но анализ показывает высокий Bounce Rate и низкое время на странице. Предполагается, что пользователи возвращаются в выдачу (pogo-sticking).
    2. Анализ (в терминах патента): Страница генерирует негативные Session Features: короткая длительность клика (short duration) и, вероятно, провоцирует последующие клики по другим результатам (subsequent search result selections).
    3. Действия:
      • Проверить соответствие сниппета содержанию страницы (устранить кликбейт).
      • Увеличить глубину контента, добавить ответы на смежные вопросы, чтобы полностью закрыть интент.
      • Улучшить UX: разбить текст, добавить визуальные элементы, улучшить навигацию для удержания внимания.
      • Добавить четкие CTA или ссылки на следующий шаг, чтобы визит не заканчивался возвратом в SERP.
    4. Ожидаемый результат: Увеличение длительности клика и вероятности того, что этот клик станет последним в поисковой сессии пользователя. Система зафиксирует улучшение Session Features, что положительно скажется на оценке качества страницы.

    Вопросы и ответы

    Этот патент описывает органический поиск или Google Ads?

    Патент явно описывает систему прогнозирования качества рекламы (Predicting Ad Quality), что соответствует механизму Quality Score в Google Ads. Однако методология, основанная на анализе поведения пользователей после клика для оценки удовлетворенности, является универсальной и крайне важной для понимания принципов работы органического поиска Google.

    Что такое «Session Features» и почему они важны?

    Session Features – это наблюдаемые действия пользователя до, во время и после клика. Они важны, потому что служат индикаторами удовлетворенности пользователя целевой страницей. В отличие от CTR, который измеряет интерес до клика, Session Features (например, время пребывания, последующие действия) измеряют реальную ценность контента после клика.

    Доказывает ли этот патент, что Google использует Dwell Time (время пребывания) для органического ранжирования?

    Напрямую нет, так как патент относится к рекламе. Однако он детально описывает измерение «Duration of ad selection» (длительность клика) как один из ключевых Session Features для оценки качества. Это является очень сильным свидетельством того, что Google обладает технологией и считает этот сигнал важным индикатором удовлетворенности, что делает его вероятным фактором и в органическом поиске.

    Какое поведение пользователя указывает на «хороший» результат согласно патенту?

    Патент не дает прямых определений, но перечисляет Session Features, которые используются моделью. Исходя из логики системы, позитивными сигналами являются: большая длительность клика (long dwell time), повторные клики на тот же результат и сценарий, когда клик является последним в сессии или по данному запросу (Last Click), что указывает на успешное завершение задачи.

    Какое поведение указывает на «плохой» результат (pogo-sticking)?

    Негативными сигналами (индикаторами pogo-sticking) являются: короткая длительность клика и последующая активность пользователя на странице выдачи. Патент явно упоминает измерение количества кликов по другим объявлениям или органическим результатам после данного клика, а также количество последующих поисковых запросов.

    Что такое «Статистическая модель», используемая в патенте?

    Это математическая модель, обученная на данных, чтобы предсказывать вероятность того, что результат является качественным, основываясь на Session Features. Патент упоминает конкретные методы, такие как logistic regression (логистическая регрессия) и boosted stumps (бустинг над решающими пнями), которые являются стандартными методами машинного обучения.

    Как Google узнает изначальное качество объявлений для обучения модели?

    Для обучения модели система использует Rated Ads – объявления, для которых уже известны рейтинги качества. В патенте указано, что эти рейтинги могут быть получены от людей-оценщиков (human raters), которые оценивают релевантность и качество рекламы.

    Что такое «Ad/Query Features»?

    Это характеристики конкретного объявления или запроса, например, URL рекламодателя, целевое ключевое слово или слова в тексте запроса. Они используются не для оценки качества клика, а для агрегации данных. Система накапливает статистику качества для конкретных комбинаций этих характеристик.

    Актуален ли этот патент, если он подан в 2005 году?

    Методологически он крайне актуален. Принцип измерения качества через анализ пост-клик поведения является основой современных систем. Хотя конкретные алгоритмы машинного обучения, вероятно, эволюционировали (например, к нейронным сетям), фундаментальный подход и типы используемых сигналов (Session Features) остаются релевантными.

    Как я могу применить эти знания в стратегии органического контента?

    Необходимо сместить фокус с оптимизации под CTR на оптимизацию под удовлетворенность пользователя. Создавайте контент, который полностью решает задачу пользователя, удерживает его внимание (увеличивает Dwell Time) и не заставляет возвращаться в поиск (минимизирует Pogo-sticking). Качество целевой страницы должно быть приоритетом.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.