Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует поведенческие факторы и машинное обучение для определения удовлетворенности пользователя после клика

    USING ESTIMATED AD QUALITIES FOR AD FILTERING, RANKING AND PROMOTION (Использование оценок качества рекламы для фильтрации, ранжирования и продвижения рекламы)
    • US8429012B2
    • Google LLC
    • 2013-04-23
    • 2005-12-30
    2005 EEAT и качество Патенты Google Поведенческие сигналы

    Google использует методологию оценки качества, основанную не только на CTR, а на анализе поведения пользователя после клика («Session Features»). Система применяет статистические модели для прогнозирования удовлетворенности пользователя (P(Good Ad)). Хотя патент описывает рекламу, методы анализа поведенческих сигналов (Dwell Time, Pogo-sticking) критически важны для понимания оценки качества в органическом поиске.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неточности использования Click-Through Rate (CTR) как основного показателя качества рекламы. CTR измеряет привлекательность рекламного объявления (creative), но не отражает удовлетворенность пользователя после перехода на целевую страницу (landing document). Высокий CTR может быть у рекламы с кликбейтным заголовком, но плохим лендингом. Изобретение предлагает метод оценки истинного качества рекламного взаимодействия, основанный на поведении пользователя после клика.

    Что запатентовано

    Запатентована система, которая оценивает качество рекламы (Ad Quality) независимо от CTR, используя статистическое моделирование поведения пользователя. Система анализирует различные действия пользователя («Session Features») до, во время и после клика по рекламе. На основе этих данных вычисляются параметры качества, такие как вероятность того, что реклама хорошая (P(Good Ad)) или плохая (P(Bad Ad)). Эти параметры затем используются для фильтрации, ранжирования и продвижения рекламы.

    Как это работает

    Система работает в несколько этапов:

    • Обучение модели: Собираются данные о кликах по рекламе, которая имеет известные оценки качества (например, от асессоров – Ad Ratings Data). Для этих кликов измеряются Session Features (например, время на лендинге, последующие клики, следующие запросы).
    • Построение модели: Используя статистические методы (например, логистическую регрессию или boosted stumps), строится модель, которая связывает Session Features с вероятностью того, что реклама является качественной.
    • Применение модели: Для новых кликов система измеряет Session Features и использует модель для прогнозирования качества рекламы (Predicted Ad Quality Value).
    • Ранжирование/Фильтрация: Полученные оценки качества комбинируются с другими параметрами (например, CTR и CPC – ставка за клик) для определения итогового рейтинга рекламы (Ad Rank) или ее отключения.

    Актуальность для SEO

    Высокая. Описанная методология лежит в основе системы Google Ads Quality Score. Для SEO актуальность также высока, поскольку патент детально описывает, как Google статистически интерпретирует поведенческие сигналы (Session Features) для оценки удовлетворенности пользователя. Эти же принципы и методологии применяются для оценки качества результатов органического поиска.

    Важность для SEO

    Патент имеет критическое значение для понимания принципов работы поиска, несмотря на то, что он напрямую описывает рекламную систему (Ads), а не органический поиск (SEO). Он детально раскрывает методологию, которую Google использует для статистического анализа поведенческих факторов (Dwell Time, Pogo-sticking, последующие действия) с целью определения, был ли пользователь удовлетворен результатом клика. Понимание этих Session Features и их роли в машинном обучении позволяет SEO-специалистам понять, как Google оценивает качество контента через призму пользовательского опыта.

    Детальный разбор

    Термины и определения

    Ad/Query Features (Признаки Рекламы/Запроса)
    Атрибуты конкретного показа рекламы, связанные как с самой рекламой, так и с запросом, который ее вызвал (например, URL рекламодателя, ключевое слово, тип соответствия, длина запроса).
    Ad Ratings Data (Данные оценок рекламы)
    Данные, сгенерированные людьми-оценщиками (асессорами), которые оценивают качество рекламных объявлений. Используются для обучения статистической модели.
    Boosted Stumps
    Техника машинного обучения, упомянутая для построения статистической модели путем последовательного улучшения слабой модели.
    CPC (Cost Per Click)
    Стоимость клика. Сумма, которую рекламодатель готов заплатить за клик по его рекламе.
    CTR (Click-Through Rate)
    Показатель кликабельности. Отношение числа кликов на рекламу к числу ее показов.
    P(Bad Ad) / PBAD AD
    Вероятность того, что реклама является низкокачественной или неудовлетворительной для пользователя, вычисленная на основе Session Features.
    P(Good Ad) / PGOOD AD
    Вероятность того, что реклама является высококачественной или удовлетворительной для пользователя, вычисленная на основе Session Features.
    Quality Parameter (QP) (Параметр качества)
    Метрика, оценивающая качество рекламы, которая, согласно патенту, не включает CTR. В патенте это часто P(Good Ad) или P(Bad Ad).
    Session Features (Признаки сессии / Поведенческие факторы)
    Наблюдаемые действия пользователя до, во время и после клика по рекламе в рамках одной сессии. Ключевые индикаторы удовлетворенности пользователя (например, Dwell Time, Pogo-sticking, последующие запросы).
    Statistical Model (Статистическая модель)
    Математическая модель (например, логистическая регрессия), обученная на Ad Ratings Data для прогнозирования качества на основе Session Features.

    Ключевые утверждения (Анализ Claims)

    Анализ основан на Claims патента US8429012B2 (который является продолжением (continuation) более ранней заявки).

    Claim 1 (Независимый пункт): Описывает основной метод ранжирования рекламы с использованием поведенческих данных.

    1. Система определяет первый поведенческий признак (Session Feature), связанный с кликом на первое объявление.
    2. Система определяет второй поведенческий признак, связанный с кликом на второе объявление.
    3. Определяется соответствие между первым и вторым признаками.
    4. Получается первый параметр качества (QP1) для второго объявления на основе первого поведенческого признака. QP1 представляет собой вероятность определенного уровня качества.
    5. Система умножает QP1 на CTR второго объявления и на CPC второго объявления для получения результата (итогового рейтинга).
    6. Второе объявление ранжируется среди других на основе этого результата.
    7. Объявление предоставляется пользователю на основе ранжирования.

    Ядро изобретения — использование вероятности качества, выведенной из поведенческих факторов (QP1), как множителя для стандартных рекламных метрик (CTR и CPC) при определении ранга.

    Claim 3 (Зависимый): Детализирует типы Session Features.

    Указывает, что измеряемые признаки сессии (Session Features) включают как минимум два из следующего списка: длительность клика, количество кликов по другим объявлениям/результатам/другим типам результатов, количество просмотров документов, количество последующих запросов, повторные клики, индикатор последнего клика в сессии/по запросу.

    Claims 5, 6, 9 (Зависимые): Детализируют применение результата.

    Указывают, что результат умножения (QP1 * CTR * CPC) также может использоваться для сравнения с пороговым значением (threshold) для принятия решения о фильтрации (отключении) или продвижении (promotion) объявления.

    Где и как применяется

    Патент описывает инфраструктуру системы онлайн-рекламы (Google Ads). Однако методология анализа поведения пользователей применима к разным этапам поиска.

    INDEXING – Индексирование (Применительно к анализу поведения)
    На этом этапе (или в аналогичных офлайн-процессах) происходит сбор и агрегация данных о поведении пользователей (Session Features), а также обучение статистической модели на основе этих данных и оценок качества (Ad Ratings Data).

    RANKING – Ранжирование (Рекламный аукцион)
    Основное применение патента. Во время рекламного аукциона система вычисляет или извлекает параметры качества (QP, например, P(Good Ad)) для релевантных объявлений. Эти параметры используются в формуле ранжирования вместе с CTR и ставкой (CPC) для определения позиции объявления.

    RERANKING – Переранжирование (Фильтрация и Продвижение)
    После основного ранжирования система может применять фильтры (disabling) для отключения рекламы, если комбинация ее параметров качества и CTR ниже определенного порога. Также система может продвигать (promote) рекламу в более заметные блоки (например, над результатами поиска), если ее показатели качества превышают порог.

    Входные данные:

    • Данные для обучения: Оценки качества рекламы (Ad Ratings Data), логи поведения пользователей (Session Features).
    • Данные для применения: CTR рекламы, CPC рекламы, Ad/Query Features, рассчитанные Odds для этих признаков.

    Выходные данные:

    • Статистическая модель, прогнозирующая качество.
    • Параметры качества (P(Good Ad), P(Bad Ad)).
    • Итоговый рейтинг рекламы (Ad Rank), решение о фильтрации или продвижении.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на рекламные объявления (текстовые, товарные). Косвенно методология влияет на любой контент, качество которого оценивается по поведенческим сигналам, включая органические результаты.
    • Специфические запросы: Влияет на все запросы, по которым показывается реклама.

    Когда применяется

    • Триггеры активации: Алгоритмы ранжирования и фильтрации активируются при каждом показе рекламы (в ответ на запрос или загрузку страницы с рекламными блоками).
    • Временные рамки: Обучение модели и агрегация данных происходят офлайн или в фоновом режиме. Применение формул ранжирования происходит в реальном времени во время аукциона.

    Пошаговый алгоритм

    Процесс состоит из трех основных частей: Обучение модели, Агрегация данных и Ранжирование в реальном времени.

    Процесс А: Обучение статистической модели (Офлайн)

    1. Сбор данных: Получение оценок качества (Ad Ratings Data) для набора рекламных объявлений.
    2. Измерение признаков: Получение (из логов) Session Features, связанных с кликами по этой рекламе.
    3. Деривация модели: Построение статистической модели (например, с помощью логистической регрессии или Boosted Stumps), которая определяет вероятность P(Good Ad | Ad Selection) и/или P(Bad Ad | Ad Selection) как функцию от Session Features.
    4. Тестирование модели: Определение, какие Session Features наиболее коррелируют с хорошим или плохим качеством рекламы.

    Процесс Б: Агрегация и расчет ODDS (Офлайн/Фоновый режим)

    1. Получение данных о клике: Для каждого клика по рекламе определяются связанные с ним Ad/Query Features (например, URL рекламодателя, ключевое слово).
    2. Расчет прогнозных значений: Применение Модели (из Процесса А) к Session Features этого клика для получения P(Good Ad) и P(Bad Ad).
    3. Агрегация: Суммирование этих прогнозных значений по каждому Ad/Query Feature в базе данных.
    4. Расчет ODDS: Итеративный расчет шансов (Odds) того, что реклама хорошая или плохая, для каждого конкретного Ad/Query Feature на основе агрегированных данных (используя методы, описанные в патенте, такие как self-excluding probability).

    Процесс В: Применение в реальном времени (Аукцион)

    1. Получение запроса: Система получает запрос пользователя.
    2. Идентификация рекламы: Определяется набор релевантных рекламных объявлений.
    3. Определение признаков: Для каждой пары Реклама/Запрос определяются все соответствующие Ad/Query Features.
    4. Извлечение ODDS: Из базы данных извлекаются сохраненные ODDS (рассчитанные в Процессе Б) для каждого признака.
    5. Расчет итогового качества: Перемножение всех извлеченных ODDS для получения итогового шанса и преобразование его в итоговые вероятности P(Good Ad) и P(Bad Ad) для данного показа (это и есть Quality Parameter, QP).
    6. Применение формул: Использование рассчитанных параметров качества (QP) в функциях ранжирования, фильтрации или продвижения. Например, расчет рейтинга: Rank = P(Good Ad) * CTR * CPC.
    7. Вывод результата: Показ отранжированной и отфильтрованной рекламы пользователю.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании поведенческих данных для оценки качества.

    • Поведенческие факторы (Session Features): Это ключевые данные патента. Примеры включают (но не ограничиваются):
      • Длительность клика (Dwell Time) – время от клика до следующего действия.
      • Количество кликов по другим объявлениям до/после данного клика.
      • Количество кликов по результатам поиска до/после данного клика (включая Pogo-sticking).
      • Количество просмотренных документов (page views) до/после клика.
      • Количество последующих запросов (Query Reformulation).
      • Количество повторных кликов по тому же объявлению.
      • Является ли клик последним в сессии или последним по данному запросу (Last Click).
      • Соотношение длительности клика к средней длительности кликов пользователя.
      • Время от клика до ввода следующего запроса.
    • Временные факторы: Длительность сессии, время между действиями.
    • Пользовательские факторы: Скорость соединения пользователя, страна/регион пользователя (для учета различий в поведении).
    • Системные данные (для ранжирования): CTR (Click-Through Rate), CPC (Cost Per Click – ставка рекламодателя).
    • Данные для обучения: Оценки качества рекламы (Ad Ratings Data), предоставленные людьми (асессорами), или данные о конверсиях.

    Какие метрики используются и как они считаются

    • P(Good Ad | Ad Selection) и P(Bad Ad | Ad Selection): Вероятности, вычисляемые статистической моделью. Например, с помощью логистической регрессии (Eqn. 3, 4, 5), где вероятность является функцией от взвешенной суммы Session Features.
    • ODDS (Шансы): Соотношение вероятности наступления события к вероятности его не наступления (P/(1-P)). Используются для удобства агрегации данных по различным Ad/Query Features. Итоговые ODDS рассчитываются путем перемножения ODDS отдельных признаков.
    • Ad Rank (Рейтинг рекламы): Итоговая оценка для ранжирования. Примеры формул:
      • Простая (Eqn. 9): RANK = P(Good Ad) * CTR * CPC.
      • Сложная (Eqn. 10): Учитывает краткосрочный доход (CTR * CPC) плюс долгосрочную выгоду от показа хорошей рекламы (ValueOfGoodAdToUser) минус долгосрочные потери от показа плохой рекламы (CostOfBadAdToUser).
    • Фильтры и Пороги: Сравнение метрик с пороговыми значениями (Threshold T) для принятия решений о фильтрации или продвижении. Например, фильтрация, если P(Good Ad) * CTR < T.

    Выводы

    1. Разделение Качества Клика и Качества Опыта: Google четко разделяет привлекательность сниппета/объявления (измеряемую через CTR) и удовлетворенность пользователя после клика (измеряемую через Session Features). Качество опыта является отдельным, вычисляемым фактором.
    2. Поведенческие сигналы как основа оценки качества: Патент подтверждает, что Google использует сложные статистические модели, основанные на машинном обучении, для интерпретации поведения пользователей. Dwell Time, Pogo-sticking, последующие запросы и другие Session Features являются входными данными для этих моделей.
    3. Методология универсальна: Хотя патент применяется к системе Ads (для расчета Quality Score), описанная методология оценки удовлетворенности пользователя через анализ Session Features является универсальной и фундаментальной для понимания того, как Google оценивает качество органических результатов поиска.
    4. Цель – долгосрочная удовлетворенность: Система стремится максимизировать не только немедленный доход от кликов, но и долгосрочную лояльность пользователей, штрафуя плохой опыт (CostOfBadAdToUser) и поощряя хороший (ValueOfGoodAdToUser).
    5. Агрегация данных по признакам: Система агрегирует данные о качестве не только на уровне конкретного объявления, но и на уровне различных признаков (Ad/Query Features), таких как рекламодатель или тип запроса, что позволяет обобщать оценки качества.

    Практика

    Best practices (это мы делаем)

    Хотя патент относится к рекламе, его методология дает критически важные инсайты для SEO.

    • Фокус на полном удовлетворении интента: Контент должен полностью решать задачу пользователя. Если пользователь уходит с вашего сайта и продолжает поиск по той же теме (последующие запросы, клики по другим результатам), это является негативным Session Feature, указывающим на низкое качество вашего контента для этого пользователя.
    • Оптимизация под положительные Session Features: Необходимо стремиться к увеличению Dwell Time (времени на сайте после клика) и к тому, чтобы ваш результат стал последним кликом в сессии (Last Click) по данному интенту. Это достигается за счет глубины контента, удобства навигации и предоставления исчерпывающей информации.
    • Соответствие сниппета и контента: Убедитесь, что заголовок (Title) и описание (Description) точно соответствуют содержанию страницы. Привлечение клика (высокий CTR) при низком качестве опыта (негативные Session Features) приведет к понижению рейтинга, аналогично тому, как это описано для рекламы.
    • Анализ Pogo-sticking: Минимизируйте быстрые возвраты на выдачу. Если пользователь кликает на ваш сайт и тут же возвращается к SERP, это сильный сигнал неудовлетворенности. Это может быть вызвано медленной загрузкой, плохим дизайном, всплывающими окнами или нерелевантным контентом.

    Worst practices (это делать не надо)

    • Кликбейт и обман ожиданий: Использование заголовков, которые привлекают трафик, но не соответствуют содержанию страницы. Система обнаружит неудовлетворенность через поведенческие факторы (короткий клик, возврат на выдачу) и классифицирует опыт как низкокачественный.
    • Игнорирование пользовательского опыта (UX/UI): Создание страниц, которые технически оптимизированы под ключевые слова, но неудобны для пользователя, что вынуждает его быстро покинуть сайт.
    • Фокус только на привлечении клика (CTR): Стратегии, направленные исключительно на повышение CTR без работы над качеством целевой страницы, обречены на провал в долгосрочной перспективе, так как система учитывает оба фактора.

    Стратегическое значение

    Этот патент является одним из наиболее важных для понимания роли поведенческих факторов в ранжировании. Он детально описывает инфраструктуру и методологию (машинное обучение на Session Features), которую Google использует для оценки качества через призму удовлетворенности пользователя. Стратегическое значение для SEO заключается в подтверждении того, что удовлетворение интента и качественный пользовательский опыт являются измеримыми факторами ранжирования. Долгосрочная SEO-стратегия должна быть сфокусирована на создании контента, который генерирует положительные поведенческие сигналы.

    Практические примеры

    Сценарий: Оценка качества органического результата с использованием методологии патента

    Предположим, Google применяет аналогичную модель для оценки органических результатов.

    1. Запрос: Пользователь вводит «как завязать галстук виндзорским узлом».
    2. Клик 1 (Сайт А): Пользователь кликает на Сайт А. Страница содержит много текста и одно маленькое изображение. Пользователь проводит на сайте 15 секунд (Session Feature: Short Dwell Time), возвращается на выдачу (Session Feature: Pogo-sticking).
    3. Клик 2 (Сайт Б): Пользователь кликает на Сайт Б. Страница содержит пошаговую видеоинструкцию и четкую схему. Пользователь проводит на сайте 3 минуты (Session Feature: Long Dwell Time) и закрывает вкладку, не возвращаясь к поиску (Session Feature: Last Click).
    4. Анализ Моделью: Статистическая модель, обученная на миллионах подобных взаимодействий, обработает Session Features.
    5. Результат: Модель присвоит Сайту А высокую вероятность P(Bad Result), а Сайту Б – высокую вероятность P(Good Result).
    6. Влияние на Ранжирование: Эти оценки качества будут использованы как фактор ранжирования, что приведет к повышению позиций Сайта Б и понижению Сайта А по этому запросу.

    Вопросы и ответы

    Патент описывает систему рекламы (Ads). Применим ли он к органическому поиску (SEO)?

    Напрямую нет. Патент описывает расчет Quality Score для рекламы и его использование в аукционе вместе с CPC и CTR. Однако методология оценки удовлетворенности пользователя через анализ поведенческих факторов (Session Features) и машинное обучение является универсальной. Крайне вероятно, что Google использует аналогичные подходы для оценки качества органических результатов.

    Что такое «Session Features» и почему они важны для SEO?

    Session Features – это наблюдаемые действия пользователя в рамках поисковой сессии: длительность клика (Dwell Time), возврат на выдачу (Pogo-sticking), последующие клики, ввод новых запросов, является ли клик последним. Для SEO это критически важно, так как эти сигналы используются статистической моделью для определения, решил ли контент задачу пользователя или нет.

    Как система определяет, является ли реклама (или результат поиска) хорошей или плохой?

    Система не определяет это напрямую. Она использует статистическую модель, обученную на примерах с известными оценками качества (Ad Ratings Data). Модель анализирует комбинацию Session Features и вычисляет вероятность того, что данный опыт был положительным (P(Good Ad)) или отрицательным (P(Bad Ad)), основываясь на паттернах поведения, которые коррелируют с удовлетворенностью.

    Значит ли это, что CTR больше не важен?

    Нет, CTR по-прежнему очень важен. В патенте показано, что итоговый рейтинг является функциональной комбинацией Качества (QP) и CTR (например, QP * CTR * CPC). Высокий CTR при низком качестве опыта (плохие Session Features) может привести к пессимизации. Идеальный сценарий – высокий CTR и высокое качество опыта.

    Какие поведенческие факторы, согласно патенту, наиболее важны?

    Патент перечисляет множество факторов (Claim 3), не указывая их веса, так как веса определяются моделью машинного обучения. Ключевые из них: длительность клика, количество последующих кликов по другим результатам/рекламе, количество последующих запросов, а также является ли клик последним в сессии или по данному запросу.

    Как измеряется «длительность клика» (Dwell Time)?

    Патент определяет это как период времени от выбора объявления до следующего действия пользователя (например, клик по другому объявлению, ввод нового запроса, возврат на страницу выдачи). Это ключевой показатель вовлеченности пользователя в контент целевой страницы.

    Что такое логистическая регрессия в контексте этого патента?

    Это один из методов машинного обучения, используемый для построения статистической модели. Она позволяет предсказать вероятность бинарного исхода (Хорошо/Плохо) на основе нескольких независимых переменных (Session Features). Модель определяет, как изменение каждого фактора влияет на итоговую вероятность.

    Как SEO-специалист может повлиять на эти Session Features?

    Необходимо сфокусироваться на качестве пользовательского опыта и полном удовлетворении интента. Создавайте глубокий, полезный контент, улучшайте скорость загрузки и юзабилити сайта. Цель – сделать так, чтобы пользователь нашел нужную информацию, провел на сайте достаточно времени и не возвращался к поиску для решения той же задачи.

    Учитывает ли система разницу в поведении пользователей?

    Да, патент упоминает возможность учета таких факторов, как скорость соединения пользователя (пользователи с медленным интернетом могут иметь более длительные клики) и страна/регион пользователя (для учета культурных различий в поведении). Также упоминается возможность расчета соотношения длительности клика к средней длительности кликов данного пользователя.

    Что такое ValueOfGoodAdToUser и CostOfBadAdToUser?

    Это параметры, отражающие долгосрочную выгоду или потерю дохода для Google от показа хорошей или плохой рекламы (Eqn. 10). Показ плохой рекламы снижает доверие пользователя и вероятность будущих кликов. Это подтверждает, что Google оптимизирует систему под долгосрочную лояльность, а не только под сиюминутную прибыль, штрафуя плохой пользовательский опыт.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.