Google измеряет, как долго пользователи остаются на сайте в течение сессии, и сравнивает эту продолжительность с эталонными показателями, специфичными для категорий сайта. Эта нормализованная оценка (Duration Performance Score) позволяет объективно оценить вовлеченность. Система также явно повышает ценность сессий, возникающих в результате прямых переходов, и фильтрует шум от последнего клика.
Описание
Какую задачу решает
Патент решает проблему использования «сырых» поведенческих метрик (таких как продолжительность сессии) в качестве универсального сигнала качества. Ожидаемое время взаимодействия сильно зависит от тематики (категории) сайта: 30 секунд на сайте погоды могут быть хорошим показателем, а 30 секунд на сайте с аналитическими статьями — плохим. Изобретение создает механизм нормализации этих данных, позволяя справедливо сравнивать производительность сайтов в контексте их специфических категорий.
Что запатентовано
Запатентована система для расчета Duration Performance Score (DPS) — нормализованной оценки качества сайта, основанной на вовлеченности пользователей. Система измеряет среднюю продолжительность сессий на сайте (Website Duration Score, WDS) и сравнивает ее с эталонными показателями для категорий, к которым принадлежит сайт (Cross-Website Category Duration Score, CWCDS). Итоговый DPS отражает, насколько сайт эффективнее (или хуже) конкурентов в своих нишах, с учетом важности этих ниш для сайта (Category Weight).
Как это работает
Система работает следующим образом:
- Сбор данных: Измеряется продолжительность пользовательских сессий на сайте (последовательность посещений ресурсов одного сайта без перехода на другой).
- Расчет WDS: Вычисляется агрегированный показатель продолжительности для сайта (WDS). При этом применяются корректировки: повышение веса (boosting) для сессий, инициированных прямым вводом адреса, и игнорирование (discounting) продолжительности последнего просмотра перед уходом с сайта.
- Бенчмаркинг (CWCDS): Для каждой категории в интернете вычисляется эталонный показатель продолжительности.
- Сравнение (CDS): WDS сайта сравнивается с эталонами (CWCDS) его категорий. Результат взвешивается по релевантности категории (Category Weight), формируя Category Duration Score (CDS).
- Агрегация (DPS): Все CDS сайта агрегируются в финальную оценку DPS, например, путем подсчета количества категорий, в которых сайт превышает порог.
Актуальность для SEO
Высокая. Оценка удовлетворенности пользователей и нормализация поведенческих сигналов являются фундаментальными задачами современных поисковых систем. Этот патент описывает сложный и контекстуальный подход к измерению вовлеченности. Участие Navneet Panda указывает на тесную связь этого механизма с основными алгоритмами оценки качества Google (например, Helpful Content System).
Важность для SEO
Патент имеет высокое значение (8.5/10). Он предоставляет детальное описание того, как Google может оценивать поведенческие сигналы на уровне сайта. Он подчеркивает, что важна не абсолютная продолжительность сессии, а относительная эффективность по сравнению с конкурентами в той же категории. Кроме того, он явно подтверждает, что вовлеченность от прямого (Direct/Brand) трафика ценится выше, чем от поискового.
Детальный разбор
Термины и определения
- Category Duration Score (CDS) (Оценка продолжительности по категории)
- Оценка для конкретного сайта в рамках конкретной категории. Рассчитывается путем сравнения WDS сайта с CWCDS категории и корректируется с помощью Category Weight.
- Category Weight (Вес категории)
- Мера силы ассоциации категории с веб-сайтом. Используется для масштабирования CDS.
- Cross-Website Category Duration Score (CWCDS) (Межсайтовая оценка продолжительности по категории)
- Эталонный показатель (бенчмарк) продолжительности для определенной категории. Вычисляется на основе WDS всех сайтов в этой категории (например, медиана или перцентиль).
- Direct User Input (Прямой пользовательский ввод)
- Запрос ресурса путем прямого ввода адреса (URL) пользователем или выбора из закладок.
- Duration Measurement (Измерение продолжительности)
- Продолжительность времени, которое проходит между запросом ресурса пользовательским устройством и запросом другого ресурса этим же устройством.
- Duration Performance Score (DPS) (Оценка эффективности продолжительности)
- Финальная нормализованная оценка веб-сайта, полученная путем агрегации его CDS. Используется для ранжирования и управления краулингом.
- Navigation Logs (Журналы навигации)
- Данные, характеризующие посещения ресурсов веб-сайтов пользователями и продолжительность этих посещений.
- User Device Session Visit (Посещение в рамках сессии)
- Последовательность посещений ресурсов одного и того же веб-сайта без промежуточного посещения ресурса другого веб-сайта. Сессия может быть приостановлена (suspended) при переключении вкладок.
- Website Duration Score (WDS) (Оценка продолжительности веб-сайта)
- Общая («сырая») оценка, пропорциональная измерениям продолжительности сессий для данного веб-сайта (например, медианная продолжительность сессии).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод расчета нормализованной оценки продолжительности с конкретным методом агрегации и использованием весов.
- Для каждого сайта система получает Duration Measurements и определяет Website Duration Score (WDS).
- Получаются данные о категориях сайта, включая Category Weight (меру силы ассоциации) для каждой категории.
- Для каждой категории определяется Category Duration Score (CDS) на основе WDS сайта и его Category Weight.
- Определяется финальная оценка Duration Performance Score (DPS) путем специфической агрегации:
- Определение первого счетчика (first count): подсчет количества CDS, которые соответствуют пороговому значению.
- Определение второго счетчика (second count): общее количество CDS для сайта.
- Расчет DPS на основе первого и второго счетчиков (например, как их соотношение).
Ядро изобретения — это расчет нормализованной оценки вовлеченности (DPS) как соотношения количества категорий, в которых сайт работает лучше порога, к общему количеству категорий, с обязательным учетом веса (значимости) этих категорий для сайта.
Claim 3 (Зависимый от 1): Уточняет, что при расчете может применяться дисконтирование (discounting) измерения продолжительности последнего ресурса, просмотренного перед тем, как пользователь запросил ресурс с другого сайта. Это механизм фильтрации шума от последнего клика.
Claim 4 (Независимый пункт): Описывает метод с фокусом на типе навигации и бустинге.
- Система получает измерения продолжительности.
- Применяется повышение (boosting) к тем измерениям, которые были сгенерированы в ответ на прямой ввод адреса ресурса пользователем (Direct User Input).
- Явно указано, что повышение НЕ применяется к измерениям, сгенерированным в ответ на выбор поискового результата.
- Далее следуют стандартные шаги расчета WDS, CDS и DPS.
Ядро изобретения по Claim 4 — это дифференцированная оценка продолжительности взаимодействия, где прямой трафик получает явное преимущество перед поисковым при расчете этой метрики.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные офлайн, и влияя на ранжирование и краулинг.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная часть вычислений. Website Category Scoring Engine обрабатывает Navigation Logs и Category Data. Рассчитываются WDS, CWCDS, CDS и общий DPS. Эти оценки сохраняются в Site Data и ассоциируются с сайтом.
RANKING – Ранжирование
Ranking Engine использует предварительно рассчитанный DPS как один из сигналов качества сайта при оценке его ресурсов. Высокий DPS может повышать оценки ресурсов этого сайта.
RERANKING – Переранжирование
В патенте описан вариант динамического расчета DPS во время запроса (at query time). Если поисковая система определяет, что запрос относится к определенным категориям, она может рассчитать DPS для сайтов, используя только CDS, релевантные этим категориям.
CRAWLING – Сканирование и Сбор данных
В патенте прямо указано, что DPS могут использоваться для определения того, являются ли ресурсы веб-сайта достаточно качественными для сканирования, обновления или добавления в индекс, что позволяет эффективно распределять ресурсы (Crawl Budget).
Входные данные:
- Navigation Logs (данные о сессиях, продолжительности, источниках переходов).
- Category Data (иерархия категорий, категоризация сайтов и Category Weights).
Выходные данные:
- Duration Performance Score (DPS) для веб-сайта (общий или специфичный для категории).
На что влияет
- Конкретные ниши и типы контента: Влияет на все ниши, но механизм нормализации адаптирует интерпретацию данных к специфике каждой ниши. Метрики вовлеченности для e-commerce будут сравниваться с другими сайтами e-commerce, а не с новостными порталами.
- Качество сайта: Влияет на оценку полезности и качества сайта в целом (Site Quality).
Когда применяется
- Временные рамки: Основные расчеты (WDS, CWCDS, общий DPS) производятся периодически в офлайн-режиме на основе накопленных логов навигации.
- Применение: Используется в реальном времени во время ранжирования и при планировании сканирования.
- Условия применения: Применяется для сайтов, по которым накоплено достаточно поведенческих данных и которые можно надежно классифицировать по категориям.
Пошаговый алгоритм
Процесс расчета Duration Performance Score (DPS) для веб-сайта.
Этап 1: Сбор и обработка данных о сессиях
- Получение измерений: Система извлекает Duration Measurements из Navigation Logs и группирует их в User Device Session Visits. Учитывается возможность приостановки сессии (suspended) при переключении вкладок.
- Корректировка измерений:
- Дисконтирование (Claim 3): Продолжительность последнего посещения в сессии (перед уходом на другой сайт) может быть исключена для фильтрации шума.
- Повышение (Boosting) (Claim 4): Если сессия началась с Direct User Input, измерения продолжительности в этой сессии повышаются (например, умножаются на коэффициент). Измерения от переходов из поиска не повышаются.
- Добавление предыдущей продолжительности (Опционально): Может добавляться время, проведенное на предыдущем сайте непосредственно перед переходом на текущий.
Этап 2: Расчет Website Duration Score (WDS)
- Агрегация сессий: Вычисляется продолжительность всех скорректированных сессий сайта.
- Определение WDS: Рассчитывается итоговый WDS для сайта (например, медианная продолжительность сессий).
Этап 3: Расчет эталонов (CWCDS)
- Расчет CWCDS: Для каждой категории вычисляется Cross-Website Category Duration Score на основе WDS всех сайтов в этой категории (например, медиана или определенный перцентиль). Это бенчмарк.
Этап 4: Расчет Category Duration Score (CDS)
- Идентификация категорий сайта: Определяются категории сайта и их Category Weights.
- Сравнение с эталоном: WDS сайта сравнивается с CWCDS каждой релевантной категории.
- Определение CDS: Рассчитывается CDS. Оценка может быть бинарной (выше/ниже эталона) или пропорциональной.
- Применение весов (Claim 1, 2): CDS масштабируется с использованием Category Weight (например, путем перемножения).
Этап 5: Расчет Duration Performance Score (DPS)
- Подсчет успешных категорий (Claim 1): Подсчитывается количество категорий, в которых взвешенный CDS сайта превышает установленный порог (Первый счетчик).
- Подсчет общего числа категорий (Claim 1): Определяется общее количество категорий сайта (Второй счетчик).
- Расчет DPS: Финальный DPS рассчитывается на основе соотношения Первого и Второго счетчиков.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Ключевые данные для этого патента.
- Duration Measurements: время между запросами ресурсов.
- Данные о сессиях (User Device Session Visits): последовательность запросов на одном сайте.
- Тип навигации/Источник: Direct User Input (прямой ввод URL/закладка) или клик по результату поиска.
- Navigation Logs: Источник данных о поведении.
- Структурные факторы (Категоризация):
- Category Data: Категории, к которым принадлежит сайт.
- Category Weights: сила ассоциации сайта с каждой категорией.
Какие метрики используются и как они считаются
- Website Duration Score (WDS): Агрегированная метрика продолжительности сессий сайта. Рассчитывается как медиана продолжительности сессий, с учетом корректировок (boosting/discounting).
- Cross-Website Category Duration Score (CWCDS): Эталон для категории. Рассчитывается как медиана или перцентиль WDS всех сайтов в категории.
- Category Duration Score (CDS): Результат сравнения WDS сайта и CWCDS категории. Масштабируется с помощью Category Weight.
- Duration Performance Score (DPS): Финальная метрика. Рассчитывается как соотношение количества категорий, где CDS превышает порог, к общему количеству категорий сайта (Claim 1).
- Boost Factor (Коэффициент повышения): Множитель, применяемый к измерениям продолжительности, если ресурс был запрошен через прямой ввод (Claim 4).
Выводы
- Нормализация вовлеченности по категориям: Google не использует «сырые» данные о продолжительности сессий. Ключевым является сравнение показателей сайта с эталонами его ниши (CWCDS). Вовлеченность — это относительная, а не абсолютная метрика.
- Активная фильтрация шума (Discounting): Система очищает поведенческие данные. Время, проведенное на последней странице перед уходом с сайта, может игнорироваться (Claim 3) для устранения шума от коротких кликов или оставленных открытых вкладок. Также учитывается приостановка сессии при переключении вкладок.
- Прямой трафик как сигнал высшего качества (Boosting): Патент явно указывает на повышение (boosting) измерений продолжительности для сессий, инициированных прямым вводом адреса (Claim 4). Это подтверждает, что прямой/брендовый трафик является сильным сигналом доверия и качества.
- Важность глубины сессии: Метрика основана на User Device Session Visit — последовательности посещений ресурсов. Это подчеркивает важность внутренней навигации и перелинковки, а не только времени на одной странице входа.
- Учет релевантности категорий (Category Weights): Эффективность сайта в его основных, наиболее релевантных категориях оказывает наибольшее влияние на финальный DPS, благодаря использованию Category Weights (Claim 1).
- Универсальность DPS: Рассчитанный DPS используется не только для ранжирования, но и для управления ресурсами краулинга (Crawl Budget).
Практика
Best practices (это мы делаем)
- Бенчмаркинг в своей нише: Анализируйте среднюю продолжительность сессии и глубину просмотра у прямых конкурентов (сайтов той же категории). Ваша задача — превзойти средние показатели (CWCDS) в вашей нише за счет предоставления большей ценности и лучшего UX.
- Построение бренда и стимулирование прямого трафика: Инвестируйте в узнаваемость бренда и лояльность аудитории. Согласно Claim 4, продолжительность сессий от прямого трафика получает повышение (boosting), что напрямую увеличивает WDS и DPS.
- Оптимизация пути пользователя и глубины сессии: Сосредоточьтесь на улучшении внутренней перелинковки и навигации, чтобы стимулировать пользователей посещать несколько страниц за сессию. Это увеличивает WDS и компенсирует эффект дисконтирования последнего клика.
- Фокус на основных категориях сайта (Topical Authority): Убедитесь, что сайт максимально эффективен в своих основных тематиках. Category Weights гарантируют, что эффективность в ключевых нишах окажет наибольшее влияние на DPS.
Worst practices (это делать не надо)
- Искусственная накрутка времени на сайте: Использование методов, которые задерживают пользователя без предоставления ценности (запутанная навигация, пагинация статей без необходимости, скрытие контента). Механизм нормализации направлен против таких манипуляций.
- Игнорирование контекста ниши: Попытка достичь универсальных «хороших» показателей времени на сайте бессмысленна. Сайт с быстрыми ответами не должен пытаться имитировать поведение пользователей на сайте с лонгридами.
- Фокус исключительно на SEO-трафике: Сайт, который полностью зависит от поискового трафика и не имеет прямого трафика, уязвим, так как не получает преимуществ от механизма boosting (Claim 4).
- Распыление тематики без глубины: Попытка охватить множество категорий без достаточной проработки приведет к низким Category Weights и усложнит задачу превышения порогов во всех категориях (согласно методу агрегации в Claim 1).
Стратегическое значение
Этот патент подтверждает, что Google использует поведенческие факторы для оценки качества сайта, но делает это сложным, нормализованным и очищенным от шума способом. Он подчеркивает стратегическую важность синергии между SEO, UX и брендингом. Для долгосрочного успеха необходимо обеспечивать лучший пользовательский опыт и вовлеченность, чем конкуренты в той же категории, и активно работать над формированием лояльной аудитории, которая приходит на сайт напрямую.
Практические примеры
Сценарий 1: Нормализация в нише рецептов
- Контекст: Средняя продолжительность сеанса (CWCDS) в категории «Рецепты» составляет 3 минуты.
- Сайт А: Предлагает четкие инструкции, видео и удобные рекомендации похожих блюд. Пользователи часто просматривают 2-3 рецепта. WDS = 5 минут.
- Сайт Б: Использует агрессивную рекламу и пагинацию для одного рецепта. Пользователи редко смотрят больше одного рецепта. WDS = 2 минуты.
- Результат: Сайт А превышает CWCDS (5 мин > 3 мин). Он получает высокий CDS в категории «Рецепты» и высокий DPS. Сайт Б (2 мин < 3 мин) получает низкий DPS.
Сценарий 2: Влияние прямого трафика на новостной сайт
- Контекст: Два новостных сайта (Сайт X и Сайт Y) имеют одинаковую фактическую среднюю продолжительность сеанса в 4 минуты.
- Сайт X: 80% трафика из поиска, 20% прямого.
- Сайт Y: 50% трафика из поиска, 50% прямого (сильный бренд).
- Расчет WDS: При расчете WDS для Сайта Y, продолжительность 50% его сеансов (прямой трафик) получает повышение (boosting, например, 1.5x), согласно Claim 4.
- Результат: Скорректированный WDS Сайта Y будет математически выше (например, (4 мин * 0.5) + (4 мин * 1.5 * 0.5) = 5 минут), чем у Сайта X (около 4 минут, в зависимости от буста на его 20% прямого трафика). Это дает Сайту Y преимущество при расчете DPS и ранжировании.
Вопросы и ответы
Является ли Dwell Time (время до возврата в выдачу) или Session Duration (продолжительность сессии) фактором ранжирования?
Патент подтверждает, что продолжительность взаимодействия используется для расчета Duration Performance Score (DPS), который применяется в ранжировании. Однако это не «сырые» метрики. Они нормализуются относительно категории сайта. Ранжирование улучшает не длительное время на сайте само по себе, а время, которое превышает средние показатели конкурентов в той же нише, с учетом корректировок на шум и источник трафика.
Что такое Cross-Website Category Duration Score (CWCDS) простыми словами?
CWCDS — это эталонное значение продолжительности сеанса, которое Google ожидает увидеть у сайтов в определенной категории. Это «средняя температура по больнице» для вашей тематики. Если в вашей нише пользователи обычно проводят на сайтах 2 минуты, то CWCDS будет около 2 минут. Ваша задача — быть лучше этого показателя.
Насколько важен прямой трафик в контексте этого патента?
Критически важен. Claim 4 прямо указывает, что измерения продолжительности для сессий, начавшихся с прямого ввода адреса (Direct User Input), получают повышение (boosting). Сессии из поиска такого повышения не получают. Это делает прямой и брендовый трафик более ценным для расчета Duration Performance Score.
Почему Google игнорирует (дисконтирует) продолжительность последнего просмотра страницы перед уходом с сайта?
Это делается для фильтрации шума (Claim 3). Продолжительность последнего просмотра может быть ненадежной: пользователь мог быстро уйти (короткий клик) или, наоборот, оставить вкладку открытой надолго, не взаимодействуя с контентом. Исключение этого измерения делает общую оценку WDS более точной и стабильной.
Как этот патент влияет на сайты с короткими сессиями, например, словари или сайты погоды?
Для таких сайтов этот механизм благоприятен благодаря нормализации. Сайт погоды будет отнесен к категории, где эталонная продолжительность сессии (CWCDS) низкая (например, 30 секунд). Сайт со средней сессией в 45 секунд (WDS) будет считаться высокопроизводительным в этой категории и получит высокий DPS.
Как рассчитывается итоговая оценка DPS, если сайт принадлежит к нескольким категориям?
Согласно Claim 1, система рассчитывает Category Duration Score (CDS) для каждой категории и взвешивает его по Category Weight. Затем подсчитывается, сколько из этих взвешенных оценок превышают определенный порог. Финальный DPS — это соотношение количества «успешных» категорий к общему числу категорий сайта.
Может ли этот алгоритм применяться в реальном времени во время запроса?
Да. Хотя основные расчеты производятся офлайн, патент описывает возможность расчета DPS, специфичного для категории запроса, в реальном времени (at query time). Если запрос связан с категорией А, система может рассчитать DPS сайта, учитывая только его производительность в категории А.
Как этот патент влияет на стратегию внутренней перелинковки?
Он делает внутреннюю перелинковку стратегически важной для управления поведением пользователей. Поскольку измеряется продолжительность всей сессии (User Device Session Visit), а последний клик может дисконтироваться, эффективная перелинковка должна стимулировать пользователя к дальнейшему изучению сайта, увеличивая глубину сессии и WDS.
Используется ли DPS для управления бюджетом сканирования (Crawl Budget)?
Да, в патенте явно указано, что Duration Performance Scores могут использоваться для определения того, следует ли сканировать, обновлять или добавлять в индекс ресурсы веб-сайта. Сайты с высоким DPS, вероятно, получат более высокий приоритет сканирования.
Что происходит, если пользователь переключается между вкладками браузера во время сессии?
В описании патента упоминается, что сессия может быть «приостановлена» (suspended). Если пользователь переключается на вкладку с другим сайтом, сессия на первом сайте приостанавливается. Когда пользователь возвращается, сессия возобновляется, и отсчет продолжительности продолжается. Это позволяет точнее измерять время активного взаимодействия.