Google оценивает качество страниц и доменов, анализируя, как они конкурируют в поисковой выдаче. Система отслеживает «Победы» (Wins) и «Поражения» (Losses) на основе поведения пользователей: сравнивая время пребывания (Dwell Time) при мульти-кликах или анализируя клики относительно показов (CTR) с учетом позиций. На основе этого соотношения рассчитывается корректирующий фактор (Adjustment Factor), который повышает или понижает рейтинг ресурса.
Описание
Какую задачу решает
Патент решает задачу интеграции сигналов пользовательского взаимодействия для оценки качества ресурса, фокусируясь на его сравнительной, а не абсолютной производительности. Цель — улучшить ранжирование путем продвижения ресурсов, которые лучше удовлетворяют информационные потребности пользователей по сравнению с другими ресурсами, показанными в той же выдаче или сессии (resource competition). Это позволяет выявлять высококачественный контент, основываясь на коллективном выборе пользователей.
Что запатентовано
Запатентована система для генерации сигнала качества (competition signal) на основе анализа конкуренции между ресурсами в результатах поиска. Система отслеживает взаимодействие пользователей и вычисляет метрики «Побед» (Wins, First Value или X value) и «Поражений» (Losses, Second Value или Y value) для отдельных URL и доменов. На основе соотношения этих метрик генерируется корректирующий фактор (Adjustment Factor), который используется для изменения поискового рейтинга ресурсов.
Как это работает
Система анализирует логи (Click Logs, Query Logs). Патент описывает два основных варианта реализации:
- Вариант 1 (Сравнение времени взаимодействия / Dwell Time): Анализируются сессии, где пользователь кликнул несколько результатов (co-clicked). Если время взаимодействия (click length) с Ресурсом А дольше, чем с Ресурсом Б, Ресурс А получает «Победу», а Б — «Поражение».
- Вариант 2 (Сравнение показов и кликов): Анализируется SERP. Если Ресурс А был показан (impressed) и выбран (selected), а Ресурс Б был показан, но не выбран, Ресурс А получает «Победу». Если Ресурс А был показан, но не выбран, а Ресурс Б был выбран, Ресурс А получает «Поражение».
На основе накопленных «Побед» (X) и «Поражений» (Y) рассчитывается Adjustment Factor (AF), например, по формуле AF = C^(-(X-Y)/max(X,Y)). Этот фактор применяется для корректировки поискового балла (например, IR score) ресурса, если данные достигают порога статистической значимости. При недостатке данных для URL система может использовать агрегированные данные его домена.
Актуальность для SEO
Высокая. Использование поведенческих факторов и метрик удовлетворенности пользователей (User Engagement, SERP Satisfaction) является ключевым направлением развития поиска. Описанные механизмы, связывающие относительную производительность в SERP (включая относительный Dwell Time и скорректированный CTR) с оценкой качества, с высокой вероятностью используются в современных системах ранжирования.
Важность для SEO
Патент имеет критическое значение (90/100) для SEO. Он описывает конкретные механизмы того, как Google может использовать сравнительные поведенческие метрики как прямой сигнал качества для корректировки рейтинга. Это подчеркивает, что оптимизация должна фокусироваться не только на привлечении клика, но и на полном удовлетворении интента пользователя лучше, чем это делают конкуренты в выдаче.
Детальный разбор
Термины и определения
- Adjustment Factor (AF) (Корректирующий фактор)
- Множитель, рассчитываемый на основе First Value (X) и Second Value (Y). Используется для корректировки (повышения или понижения) оценки ранжирования ресурса (например, IR score) во время поисковой операции.
- Click Length (Длина клика / Dwell Time)
- Период времени, в течение которого пользователь просматривал ресурс после выбора соответствующего результата поиска.
- Co-clicked (Совместный клик)
- Ситуация, когда пользователь выбирает два или более результата поиска в рамках одной поисковой сессии.
- Competition Signal (Сигнал конкуренции)
- Сигнал, используемый для измерения качества веб-страницы на основе ее производительности по сравнению с другими ресурсами.
- Domain Adjustment Factor (Корректирующий фактор домена)
- Adjustment Factor, рассчитанный на основе агрегированных данных домена. Может применяться к URL, для которых недостаточно собственных данных.
- First Value (X Value / Wins) (Победы)
- Счетчик, представляющий количество «побед» ресурса над конкурентами. (Dwell Time): Ресурс просматривался дольше, чем другой co-clicked ресурс. (Impressions): Ресурс был выбран, а другой показанный ресурс — нет.
- Impressed (Показан)
- Статус ресурса, когда он был отображен в SERP. В патенте описаны разные схемы атрибуции показов (impression attribution scheme), например, с учетом позиции.
- Information Retrieval (IR) Score (Оценка информационного поиска)
- Базовая оценка релевантности ресурса запросу.
- Second Value (Y Value / Losses) (Поражения)
- Счетчик, представляющий количество «поражений» ресурса. (Dwell Time): Ресурс просматривался короче, чем другой co-clicked ресурс. (Impressions): Ресурс был показан, но не выбран, а другой ресурс был выбран.
- Threshold Value (Пороговое значение)
- Минимальная сумма Wins и Losses (X+Y), необходимая для применения Adjustment Factor. Обеспечивает статистическую значимость.
Ключевые утверждения (Анализ Claims)
Патент описывает два основных механизма. Первый основан на сравнении Dwell Time (описан в Detailed Description, Фигуры 2A-3B). Второй основан на сравнении Impressions и Clicks (описан в Detailed Description, Фигуры 4A-4B, и формализован в итоговых Claims 1-13 патента B1).
Реализация 1: Конкуренция на основе Dwell Time (Описательная часть)
Система сравнивает длительность кликов в сессиях с мульти-кликами (co-clicks).
- Генерация First Value (Wins): счетчик случаев, когда URL просматривался *длиннее*, чем другой URL в той же сессии.
- Генерация Second Value (Losses): счетчик случаев, когда URL просматривался *короче*.
- Генерация Adjustment Factor на основе разницы между Wins и Losses.
Реализация 2: Конкуренция на основе Impressions/Clicks (Claims 1, 6, 7)
Итоговые Claims фокусируются на этой реализации, агрегируя данные на уровне *домена* и потенциально для *конкретного запроса*.
Claim 1 (Независимый пункт):
- Сбор данных (на уровне домена):
- First Value (Wins): Количество случаев, когда URL домена был выбран, а другие URL (конкуренты) были показаны, но не выбраны.
- Second Value (Losses): Количество случаев, когда URL домена был показан, но не выбран, а другие URL были выбраны.
- Расчет фактора: Генерация Adjustment Factor для домена на основе разницы Wins и Losses. Расчет включает определение *соотношения* (ratio) разницы к максимуму из двух значений ((X-Y)/max(X,Y)).
- Применение в ранжировании:
- Система проверяет, превышает ли сумма Wins и Losses для домена пороговое значение (threshold value).
- Только если порог превышен, Adjustment Factor домена применяется к URL этого домена в выдаче.
Claims 2-4 (Зависимые): Вводят позиционный биас (Positional Bias) в расчеты.
- Claim 3 (Условие Победы): Победа засчитывается только против невыбранных URL, показанных на позиции *выше*, чем выбранный URL.
- Claim 4 (Условие Поражения): Поражение засчитывается, только если выбранный URL конкурента был показан на позиции *ниже*, чем невыбранный URL данного домена.
Claim 6 (Независимый пункт): Детализирует формулу расчета AF.
Adjustment Factor определяется на основе произведения константы (C), возведенной в степень частного (Quotient): C ^ Quotient. Где Quotient = (X-Y)/max(X,Y). (Примечание: в описании патента формула часто приводится как C ^ (-Quotient), что более логично для бустинга при победах, если C<1).
Где и как применяется
Изобретение затрагивает офлайн-анализ данных для генерации сигналов, которые затем применяются на финальных стадиях ранжирования.
Офлайн-анализ данных (Вне стандартных фаз)
Основная часть работы алгоритма происходит офлайн. Система анализирует Query Logs и Click Logs для сбора данных о сессиях, показах, кликах и времени взаимодействия (Dwell Time). На этом этапе рассчитываются First Value (Wins) и Second Value (Losses) для URL и доменов. Также рассчитываются и сохраняются Adjustment Factors.
RANKING / RERANKING
Применение алгоритма происходит во время ранжирования или переранжирования.
- Система получает набор кандидатов с базовыми оценками (например, IR scores).
- Система извлекает предварительно рассчитанные Adjustment Factors для URL или их доменов.
- Проверяется пороговое значение (threshold value) для достаточности данных (X+Y).
- Если порог достигнут, Adjustment Factor применяется к базовой оценке (например, путем умножения) для получения скорректированной оценки.
- Результаты сортируются по скорректированным оценкам.
Входные данные:
- Логи поисковых сессий: запросы, показанные URL, выбранные URL, порядок показа (позиции), время взаимодействия (click length).
- Базовые оценки ранжирования (IR scores).
Выходные данные:
- Adjustment Factor (AF) для URL и доменов.
- Скорректированные оценки ранжирования.
На что влияет
- Все типы контента и запросов: Алгоритм универсален, так как основан на базовых взаимодействиях пользователя (клики, время, показы).
- Конкурентные ниши: Наибольшее влияние будет заметно в нишах с большим объемом трафика, где накапливается достаточно данных для расчета надежных Adjustment Factors, и где пользователи часто сравнивают результаты (высокий процент co-clicks).
Когда применяется
- Триггеры активации: Алгоритм применяется во время ранжирования результатов поиска.
- Пороговые значения (Threshold Value): Ключевое условие применения — наличие достаточного количества данных. Adjustment Factor применяется, только если сумма X+Y превышает установленный порог. Это необходимо для обеспечения статистической значимости.
- Исключения: Если данных недостаточно ни для URL, ни для его домена, корректировка не производится.
Пошаговый алгоритм
Алгоритм состоит из офлайн-расчета метрик и онлайн-применения корректировок.
Процесс А: Офлайн-расчет метрик конкуренции (Wins/Losses)
Система анализирует логи сессий. Применяется один из двух вариантов (или оба):
Вариант 1: На основе времени взаимодействия (Dwell Time)
- Сбор данных сессий: Идентификация сессий, в которых было выбрано два или более результата (co-clicked).
- Измерение времени: Для каждого URL определяется click length.
- Сравнение: В рамках сессии сравниваются времена взаимодействия для всех пар совместно выбранных URL.
- Атрибуция метрик:
- Если Click Length (A) > Click Length (B): Увеличить Win для A, увеличить Loss для B.
- Фильтрация (Опционально): Игнорировать сравнения между URL одного домена.
Вариант 2: На основе показов и кликов (Impressions/Selections)
- Сбор данных SERP: Определение, какие URL были показаны (impressed) и какие выбраны (selected).
- Атрибуция «Побед»: Для выбранного URL A подсчитывается количество других URL (B, C…), которые были показаны, но не выбраны.
- Атрибуция «Поражений»: Для показанного, но не выбранного URL B, подсчитывается количество других URL (A, C…), которые были выбраны.
- Корректировка по позиции (Опционально, согласно Claims): Применение правил атрибуции на основе позиций (Positional Bias). Например, «Победа» засчитывается только над URL, расположенными выше; «Поражение» засчитывается только от URL, расположенного ниже.
- Взвешивание по позиции (Опционально, согласно Claims): Вес победы/поражения может зависеть от разницы в позициях.
Процесс Б: Расчет и агрегация Adjustment Factor
- Агрегация на уровне домена: Суммирование Wins и Losses всех URL домена.
- Расчет AF: Применение формулы расчета для URL и Доменов. Например: AF = C^(-(X-Y)/max(X,Y)).
- Масштабирование (Опционально): Применение дополнительного множителя (B) для усиления эффекта AF, если базовая оценка (IR score) высока.
- Сохранение: Сохранение рассчитанных AF в индексе.
Процесс В: Онлайн-применение при ранжировании
- Получение результатов: Генерация набора результатов с базовыми IR scores.
- Проверка порога URL: Проверка, превышает ли (X+Y) URL порог. Если да, применение AF (URL).
- Проверка порога Домена (Fallback): Если порог URL не пройден, проверка порога домена. Если да, применение AF (Domain).
- Ранжирование: Результаты сортируются по скорректированным оценкам (Adjusted Score = IR Score * AF).
Какие данные и как использует
Данные на входе
Патент полностью полагается на поведенческие данные, собранные из логов поисковой системы.
- Поведенческие факторы:
- Клики (Selections): Факт выбора пользователем результата.
- Показы (Impressions): Факт отображения результата.
- Время взаимодействия (Click Length / Dwell Time): Продолжительность пребывания пользователя на ресурсе после клика.
- Данные сессии (Session Data): Группировка кликов в рамках одной сессии (для определения co-clicks).
- Структурные факторы (SERP):
- Позиция в выдаче (Ordinal Position): Порядок отображения результатов в SERP (используется для учета позиционного биаса и взвешивания).
Какие метрики используются и как они считаются
- First Value (X) / Wins: Счетчик побед в конкуренции.
- Second Value (Y) / Losses: Счетчик поражений в конкуренции.
- Threshold Value (Пороговое значение): Минимальная сумма (X+Y), необходимая для применения корректировки.
- Adjustment Factor (AF): Основная рассчитываемая метрика.
- Формулы расчета AF:
- Базовая формула: AF = C^(-(X-Y)/max(X,Y)). Где C — константа (например, 0.6). Эта формула нормализует разницу, создавая множитель, который повышает рейтинг при X>Y и понижает при Y>X. При C=0.6 диапазон AF составляет от 0.6 до 1.667.
- Усиленная формула: AF = C^(-B*(X-Y)/max(X,Y)). Где B — дополнительная константа для масштабирования эффекта.
Выводы
- Относительная производительность как сигнал качества: Ключевой вывод — Google может оценивать качество ресурса на основе того, насколько хорошо он конкурирует с другими ресурсами в реальных условиях. Это смещает фокус с абсолютных поведенческих метрик на относительные.
- Два механизма оценки конкуренции: Патент определяет два способа измерения предпочтений: сравнение времени взаимодействия (Dwell Time) для совместно выбранных результатов (пост-клик удовлетворенность) и сравнение кликов/показов (Selection/Impression rates) в SERP (привлекательность сниппета).
- Нормализация и демпфирование сигнала: Формула AF = C^(-(X-Y)/max(X,Y)) преобразует сырые данные о кликах в нормализованный множитель с ограниченным диапазоном влияния, предотвращая доминирование этого сигнала над другими.
- Преодоление нехватки данных (Data Sparsity): Система предусматривает агрегацию данных с уровня URL на уровень домена. Это позволяет применять сигнал конкуренции даже к новым или низкочастотным страницам, если домен в целом имеет достаточно данных.
- Важность статистической значимости: Использование пороговых значений (Threshold Value) гарантирует, что корректировки применяются только при наличии достаточного объема данных, а не на основе случайных флуктуаций.
- Учет позиционного биаса: В варианте с показами/кликами система может учитывать позицию URL при атрибуции «побед» и «поражений» (например, победа засчитывается только над URL выше). Это делает сигнал более точным и устойчивым к естественному распределению кликов.
Практика
Best practices (это мы делаем)
- Оптимизация под удовлетворенность пользователя (User Satisfaction / Dwell Time): Фокусируйтесь на том, чтобы контент полностью отвечал на запрос пользователя и удерживал его внимание дольше конкурентов. Необходимо минимизировать «пого-стикинг» (быстрый возврат в выдачу и выбор конкурента), так как это напрямую генерирует «Поражение» (Loss) в модели Dwell Time.
- Улучшение привлекательности сниппетов (Snippet Optimization): Критически важно иметь Title и Description, которые не просто релевантны, но и более привлекательны, чем у конкурентов. В модели Impressions/Selections «Победа» — это когда кликнули вас, а не их. Особенно важно выигрывать клики у результатов выше вас.
- Анализ конкурентов в SERP по интенту и UX: Изучайте, какой контент и пользовательский опыт предлагают конкуренты. Ваша задача — предоставить лучший опыт, чтобы «выиграть» в сессии пользователя.
- Повышение качества на уровне домена: Работайте над общим качеством всех разделов сайта. Благодаря механизму агрегации, высокий Domain Adjustment Factor может помочь в ранжировании даже тем страницам, у которых мало собственного трафика.
- Мониторинг поведенческих метрик: Отслеживайте показатели вовлеченности (время на сайте, глубина просмотра, отказы, Engagement Rate в GA4) как прокси-метрики для оценки Dwell Time.
Worst practices (это делать не надо)
- Кликбейт и обман ожиданий: Использование заголовков, которые привлекают клик, но не соответствуют содержанию. Это приведет к коротким кликам и возврату в выдачу, что генерирует «Поражение» (Loss) в модели Dwell Time и ведет к понижению Adjustment Factor.
- Игнорирование UX и скорости загрузки: Медленная загрузка или плохой UX увеличивают вероятность того, что пользователь быстро покинет страницу, что негативно скажется на метриках конкуренции.
- Создание тонкого контента (Thin Content): Страницы, которые не удовлетворяют интент, будут систематически «проигрывать» более полным и авторитетным ресурсам по времени взаимодействия.
- Фокус только на CTR без учета удовлетворенности: Оптимизация для высокого CTR без обеспечения качественного пост-клик опыта является проигрышной стратегией в контексте этого патента.
Стратегическое значение
Этот патент подтверждает стратегическую важность интеграции анализа поведенческих факторов в SEO. Он демонстрирует, что Google обладает механизмами для измерения удовлетворенности пользователей в прямом сравнении с конкурентами. Долгосрочная стратегия должна быть направлена на создание контента, который не просто релевантен запросу, но и обеспечивает лучший в нише пользовательский опыт. Качество сайта — это измеряемая способность удовлетворять пользователей лучше конкурентов.
Практические примеры
Сценарий 1: Оптимизация статьи для увеличения Dwell Time (Вариант 1)
- Задача: Информационная статья «Как выбрать палатку» проигрывает конкурентам по времени взаимодействия (пользователи часто возвращаются в SERP).
- Действия:
- Анализ контента конкурентов, которых пользователи изучают дольше.
- Добавление в начало статьи таблицы сравнения или резюме (TL;DR) для быстрого ответа на основной интент.
- Улучшение структуры, добавление инфографики и видеообзора для удержания внимания.
- Ожидаемый результат: Пользователи проводят больше времени на странице и реже выбирают конкурента после возврата. First Value (Wins) растет, Adjustment Factor увеличивается, позиции улучшаются.
Сценарий 2: Улучшение привлекательности сниппета (Вариант 2)
- Задача: Карточка товара на позиции 3 имеет показы, но пользователи часто кликают на позицию 4 (проигрыш результату ниже).
- Действия:
- Анализ сниппетов конкурента на позиции 4.
- Оптимизация Title для включения ключевых УТП (например, «Бесплатная доставка», «В наличии»).
- Внедрение микроразметки (Review, Price) для обогащения сниппета.
- Ожидаемый результат: Сниппет становится более привлекательным. Пользователи чаще выбирают этот результат, уменьшая количество «Поражений» (Second Value). Рейтинг корректируется в лучшую сторону.
Вопросы и ответы
Патент описывает два разных метода: по времени взаимодействия (Dwell Time) и по показам/кликам (Impressions/Clicks). Какой из них важнее?
Оба метода важны, так как они описывают разные аспекты поведения. Dwell Time измеряет удовлетворенность после клика (качество контента) и направлен против «пого-стикинга». Метод показов/кликов измеряет привлекательность до клика (качество сниппета и релевантность). Для комплексного SEO необходимо оптимизировать оба аспекта: привлекать релевантные клики и полностью удовлетворять интент пользователя после перехода.
Как рассчитывается Adjustment Factor (AF) и насколько сильно он влияет на ранжирование?
AF рассчитывается по формуле, нормализующей разницу между «Победами» (X) и «Поражениями» (Y), например: AF = C^(-(X-Y)/max(X,Y)). Если константа C=0.6 (как в примере патента), то AF варьируется от 0.6 (максимальная пессимизация) до 1.667 (максимальный бустинг). Это значительное влияние, способное существенно изменить позиции в ТОПе, если базовые оценки релевантности близки.
Что такое «Победа» (Win) в контексте этого патента?
«Победа» — это событие, когда ваш ресурс показал лучшую производительность по сравнению с конкурентом. Это может означать, что пользователь изучал вашу страницу дольше, чем страницу конкурента в той же сессии (Вариант 1), или что пользователь кликнул на ваш результат, проигнорировав результат конкурента в той же выдаче (Вариант 2).
Как система учитывает позицию в выдаче при расчете «Побед» и «Поражений»?
В варианте с показами/кликами (согласно Claims) система может применять правила атрибуции (Positional Bias). Например, «Победа» засчитывается только над URL, расположенными выше выбранного. «Поражение» засчитывается, только если был выбран URL, расположенный ниже. Это помогает отделить реальное предпочтение пользователя от естественного поведения при сканировании сверху вниз.
Что произойдет, если у моей страницы мало трафика?
Если для страницы недостаточно данных (сумма X+Y ниже порога Threshold Value), система проверит данные для всего домена. Если домен имеет достаточно данных и рассчитанный Domain Adjustment Factor, этот фактор может быть применен к вашей странице. Это подчеркивает важность работы над качеством всего сайта.
Является ли этот патент подтверждением того, что Dwell Time является фактором ранжирования?
Да, этот патент является сильным подтверждением того, что время взаимодействия (Click Length) используется как сигнал качества. Важно отметить, что используется не абсолютное время, а относительное — сравнение времени взаимодействия с вашим сайтом и сайтами конкурентов в рамках одной сессии. Систематически короткое время пребывания по сравнению с конкурентами является негативным сигналом.
Как защититься от негативного влияния этого алгоритма?
Ключевая защита — это полное удовлетворение интента пользователя. Необходимо минимизировать ситуации, когда пользователь возвращается в выдачу и выбирает конкурента (пого-стикинг). Обеспечьте высокое качество контента, хороший UX, быструю загрузку и соответствие сниппета содержанию страницы.
Учитывает ли система конкуренцию между страницами одного и того же сайта?
В описании патента (для модели Dwell Time) упоминается опциональная реализация, при которой сравнение времени взаимодействия между URL одного домена игнорируется. Это означает, что ресурсы одного домена не конкурируют друг с другом в рамках этого алгоритма, и фокус смещается на конкуренцию с внешними доменами.
Может ли вес «победы» или «поражения» отличаться?
Да. Патент (Claim 5) упоминает, что вес может масштабироваться в зависимости от разницы в ординальных позициях (ordinal positions). Например, «победа» над результатом на позиции 1, когда вы на позиции 5, может иметь больший вес, чем победа над результатом на позиции 4.
Что делать, если конкуренты используют кликбейт и получают больше кликов?
Хотя кликбейт может дать преимущество в Варианте 2 (Показы/Клики), он приведет к плохим результатам в Варианте 1 (Время взаимодействия). Пользователи быстро покинут страницу и выберут другой результат, что приведет к накоплению «Поражений» (Losses) и пессимизации. Стратегия, основанная на качестве и честности, более устойчива.