Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс использует анализ трендов (Amplitude и Phase Metrics) для оценки успеха A/B тестов в поиске

    METHOD FOR DETERMINING A TREND OF A USER ENGAGEMENT METRIC (Метод определения тренда метрики вовлеченности пользователя)
    • US20170289284A1
    • Yandex LLC
    • 2017-10-05
    • 2016-08-01
    2017 Метрики качества поиска Патенты Яндекс Поведенческие факторы Ранжирование

    Яндекс патентует метод оценки результатов A/B тестов, который фокусируется на трендах вовлеченности, а не на средних значениях. Система использует математические преобразования (например, Дискретное преобразование Фурье) временных рядов поведения пользователей для расчета метрик Амплитуды (величина изменения) и Фазы (направление изменения). Это позволяет понять, улучшает ли изменение алгоритма вовлеченность пользователя с течением времени.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает фундаментальную проблему оценки качества веб-сервисов (включая поисковые системы) через A/B тестирование. Стандартный подход, основанный на средних значениях метрик поведения пользователей (mean values of the user behavior metrics) за период эксперимента, может скрывать важные тренды. Например, пользователь, который был очень активен в начале эксперимента и перестал пользоваться сервисом в конце, может иметь то же среднее значение вовлеченности, что и пользователь с постоянной активностью. Изобретение позволяет выявлять динамику изменения вовлеченности (тренды) в течение времени, обеспечивая более точную оценку влияния изменений (например, нового алгоритма ранжирования) на долгосрочное удержание пользователей.

    Что запатентовано

    Запатентован метод определения тренда метрики вовлеченности пользователя (User Engagement Metric) в рамках A/B тестирования. Суть изобретения заключается в анализе временных рядов взаимодействия пользователей с сервисом с использованием дискретизационных преобразований (например, Дискретного преобразования Фурье). На основе этого анализа для каждого пользователя вычисляются две ключевые метрики: Amplitude Metric (Метрика Амплитуды), отражающая величину изменения вовлеченности, и Phase Metric (Метрика Фазы), отражающая направление этого изменения (рост или падение).

    Как это работает

    Система собирает данные о взаимодействиях пользователей (например, количество сессий, кликов, время на сайте) в контрольной и тестовой группах в течение экспериментального периода, формируя временной ряд для каждого пользователя. К этому ряду применяется дискретизационное преобразование (например, Фурье), в результате чего вычисляется Periodicity Metric (Метрика Периодичности). Затем рассчитываются Amplitude Metric (на основе магнитуды метрики периодичности) и Phase Metric (на основе мнимой части метрики периодичности). Сравнивая усредненные метрики амплитуды и фазы между тестовой и контрольной группами, система определяет, вызывает ли экспериментальное изменение возрастающий или убывающий тренд вовлеченности.

    Актуальность для SEO

    Высокая. Современные поисковые системы полагаются на data-driven подход и непрерывное A/B тестирование для улучшения алгоритмов. Способность точно измерять долгосрочное влияние изменений на вовлеченность и удержание пользователей (Retention) критически важна. Описанный метод предоставляет сложный, но точный инструмент для такой оценки, превосходящий простые средние значения.

    Важность для SEO

    Влияние на SEO среднее (6/10). Этот патент описывает внутреннюю методологию Яндекса для измерения успеха экспериментов, а не сам алгоритм ранжирования. Он не дает прямых тактических рекомендаций для SEO. Однако он имеет критическое стратегическое значение для понимания того, что Яндекс считает успешным поисковым опытом. Алгоритмы ранжирования, которые демонстрируют положительный тренд вовлеченности (измеренный этим методом), будут внедряться в продакшн. Это подтверждает необходимость фокусироваться на долгосрочном удовлетворении пользователя и устойчивых положительных поведенческих сигналах.

    Детальный разбор

    Термины и определения

    A/B Testing (A/B тестирование)
    Метод сравнения двух версий сервиса (контрольной и тестовой) путем их предоставления разным группам пользователей для измерения эффекта изменений.
    Amplitude Metric (Метрика Амплитуды)
    Метрика, рассчитываемая на основе магнитуды (абсолютного значения) метрики периодичности. Она представляет собой величину изменения метрики вовлеченности пользователя за экспериментальный период, но не указывает направление этого изменения (sign-agnostic).
    Discretization Transform (Дискретизационное преобразование)
    Математическая операция, применяемая к временному ряду данных о взаимодействиях пользователя. В патенте в качестве основного примера используется Дискретное преобразование Фурье (Discrete Fourier Transform, DFT), также упоминаются вейвлет-преобразование (Wavelet Transform) и преобразование Лапласа (Laplace Transform).
    Experimental Treatment (Экспериментальное воздействие)
    Изменение, применяемое к веб-сервису в тестовой версии. Примерами могут быть новый алгоритм ранжирования, изменение дизайна SERP или новая функциональность.
    Periodicity Metric (Метрика Периодичности)
    Результат применения дискретизационного преобразования к временному ряду взаимодействий. В случае DFT, это обычно первый гармонический член ряда Фурье (X1).
    Phase Metric (Метрика Фазы)
    Метрика, рассчитываемая на основе мнимой части (imaginary part) метрики периодичности. Она представляет направление изменения метрики вовлеченности пользователя (возрастающий или убывающий тренд).
    Time Series Data (Временные ряды данных)
    Последовательность данных о взаимодействиях пользователя, упорядоченная по времени (например, ежедневное количество сессий).
    User Engagement Metric (Метрика вовлеченности пользователя)
    Показатель, используемый для измерения взаимодействия пользователя с сервисом. Примеры: количество сессий, кликов, время пребывания (dwell time), время отсутствия (absence time).

    Ключевые утверждения (Анализ Claims)

    Патент фокусируется на методологии анализа данных A/B тестирования для выявления трендов.

    Claim 1 (Независимый пункт): Описывает основной метод.

    1. Сервер получает запросы от множества пользовательских устройств в течение экспериментального периода.
    2. Пользователи разделяются на тестовую группу (получает тестовую версию с experimental treatment) и контрольную группу (получает контрольную версию).
    3. Для каждого пользователя в обеих группах собираются indications (показатели взаимодействий), формируя временной ряд.
    4. К этим данным применяется Discretization Transform для вычисления Periodicity Metric.
    5. На основе Periodicity Metric вычисляются:
      • Amplitude Metric (на основе магнитуды) – отражает величину изменения.
      • Phase Metric (на основе мнимой части) – отражает направление изменения.
    6. Вычисляются средние групповые метрики:
      • Control Average Amplitude Metric.
      • Test Average Amplitude Metric.
      • Test Average Phase Metric.
    7. Тренд метрики вовлеченности определяется путем анализа этих трех средних метрик.

    Claim 2 (Зависимый от 1): Уточняет, что анализ включает определение разницы между Test Average Amplitude Metric и Control Average Amplitude Metric (далее – Amplitude Difference).

    Claims 3, 5, 7, 9 (Зависимые): Описывают четыре возможных сценария интерпретации тренда на основе знаков Amplitude Difference и Test Average Phase Metric.

    • Claim 3 (Позитивная разница, Позитивная фаза): Возрастающий тренд.
    • Claim 5 (Негативная разница, Негативная фаза): Возрастающий тренд.
    • Claim 7 (Позитивная разница, Негативная фаза): Убывающий тренд.
    • Claim 9 (Негативная разница, Позитивная фаза): Убывающий тренд.

    (Логика этих сценариев подробно разобрана в разделе «Пошаговый алгоритм»).

    Где и как применяется

    Это изобретение не является частью实时ного конвейера обработки запросов (Crawling, Indexing, Ranking). Оно относится к инфраструктуре контроля качества и аналитики.

    QUALITY & GOVERNANCE LAYER – Слой Качества и Метрик
    Метод применяется для анализа результатов A/B экспериментов, проводимых Яндексом для оценки изменений в поисковой системе. Это офлайн-процесс, который анализирует логи поведения пользователей, собранные во время эксперимента.

    • Взаимодействие с компонентами: Система взаимодействует с хранилищами логов пользовательских взаимодействий (User Interaction Logs) и инфраструктурой A/B тестирования.
    • Данные на входе: Временные ряды (Time Series Data) конкретных метрик вовлеченности (клики, сессии, dwell time) для каждого пользователя в контрольной и тестовой группах за весь период эксперимента.
    • Данные на выходе: Заключение о тренде (возрастающий/убывающий) метрики вовлеченности, вызванном экспериментальным изменением (Experimental Treatment).
    • Технические особенности: Ключевой особенностью является применение сложных математических методов (Дискретное преобразование Фурье) для анализа поведенческих данных, что позволяет уловить динамику, невидимую при простом усреднении.

    На что влияет

    Метод влияет на принятие решений о внедрении изменений в поисковую систему.

    • Алгоритмы ранжирования (RANKING): Если новый алгоритм ранжирования (выступающий как Experimental Treatment) показывает возрастающий тренд по ключевым метрикам вовлеченности (например, кликам или времени сессии), он, вероятно, будет внедрен.
    • Метапоиск и Смешивание (BLENDER): Изменения в логике смешивания вертикалей или дизайне SERP также оцениваются этим методом.
    • Типы контента и запросов: Метод универсален и может применяться для оценки изменений, затрагивающих любые типы контента и запросов, так как он измеряет общую вовлеченность пользователей.

    Когда применяется

    • Условия применения: Применяется в рамках A/B тестирования для оценки влияния изменений на поведение пользователей.
    • Временные рамки: Анализ проводится после завершения экспериментального периода (например, 10 дней, как указано в примере патента), когда собрано достаточно данных для построения временных рядов. Это офлайн-процесс.

    Пошаговый алгоритм

    Процесс определения тренда вовлеченности пользователя.

    1. Настройка эксперимента (A/B Test Setup): Определяется экспериментальное изменение (например, новый фактор ранжирования). Пользователи случайным образом делятся на контрольную (Control) и тестовую (Test) группы. Определяется экспериментальный период (N дней).
    2. Сбор данных (Data Acquisition): В течение экспериментального периода собираются данные о взаимодействиях пользователей. Для каждого пользователя формируется временной ряд выбранной метрики вовлеченности (например, количество сессий в день): $y=(y_{0},y_{1},y_{2},…y_{N-1})$.
    3. Дискретизационное преобразование (Discretization Transform): К временному ряду каждого пользователя применяется Дискретное преобразование Фурье (DFT).
    4. Вычисление Метрики Периодичности (Periodicity Metric Calculation): Вычисляется Метрика Периодичности ($X_{1}$). В патенте она определяется как первый гармонический член ряда Фурье.
      Формула ряда Фурье: $$X_{k}=\Sigma_{n=0}^{N-1}x_{n}e^{-i\pi\omega n_{k}},\omega_{k}=\frac{2\pi k}{N}$$
    5. Вычисление индивидуальных метрик (Metric Calculation): Для каждого пользователя рассчитываются:
      • Amplitude Metric (A): Магнитуда изменения. Рассчитывается как нормализованное абсолютное значение $X_{1}$. $$A=|X_{1}|/N$$
      • Phase Metric (P): Направление изменения. Рассчитывается как мнимая часть $X_{1}$. $$P=Im(X_{1})$$
    6. Агрегация (Averaging): Вычисляются средние групповые метрики:
      • Control Average Amplitude (C_A).
      • Test Average Amplitude (T_A).
      • Test Average Phase (T_P).
    7. Анализ тренда (Trend Analysis):
      1. Вычисляется разница амплитуд (Amplitude Difference): $AD = T\_A — C\_A$.
      2. Определяется тренд на основе знаков AD и T_P:
        • Сценарий 1 (AD > 0, T_P > 0): Возрастающий тренд. Величина изменения в тестовой группе выше, и фаза указывает на рост.
        • Сценарий 2 (AD < 0, T_P < 0): Возрастающий тренд. Величина изменения в тестовой группе ниже, но фаза указывает на рост в отрицательную сторону (что также является ростом магнитуды).
        • Сценарий 3 (AD > 0, T_P < 0): Убывающий тренд. Величина выше, но фаза указывает на тренд к уменьшению разницы.
        • Сценарий 4 (AD < 0, T_P > 0): Убывающий тренд. Величина ниже, но фаза указывает на тренд к увеличению (т.е. к уменьшению отрицательной разницы).
    8. Интерпретация результата (Interpretation): Возрастающий или убывающий тренд интерпретируется как положительный или отрицательный эффект в зависимости от самой метрики. (Например, возрастающий тренд кликов – хорошо; возрастающий тренд времени отсутствия – плохо).

    Какие данные и как использует

    Данные на входе

    Система использует исключительно Поведенческие факторы, представленные в виде временных рядов.

    • Поведенческие факторы: В патенте явно упоминаются следующие метрики взаимодействий (interactions), которые могут использоваться:
      • Количество сессий (Number of sessions).
      • Время пребывания (Dwell time).
      • Время на сессию (Time per session).
      • Количество кликов (Number of clicks).
      • Количество запросов (Number of queries).
      • Время отсутствия (Absence time) (упомянуто в описании).

    Контентные, ссылочные, технические и другие факторы в этом патенте не используются. Они могут быть частью Experimental Treatment (например, изменение ранжирования на основе ссылочного фактора), но сам метод анализа использует только результаты этого воздействия на поведение пользователей.

    Какие метрики используются и как они считаются

    • Discretization Transform: Основной метод – Дискретное преобразование Фурье (DFT). Альтернативы: Wavelet Transform, Laplace Transform. Цель – преобразовать временные данные в частотную область.
    • Periodicity Metric (X1): Первый гармонический член ряда Фурье, полученный в результате DFT.
    • Amplitude Metric (A): Измеряет магнитуду изменения вовлеченности. Формула: $A=|X_{1}|/N$.
    • Phase Metric (P): Измеряет направление тренда вовлеченности. Формула: $P=Im(X_{1})$.
    • Amplitude Difference (AD): Разница между средней амплитудой тестовой и контрольной групп. Используется для определения влияния экспериментального изменения на величину тренда.
    • Нормализация: Amplitude Metric нормализуется на количество сессий (N).

    Выводы

    1. Яндекс ценит тренды выше средних значений: Патент подтверждает, что при оценке качества поиска Яндекс стремится измерять долгосрочное влияние изменений. Устойчивая вовлеченность (Sustained Engagement) и положительные тренды являются целью, а не просто высокие средние показатели за короткий период.
    2. Сложный математический аппарат для анализа поведения: Яндекс использует методы цифровой обработки сигналов (Дискретное преобразование Фурье) для анализа поведенческих данных. Это позволяет выявлять скрытые закономерности и динамику в поведении пользователей.
    3. Разделение величины и направления изменения: Метод четко разделяет анализ на два компонента: Amplitude (насколько сильно изменилось поведение) и Phase (в какую сторону оно меняется). Оба компонента необходимы для корректной интерпретации тренда.
    4. Научная валидация качества поиска: Этот метод является частью инфраструктуры, которая позволяет Яндексу научно обосновывать решения о внедрении новых алгоритмов ранжирования и других изменений в поиске. Изменения, которые не приводят к положительному тренду вовлеченности, вероятно, будут отклонены.

    Практика

    Best practices (это мы делаем)

    Хотя патент описывает внутреннюю методологию измерений Яндекса, он дает важные стратегические ориентиры для SEO.

    • Фокус на долгосрочном удовлетворении пользователя (Long-Term User Satisfaction): Стратегия должна быть направлена на создание ценности, которая заставляет пользователей возвращаться на сайт и поддерживать высокий уровень взаимодействия. Яндекс измеряет тренды, поэтому важно, чтобы вовлеченность росла или оставалась стабильно высокой.
    • Оптимизация под метрики подлинной вовлеченности: Необходимо работать над улучшением метрик, которые отражают реальное решение задачи пользователя: длительное время пребывания (при условии полезности контента), глубина просмотра, низкий показатель отказов и возвратов к выдаче.
    • Качество и глубина контента: Создание экспертного, авторитетного контента (E-E-A-T), который полностью раскрывает тему, способствует устойчивому интересу пользователей и положительным поведенческим трендам.
    • Улучшение UX/UI: Удобный интерфейс, высокая скорость загрузки и отсутствие технических проблем способствуют удержанию пользователей и формированию положительных трендов вовлеченности.

    Worst practices (это делать не надо)

    • Тактики для краткосрочных поведенческих всплесков: Использование кликбейтных заголовков, вводящих в заблуждение сниппетов или агрессивной рекламы для искусственного повышения CTR или времени на сайте. Хотя эти тактики могут повысить средние показатели, методология Яндекса, описанная в патенте, выявит последующий спад вовлеченности (убывающий тренд), что приведет к негативной оценке качества.
    • Накрутка поведенческих факторов: Искусственная симуляция активности, которая не может быть устойчивой в долгосрочной перспективе. Система анализа трендов способна отличить органический рост вовлеченности от неестественных паттернов и последующего спада.
    • Игнорирование оттока пользователей (Churn): Если сайт теряет аудиторию или пользователи становятся менее активными, это формирует негативный тренд, который Яндекс учитывает при оценке качества поиска в целом.

    Стратегическое значение

    Этот патент подтверждает, что конечным мерилом качества поиска для Яндекса является поведение пользователей, причем не усредненное, а в динамике. Он демонстрирует высокий уровень сложности инструментов, которые Яндекс использует для интерпретации этих данных. Для SEO это означает, что долгосрочная стратегия должна строиться на подлинном и устойчивом удовлетворении пользователя. Попытки обмануть систему краткосрочными манипуляциями обречены на провал, так как Яндекс обладает инструментарием для точного измерения трендов вовлеченности.

    Практические примеры

    Поскольку патент описывает внутренний инструмент анализа, прямых примеров применения в SEO нет. Однако можно смоделировать сценарий, как этот метод влияет на решения Яндекса.

    Сценарий: Оценка двух алгоритмов генерации сниппетов

    Яндекс проводит A/B тест двух новых алгоритмов генерации сниппетов в течение 14 дней.

    • Алгоритм А (Кликбейт): Генерирует более интригующие, но менее точные сниппеты.
    • Алгоритм Б (Точность): Генерирует точные, но менее «продающие» сниппеты.

    Анализ результатов:

    1. Стандартный анализ (Средние значения): Алгоритм А показывает средний CTR на 5% выше, чем Алгоритм Б. На основе этого Алгоритм А выглядит победителем.
    2. Анализ трендов (по патенту): Система анализирует временные ряды CTR.
      • Алгоритм А: Показывает высокую активность в первые дни, но затем пользователи адаптируются и понимают, что сниппеты вводят в заблуждение. Вовлеченность падает. Анализ показывает: Высокая Amplitude Difference, но отрицательная Test Average Phase. Вывод: Убывающий тренд.
      • Алгоритм Б: Показывает стабильный CTR с небольшим ростом к концу периода, так как пользователи доверяют выдаче. Анализ показывает: Положительная Amplitude Difference и положительная Test Average Phase. Вывод: Возрастающий тренд.
    3. Решение Яндекса: Несмотря на более низкий средний CTR, Яндекс внедряет Алгоритм Б, так как он обеспечивает положительный тренд долгосрочной вовлеченности.

    Вопросы и ответы

    Являются ли Amplitude Metric и Phase Metric факторами ранжирования?

    Нет, напрямую они не являются факторами ранжирования. Это метрики, используемые внутри Яндекса для анализа результатов A/B тестов. Они определяют, какие изменения в алгоритмах ранжирования (факторы) будут внедрены в продакшн. Если изменение приводит к положительному тренду вовлеченности (измеренному через Amplitude и Phase), оно считается успешным.

    Что такое Дискретное преобразование Фурье (DFT) и зачем оно используется в этом патенте?

    DFT — это математический инструмент, который позволяет преобразовать временной ряд данных (например, ежедневные клики) в частотную область. Это помогает выявить периодичность и тренды в данных. В контексте патента DFT используется для вычисления Метрики Периодичности, на основе которой затем рассчитываются Амплитуда (величина изменения) и Фаза (направление изменения) поведения пользователя.

    Что конкретно означает Amplitude Metric для SEO?

    Amplitude Metric (Метрика Амплитуды) измеряет, насколько сильно изменилась вовлеченность пользователя за период эксперимента. Высокая амплитуда означает значительное изменение (неважно, в лучшую или худшую сторону). Для SEO это сигнал о том, что Яндекс измеряет не только факт взаимодействия, но и интенсивность изменения этого взаимодействия с течением времени.

    Что конкретно означает Phase Metric для SEO?

    Phase Metric (Метрика Фазы) определяет направление тренда – растет ли вовлеченность или падает. Это критически важный компонент. Для SEO это подчеркивает важность устойчивого положительного поведения. Если ваш сайт сначала привлек много внимания (высокая амплитуда), но затем интерес упал (негативная фаза), это будет интерпретировано как убывающий тренд.

    Почему патент описывает четыре сценария интерпретации тренда, и почему два из них приводят к «Возрастающему тренду»?

    Четыре сценария возникают из комбинации знаков Разницы Амплитуд (AD) и Тестовой Фазы (T_P). Возрастающий тренд фиксируется, когда оба знака одинаковы (Позитивный/Позитивный или Негативный/Негативный). Это связано с математическими свойствами преобразования Фурье: рост может происходить как в положительную, так и в отрицательную сторону (магнитуда увеличивается в обоих случаях). Важно понимать, что здесь «возрастающий» означает увеличение магнитуды изменения.

    Как этот патент связан с метриками Proxima и Профицит?

    Proxima и Профицит — это ключевые метрики качества поиска Яндекса. Описанный в патенте метод является инструментом для измерения того, как изменения в поиске влияют на эти (и другие) метрики вовлеченности с течением времени. Яндекс может использовать этот метод анализа трендов, чтобы убедиться, что новый алгоритм не только повышает среднее значение Профицита, но и обеспечивает его возрастающий тренд.

    Какие типы поведения пользователей Яндекс считает наиболее важными согласно этому патенту?

    Патент не приоритизирует конкретные метрики, но упоминает количество сессий, кликов, запросов, время пребывания (dwell time) и время отсутствия (absence time). Ключевая мысль заключается в том, что наиболее важным является не конкретная метрика, а ее положительный тренд с течением времени, что указывает на устойчивую вовлеченность и удержание пользователя.

    Может ли этот метод обнаружить накрутку поведенческих факторов?

    Косвенно, да. Накрутка часто характеризуется резким всплеском активности, за которым следует спад, когда накрутка прекращается. Такой паттерн будет зафиксирован как высокая Амплитуда, но негативная Фаза (Убывающий тренд). Это позволяет Яндексу отклонять изменения, которые приводят к таким нестабильным результатам, и лучше понимать качество трафика.

    Стоит ли мне пытаться оптимизировать свой сайт под возрастающий тренд?

    Да, но не искусственно. Стратегия должна заключаться в создании реальной долгосрочной ценности. Это включает регулярное обновление контента, улучшение UX, работу над E-E-A-T и построение лояльного сообщества. Цель – добиться органического роста или стабильно высокой вовлеченности пользователей, что и будет зафиксировано Яндексом как положительный тренд.

    Если я вижу падение трафика после апдейта Яндекса, означает ли это, что мой сайт показал убывающий тренд во время их A/B теста?

    Это вполне вероятно. Апдейт (внедрение нового алгоритма) происходит после того, как A/B тест показал положительный тренд вовлеченности для новой версии выдачи. Если ваш сайт ранжировался лучше в старой версии, но хуже в новой (которая оказалась лучше для пользователей в целом), это означает, что пользователи предпочитали другие результаты или ваш сайт не соответствовал критериям качества нового алгоритма, что привело к снижению вашей видимости.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.