Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс использует анализ временных рядов и Преобразование Фурье для оценки трендов вовлеченности в A/B тестах

    СПОСОБ ОПРЕДЕЛЕНИЯ ТРЕНДА ПОКАЗАТЕЛЯ СТЕПЕНИ ВОВЛЕЧЕННОСТИ ПОЛЬЗОВАТЕЛЯ (METHOD FOR DETERMINING TREND OF INDICATOR OF DEGREE OF USER INVOLVEMENT)
    • RU2642411C2
    • Yandex LLC
    • 2018-01-24
    • 2016-04-04
    2018 SERP Метрики качества поиска Патенты Яндекс Поведенческие факторы

    Яндекс патентует метод оценки результатов A/B тестирования, который фокусируется на тренде вовлеченности пользователя, а не только на средних значениях. Используя Дискретное Преобразование Фурье, система вычисляет метрики «Амплитуда» (величина изменения) и «Фаза» (направление изменения) поведенческих сигналов. Это позволяет определить, вызывает ли изменение в сервисе (включая алгоритмы ранжирования) устойчивый рост или падение интереса пользователей.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему ограниченности традиционных метрик A/B тестирования, основанных на средних значениях поведенческих показателей. Средние значения усредняются за весь экспериментальный период и могут скрывать важную динамику. Например, пользователь с высокой активностью в начале и низкой в конце (эффект новизны) может иметь то же среднее значение, что и пользователь со стабильной активностью. Изобретение направлено на точное измерение тренда (роста или снижения) вовлеченности пользователя в течение эксперимента, обеспечивая более точную оценку долгосрочного эффекта изменений.

    Что запатентовано

    Запатентован способ анализа результатов A/B тестирования путем применения методов анализа временных рядов к данным о взаимодействии пользователей. Суть изобретения заключается в использовании Дискретного Преобразования (в частности, Дискретного Преобразования Фурье, DFT) для вычисления двух ключевых показателей: Показателя Амплитуды (величина изменения вовлеченности) и Показателя Фазы (направление изменения вовлеченности). Это позволяет оценить тренд вовлеченности, вызванный экспериментом.

    Как это работает

    Система собирает временные ряды данных о взаимодействии (например, ежедневное количество кликов или сессий) для пользователей в контрольной и тестовой группах. К данным каждого пользователя применяется DFT для извлечения первой гармоники (Показатель Периодичности, X1X_{1}X1​). Величина (модуль) этой гармоники определяет Амплитуду (A), а ее мнимая часть определяет Фазу (P). Сравнивая средние значения A и P между группами, Яндекс определяет, вызывает ли эксперимент возрастающий или убывающий тренд вовлеченности.

    Актуальность для SEO

    Высокая. Сложный анализ результатов A/B тестов и метрик вовлеченности пользователей (связанных с Профицитом и Proxima) является центральным элементом процесса улучшения качества поиска в Яндексе. Анализ временной динамики и трендов поведения остается критически важным для оценки долгосрочного влияния изменений в алгоритмах.

    Важность для SEO

    Влияние на SEO среднее (5/10). Важно понимать: это не патент о ранжировании. Он описывает методологию оценки, которую Яндекс использует, чтобы решить, является ли изменение (в том числе изменение алгоритма ранжирования) успешным. Для SEO это подчеркивает, что Яндекс ценит устойчивый, положительный тренд вовлеченности, а не просто временные всплески метрик. Понимание того, как Яндекс измеряет успех своих обновлений, дает стратегическое преимущество.

    Детальный разбор

    Термины и определения

    A/B Тестирование (A/B Testing)
    Метод сравнения двух версий сервиса (контрольной и тестовой) путем предложения их разным группам пользователей для оценки влияния изменений.
    Амплитудная Разница (Amplitude Difference, ΔA\Delta AΔA)
    Разница между средним тестовым показателем амплитуды и средним контрольным показателем амплитуды. Представляет собой разницу в величине изменения вовлеченности, вызванную экспериментом.
    Дискретное Преобразование (Discrete Transform)
    Математическая операция, преобразующая временной ряд данных в частотное представление. В патенте упоминаются Дискретное Преобразование Фурье (DFT), Вейвлет-преобразование и Преобразование Лапласа.
    Показатель Амплитуды (Amplitude Indicator, A)
    Метрика, вычисленная на основе величины (модуля) Показателя Периодичности. Представляет собой величину изменения степени вовлеченности пользователя за экспериментальный период, независимо от направления.
    Показатель Периодичности (Periodicity Indicator, X1X_1X1​)
    Результат применения Дискретного Преобразования к временному ряду взаимодействий. В контексте DFT это первая гармоника (X1X_1X1​), которая отражает основной тренд за период.
    Показатель Фазы (Phase Indicator, P)
    Метрика, вычисленная на основе мнимой части Показателя Периодичности. Представляет собой направление изменения (возрастание или убывание) степени вовлеченности пользователя.
    Указания (Indications) / Взаимодействия
    Данные, представляющие активность пользователя с веб-сервисом (число сессий, кликов, время покоя, число запросов и т.д.). Используются как входные данные для анализа.
    Экспериментальный период (N)
    Продолжительность A/B теста, в течение которого собираются данные (например, N дней).

    Ключевые утверждения (Анализ Claims)

    Патент защищает метод определения тренда вовлеченности в рамках A/B тестирования с использованием анализа временных рядов через дискретные преобразования.

    Claim 1 (Независимый пункт): Описывает основной процесс определения тренда.

    1. Настройка A/B теста: Предоставление тестовой и контрольной версий веб-сервиса соответствующим группам.
    2. Сбор данных: Получение временных рядов взаимодействий за экспериментальный период.
    3. Индивидуальный расчет показателей для каждого пользователя:
      • Выполнение Дискретного Преобразования (например, DFT).
      • Вычисление Показателя Периодичности (X1X_1X1​).
      • Вычисление Показателя Амплитуды (A) (на основе величины X1X_1X1​). Отражает величину изменения.
      • Вычисление Показателя Фазы (P) (на основе мнимой части X1X_1X1​). Отражает направление изменения.
    4. Расчет средних групповых показателей: Средняя A (Контроль), Средняя A (Тест), Средняя P (Тест). (Claim 1 также упоминает средний контрольный показатель фазы).
    5. Определение тренда: На основе анализа средних показателей амплитуды и фазы.

    Claims 2-11 (Зависимые пункты): Детализируют логику интерпретации тренда.

    Эти пункты описывают четыре основных сценария, основанных на знаках Амплитудной Разницы (ΔA\Delta AΔA = Avg_A_Test — Avg_A_Ctrl) и Среднего Тестового Показателя Фазы (Avg_P_Test).

    Сценарии возрастающего тренда (Claims 3, 5): Величина разницы растет.

    • ΔA\Delta AΔA положительна И Avg_P_Test положителен.
    • ΔA\Delta AΔA отрицательна И Avg_P_Test отрицателен.

    Сценарии убывающего тренда (Claims 7, 9): Разница сокращается.

    • ΔA\Delta AΔA положительна И Avg_P_Test отрицателен.
    • ΔA\Delta AΔA отрицательна И Avg_P_Test положителен.

    Пункты 4, 6, 8, 10 подчеркивают, что интерпретация тренда (хорошо это или плохо) зависит от природы самой метрики (например, возрастающий тренд по кликам – это хорошо, а возрастающий тренд по времени отсутствия – плохо).

    Где и как применяется

    Этот патент описывает инфраструктурный механизм оценки качества, а не компонент ранжирования.

    Слой Качества и Метрик (QUALITY & GOVERNANCE LAYER)
    Это основная область применения патента. Описанный способ используется для анализа результатов A/B тестирования. Он позволяет инженерам и аналитикам Яндекса принимать решения о том, следует ли внедрять изменения (включая обновления алгоритмов ранжирования или изменения в SERP) в продакшн.

    • Взаимодействие с компонентами: Система взаимодействует с инфраструктурой A/B тестирования и хранилищем логов пользовательского поведения.
    • Данные на входе: Временные ряды (Time Series) данных о взаимодействиях пользователей (клики, сессии, время на сайте, время отсутствия) для контрольной и тестовой групп за экспериментальный период N.
    • Данные на выходе: Количественная оценка тренда (возрастающий/убывающий), основанная на средних показателях Амплитуды и Фазы.

    На что влияет

    • Принятие решений об обновлениях: Влияет на то, какие изменения в алгоритмах ранжирования (RANKING), дизайне выдачи (BLENDER, Генерация SERP) или других компонентах системы будут приняты. Если изменение приводит к положительному тренду вовлеченности, оно, вероятно, будет внедрено.
    • Метрики качества: Этот метод может использоваться для расчета или валидации сложных метрик качества, таких как Профицит (Proficit), которые оценивают успех сессии и долгосрочную лояльность.
    • Веб-сервисы: В патенте указано, что веб-сервис может представлять собой поисковую систему или страницу результатов поиска (SERP).

    Когда применяется

    • Условия применения: Применяется в рамках A/B тестирования при внесении любых изменений в веб-сервис.
    • Временные рамки: Это офлайн-процесс. Требует накопления данных за достаточный экспериментальный период (N дней/недель), чтобы можно было установить тренд и применить Дискретное Преобразование Фурье.

    Пошаговый алгоритм

    Процесс определения тренда вовлеченности пользователя.

    1. Настройка эксперимента и сбор данных:
      • Запуск A/B теста с контрольной (Ctrl) и тестовой (Test) группами.
      • Сбор временных рядов взаимодействий для каждого пользователя за N дней: (y0,y1,y2,...,yN−1)(y_{0},y_{1},y_{2},…,y_{N-1})(y0​,y1​,y2​,…,yN−1​).
    2. Дискретное Преобразование: Применение Дискретного Преобразования Фурье (DFT) к временному ряду каждого пользователя.
    3. Вычисление Гармоник (Показатель Периодичности): Расчет гармоник XkX_{k}Xk​ по формуле:
      Xk=Σn=0N−1xne−inωkX_{k}=\Sigma_{n=0}^{N-1}x_{n}e^{-in\omega_{k}}Xk​=Σn=0N−1​xn​e−inωk​, где ωk=2πkN\omega_{k}=\frac{2\pi k}{N}ωk​=N2πk​
      Ключевым является расчет первой гармоники X1X_{1}X1​.
    4. Вычисление Индивидуальных Показателей:
      • Расчет Показателя Амплитуды (A) для каждого пользователя: A=∣X1∣/NA=|X_{1}|/NA=∣X1​∣/N. (Величина изменения).
      • Расчет Показателя Фазы (P) для каждого пользователя: P=Im(X1)P=Im(X_{1})P=Im(X1​). (Направление изменения).
    5. Групповое Усреднение:
      • Вычисление среднего контрольного показателя амплитуды (Avg_A_Ctrl).
      • Вычисление среднего тестового показателя амплитуды (Avg_A_Test).
      • Вычисление среднего тестового показателя фазы (Avg_P_Test).
    6. Анализ Тренда:
      • Вычисление Амплитудной Разницы: ΔA\Delta AΔA = Avg_A_Test — Avg_A_Ctrl.
      • Анализ знаков ΔA\Delta AΔA и Avg_P_Test:
        • Если (ΔA\Delta AΔA > 0 И Avg_P_Test > 0) ИЛИ (ΔA\Delta AΔA < 0 И Avg_P_Test < 0) → Тренд Возрастающий.
        • Если (ΔA\Delta AΔA > 0 И Avg_P_Test < 0) ИЛИ (ΔA\Delta AΔA < 0 И Avg_P_Test > 0) → Тренд Убывающий.
    7. Интерпретация результата: Определение того, является ли выявленный тренд положительным или отрицательным для веб-сервиса, в зависимости от того, какая метрика анализировалась (например, возрастающий тренд кликов – хорошо; возрастающий тренд времени отсутствия – плохо).

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Являются основой для анализа. Используются временные ряды данных о взаимодействиях пользователя с сервисом. В патенте конкретно упоминаются:
      • Число сеансов (Number of sessions).
      • Время покоя / Время отсутствия (Dormancy time / Absence time).
      • Время сеанса (Session time).
      • Число кликов (Number of clicks).
      • Число запросов (Number of queries).
    • Временные факторы: Временные метки взаимодействий критически важны для построения временного ряда.

    Какие метрики используются и как они считаются

    • Дискретное Преобразование Фурье (DFT): Основной математический метод, используемый для преобразования данных из временной области в частотную. Также упоминаются Вейвлет-преобразование и Преобразование Лапласа как альтернативы.
    • Показатель Периодичности (X1X_1X1​): Первая гармоника, полученная в результате DFT. Является комплексным числом.
    • Показатель Амплитуды (A): Рассчитывается как нормализованная величина (модуль) X1X_1X1​. A=∣X1∣/NA=|X_{1}|/NA=∣X1​∣/N.
    • Показатель Фазы (P): Рассчитывается как мнимая часть X1X_1X1​. P=Im(X1)P=Im(X_{1})P=Im(X1​).

    Выводы

    1. Яндекс ценит тренды выше средних значений при оценке изменений: Патент подтверждает, что при анализе A/B тестов Яндекс фокусируется на динамике поведения пользователей во времени. Это позволяет отличать краткосрочные эффекты (например, «эффект новизны») от долгосрочных изменений в лояльности.
    2. Сложный математический аппарат для анализа поведения: Использование Дискретного Преобразования Фурье (DFT) для анализа временных рядов указывает на высокий уровень сложности и научный подход к измерению вовлеченности.
    3. Декомпозиция вовлеченности на Амплитуду и Фазу: Вовлеченность анализируется через два компонента: насколько сильно изменилось поведение (Амплитуда) и в каком направлении (Фаза). Оба компонента необходимы для корректной интерпретации тренда.
    4. Контекстуальная интерпретация метрик: Система учитывает природу метрики. Возрастающий тренд не всегда положителен (например, если растет время отсутствия пользователя на сервисе).
    5. Фокус на долгосрочное удержание (Retention): Эта методология позволяет Яндексу обнаруживать устойчивые эффекты изменений в алгоритмах или интерфейсе, которые влияют на долгосрочное удержание пользователей и качество сервиса.

    Практика

    Best practices (это мы делаем)

    Хотя патент описывает внутренние механизмы оценки Яндекса, он дает важные инсайты для SEO-стратегии.

    • Фокус на устойчивом удовлетворении пользователя (Sustained User Satisfaction): Оптимизируйте сайт так, чтобы пользователи не просто совершали целевое действие, но и хотели вернуться. Яндекс измеряет тренды, поэтому важно обеспечивать стабильно высокое качество взаимодействия.
    • Оптимизация под долгосрочную вовлеченность: Работайте над метриками, отражающими лояльность: глубина просмотра, частота возвратов (Retention), уменьшение времени отсутствия (Dormancy time). Алгоритмы ранжирования, которые проходят проверку с помощью описанного метода, будут поощрять сайты, улучшающие эти показатели.
    • Анализ трендов в собственных данных: При анализе влияния SEO-работ не полагайтесь только на средние значения трафика или конверсий в Метрике. Анализируйте тренды во времени и используйте когортный анализ, чтобы понять динамику поведения.

    Worst practices (это делать не надо)

    • Тактики краткосрочного буста метрик (Кликбейт): Использование кликбейта или манипулятивных UX-паттернов может дать краткосрочный рост средних показателей. Однако, если это приводит к негативному тренду вовлеченности (пользователи разочаровываются со временем), система Яндекса это зафиксирует. Алгоритмы, направленные на борьбу с такими практиками (например, Anti-Quality), вероятно, будут одобрены с помощью этого метода оценки.
    • Игнорирование динамики поведения: Оценка успеха только по средним значениям может привести к неверным стратегическим решениям, так как она игнорирует ухудшение или улучшение ситуации во времени.
    • Краткосрочная накрутка ПФ: Попытки искусственно завысить ПФ могут быть обнаружены как неестественный тренд. Например, если активность резко возрастает, а затем падает (когда бюджет на накрутку заканчивается), метод анализа трендов может интерпретировать это негативно (как убывающий тренд после всплеска).

    Стратегическое значение

    Патент подтверждает стратегический приоритет Яндекса на измерение качества через долгосрочное поведение пользователей. Он показывает, что система оценки изменений (включая обновления ранжирования) настроена на выявление устойчивых трендов, а не сиюминутной выгоды. Это укрепляет понимание того, что метрики качества Яндекса (Proxima, Профицит) вероятно также включают анализ временной динамики. Для SEO это означает, что долгосрочная стратегия должна быть направлена на построение качественного ресурса, который формирует лояльную аудиторию.

    Практические примеры

    Сценарий: Яндекс тестирует новый алгоритм ранжирования (Эксперимент).

    Яндекс проводит A/B тест в течение 14 дней. Измеряемая метрика – Ежедневное количество кликов на результаты поиска (Больше = лучше).

    Ситуация 1 (Положительный тренд):

    • Наблюдение: Среднее количество кликов в тестовой группе чуть ниже, чем в контрольной.
    • Анализ DFT: Амплитудная разница (ΔA\Delta AΔA) положительна, Средний Тестовый Показатель Фазы (Avg_P_Test) положителен.
    • Вывод Яндекса: Тренд возрастающий. Хотя среднее значение пока ниже, вовлеченность пользователей растет с течением времени. Эксперимент, вероятно, успешен в долгосрочной перспективе.

    Ситуация 2 (Отрицательный тренд – Эффект новизны):

    • Наблюдение: Среднее количество кликов в тестовой группе значительно выше, чем в контрольной (например, из-за более агрессивных сниппетов).
    • Анализ DFT: ΔA\Delta AΔA положительна, Avg_P_Test отрицателен.
    • Вывод Яндекса: Тренд убывающий. Несмотря на высокое среднее значение, вовлеченность падает со временем (пользователи разочаровываются после первоначального всплеска интереса). Эксперимент, вероятно, будет отклонен.

    Вопросы и ответы

    Описывает ли этот патент конкретный фактор ранжирования?

    Нет, этот патент не описывает фактор ранжирования. Он описывает внутреннюю методологию, которую Яндекс использует для анализа результатов A/B тестов. Эта методология применяется для оценки успешности любых изменений в сервисе, включая изменения в алгоритмах ранжирования. Она определяет, будет ли обновление внедрено или нет.

    Каков главный вывод из этого патента для SEO-специалиста?

    Главный вывод заключается в том, что Яндекс при оценке качества фокусируется на трендах пользовательского поведения, а не только на средних значениях. Это означает, что SEO-стратегия должна быть направлена на обеспечение устойчивого, долгосрочного удовлетворения пользователей и формирование лояльности (Retention), а не на краткосрочные всплески метрик.

    Что такое «Показатель Амплитуды» в контексте этого патента?

    Показатель Амплитуды (A) — это метрика, которая количественно оценивает величину изменения в поведении пользователя за экспериментальный период. Он рассчитывается с использованием Дискретного Преобразования Фурье (как модуль первой гармоники). Высокая амплитуда означает, что поведение пользователя значительно изменилось, но она не указывает, было ли это изменение положительным или отрицательным.

    Что такое «Показатель Фазы» и зачем он нужен?

    Показатель Фазы (P) определяет направление изменения поведения пользователя — возрастает оно или убывает в течение экспериментального периода. Он рассчитывается как мнимая часть первой гармоники DFT. Фаза необходима для интерпретации Амплитуды: вместе они определяют тренд (например, растет ли разница в поведении между тестовой и контрольной группой или сокращается).

    Зачем Яндекс использует сложное Преобразование Фурье вместо простого сравнения средних значений?

    Средние значения скрывают временную динамику. Два сценария могут иметь одинаковое среднее значение вовлеченности, но совершенно разные тренды (один улучшается, другой ухудшается). Преобразование Фурье позволяет преобразовать временные данные в частотную область, выявляя скрытые тренды, что дает гораздо более точное понимание долгосрочного влияния изменений и позволяет отсечь «эффект новизны».

    Какие поведенческие метрики анализируются этим методом?

    Патент упоминает несколько примеров «указаний» (метрик вовлеченности), которые могут быть проанализированы: число сеансов, число кликов, число запросов, время сеанса, а также время покоя (время отсутствия пользователя на сервисе). Метод универсален и может применяться к любому поведенческому сигналу, представленному в виде временного ряда.

    Что означает «Возрастающий тренд» в интерпретации Яндекса?

    Возрастающий тренд означает, что разница в поведении между тестовой и контрольной группами увеличивается со временем. Важно понимать, что это не всегда хорошо. Если анализируется метрика «время отсутствия» (где меньше = лучше), то возрастающий тренд будет означать негативный результат эксперимента. Если анализируются «клики» (где больше = лучше), то возрастающий тренд положителен.

    Как этот патент связан с метриками Proxima и Профицит?

    Proxima и Профицит являются ключевыми метриками качества в Яндексе. Описанный в патенте метод анализа временных рядов, вероятно, используется как один из инструментов для расчета или валидации этих метрик. Профицит, оценивающий успех сессии и долгосрочную полезность, напрямую выигрывает от способности анализировать тренды вовлеченности, а не только изолированные события.

    Может ли этот механизм привести к тому, что обновление с хорошими средними показателями будет отклонено?

    Да, абсолютно. Если обновление показывает высокие средние значения метрик (например, за счет кликбейта), но анализ DFT выявляет убывающий тренд вовлеченности (Показатель Фазы указывает на снижение), это означает, что пользователи со временем разочаровываются. Такое обновление, скорее всего, будет признано неудачным и отклонено Яндексом.

    Может ли этот метод использоваться для обнаружения накруток ПФ?

    В патенте это не указано, но анализ временных рядов и трендов может помочь выявить неестественную динамику. Накрутки часто создают резкие всплески активности, которые затем прекращаются. Если это происходит в рамках экспериментального периода, метод может зафиксировать убывающий тренд (отрицательную фазу) после первоначального всплеска, что является негативным сигналом.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.