Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс использует перекрестное офлайн-обучение для оптимизации параметров PPC-аукциона и предотвращения манипуляций ставками

    METHOD AND SYSTEM OF DETERMINING AN OPTIMAL VALUE OF AN AUCTION PARAMETER FOR A DIGITAL OBJECT (Метод и система определения оптимального значения параметра аукциона для цифрового объекта)
    • US10529011B2
    • Yandex LLC
    • 2020-01-07
    • 2016-09-27
    2020 Антиспам Обучение моделей Патенты Яндекс Яндекс Директ

    Патент описывает внутреннюю механику рекламных аукционов Яндекса (например, Яндекс.Директ). Для предотвращения манипуляций ставками и снижения нагрузки на серверы, Яндекс использует офлайн машинное обучение для расчета оптимальных параметров аукциона (например, резервной цены). Ключевой механизм: рекламодатели делятся на две группы; модель обучается на данных Группы А, но применяется к Группе Б, и наоборот. Это гарантирует, что история ставок рекламодателя не влияет напрямую на его собственные ценовые пороги. Патент относится исключительно к PPC, а не к органическому поиску.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает две фундаментальные задачи в контексте систем онлайн-аукционов, таких как контекстная реклама (PPC):

    1. Предотвращение манипуляций рынком (Bid Manipulation): Системы, где резервная цена (Reserve Price) зависит от истории ставок рекламодателя, уязвимы. Рекламодатели могут намеренно снижать ставки, чтобы искусственно занизить резервную цену, формируя невыгодное для платформы состояние рынка (плохое равновесие Нэша).
    2. Снижение нагрузки на сервер (Infrastructure Efficiency): Вычисление сложных оптимальных параметров аукциона в режиме реального времени создает высокую вычислительную нагрузку. Патент предлагает метод офлайн-вычислений для повышения производительности.

    Что запатентовано

    Запатентован метод и система для определения оптимального значения параметра аукциона (например, минимальной цены размещения) для цифрового объекта (рекламного объявления). Суть изобретения заключается в использовании офлайн машинного обучения (Offline Training) и методологии перекрестного применения моделей. Модель обучается на исторических данных одной группы рекламодателей, а применяется для определения оптимальных параметров для другой группы. Это разрывает петлю обратной связи, предотвращая манипуляции, и переносит вычисления в офлайн.

    Как это работает

    Система собирает исторические данные аукционов (ставки, показы, факторы окружения) и делит рекламодателей на две части (Group A и Group B). Далее выполняется офлайн-обучение:

    1. Модель ML обучается на данных Group A для предсказания оптимальных параметров.
    2. Эта модель применяется для расчета параметров для Group B.
    3. Параллельно обучается вторая модель ML на данных Group B.
    4. Эта вторая модель применяется для расчета параметров для Group A.

    В реальном времени, во время аукциона, система определяет группу рекламодателя и применяет заранее рассчитанное оптимальное значение, полученное с помощью модели, обученной на данных другой группы.

    Актуальность для SEO

    Высокая (для PPC/AdTech). Оптимизация аукционов, использование машинного обучения для ценообразования и борьба с манипуляциями ставками являются критически важными задачами для любой крупной рекламной платформы, включая Яндекс.Директ. Механизм офлайн-расчетов и перекрестного применения моделей актуален для поддержания стабильности и доходности рекламной сети.

    Важность для SEO

    Влияние на SEO нулевое (0/10). Патент полностью посвящен механике платных рекламных аукционов (PPC). Он не описывает алгоритмы сканирования, индексирования или ранжирования органических результатов поиска. Для SEO-специалистов, занимающихся исключительно органическим продвижением, этот патент не несет практической ценности.

    Детальный разбор

    Термины и определения

    Auction Parameter (Параметр аукциона)
    Значение, используемое в механике аукциона. В патенте (Claim 15) упоминаются Minimal Placing Price (минимальная цена размещения или Резервная цена) и Amnesty Threshold (порог амнистии) для рекламодателя.
    Auction Service (Аукционный сервис)
    Компьютерная программа, реализующая онлайн-аукцион, например, Яндекс.Директ.
    Digital Object (Цифровой объект)
    Элемент, участвующий в аукционе. В контексте PPC это рекламное объявление (текст, изображение, видео).
    Environment Feature (Признак окружения)
    Внешние факторы, характеризующие контекст взаимодействия в момент времени. Примеры (Claim 14): средняя ставка, минимальная/максимальная ставка, квантиль ставки 90%, вероятность клика (CTR), показатель релевантности объекта запросу (Relevancy Score), географический регион, текст поискового запроса.
    First/Second Portion of Users (Первая/Вторая часть пользователей)
    Две группы, на которые разделяется вся совокупность пользователей аукционного сервиса (рекламодателей). Разделение необходимо для реализации основного механизма патента: обучение на первой части, применение ко второй, и наоборот.
    Interaction History Data (Данные истории взаимодействий)
    Накопленные данные о прошлых аукционах, включающие идентификатор объекта, параметры аукциона и признаки окружения.
    Offline Training (Офлайн-обучение)
    Процесс обучения алгоритма машинного обучения на исторических данных, выполняемый не в реальном времени, а по расписанию или в периоды минимальной нагрузки.

    Ключевые утверждения (Анализ Claims)

    Ядром изобретения является метод офлайн-оптимизации параметров аукциона с защитой от манипуляций путем разделения данных для обучения и применения.

    Claim 1 (Независимый пункт): Описывает базовый процесс оптимизации для одной из групп.

    1. Система получает исторические данные Первой и Второй частей пользователей.
    2. Выполняется офлайн-обучение ML-алгоритма, используя ТОЛЬКО данные Первой части пользователей.
    3. Обученный алгоритм применяется для определения Первого Оптимального Значения (First Optimal Value) для объектов, связанных со Второй частью пользователей.
    4. Это значение сохраняется.
    5. В реальном времени: определяется объект и связанный с ним пользователь (рекламодатель).
    6. Если пользователь принадлежит ко Второй части, к объекту применяется заранее рассчитанное Первое Оптимальное Значение.

    Claim 5: Уточняет, что данные могут храниться как единая группа и разделяться на Первую и Вторую части непосредственно перед обучением.

    Claim 6: Описывает возможность категоризации. Объекты и пользователи могут быть разделены на категории/подмножества, и обучение происходит независимо внутри каждой категории.

    Claim 15: Уточняет, что оптимальное значение может быть Minimal Placing Price или Amnesty Threshold.

    Claim 17: Описывает зеркальный процесс для второй группы.

    1. Выполняется офлайн-обучение ML-алгоритма, используя ТОЛЬКО данные Второй части пользователей.
    2. Обученный алгоритм применяется для определения Второго Оптимального Значения (Second Optimal Value) для объектов, связанных с Первой частью пользователей.
    3. Это значение сохраняется.

    Claim 18: Уточняет применение Claim 17. В реальном времени, если пользователь принадлежит к Первой части, к объекту применяется Второе Оптимальное Значение.

    Где и как применяется

    Патент не относится к инфраструктуре органического поиска (Crawling, Indexing, Ranking). Он применяется в параллельной системе – Рекламной Платформе (например, Яндекс.Директ), которая активируется на этапах QUERY PROCESSING и BLENDER для интеграции рекламы в выдачу.

    Механизм работает в двух режимах:

    Офлайн-процессы (Периодические вычисления):

    • Training System (Система обучения) и Determination Module (Модуль определения) периодически (например, ночью) выполняют основную работу.
    • Они получают данные из хранилища, разделяют пользователей, обучают ML-модели (одну на данных первой части, другую на данных второй части) и рассчитывают оптимальные параметры аукциона (Optimal Values).
    • Рассчитанные значения сохраняются в хранилище.

    Онлайн-процессы (В реальном времени):

    • Auction Server (Аукционный сервер) получает запрос (например, поисковый запрос, инициирующий показ рекламы).
    • Происходит аукцион. Для каждого релевантного объявления сервер определяет рекламодателя и группу, к которой он принадлежит.
    • Сервер применяет заранее рассчитанное Optimal Value (например, резервную цену) из хранилища. Поскольку это значение было рассчитано заранее (офлайн), нагрузка на сервер в реальном времени снижается.

    На что влияет

    • Типы контента: Влияет исключительно на цифровые объекты, участвующие в аукционе (рекламные объявления). Не влияет на органический контент.
    • Специфические запросы: Влияет на все запросы, которые инициируют рекламный аукцион.
    • Ниши и тематики: Влияет на все тематики, где работает аукционная модель рекламы. Механизм может работать по-разному в разных категориях, если реализована категоризация (Claim 6).

    Когда применяется

    • Офлайн-обучение: Применяется периодически для обновления оптимальных значений (ежедневно, еженедельно, ежемесячно).
    • Онлайн-применение: Применяется при каждом запросе к аукционному сервису в реальном времени. Триггером является необходимость определить параметры аукциона (например, резервную цену) для конкретного объявления.

    Пошаговый алгоритм

    Алгоритм состоит из двух основных фаз: Офлайн-подготовка и Онлайн-применение.

    Фаза 1: Офлайн-подготовка (Периодический процесс)

    1. Сбор данных: Из хранилища извлекаются данные истории взаимодействий за определенный период.
    2. Разделение пользователей: Вся совокупность пользователей (рекламодателей) делится на Первую часть (Group A) и Вторую часть (Group B).
    3. Категоризация (Опционально): Объекты и пользователи могут быть разделены на категории/подмножества.
    4. Обучение Модели 1: ML-алгоритм обучается на исторических данных Group A для предсказания оптимальных параметров аукциона.
    5. Обучение Модели 2: Параллельно или последовательно ML-алгоритм обучается на исторических данных Group B.
    6. Определение значений для Group B: Модель 1 (обученная на Group A) применяется для расчета Первого Оптимального Значения для объектов Group B.
    7. Определение значений для Group A: Модель 2 (обученная на Group B) применяется для расчета Второго Оптимального Значения для объектов Group A.
    8. Сохранение: Первое и Второе Оптимальные Значения сохраняются в хранилище.

    Фаза 2: Онлайн-применение (В реальном времени)

    1. Получение запроса: Аукционный сервер получает запрос.
    2. Идентификация объектов и пользователей: Определяются релевантные объявления и рекламодатели.
    3. Определение группы: Система проверяет, принадлежит ли рекламодатель к Group A или Group B.
    4. Применение значения:
      • Если рекламодатель из Group A, применяется Второе Оптимальное Значение (рассчитанное Моделью 2).
      • Если рекламодатель из Group B, применяется Первое Оптимальное Значение (рассчитанное Моделью 1).
    5. Завершение аукциона: Аукцион проводится с использованием примененных оптимальных значений.

    Какие данные и как использует

    Данные на входе

    Система использует исключительно данные, связанные с историей аукционов (Interaction History Data). В патенте не упоминаются стандартные SEO-факторы (контентные, технические, ссылочные).

    • Идентификаторы: Индикация цифрового объекта (ID объявления), ID пользователя (рекламодателя).
    • Параметры аукциона (Auction Parameter): Исторические значения ставок (Bids) или цен.
    • Временные факторы: Момент времени взаимодействия; история изменений параметра аукциона во времени.
    • Признаки окружения (Environment Feature) (Claim 14), включающие:
      • Статистика аукциона: Средняя ставка, минимальная/максимальная ставка, квантили ставок (например, 90%).
      • Поведенческие факторы (PPC): Вероятность клика на цифровой объект (Predicted CTR).
      • Релевантность (PPC): Показатель релевантности цифрового объекта поисковому запросу (Relevancy Score).
      • Географические факторы: Индикация географической области.
      • Данные запроса: Поисковый запрос, в ответ на который был показан объект.
    • Структурные факторы: Тип цифрового объекта (текст, изображение и т.д.) (Claim 11, 12); Пространственное положение объекта на экране (Claim 10).

    Какие метрики используются и как они считаются

    • Оптимальное значение параметра аукциона (Optimal Value): Целевая переменная, которую предсказывает система машинного обучения. Конкретная формула расчета в патенте не приводится.
    • Конкретные предсказываемые параметры (Claim 15): Minimal Placing Price (минимальная цена размещения) и Amnesty Threshold (порог амнистии).
    • Алгоритмы машинного обучения: Патент не специфицирует конкретный алгоритм ML, но описывает процесс офлайн-обучения (Offline Training) для предсказания оптимальных значений.

    Выводы

    1. Патент строго о PPC, не о SEO: Изобретение описывает внутренние процессы оптимизации рекламных аукционов Яндекс (Яндекс.Директ). Он не имеет отношения к алгоритмам ранжирования органического поиска.
    2. Цель – стабильность аукциона и снижение нагрузки: Основные задачи патента – предотвратить манипуляции ставками со стороны рекламодателей и снизить нагрузку на серверы за счет переноса вычислений в офлайн-режим.
    3. Ключевой механизм – перекрестное применение ML-моделей: Для защиты от манипуляций используется разделение рекламодателей на группы. Параметры для Группы А определяются моделью, обученной на данных Группы B, и наоборот. Это гарантирует, что собственное поведение рекламодателя не влияет напрямую на устанавливаемые для него пороги (например, резервную цену).
    4. Сложная инфраструктура PPC: Патент демонстрирует, что управление рекламными аукционами является сложной задачей, требующей применения машинного обучения и анализа больших данных о поведении рынка и окружении.

    Практика

    Патент описывает инфраструктурные процессы системы рекламных аукционов Яндекс и не дает практических рекомендаций для органического SEO.

    Best practices (это мы делаем)

    • Для SEO-специалистов: В патенте нет информации, применимой для улучшения органического ранжирования.
    • Для PPC-специалистов: Необходимо понимать, что система аукциона Яндекса активно борется с манипуляциями ставками. Оптимальная стратегия – фокусироваться на качестве объявлений (релевантность, CTR) и устанавливать ставки, исходя из бизнес-целей, а не пытаться «обмануть» алгоритм занижения резервной цены. Ваши пороги определяются поведением других участников рынка.

    Worst practices (это делать не надо)

    • Для SEO-специалистов: В патенте нет информации о худших практиках в SEO.
    • Для PPC-специалистов: Пытаться манипулировать резервной ценой путем резкого или скоординированного снижения ставок. Описанный механизм (обучение на одной группе, применение к другой) делает такие стратегии неэффективными, так как разрывает прямую связь между историей ставок рекламодателя и устанавливаемыми для него параметрами аукциона.

    Стратегическое значение

    Стратегическое значение для органического SEO отсутствует. Патент подтверждает инвестиции Яндекса в развитие и стабилизацию своих рекламных продуктов с использованием машинного обучения. Он подчеркивает сложность и автономность системы PPC-аукционов по отношению к органическому поиску.

    Практические примеры

    Практических примеров для применения в SEO нет.

    Пример для PPC (иллюстрация механизма защиты от манипуляций):

    1. Ситуация: Рекламодатель «Иванов» решает снизить свои ставки на 50% в надежде, что система адаптируется и снизит для него минимальную цену размещения (Reserve Price).
    2. Разделение: Система Яндекса разделила рекламодателей на Group A и Group B. «Иванов» попал в Group A.
    3. Офлайн-обучение:
      • Модель 1 обучается на данных Group A (включая сниженные ставки «Иванова»).
      • Модель 2 обучается на данных Group B (где ставки остались рыночными).
    4. Применение:
      • Для «Иванова» (Group A) применяется Модель 2. Поскольку Модель 2 обучалась на рыночных данных Group B, она устанавливает для «Иванова» рыночную резервную цену.
    5. Результат: Попытка «Иванова» манипулировать своей резервной ценой не удалась. Система использовала данные других участников рынка для определения его порогов.

    Вопросы и ответы

    Имеет ли этот патент отношение к органическому ранжированию в Яндексе?

    Нет, этот патент не имеет отношения к органическому SEO. Он описывает исключительно внутреннюю механику системы платных рекламных аукционов (PPC), таких как Яндекс.Директ. Алгоритмы, описанные здесь, используются для расчета оптимальных параметров аукциона и предотвращения манипуляций со ставками, а не для ранжирования сайтов в органической выдаче.

    Какую основную проблему решает этот патент?

    Патент решает две проблемы. Во-первых, он предотвращает манипуляции со стороны рекламодателей, которые могут пытаться искусственно занизить резервную цену, снижая свои ставки (создавая плохое равновесие Нэша). Во-вторых, он снижает нагрузку на серверы за счет использования офлайн машинного обучения для расчета параметров аукциона, вместо того чтобы вычислять их в реальном времени при каждом запросе.

    Как именно Яндекс предотвращает манипуляции ставками согласно этому патенту?

    Ключевой механизм – это разделение рекламодателей на две группы (А и Б) и перекрестное применение моделей машинного обучения. Модель, определяющая параметры аукциона для Группы А, обучается на исторических данных Группы Б. И наоборот. Это разрывает прямую связь между историей ставок рекламодателя и устанавливаемыми для него порогами, делая манипуляции неэффективными.

    Что такое «Цифровой объект» и «Параметр аукциона» в контексте этого патента?

    «Цифровой объект» – это то, что участвует в аукционе, как правило, рекламное объявление. «Параметр аукциона» – это значение, которое система оптимизирует. В патенте упоминаются «Минимальная цена размещения» (Minimal Placing Price / Reserve Price) и «Порог амнистии» (Amnesty Threshold).

    В патенте упоминается «Показатель релевантности» (Relevancy Score). Это фактор органического ранжирования?

    Нет. В данном контексте «Показатель релевантности» является одним из «Признаков окружения» (Environment Feature) и относится к релевантности рекламного объявления поисковому запросу. Это компонент, используемый в расчете Показателя Качества объявления в PPC (Ad Quality Score), а не метрика органической релевантности страницы.

    Что означает «Офлайн-обучение» в этом патенте?

    «Офлайн-обучение» означает, что сложные вычисления и тренировка моделей машинного обучения происходят не в момент запроса пользователя в реальном времени, а заранее, по расписанию (например, ночью). В реальном времени система просто применяет уже рассчитанные оптимальные значения, что значительно снижает нагрузку на сервер.

    Может ли этот механизм повлиять на стоимость клика (CPC) в Яндекс.Директ?

    Да, напрямую. Поскольку механизм оптимизирует «Минимальную цену размещения» (Резервную цену), он влияет на формирование финальной стоимости клика в аукционе. Цель системы – поддерживать стабильный и эффективный рынок, что может приводить как к повышению, так и к понижению CPC в зависимости от рыночной ситуации, но главное – предотвращать искусственное занижение цен.

    Есть ли хоть какая-то польза от этого патента для SEO-специалиста?

    Прямой пользы для работы по органическому продвижению нет. Однако патент полезен для общего понимания экосистемы Яндекса. Он демонстрирует, насколько сложны и независимы друг от друга системы органического поиска и платной рекламы, и подчеркивает, что они решают разные задачи разными методами.

    Как часто обновляются эти оптимальные параметры аукциона?

    Патент указывает, что обновление происходит путем периодического повторения процесса офлайн-обучения (Claim 16). Конкретные интервалы не указаны, но упоминаются примеры: несколько дней, неделя, месяц, а в некоторых случаях — ежедневно. Это зависит от динамики рынка и настроек системы.

    Что такое «Признаки окружения» (Environment Features) и зачем они нужны?

    Это факторы, описывающие контекст, в котором происходил аукцион. Они включают средние ставки конкурентов, географию, текст запроса, предсказанный CTR, релевантность объявления и т.д. Эти признаки используются как входные данные для модели машинного обучения, чтобы она могла понять рыночную ситуацию и предсказать оптимальные параметры аукциона с учетом всех этих условий.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.