Патент описывает внутреннюю механику рекламных аукционов Яндекса (например, Яндекс.Директ). Для предотвращения манипуляций ставками и снижения нагрузки на серверы, Яндекс использует офлайн машинное обучение для расчета оптимальных параметров аукциона (например, резервной цены). Ключевой механизм: рекламодатели делятся на две группы; модель обучается на данных Группы А, но применяется к Группе Б, и наоборот. Это гарантирует, что история ставок рекламодателя не влияет напрямую на его собственные ценовые пороги. Патент относится исключительно к PPC, а не к органическому поиску.
Описание
Какую задачу решает
Патент решает две фундаментальные задачи в контексте систем онлайн-аукционов, таких как контекстная реклама (PPC):
- Предотвращение манипуляций рынком (Bid Manipulation): Системы, где резервная цена (Reserve Price) зависит от истории ставок рекламодателя, уязвимы. Рекламодатели могут намеренно снижать ставки, чтобы искусственно занизить резервную цену, формируя невыгодное для платформы состояние рынка (плохое равновесие Нэша).
- Снижение нагрузки на сервер (Infrastructure Efficiency): Вычисление сложных оптимальных параметров аукциона в режиме реального времени создает высокую вычислительную нагрузку. Патент предлагает метод офлайн-вычислений для повышения производительности.
Что запатентовано
Запатентован метод и система для определения оптимального значения параметра аукциона (например, минимальной цены размещения) для цифрового объекта (рекламного объявления). Суть изобретения заключается в использовании офлайн машинного обучения (Offline Training) и методологии перекрестного применения моделей. Модель обучается на исторических данных одной группы рекламодателей, а применяется для определения оптимальных параметров для другой группы. Это разрывает петлю обратной связи, предотвращая манипуляции, и переносит вычисления в офлайн.
Как это работает
Система собирает исторические данные аукционов (ставки, показы, факторы окружения) и делит рекламодателей на две части (Group A и Group B). Далее выполняется офлайн-обучение:
- Модель ML обучается на данных Group A для предсказания оптимальных параметров.
- Эта модель применяется для расчета параметров для Group B.
- Параллельно обучается вторая модель ML на данных Group B.
- Эта вторая модель применяется для расчета параметров для Group A.
В реальном времени, во время аукциона, система определяет группу рекламодателя и применяет заранее рассчитанное оптимальное значение, полученное с помощью модели, обученной на данных другой группы.
Актуальность для SEO
Высокая (для PPC/AdTech). Оптимизация аукционов, использование машинного обучения для ценообразования и борьба с манипуляциями ставками являются критически важными задачами для любой крупной рекламной платформы, включая Яндекс.Директ. Механизм офлайн-расчетов и перекрестного применения моделей актуален для поддержания стабильности и доходности рекламной сети.
Важность для SEO
Влияние на SEO нулевое (0/10). Патент полностью посвящен механике платных рекламных аукционов (PPC). Он не описывает алгоритмы сканирования, индексирования или ранжирования органических результатов поиска. Для SEO-специалистов, занимающихся исключительно органическим продвижением, этот патент не несет практической ценности.
Детальный разбор
Термины и определения
- Auction Parameter (Параметр аукциона)
- Значение, используемое в механике аукциона. В патенте (Claim 15) упоминаются Minimal Placing Price (минимальная цена размещения или Резервная цена) и Amnesty Threshold (порог амнистии) для рекламодателя.
- Auction Service (Аукционный сервис)
- Компьютерная программа, реализующая онлайн-аукцион, например, Яндекс.Директ.
- Digital Object (Цифровой объект)
- Элемент, участвующий в аукционе. В контексте PPC это рекламное объявление (текст, изображение, видео).
- Environment Feature (Признак окружения)
- Внешние факторы, характеризующие контекст взаимодействия в момент времени. Примеры (Claim 14): средняя ставка, минимальная/максимальная ставка, квантиль ставки 90%, вероятность клика (CTR), показатель релевантности объекта запросу (Relevancy Score), географический регион, текст поискового запроса.
- First/Second Portion of Users (Первая/Вторая часть пользователей)
- Две группы, на которые разделяется вся совокупность пользователей аукционного сервиса (рекламодателей). Разделение необходимо для реализации основного механизма патента: обучение на первой части, применение ко второй, и наоборот.
- Interaction History Data (Данные истории взаимодействий)
- Накопленные данные о прошлых аукционах, включающие идентификатор объекта, параметры аукциона и признаки окружения.
- Offline Training (Офлайн-обучение)
- Процесс обучения алгоритма машинного обучения на исторических данных, выполняемый не в реальном времени, а по расписанию или в периоды минимальной нагрузки.
Ключевые утверждения (Анализ Claims)
Ядром изобретения является метод офлайн-оптимизации параметров аукциона с защитой от манипуляций путем разделения данных для обучения и применения.
Claim 1 (Независимый пункт): Описывает базовый процесс оптимизации для одной из групп.
- Система получает исторические данные Первой и Второй частей пользователей.
- Выполняется офлайн-обучение ML-алгоритма, используя ТОЛЬКО данные Первой части пользователей.
- Обученный алгоритм применяется для определения Первого Оптимального Значения (First Optimal Value) для объектов, связанных со Второй частью пользователей.
- Это значение сохраняется.
- В реальном времени: определяется объект и связанный с ним пользователь (рекламодатель).
- Если пользователь принадлежит ко Второй части, к объекту применяется заранее рассчитанное Первое Оптимальное Значение.
Claim 5: Уточняет, что данные могут храниться как единая группа и разделяться на Первую и Вторую части непосредственно перед обучением.
Claim 6: Описывает возможность категоризации. Объекты и пользователи могут быть разделены на категории/подмножества, и обучение происходит независимо внутри каждой категории.
Claim 15: Уточняет, что оптимальное значение может быть Minimal Placing Price или Amnesty Threshold.
Claim 17: Описывает зеркальный процесс для второй группы.
- Выполняется офлайн-обучение ML-алгоритма, используя ТОЛЬКО данные Второй части пользователей.
- Обученный алгоритм применяется для определения Второго Оптимального Значения (Second Optimal Value) для объектов, связанных с Первой частью пользователей.
- Это значение сохраняется.
Claim 18: Уточняет применение Claim 17. В реальном времени, если пользователь принадлежит к Первой части, к объекту применяется Второе Оптимальное Значение.
Где и как применяется
Патент не относится к инфраструктуре органического поиска (Crawling, Indexing, Ranking). Он применяется в параллельной системе – Рекламной Платформе (например, Яндекс.Директ), которая активируется на этапах QUERY PROCESSING и BLENDER для интеграции рекламы в выдачу.
Механизм работает в двух режимах:
Офлайн-процессы (Периодические вычисления):
- Training System (Система обучения) и Determination Module (Модуль определения) периодически (например, ночью) выполняют основную работу.
- Они получают данные из хранилища, разделяют пользователей, обучают ML-модели (одну на данных первой части, другую на данных второй части) и рассчитывают оптимальные параметры аукциона (Optimal Values).
- Рассчитанные значения сохраняются в хранилище.
Онлайн-процессы (В реальном времени):
- Auction Server (Аукционный сервер) получает запрос (например, поисковый запрос, инициирующий показ рекламы).
- Происходит аукцион. Для каждого релевантного объявления сервер определяет рекламодателя и группу, к которой он принадлежит.
- Сервер применяет заранее рассчитанное Optimal Value (например, резервную цену) из хранилища. Поскольку это значение было рассчитано заранее (офлайн), нагрузка на сервер в реальном времени снижается.
На что влияет
- Типы контента: Влияет исключительно на цифровые объекты, участвующие в аукционе (рекламные объявления). Не влияет на органический контент.
- Специфические запросы: Влияет на все запросы, которые инициируют рекламный аукцион.
- Ниши и тематики: Влияет на все тематики, где работает аукционная модель рекламы. Механизм может работать по-разному в разных категориях, если реализована категоризация (Claim 6).
Когда применяется
- Офлайн-обучение: Применяется периодически для обновления оптимальных значений (ежедневно, еженедельно, ежемесячно).
- Онлайн-применение: Применяется при каждом запросе к аукционному сервису в реальном времени. Триггером является необходимость определить параметры аукциона (например, резервную цену) для конкретного объявления.
Пошаговый алгоритм
Алгоритм состоит из двух основных фаз: Офлайн-подготовка и Онлайн-применение.
Фаза 1: Офлайн-подготовка (Периодический процесс)
- Сбор данных: Из хранилища извлекаются данные истории взаимодействий за определенный период.
- Разделение пользователей: Вся совокупность пользователей (рекламодателей) делится на Первую часть (Group A) и Вторую часть (Group B).
- Категоризация (Опционально): Объекты и пользователи могут быть разделены на категории/подмножества.
- Обучение Модели 1: ML-алгоритм обучается на исторических данных Group A для предсказания оптимальных параметров аукциона.
- Обучение Модели 2: Параллельно или последовательно ML-алгоритм обучается на исторических данных Group B.
- Определение значений для Group B: Модель 1 (обученная на Group A) применяется для расчета Первого Оптимального Значения для объектов Group B.
- Определение значений для Group A: Модель 2 (обученная на Group B) применяется для расчета Второго Оптимального Значения для объектов Group A.
- Сохранение: Первое и Второе Оптимальные Значения сохраняются в хранилище.
Фаза 2: Онлайн-применение (В реальном времени)
- Получение запроса: Аукционный сервер получает запрос.
- Идентификация объектов и пользователей: Определяются релевантные объявления и рекламодатели.
- Определение группы: Система проверяет, принадлежит ли рекламодатель к Group A или Group B.
- Применение значения:
- Если рекламодатель из Group A, применяется Второе Оптимальное Значение (рассчитанное Моделью 2).
- Если рекламодатель из Group B, применяется Первое Оптимальное Значение (рассчитанное Моделью 1).
- Завершение аукциона: Аукцион проводится с использованием примененных оптимальных значений.
Какие данные и как использует
Данные на входе
Система использует исключительно данные, связанные с историей аукционов (Interaction History Data). В патенте не упоминаются стандартные SEO-факторы (контентные, технические, ссылочные).
- Идентификаторы: Индикация цифрового объекта (ID объявления), ID пользователя (рекламодателя).
- Параметры аукциона (Auction Parameter): Исторические значения ставок (Bids) или цен.
- Временные факторы: Момент времени взаимодействия; история изменений параметра аукциона во времени.
- Признаки окружения (Environment Feature) (Claim 14), включающие:
- Статистика аукциона: Средняя ставка, минимальная/максимальная ставка, квантили ставок (например, 90%).
- Поведенческие факторы (PPC): Вероятность клика на цифровой объект (Predicted CTR).
- Релевантность (PPC): Показатель релевантности цифрового объекта поисковому запросу (Relevancy Score).
- Географические факторы: Индикация географической области.
- Данные запроса: Поисковый запрос, в ответ на который был показан объект.
- Структурные факторы: Тип цифрового объекта (текст, изображение и т.д.) (Claim 11, 12); Пространственное положение объекта на экране (Claim 10).
Какие метрики используются и как они считаются
- Оптимальное значение параметра аукциона (Optimal Value): Целевая переменная, которую предсказывает система машинного обучения. Конкретная формула расчета в патенте не приводится.
- Конкретные предсказываемые параметры (Claim 15): Minimal Placing Price (минимальная цена размещения) и Amnesty Threshold (порог амнистии).
- Алгоритмы машинного обучения: Патент не специфицирует конкретный алгоритм ML, но описывает процесс офлайн-обучения (Offline Training) для предсказания оптимальных значений.
Выводы
- Патент строго о PPC, не о SEO: Изобретение описывает внутренние процессы оптимизации рекламных аукционов Яндекс (Яндекс.Директ). Он не имеет отношения к алгоритмам ранжирования органического поиска.
- Цель – стабильность аукциона и снижение нагрузки: Основные задачи патента – предотвратить манипуляции ставками со стороны рекламодателей и снизить нагрузку на серверы за счет переноса вычислений в офлайн-режим.
- Ключевой механизм – перекрестное применение ML-моделей: Для защиты от манипуляций используется разделение рекламодателей на группы. Параметры для Группы А определяются моделью, обученной на данных Группы B, и наоборот. Это гарантирует, что собственное поведение рекламодателя не влияет напрямую на устанавливаемые для него пороги (например, резервную цену).
- Сложная инфраструктура PPC: Патент демонстрирует, что управление рекламными аукционами является сложной задачей, требующей применения машинного обучения и анализа больших данных о поведении рынка и окружении.
Практика
Патент описывает инфраструктурные процессы системы рекламных аукционов Яндекс и не дает практических рекомендаций для органического SEO.
Best practices (это мы делаем)
- Для SEO-специалистов: В патенте нет информации, применимой для улучшения органического ранжирования.
- Для PPC-специалистов: Необходимо понимать, что система аукциона Яндекса активно борется с манипуляциями ставками. Оптимальная стратегия – фокусироваться на качестве объявлений (релевантность, CTR) и устанавливать ставки, исходя из бизнес-целей, а не пытаться «обмануть» алгоритм занижения резервной цены. Ваши пороги определяются поведением других участников рынка.
Worst practices (это делать не надо)
- Для SEO-специалистов: В патенте нет информации о худших практиках в SEO.
- Для PPC-специалистов: Пытаться манипулировать резервной ценой путем резкого или скоординированного снижения ставок. Описанный механизм (обучение на одной группе, применение к другой) делает такие стратегии неэффективными, так как разрывает прямую связь между историей ставок рекламодателя и устанавливаемыми для него параметрами аукциона.
Стратегическое значение
Стратегическое значение для органического SEO отсутствует. Патент подтверждает инвестиции Яндекса в развитие и стабилизацию своих рекламных продуктов с использованием машинного обучения. Он подчеркивает сложность и автономность системы PPC-аукционов по отношению к органическому поиску.
Практические примеры
Практических примеров для применения в SEO нет.
Пример для PPC (иллюстрация механизма защиты от манипуляций):
- Ситуация: Рекламодатель «Иванов» решает снизить свои ставки на 50% в надежде, что система адаптируется и снизит для него минимальную цену размещения (Reserve Price).
- Разделение: Система Яндекса разделила рекламодателей на Group A и Group B. «Иванов» попал в Group A.
- Офлайн-обучение:
- Модель 1 обучается на данных Group A (включая сниженные ставки «Иванова»).
- Модель 2 обучается на данных Group B (где ставки остались рыночными).
- Применение:
- Для «Иванова» (Group A) применяется Модель 2. Поскольку Модель 2 обучалась на рыночных данных Group B, она устанавливает для «Иванова» рыночную резервную цену.
- Результат: Попытка «Иванова» манипулировать своей резервной ценой не удалась. Система использовала данные других участников рынка для определения его порогов.
Вопросы и ответы
Имеет ли этот патент отношение к органическому ранжированию в Яндексе?
Нет, этот патент не имеет отношения к органическому SEO. Он описывает исключительно внутреннюю механику системы платных рекламных аукционов (PPC), таких как Яндекс.Директ. Алгоритмы, описанные здесь, используются для расчета оптимальных параметров аукциона и предотвращения манипуляций со ставками, а не для ранжирования сайтов в органической выдаче.
Какую основную проблему решает этот патент?
Патент решает две проблемы. Во-первых, он предотвращает манипуляции со стороны рекламодателей, которые могут пытаться искусственно занизить резервную цену, снижая свои ставки (создавая плохое равновесие Нэша). Во-вторых, он снижает нагрузку на серверы за счет использования офлайн машинного обучения для расчета параметров аукциона, вместо того чтобы вычислять их в реальном времени при каждом запросе.
Как именно Яндекс предотвращает манипуляции ставками согласно этому патенту?
Ключевой механизм – это разделение рекламодателей на две группы (А и Б) и перекрестное применение моделей машинного обучения. Модель, определяющая параметры аукциона для Группы А, обучается на исторических данных Группы Б. И наоборот. Это разрывает прямую связь между историей ставок рекламодателя и устанавливаемыми для него порогами, делая манипуляции неэффективными.
Что такое «Цифровой объект» и «Параметр аукциона» в контексте этого патента?
«Цифровой объект» – это то, что участвует в аукционе, как правило, рекламное объявление. «Параметр аукциона» – это значение, которое система оптимизирует. В патенте упоминаются «Минимальная цена размещения» (Minimal Placing Price / Reserve Price) и «Порог амнистии» (Amnesty Threshold).
В патенте упоминается «Показатель релевантности» (Relevancy Score). Это фактор органического ранжирования?
Нет. В данном контексте «Показатель релевантности» является одним из «Признаков окружения» (Environment Feature) и относится к релевантности рекламного объявления поисковому запросу. Это компонент, используемый в расчете Показателя Качества объявления в PPC (Ad Quality Score), а не метрика органической релевантности страницы.
Что означает «Офлайн-обучение» в этом патенте?
«Офлайн-обучение» означает, что сложные вычисления и тренировка моделей машинного обучения происходят не в момент запроса пользователя в реальном времени, а заранее, по расписанию (например, ночью). В реальном времени система просто применяет уже рассчитанные оптимальные значения, что значительно снижает нагрузку на сервер.
Может ли этот механизм повлиять на стоимость клика (CPC) в Яндекс.Директ?
Да, напрямую. Поскольку механизм оптимизирует «Минимальную цену размещения» (Резервную цену), он влияет на формирование финальной стоимости клика в аукционе. Цель системы – поддерживать стабильный и эффективный рынок, что может приводить как к повышению, так и к понижению CPC в зависимости от рыночной ситуации, но главное – предотвращать искусственное занижение цен.
Есть ли хоть какая-то польза от этого патента для SEO-специалиста?
Прямой пользы для работы по органическому продвижению нет. Однако патент полезен для общего понимания экосистемы Яндекса. Он демонстрирует, насколько сложны и независимы друг от друга системы органического поиска и платной рекламы, и подчеркивает, что они решают разные задачи разными методами.
Как часто обновляются эти оптимальные параметры аукциона?
Патент указывает, что обновление происходит путем периодического повторения процесса офлайн-обучения (Claim 16). Конкретные интервалы не указаны, но упоминаются примеры: несколько дней, неделя, месяц, а в некоторых случаях — ежедневно. Это зависит от динамики рынка и настроек системы.
Что такое «Признаки окружения» (Environment Features) и зачем они нужны?
Это факторы, описывающие контекст, в котором происходил аукцион. Они включают средние ставки конкурентов, географию, текст запроса, предсказанный CTR, релевантность объявления и т.д. Эти признаки используются как входные данные для модели машинного обучения, чтобы она могла понять рыночную ситуацию и предсказать оптимальные параметры аукциона с учетом всех этих условий.