Как Яндекс использует алгоритмы «Многорукого бандита» для тестирования и продвижения новых документов в ТОП выдачи

Яндекс использует механизм «Exploration vs. Exploitation» для решения проблемы «холодного старта» новых документов, у которых нет накопленных поведенческих данных. Система предсказывает их потенциальную релевантность на основе контента и структуры, вычисляет «Exploration Score» с помощью Bandit-алгоритмов и принудительно добавляет лучшие из них на высокие позиции в SERP. Это позволяет собрать данные о поведении пользователей и улучшить ранжирование в долгосрочной перспективе.

Описание

Какую задачу решает

Патент решает фундаментальную проблему поисковых систем, известную как дилемма Exploration-Exploitation (Исследование-Использование) и связанную с ней проблему «холодного старта». Стандартные алгоритмы ранжирования сильно зависят от накопленных поведенческих данных (Prior-History Features). Это приводит к стагнации выдачи: система предпочитает показывать уже известные документы, получая избыточное подтверждение их релевантности. Новые или редко показываемые документы (Candidate Web Resources), даже если они потенциально более релевантны, не могут попасть в ТОП, так как не имеют истории взаимодействий. Патент предлагает механизм для активного исследования (Exploration) этих документов путем их принудительного размещения на верхних позициях SERP для сбора обратной связи.

Что запатентовано

Запатентована система и метод обработки поискового запроса, реализующие стратегию Online Learning to Rank with Exploration and Exploitation (OLREE) на основе подхода Stochastic Multi-Armed Bandit (SMAB). Суть изобретения — в параллельном выполнении двух процессов ранжирования: стандартного (Exploitation) для известных документов и исследовательского (Exploration) для документов без истории. Исследовательский процесс использует каскад алгоритмов машинного обучения для предсказания потенциальной релевантности и расчета Exploration Score, на основе которого новые документы внедряются в ТОП выдачи.

Как это работает

Система идентифицирует документы, не имеющие достаточной истории взаимодействий. Для них запускается исследовательский процесс. Первый алгоритм машинного обучения (First MLA) предсказывает их релевантность (Probability of Gain) и уровень уверенности в этой оценке (Confidence), используя только статические факторы (Web-Resource-Inherent Data). Затем Второй алгоритм (Second MLA / Bandit Algorithm) вычисляет Exploration Score, определяющий необходимость тестирования документа. На основе этого скора Bandit-Based-Ranking Algorithm (BBRA) выбирает лучших кандидатов. Эти кандидаты подмешиваются в ТОП SERP к результатам основного ранжирования. Система собирает данные о кликах на эти документы, используя сложные кликовые модели (например, DCM), и обновляет свои оценки.

Актуальность для SEO

Высокая. Механизмы Exploration-Exploitation критически важны для поддержания свежести и качества поиска в условиях постоянного появления нового контента. Алгоритмы на основе Multi-Armed Bandits активно используются в индустрии для онлайн-обучения ранжированию. Описанный подход является фундаментальным для систем, работающих с обратной связью.

Важность для SEO

Влияние на SEO критическое (9/10). Этот патент описывает механизм, который напрямую отвечает за то, как новые сайты или новые страницы могут пробиться в ТОП выдачи, где доминируют ресурсы с накопленной историей. Он доказывает, что Яндекс намеренно резервирует слоты в ТОПе для тестирования контента. Понимание этого механизма позволяет эффективно выстраивать стратегию: сильные статические факторы необходимы для попадания в тест, а положительные поведенческие сигналы — для закрепления в топе.

Детальный разбор

Термины и определения

Bandit-Based-Ranking Algorithm (BBRA): Алгоритм (308), который ранжирует Candidate Web Resources на основе их Exploration Score и выбирает подмножество для показа в SERP.
Candidate Web Resource (Кандидатный веб-ресурс): Документ (128), который не имеет достаточных Prior-History Features для адекватного ранжирования стандартным алгоритмом. Объект исследования (Exploration).
Confidence (Уверенность) / Confidence Parameter: Параметр (316), оценивающий степень уверенности системы в предсказанном значении Probability of Gain. Вычисляется MADPML.
Dependent Click Model (DCM): Зависимая кликовая модель. Используется для анализа поведения пользователя на SERP, основана на каскадной гипотезе (пользователь просматривает выдачу сверху вниз). Используется для обновления оценок релевантности после получения кликов.
Exploration Score (Оценка исследования): Метрика (318), вычисляемая Bandit Algorithm (Second MLA) на основе Predicted Relevancy Parameter. Определяет приоритет документа в процессе Exploration.
First Machine Learned Algorithm (First MLA): Первый алгоритм машинного обучения (301). Предсказывает Predicted Relevancy Parameter (Gain и Confidence) для Candidate Web Resources на основе Web-Resource-Inherent Data.
MADPML (Mean-Absolute-Deviation-Prediction MLA / Fourth MLA): Четвертый MLA (304). Компонент First MLA, предсказывающий абсолютную ошибку MVPML, что используется как параметр Confidence.
MVPML (Mean-Value-Prediction MLA / Third MLA): Третий MLA (302). Компонент First MLA, предсказывающий Probability of Gain. Может быть реализован как Gradient Boosted Decision Trees (GBDT).
OLREE (Online Learning to Rank with Exploration and Exploitation): Общий подход к онлайн-обучению ранжированию, балансирующий между использованием лучших известных результатов (Exploitation) и исследованием новых вариантов (Exploration).
Predicted Relevancy Parameter: Предсказанный параметр релевантности (312). Оценка релевантности Candidate Web Resource. Состоит из Probability of Gain и Confidence.
Prior-History Feature (Признак прошлой истории): Данные о поведении пользователей, связанные с документом (клики, CTR, показы и т.д.), хранящиеся в логах поиска.
Probability of Gain (Вероятность выигрыша): Предсказанная вероятность (314) того, что данный Candidate Web Resource удовлетворит поисковый запрос. Вычисляется MVPML.
Ranking Algorithm (Алгоритм ранжирования): Стандартный (основной) алгоритм ранжирования поисковой системы (118), который использует как Web-Resource-Inherent Data, так и Prior-History Features.
Second Machine Learned Algorithm (Second MLA) / Bandit Algorithm: Второй алгоритм машинного обучения (306). Использует Predicted Relevancy Parameter для вычисления Exploration Score, применяя логику Multi-Armed Bandit (например, UCB-1 или Bayesian).
Web-Resource-Inherent Data (Внутренние данные веб-ресурса): Статические признаки документа (132), не зависящие от поведения пользователей: контент, метаданные, ссылки, структура и т.д.

Ключевые утверждения (Анализ Claims)

Патент защищает систему, которая активно вмешивается в процесс ранжирования для сбора данных о новых документах, используя два параллельных процесса ранжирования.

Claim 1 (Независимый пункт): Описывает полный метод обработки запроса.

Получение запроса.
Выполнение Первого процесса ранжирования (Exploitation):
- Используется стандартный Ranking Algorithm.
- Выбираются релевантные ресурсы для высоких позиций на основе Web-Resource-Inherent Data И Prior-History Features.
Выполнение Второго процесса ранжирования (Exploration):
- Идентификация Candidate Web Resources, у которых НЕТ достаточных Prior-History Features.
- Применение First MLA (отличного от основного Ranking Algorithm) для определения Predicted Relevancy Parameter на основе Web-Resource-Inherent Data.
- Применение Second MLA для определения Exploration Score.
- Использование Bandit-Based-Ranking Algorithm (BBRA) для ранжирования кандидатов по Exploration Score и выбора подмножества лучших.
Генерация SERP: Добавление на высокие позиции КАК выбранных кандидатов (из Второго процесса), ТАК И релевантных ресурсов (из Первого процесса).
Сбор и сохранение данных о взаимодействии пользователя с показанными кандидатами.

Claim 2 (Зависимый): Уточняет структуру First MLA.

First MLA состоит из Третьего MLA (MVPML), определяющего Probability of Gain, и Четвертого MLA (MADPML), определяющего Confidence Parameter. Эти два компонента определяют Predicted Relevancy Parameter.

Claim 3 (Зависимый): Уточняет, что Третий MLA может быть реализован как Gradient Boosted Decision Trees (GBDT).

Claim 9 (Зависимый): Уточняет определение Candidate Web Resource.

Ресурс считается кандидатом, даже если у него есть «минимальный набор» (minimal-set) исторических признаков, которых недостаточно для стандартного алгоритма. В этом случае расчет Predicted Relevancy Parameter учитывает этот минимальный набор (количество прошлых показов, кликов).

Claims 11 и 12 (Зависимые): Уточняют методы интерпретации обратной связи.

Для анализа собранных данных используется Dependent Click Model (DCM), если ресурс находился на той же позиции или выше, чем кликнутый ресурс (Claim 11). Если ресурс находился ниже кликнутого ресурса, используется алгоритм Expectation-Maximization (EM) или Bayesian inference (Байесовский вывод) (Claim 12).

Где и как применяется

Изобретение применяется на поздних стадиях обработки запроса, модифицируя финальную выдачу.

INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются Web-Resource-Inherent Data (статические факторы, текстовые векторы). Эти данные позже будут использоваться First MLA для предсказания релевантности новых документов.

RANKING – Ранжирование (Уровни L3/Upper Reranking)
Основной Ranking Algorithm (вероятно, CatBoost/YATI на L3) выполняет стандартное ранжирование (Первый процесс), используя все доступные признаки, включая поведенческие. Параллельно запускается Exploration Ranking Module (Второй процесс).

Идентификация: Модуль определяет документы с недостаточной историей (Candidate Web Resources).
Оценка кандидатов: First MLA и Second MLA оценивают их потенциал и рассчитывают Exploration Score. Это может происходить на этапе L3 или как отдельный процесс переранжирования.

BLENDER – Метапоиск и Смешивание
На этапе смешивания (Blender) происходит генерация финального SERP. Система объединяет результаты Первого процесса (стандартное ранжирование) и Второго процесса (выбранные кандидаты от BBRA). Кандидаты агрессивно добавляются на высокие позиции SERP для сбора данных.

Офлайн-процессы и обработка данных
Система требует значительных офлайн-вычислений:

Обучение First MLA (MVPML и MADPML) на исторических данных для предсказания релевантности и ошибок предсказания.
Обработка логов и обновление оценок релевантности для исследуемых документов с использованием кликовых моделей (DCM, EM).

На что влияет

Новый контент и сайты: Наибольшее влияние оказывается на свежие документы, новые сайты или страницы, которые ранее не получали трафика по данному запросу. Этот механизм является основным путем для такого контента в ТОП выдачи.
Разнообразие выдачи (Diversity): Система способствует увеличению разнообразия SERP, тестируя документы, которые иначе не были бы показаны.
Стабильность ТОПа: В краткосрочной перспективе система может снижать качество выдачи (показывая непроверенных кандидатов), но в долгосрочной — повышает его, находя новые релевантные документы. Это вносит элемент волатильности в SERP.

Когда применяется

Алгоритм применяется постоянно, но его активация зависит от наличия кандидатов для исследования.

Триггеры активации: Наличие в индексе документов, релевантных запросу (по статическим факторам), но не имеющих достаточных Prior-History Features.
Условия работы: Система балансирует между Exploration и Exploitation. Интенсивность исследования регулируется параметрами Bandit-алгоритмов (например, параметром $\alpha$ в UCB-1) и лимитом на количество кандидатов (Predefined Inclusion Parameter).

Пошаговый алгоритм

Процесс обработки запроса и исследования новых документов.

Получение запроса и стандартное ранжирование (Exploitation):
- Система получает запрос.
- Основной Ranking Algorithm ранжирует документы, используя статические и поведенческие факторы.
- Выбирается набор лучших Relevant Web Resources.
Идентификация кандидатов (Exploration — Шаг 1):
- Система идентифицирует Candidate Web Resources — документы без достаточной истории взаимодействий.
Предсказание релевантности (Exploration — Шаг 2):
- First MLA обрабатывает статические факторы (Web-Resource-Inherent Data) кандидатов.
- MVPML предсказывает Probability of Gain (ожидаемую релевантность). Упоминается возможность калибровки через Isotonic Regression.
- MADPML предсказывает Confidence (ожидаемую ошибку предсказания).
- Формируется Predicted Relevancy Parameter.
Расчет Exploration Score (Exploration — Шаг 3):
- Second MLA (Bandit Algorithm) использует Predicted Relevancy Parameter для расчета Exploration Score. Патент упоминает два подхода:
- UCB-1 подход (Формула 2 в патенте): $S_{t}(d)=\hat{r}_{d,J_{.}}+\alpha\sqrt{\frac{2lm}{\gamma_{d,j}}}$. Где $\hat{r}$ — оценка выигрыша, $\gamma$ — количество показов.
- Bayesian Bandit подход (Формула 3 в патенте): $S_{l}(d)=\overline{r_{d}}+co_{d,r}$. Где $\overline{r}$ — средняя вероятность выигрыша, $co$ — параметр уверенности.
Ранжирование кандидатов (Exploration — Шаг 4):
- BBRA сортирует кандидатов по Exploration Score.
- Выбирается Топ-K кандидатов для показа (на основе Predefined Inclusion Parameter).
Генерация SERP (Blending):
- Система объединяет результаты стандартного ранжирования и выбранных кандидатов, размещая их на высоких позициях SERP.
Сбор обратной связи и обновление:
- Система получает данные о взаимодействии пользователя (клики, позиция клика).
- Данные сохраняются в логах.
- Оценки релевантности кандидатов обновляются с использованием кликовых моделей: DCM (если кандидат выше или на уровне клика) или EM/Bayesian Inference (если ниже клика). Обновляются значения $W_{d,t}$ (успехи) и $\gamma_{d,t}$ (попытки).

Какие данные и как использует

Данные на входе

Система использует два основных типа данных:

Web-Resource-Inherent Data (Статические факторы): Используются основным Ranking Algorithm и First MLA. Это единственный источник данных для оценки новых документов.
- Контентные факторы: Текст документа, заголовки, метаданные.
- Ссылочные факторы: Входящие и исходящие ссылки (упоминаются «numbers and associations of hyperlinks»).
- Структурные факторы: Метаданные, структура документа, вставки (embeds).
Prior-History Features (Поведенческие факторы): Используются основным Ranking Algorithm для известных документов и для обновления оценок в Exploration модуле.
- Данные о взаимодействии: Клики (Click Through Data), позиция кликнутого ресурса.
- Статистика: Количество показов ($\gamma_{d,t}$) и успехов ($W_{d,t}$) для документов с минимальной историей.

Какие метрики используются и как они считаются

Probability of Gain ($\hat{r}$): Предсказание вероятности удовлетворения запроса. Для документов с историей рассчитывается как отношение успехов к попыткам ($W / \gamma$). Для новых документов предсказывается MVPML (GBDT).
Confidence: Оценка уверенности в Probability of Gain. Предсказывается MADPML как абсолютная ошибка MVPML.
Exploration Score ($S(d)$): Рассчитывается по формулам Multi-Armed Bandit (UCB-1 или Bayesian). Определяет баланс между ожидаемым выигрышем и неопределенностью (стимулируя исследование малоизвестных, но перспективных документов).
Кликовые модели (DCM, EM, Bayesian Inference): Сложные статистические методы для интерпретации кликов с учетом позиционного смещения (position bias) и каскадного просмотра. Они позволяют оценить вероятность того, что документ был просмотрен (Examined) и кликнут (Clicked), и на основе этого обновить оценки релевантности.

Выводы

Яндекс активно тестирует новый контент в ТОПе: Система Exploration-Exploitation гарантирует, что документы без поведенческой истории будут принудительно показаны пользователям для сбора данных. Это не случайный процесс, а управляемый механизм на базе Multi-Armed Bandits.
Баланс риска и выгоды: Система оценивает потенциальный выигрыш (Probability of Gain) и риск (Confidence). Алгоритмы Bandit выбирают для показа документы, которые максимизируют долгосрочное качество поиска, балансируя между исследованием неопределенности и использованием предсказанной релевантности.
Статические факторы — входной билет для Exploration: Чтобы документ попал в процесс Exploration, он должен обладать сильными статическими факторами (Web-Resource-Inherent Data). First MLA (MVPML) использует их для предсказания начальной релевантности.
Поведенческие факторы — ключ к закреплению в ТОПе: Цель всей системы — собрать Prior-History Features. Если документ прошел Exploration и получил положительную обратную связь, он переходит в основное ранжирование.
Сложная интерпретация кликов: Яндекс использует продвинутые кликовые модели (DCM, EM) для анализа результатов Exploration. Это означает, что система учитывает позицию документа и контекст клика, а не только сам факт клика.

Практика

Best practices (это мы делаем)

Максимизация статической релевантности (Входной билет): Обеспечьте максимально высокие показатели по статическим факторам (текстовая релевантность, авторитетность, техническое качество). Это необходимо, чтобы First MLA (MVPML) высоко оценил Probability of Gain и документ был отобран для тестирования (Exploration).
Оптимизация сниппетов для повышения CTR (Успешное тестирование): Поскольку система активно собирает поведенческие данные во время фазы Exploration, критически важно обеспечить высокий CTR сниппета. Привлекательные Title и Description увеличивают вероятность положительной оценки со стороны кликовых моделей (DCM).
Оптимизация контента для удержания пользователя (Закрепление в ТОПе): Мало получить клик, нужно решить задачу пользователя. Если документ, находящийся в фазе Exploration, получает короткие клики и возвраты на выдачу, его оценка будет снижена (на основе DCM/EM анализа), и он выпадет из ТОПа. Контент должен быть качественным и полностью отвечать интенту.
Мониторинг позиций новых страниц: При публикации нового контента ожидайте флуктуаций позиций. Резкое появление в ТОПе и последующее падение может быть признаком работы системы Exploration. Анализируйте поведение пользователей в эти периоды (через Метрику), чтобы понять, каких сигналов не хватило для закрепления.

Worst practices (это делать не надо)

Игнорирование статических факторов в надежде на поведенческие: Нельзя полагаться только на будущие поведенческие факторы. Если документ не пройдет первичный фильтр First MLA из-за слабой оптимизации, он никогда не попадет в фазу Exploration.
Кликбейт и обман ожиданий: Использование кликбейтных заголовков для получения клика во время фазы Exploration приведет к быстрому отказу от страницы. Кликовые модели интерпретируют это как негативный сигнал, что приведет к исключению документа из ТОПа и накоплению негативных Prior-History Features.
Накрутка поведенческих факторов на новых страницах: Попытки искусственно симулировать интерес к новым страницам могут быть неэффективны или опасны, так как система использует сложные модели (DCM, EM) для интерпретации кликов, которые могут выявлять аномалии и неестественное поведение.

Стратегическое значение

Патент подтверждает двухэтапную модель ранжирования Яндекса для нового контента: сначала оценка по статическим факторам, затем активное тестирование и оценка по поведенческим факторам. Это подчеркивает стратегическую необходимость комплексного подхода к SEO: нельзя разделять внутреннюю оптимизацию и работу над качеством продукта (которое генерирует положительные ПФ). Для SEO-специалистов это означает, что скорость и успех вывода нового контента в ТОП напрямую зависят от того, насколько хорошо он подготовлен к обеим фазам оценки.

Практические примеры

Сценарий: Запуск новой карточки товара в интернет-магазине

Подготовка (Оптимизация под First MLA): SEO-специалист обеспечивает максимальную проработку карточки: полное описание, качественные фото, микроразметка, внутренняя перелинковка. Цель — максимизировать оценку Probability of Gain по статическим факторам.
Индексация и Идентификация: Яндекс индексирует страницу. При обработке релевантных запросов система идентифицирует ее как Candidate Web Resource (истории нет).
Exploration (Тестирование в ТОПе): Благодаря сильным статическим факторам, Bandit Algorithm присваивает карточке высокий Exploration Score. Система подмешивает карточку в ТОП-10 выдачи по нескольким запросам.
Сбор данных (Анализ ПФ):
- Вариант А (Успех): Сниппет привлекателен (высокий CTR), пользователи переходят на карточку, проводят там время, добавляют в корзину (решают задачу). DCM интерпретирует это как успех (счетчик успехов $W_{d,t}$ увеличивается). Карточка переходит в разряд Relevant Web Resource и закрепляется в ТОПе.
- Вариант Б (Провал): Сниппет не кликают, ИЛИ кликают, но сразу уходят (цена неконкурентна, товара нет в наличии). DCM интерпретирует это как провал. Счетчик показов $\gamma_{d,t}$ растет, а успехов — нет. Exploration Score падает, карточка исчезает из ТОПа.

Вопросы и ответы

Что такое алгоритм «Многорукого бандита» (Multi-Armed Bandit) в контексте этого патента?

Это класс алгоритмов машинного обучения, решающих задачу баланса между исследованием (Exploration) и использованием (Exploitation). В контексте поиска, «Использование» — это показ документов, которые уже доказали свою релевантность (имеют хорошие ПФ). «Исследование» — это показ новых документов, о которых мало что известно, с целью сбора данных. Bandit-алгоритмы (Second MLA) определяют, какие новые документы наиболее перспективны для показа, чтобы максимизировать общую пользу в долгосрочной перспективе, даже рискуя временным ухудшением качества выдачи.

Как Яндекс определяет, что новый документ потенциально релевантен, если у него нет поведенческих факторов?

Для этого используется First Machine Learned Algorithm (First MLA), в частности его компонент MVPML. Этот алгоритм обучается предсказывать вероятность успеха (Probability of Gain), используя только Web-Resource-Inherent Data — то есть контент, структуру, метаданные, ссылки документа. По сути, это модель, которая пытается предсказать будущие ПФ на основе статических факторов. Если эта модель высоко оценивает документ, он становится кандидатом на тестирование в ТОПе.

Значит ли этот патент, что качество контента важнее поведенческих факторов для новых страниц?

Да, абсолютно. Для того чтобы новая страница вообще получила шанс быть показанной в ТОПе и начала собирать поведенческие факторы, она должна сначала пройти фильтр First MLA. Этот фильтр оценивает именно качество контента, его структуру и другие статические признаки (Web-Resource-Inherent Data). Без сильной базовой оптимизации механизм Exploration не активируется для данной страницы.

Как долго длится фаза тестирования (Exploration) для нового документа?

Патент не указывает точные временные рамки. Это зависит от того, как быстро система наберет достаточно данных для уверенной оценки релевантности. Bandit-алгоритмы (например, UCB-1) разработаны так, чтобы снижать Exploration Score по мере уменьшения неопределенности (т.е. по мере накопления показов $\gamma_{d,t}$). Если документ быстро получает позитивный фидбек, он может закрепиться быстро. Если фидбек негативный, он быстро исключается из тестирования.

На какие позиции в SERP Яндекс добавляет эти новые документы для тестирования?

В патенте используется термин «higher-ranked position» (высокоранжированная позиция). Это означает позиции, которые обеспечивают высокую видимость и вероятность взаимодействия пользователя. Логично предположить, что речь идет о первой странице выдачи, возможно, даже о ТОП-5, так как тестирование на низких позициях не позволит эффективно собрать данные.

Что такое UCB-1 и как он используется?

UCB-1 (Upper Confidence Bound) — это один из вариантов Bandit-алгоритма (Second MLA), упомянутый в патенте. Он рассчитывает Exploration Score, суммируя текущую среднюю оценку релевантности документа и «бонус за исследование». Этот бонус тем выше, чем меньше раз документ был показан (чем выше неопределенность). UCB-1 оптимистичен в условиях неопределенности — он предпочитает тестировать документы с высоким потенциалом, даже если данных пока мало.

Как система обрабатывает ситуацию, когда добавленный для теста документ оказался плохим?

Если документ показан в ТОПе, но не получает кликов, или получает клики с быстрым возвратом, система фиксирует это как неудачу (используя DCM/EM для анализа). Счетчик показов ($\gamma_{d,t}$) увеличивается, а счетчик успехов ($W_{d,t}$) — нет. Это приводит к быстрому снижению средней оценки релевантности и уменьшению Exploration Score. В результате система перестанет выбирать этот документ для показа в ТОПе.

Почему моя новая страница появилась в ТОП-10, а затем исчезла?

Это классический симптом работы системы Exploration. Ваша страница была идентифицирована как перспективный кандидат, и Bandit Algorithm решил ее протестировать, поместив в ТОП для сбора данных. Исчезновение из ТОПа означает, что собранные поведенческие данные оказались недостаточно хороши (низкий CTR сниппета, короткие клики, возвраты на выдачу). Система снизила оценку релевантности страницы.

Что такое Dependent Click Model (DCM) и почему это важно?

DCM — это модель для анализа кликов, которая предполагает, что пользователь просматривает выдачу сверху вниз. Это важно для интерпретации отсутствия клика. Если пользователь кликнул на позицию 3, DCM предполагает, что позиции 1 и 2 были просмотрены, но отвергнуты (сильный негативный сигнал). Позиции ниже 3, возможно, не были просмотрены вообще. Яндекс использует DCM (для позиций выше клика) и EM/Bayesian Inference (для позиций ниже клика) для более точного обновления оценок релевантности во время фазы Exploration.

Как SEO-специалисту использовать знания из этого патента для продвижения нового сайта?

Для нового сайта критически важно максимизировать вероятность попадания в Exploration и успешного его прохождения. Это достигается через: 1) Идеальную техническую оптимизацию и высокое качество контента для получения высокого скора от First MLA. 2) Максимально привлекательные сниппеты (Title, Description) для обеспечения высокого CTR во время показов в ТОПе. 3) Обеспечение высокой удовлетворенности пользователя после клика (решение задачи, удобство сайта), чтобы закрепить успех и начать накапливать позитивные ПФ.