Как Яндекс учитывает размер и позицию сниппетов (Presentation Bias) при обучении ранжирования и формировании выдачи

Яндекс патентует метод учета визуального представления элементов на SERP (размер сниппета, позиция, расстояние от топа) при обучении ранжирования. Система корректирует оценку полезности элемента, учитывая, как его размер мог повлиять на клик. Если большой элемент пропускают в пользу маленького, он получает сильный штраф. Это позволяет бороться с Presentation Bias и точнее определять истинную релевантность.

Описание

Какую задачу решает

Патент решает фундаментальную проблему в обучении систем ранжирования, известную как Presentation Bias (предвзятость представления), включая Position Bias и Size Bias. Проблема заключается в том, что взаимодействие пользователя (клик) зависит не только от релевантности контента, но и от того, как он представлен на SERP. В гетерогенной выдаче крупные элементы (расширенные сниппеты, колдунщики, видео) привлекают больше внимания. Традиционные ML-модели могут ошибочно интерпретировать эти клики как сигнал высокой релевантности. Данное изобретение предлагает механизм для корректировки этой предвзятости и более точной интерпретации поведенческих сигналов.

Что запатентовано

Запатентован способ и система для определения ранжированных позиций, который явно включает визуальные характеристики элементов (размер и позицию) в процесс обучения и ранжирования. Суть изобретения — в методе расчета Оценки (Score) полезности элемента во время обучения. Эта оценка корректируется с учетом размера элемента и контекста взаимодействия (что было пропущено, что было выбрано). Это позволяет модели лучше разделять истинную релевантность и влияние визуального дизайна.

Как это работает

Система работает в две фазы. Во время Фазы обучения система анализирует логи взаимодействий. Ключевым является расчет оценки: если элемент был выбран (кликнут), он получает положительную оценку (например, 1). Если элемент был пропущен (пользователь кликнул ниже), он штрафуется. Штраф рассчитывается на основе отношения высоты пропущенного элемента к высоте выбранного (Claim 4). Если большой элемент пропущен в пользу меньшего, он получает значительный штраф. Во время Фазы использования система определяет позицию элемента, учитывая его размер и расстояние от топа, стремясь максимизировать его Предсказанную оценку полезности на этой конкретной позиции.

Актуальность для SEO

Высокая. Борьба с различными видами смещений (Bias) является центральной темой в современных исследованиях Information Retrieval. По мере того как выдача Яндекса становится более визуально разнообразной (интеграция вертикалей, Колдунщики, расширенные сниппеты), необходимость учета влияния макета SERP на поведение пользователей критически важна для объективной оценки качества поиска и обучения моделей.

Важность для SEO

Влияние на SEO значительно (8/10). Патент демонстрирует, что Яндекс не просто учитывает CTR, а интерпретирует его в контексте визуального представления сниппета. Это означает, что стратегии, направленные на максимизацию размера сниппета (например, через микроразметку), являются стратегией повышенного риска. Большой, но нерелевантный сниппет будет строго пенализирован системой обучения, описанной в патенте. Это подчеркивает необходимость сочетания визуальной привлекательности с высокой релевантностью.

Детальный разбор

Термины и определения

SERP (Search Engine Results Page): Страница результатов поисковой машины. В патенте упоминаются Первая SERP (во время обучения) и Вторая SERP (во время использования).
Система ранжирования (Ranking System): Компонент поисковой системы (например, ML-модель), отвечающий за упорядочивание элементов на SERP. Обучается на основе предыдущих пользовательских взаимодействий.
Элемент контента (Content Item): Отдельный результат на SERP (например, сниппет веб-документа, изображение, видео, колдунщик).
Фаза обучения (Training Phase): Офлайн-процесс, во время которого система ранжирования обучается на исторических данных о взаимодействиях пользователей с SERP.
Фаза использования (In-use Phase): Онлайн-процесс обработки запроса пользователя и генерации SERP в реальном времени.
Оценка (Score): Метрика, рассчитываемая во время фазы обучения. Она служит целевой переменной (Ground Truth) и отражает полезность элемента с учетом его размера, ранжирования на конкретной SERP и действий пользователя.
Предсказанная оценка полезности (Predicted Utility Score): Оценка, которую обученная система ранжирования предсказывает для элемента контента. Используется для определения финального ранжирования во время фазы использования.
Пользовательские взаимодействия (User Interactions): Действия пользователя на SERP, такие как выбор (клик), длительный выбор, наведение курсора, воспроизведение аудио и т.д. (Claim 18).

Ключевые утверждения (Анализ Claims)

Патент фокусируется на том, как визуальные атрибуты элементов на SERP учитываются при обучении и применении модели ранжирования для борьбы с предвзятостью представления.

Claim 1 (Независимый пункт): Описывает общий процесс.

Фаза обучения:

Получение данных о взаимодействиях с Первой SERP в ответ на обучающий запрос.
Определение Оценки (Score) для первого элемента контента. Ключевой момент: Оценка основана, по меньшей мере частично, на (i) Размере первого элемента и (ii) его Ранжировании (позиции).
Обучение системы ранжирования предсказывать Предсказанную оценку полезности на основе этой Оценки.

Фаза использования:

Получение запроса пользователя.
Определение ранжированной позиции для второго элемента контента. Ключевой момент: Позиция определяется на основе, по меньшей мере частично, (i) Размера второго элемента и (ii) Расстояния между вторым элементом и наиболее высоко ранжированным элементом (расстояние от топа).
Генерация Второй SERP.

Claims 2-4 и 12-14: Детализируют расчет Оценки во время Фазы обучения. Это ядро механизма.

Claim 2/12: Если пользователь выбрал элемент НАД текущим элементом, Оценка текущего элемента устанавливается на ноль. (Пользователь нашел ответ раньше).
Claim 3/13: Если пользователь выбрал текущий элемент, Оценка устанавливается на единицу. (Элемент был полезен).
Claim 4/14 (Критически важный механизм): Если пользователь выбрал элемент ПОД текущим элементом (т.е. текущий элемент был пропущен):
1. Определяется Первая высота (H1) текущего (пропущенного) элемента.
2. Определяется Вторая высота (H2) выбранного элемента ниже.
3. Из Оценки вычитается Первая высота, деленная на Вторую высоту (H1/H2).

Эта формула означает, что чем больше размер (высота) пропущенного элемента по сравнению с выбранным, тем сильнее он штрафуется. Пропуск большого, заметного элемента интерпретируется как сильный негативный сигнал релевантности.

Claims 5-6 и 15-16: Описывают процесс оптимизации ранжирования во время Фазы использования.

Система определяет Предсказанную оценку полезности для элемента на каждой возможной позиции (Claim 5/15).
Финальная позиция выбирается так, чтобы иметь наивысшую предсказанную оценку полезности (Claim 6/16). Это означает, что система итеративно оптимизирует макет SERP, учитывая, как изменится полезность элемента при его размещении на разных позициях с учетом его размера.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска, интегрируя офлайн-обучение и онлайн-ранжирование.

Офлайн-процессы и Слой Качества (QUALITY & GOVERNANCE LAYER) (Фаза Обучения)
Система анализирует логи поведения пользователей. На вход поступают данные о макете SERP (размеры и позиции всех элементов из логов рендеринга) и взаимодействиях.

Расчет Оценок (Labeling): Вычисление скорректированных оценок полезности (Ground Truth) для обучающей выборки с применением логики из Claims 2-4. Это позволяет очистить метрики качества (такие как компоненты Профицита или Proxima) от влияния дизайна (Presentation Bias).
Обучение Модели: Обучение Системы Ранжирования (вероятно, CatBoost) предсказывать эти скорректированные оценки. Визуальные характеристики (размер, расстояние от топа, горизонтальная позиция (Claim 9)) используются как признаки (features) в модели.

RANKING – Ранжирование (L3/L4) и BLENDER – Метапоиск и Смешивание (Фаза Использования)
На поздних стадиях ранжирования и особенно на этапе смешивания (Blender), где объединяются элементы разных размеров (веб-результаты, картинки, видео, Колдунщики).

Оптимизация позиций: Согласно Claims 5-6, система не просто сортирует элементы по убыванию скора, а итеративно определяет наилучшую позицию для каждого элемента, максимизируя его предсказанную полезность с учетом его размера и расстояния от топа (Claim 1) на этой позиции.

На что влияет

Конкретные типы контента: Наибольшее влияние оказывается на элементы с переменным или большим размером: расширенные сниппеты (Rich Snippets), блоки изображений и видео (Claim 8), Колдунщики (Wizards), Турбо-страницы.
Форматы контента: Система позволяет более справедливо сравнивать релевантность стандартных текстовых сниппетов и визуально богатых форматов.
Специфические запросы: Особенно заметно на запросах, где выдача визуально разнообразна (мультимедийные, коммерческие, информационные с богатой разметкой).

Когда применяется

Фаза обучения: Постоянно в офлайн-режиме при переобучении основных моделей ранжирования на свежих логах пользовательского поведения.
Фаза использования: При генерации каждой страницы результатов поиска (SERP) для определения финального ранжирования и макета.
Триггеры активации: Расчет штрафа активируется, когда пользователь пропускает элемент и кликает на элемент, расположенный ниже (Claim 4, 14).

Пошаговый алгоритм

Процесс А: Фаза Обучения (Офлайн)

Сбор данных: Получение исторических данных о SERP. Фиксируются размеры (высота) и позиции всех элементов, а также логи взаимодействий (клики).
Расчет Оценки (Labeling) для каждого элемента (E_i):
1. Инициализация Оценки.
2. Проверка клика выше: Если клик был выше E_i, Оценка = 0.
3. Проверка клика на элементе: Если клик был на E_i, Оценка = 1. (Может быть скорректировано временем доступа/Dwell Time по Claim 7).
4. Проверка клика ниже (Пропуск): Если клик был ниже E_i (на элементе E_click):
  
  Расчет штрафа: $Penalty = \frac{Height(E_i)}{Height(E_{click})}$.
  
  Корректировка Оценки: $Score = Score — Penalty$.
Обучение модели: Обучение системы ранжирования предсказывать рассчитанную Оценку (Ground Truth), используя признаки документа, запроса и визуальные признаки (размер, позиция, расстояние от топа).

Процесс Б: Фаза Использования (Онлайн)

Получение запроса и Генерация кандидатов.
Итеративная Оптимизация Ранжирования:
1. Для каждого элемента-кандидата определяется его потенциальный размер.
2. Система рассчитывает Предсказанную оценку полезности для каждого элемента на каждой доступной позиции, используя обученную модель и учитывая визуальные признаки этой позиции (расстояние от топа, размер).
3. Выбирается комбинация элементов и их позиций, которая максимизирует полезность (Claims 5, 6).
Генерация SERP: Формирование финальной страницы выдачи.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Критически важные данные для Фазы обучения.
- Выбор элемента (Клик) (Claim 18).
- Контекст клика (что было выше/ниже кликнутого элемента).
- Длительный выбор (Long Click) (Claim 18).
- Количество времени доступа к элементу (Dwell Time) (Claim 7).
- Наведение курсора, воспроизведение аудио (Claim 18).
Визуальные/Структурные факторы (SERP Layout): Используются и в Фазе обучения, и в Фазе использования.
- Размер элемента (Size) (Claim 1).
- Высота элемента (Height) (Claim 4). Используется как мера размера для расчета штрафов.
- Ранжирование/Позиция элемента (Ranking/Position) (Claim 1).
- Расстояние от наиболее высоко ранжированного элемента (Distance from top) (Claim 1, 10).
- Горизонтальная позиция элемента (Horizontal position) (Claim 9).
Мультимедиа факторы: Учитывается наличие изображений или видео в элементе (Claim 8), что влияет на его размер и формат.

Какие метрики используются и как они считаются

Оценка (Score): Рассчитывается во время обучения как Ground Truth. Изначально может быть бинарной (0 или 1), но затем модифицируется.
Штраф за пропуск (Skip Penalty): Ключевая метрика патента. Рассчитывается как отношение высоты пропущенного элемента к высоте выбранного элемента (Claim 4/14).
$$Penalty = \frac{Height_{skipped}}{Height_{selected}}$$
Скорректированная Оценка: Результат вычитания Штрафа за пропуск из исходной Оценки.
Предсказанная оценка полезности (Predicted Utility Score): Выход обученной модели ранжирования. Предсказание полезности элемента с учетом его размера и позиции.

Выводы

Яндекс активно борется с Presentation Bias: Патент подтверждает, что Яндекс не использует поведенческие данные (клики) напрямую для обучения, а активно корректирует их, чтобы нивелировать влияние дизайна и позиции на SERP на выбор пользователя.
Размер и позиция сниппета — явные признаки ранжирования: Визуальные характеристики сниппета (размер, высота, расстояние от топа, горизонтальное положение) являются явными признаками (features) как при обучении, так и при финальном ранжировании.
Штраф за нерелевантность пропорционален размеру: Ключевой механизм (Claim 4) — штрафование пропущенных элементов пропорционально их размеру относительно выбранного элемента. Чем больше и заметнее сниппет, тем сильнее он будет пессимизирован моделью обучения, если пользователи его игнорируют.
Богатые сниппеты — высокий риск и высокая награда: Визуально привлекательные форматы увеличивают заметность, но если они не соответствуют интенту пользователя, они генерируют сильные негативные сигналы из-за своего размера.
Оптимизация макета SERP: Система не просто ранжирует документы, но и оптимизирует их расположение (Claims 5-6), оценивая полезность элемента на каждой возможной позиции с учетом того, как он будет там выглядеть.

Практика

Best practices (это мы делаем)

Стремиться к расширенным сниппетам только при высокой релевантности: Используйте микроразметку (Schema.org), Турбо-страницы и другие методы для получения крупных сниппетов, но только если ваш контент точно соответствует интенту запроса. Визуальное преимущество должно подкрепляться качеством, так как риски пессимизации выше.
Максимизировать точность и привлекательность Title и Description: Сниппет должен максимально точно отражать содержание страницы и мотивировать клик. Это минимизирует вероятность пропуска вашего результата (Skip), что приведет к штрафам при обучении модели.
Анализировать CTR в связке с формой сниппета: При анализе поведенческих метрик учитывайте, как выглядел ваш сниппет. Низкий CTR для расширенного сниппета — это гораздо более тревожный сигнал, чем для стандартного, так как система обучения Яндекса оштрафует его сильнее.
Фокус на удовлетворении пользователя (Dwell Time): Патент (Claim 7) упоминает учет времени доступа к элементу при определении Оценки. Важно не просто получить клик, но и удержать пользователя качественным контентом (длинный клик), что повысит Оценку полезности при обучении.
Релевантные визуальные элементы: Убедитесь, что изображения или видео в сниппете строго релевантны контенту. Они увеличивают размер сниппета и, следовательно, потенциальный штраф при пропуске.

Worst practices (это делать не надо)

Кликбейт и вводящие в заблуждение сниппеты: Использование заголовков, изображений или описаний, которые привлекают внимание, но не соответствуют контенту. Это приведет либо к пропускам (Skips), либо к коротким кликам. Оба сценария негативно влияют на Оценку полезности, особенно для крупных сниппетов.
Манипуляции с разметкой для увеличения размера сниппета: Попытки искусственно увеличить высоту сниппета (например, добавляя лишние элементы в разметку FAQ или используя нерелевантные изображения), не увеличивая его информативность. Если такой «раздутый» сниппет будут пропускать, он получит максимальный штраф по формуле из Claim 4.
Игнорирование качества контента при фокусе на формате: Полагаться на то, что визуально привлекательный формат (например, Турбо-страница) сам по себе обеспечит хорошие позиции, игнорируя релевантность.

Стратегическое значение

Этот патент подчеркивает стратегический приоритет Яндекса на измерение истинной релевантности и удовлетворенности пользователя, очищенной от шумов и смещений. Система стремится понять, *почему* пользователь кликнул — из-за релевантности или из-за дизайна. Для SEO это означает, что долгосрочный успех зависит от способности предоставлять наилучший ответ, а не от способности создать самый заметный сниппет. Визуальная оптимизация SERP является важной частью стратегии, но она должна быть инструментом для демонстрации релевантности, а не ее заменой.

Практические примеры

Сценарий 1: Штраф за пропуск расширенного сниппета (Фаза Обучения)

Пользователь ищет «как приготовить пасту карбонара». На SERP:

Элемент А (Позиция 1): Расширенный сниппет (Rich Snippet) с картинкой и рейтингом. Высота = 200px. Заголовок кликбейтный.
Элемент Б (Позиция 2): Стандартный текстовый сниппет. Высота = 100px. Заголовок точный.

Пользователь пропускает Элемент А и кликает на Элемент Б.

Действие системы (по Claim 4):

Система фиксирует пропуск Элемента А.
Рассчитывается штраф для Элемента А: $Penalty = \frac{Height_A}{Height_Б} = \frac{200px}{100px} = 2$.
Оценка Элемента А уменьшается на 2.

Вывод: Модель ранжирования получает сильный сигнал о нерелевантности Элемента А. Если бы Элемент А был стандартного размера (100px), штраф был бы всего 1. Увеличение размера привело к удвоению штрафа.

Сценарий 2: Пропуск стандартного сниппета ради большого (Фаза Обучения)

Элемент В (Позиция 1): Стандартный сниппет. Высота = 100px.
Элемент Г (Позиция 2): Большой сниппет (например, видео блок). Высота = 300px.

Пользователь пропускает Элемент В и кликает на Элемент Г.

Действие системы (по Claim 4):

Рассчитывается штраф для Элемента В: $Penalty = \frac{Height_В}{Height_Г} = \frac{100px}{300px} \approx 0.33$.
Оценка Элемента В уменьшается на 0.33.

Вывод: Штраф для В меньше, так как он был пропущен ради очень крупного и заметного результата Г. Система учитывает, что В было сложнее конкурировать за внимание.

Вопросы и ответы

Означает ли этот патент, что CTR не является фактором ранжирования?

Не совсем. CTR и другие поведенческие сигналы являются основой для обучения модели ранжирования (Фаза обучения). Однако этот патент показывает, что Яндекс не использует «сырой» CTR. Вместо этого он рассчитывает скорректированную Оценку полезности, которая фильтрует влияние размера и позиции сниппета (Presentation Bias). Таким образом, CTR является критически важным входным сигналом, но его интерпретация сложна и зависит от контекста.

Как этот патент влияет на использование микроразметки (Schema.org) и стремление к расширенным сниппетам?

Стремление к расширенным сниппетам остается важной SEO-задачей, так как они увеличивают заметность. Однако патент вводит высокий риск: если ваш расширенный (крупный) сниппет окажется нерелевантным и пользователи будут его пропускать, система обучения оштрафует его значительно сильнее, чем стандартный сниппет (согласно формуле в Claim 4). Используйте микроразметку только тогда, когда ваш контент полностью соответствует интенту запроса.

Что такое Presentation Bias, с которым борется этот патент?

Presentation Bias (Предвзятость представления) — это склонность пользователей кликать на элементы не только из-за их релевантности, но и из-за того, как они выглядят (например, они больше, ярче или расположены в более заметном месте). Если не учитывать это при обучении, модель ранжирования будет ошибочно считать визуально привлекательные, но нерелевантные результаты качественными. Патент предлагает механизм для отделения релевантности от влияния дизайна.

Как именно рассчитывается штраф, если мой сниппет пропустили и кликнули ниже?

Штраф рассчитывается по формуле: Высота вашего сниппета, деленная на Высоту сниппета, на который кликнули (Claim 4). $Penalty = Height_{ваш}/Height_{кликнутый}$. Если ваш сниппет вдвое выше того, что выбрали под ним, вы получите штраф 2. Если ваш сниппет меньше того, что выбрали под ним, штраф будет меньше 1. Это подчеркивает риск использования больших сниппетов при недостаточной релевантности.

Применяется ли этот механизм только к основной веб-выдаче?

Нет. В патенте явно указано (Claim 8), что элементы контента могут содержать одно или более изображений или видео. Это означает, что механизм применяется ко всей SERP, включая результаты из вертикальных поисков (Картинки, Видео) и Колдунщики, которые смешиваются Блендером. Это особенно важно при сравнении полезности разнородных блоков.

Как система определяет «размер» элемента? Это ширина или высота?

В ключевых пунктах, описывающих расчет штрафа (Claim 4 и 14), используется термин «Высота» (Height). В более общих пунктах (Claim 1 и 11) используется термин «Размер» (Size). Также упоминается «Горизонтальная позиция» (Claim 9) как отдельный фактор. На практике, высота является основным параметром для измерения визуального пространства, занимаемого элементом в вертикальной прокрутке SERP.

Учитывает ли система расстояние от начала выдачи?

Да, явно. В Claim 1 и Claim 10 указано, что Оценка определяется на основе, в том числе, расстояния на SERP до элемента от наиболее высоко ранжированного элемента (расстояние от топа). Это используется как в фазе обучения, так и в фазе использования для определения финальной позиции.

Пытается ли система оптимизировать макет SERP в реальном времени?

Да. Согласно Claims 5-6 и 15-16, во время фазы использования система не просто сортирует результаты. Она рассчитывает Предсказанную оценку полезности для каждого элемента на каждой возможной позиции и выбирает ту позицию, где полезность максимальна. Это означает, что система итеративно оптимизирует финальный макет SERP, учитывая, как размер элемента будет влиять на его восприятие на конкретной позиции.

Влияет ли время, проведенное на сайте (Dwell Time), на эту систему?

Да. В Claim 7 указано, что определение Оценки для элемента может основываться, по меньшей мере частично, на количестве времени, в течение которого пользователь осуществлял доступ к элементу. Это означает, что не только факт клика важен, но и последующее поведение (например, разница между коротким и длинным кликом) учитывается при обучении модели ранжирования.

Как бороться с низким CTR, если мой сниппет стандартный и находится внизу выдачи?

Преимущество описанной системы в том, что она учитывает контекст. Низкий CTR для сниппета внизу выдачи ожидаем и не будет сильно оштрафован, так как модель знает о его позиции и размере. Однако, если пользователи часто прокручивают до вашего сниппета и кликают на него, пропуская результаты выше, это будет сильным позитивным сигналом. Система зафиксирует, что результаты выше получили штрафы, а ваш результат получил положительную оценку, несмотря на низкую позицию.