Как Яндекс учитывает визуальный размер и позицию сниппетов и виджетов для расчета их полезности и ранжирования на SERP

Яндекс патентует метод ранжирования и смешивания (Blending), который учитывает визуальный размер (высоту) и позицию элемента на странице выдачи для расчета его «оценки полезности». Система обучается предсказывать, насколько полезным будет элемент определенного размера на определенной позиции. Ключевой механизм: большие элементы (виджеты, расширенные сниппеты) сильнее пессимизируются, если пользователи их пропускают и кликают на элементы ниже.

Описание

Какую задачу решает

Патент решает проблему интеграции разнородных элементов в поисковую выдачу (SERP). Традиционные методы ранжирования не учитывают различия в визуальном размере и характере взаимодействия с современными элементами SERP, такими как «элементы контента» (виджеты, колдунщики, расширенные сниппеты) по сравнению со стандартными ссылками. Изобретение предлагает способ более точной оценки полезности этих элементов и их оптимального размещения (Blending) на выдаче, учитывая, как визуальный размер влияет на внимание пользователя и интерпретацию его кликов (или их отсутствия).

Что запатентовано

Запатентована система ранжирования (реализованная как алгоритм машинного обучения, MLA), которая обучена предсказывать Оценку Полезности (Utility Score) элемента. Ключевой особенностью является использование визуального размера элемента (высота, ширина) и его позиции (вертикальное и горизонтальное расстояние от начала страницы) в качестве признаков для расчета этой оценки.

Как это работает

Система работает в две фазы. Во время фазы обучения система анализирует логи взаимодействий пользователей с SERP. Она рассчитывает фактическую Оценку Полезности для каждого элемента, используя формулы, учитывающие его размер. Критически важно: если пользователь пропускает большой элемент и кликает на элемент ниже, большой элемент получает отрицательную оценку полезности, пропорциональную его размеру относительно кликнутого элемента. MLA обучается предсказывать эту оценку. Во время фазы использования (ранжирования) обученная модель предсказывает полезность элемента в различных потенциальных позициях на SERP и выбирает позицию, где предсказанная полезность максимальна.

Актуальность для SEO

Высокая. Современные поисковые выдачи становятся все более визуальными и гетерогенными, включая множество блоков разного размера (картинки, видео, карты, спецответы). Точное моделирование внимания пользователя и его удовлетворенности с учетом верстки (Position Bias, Visual Salience) является центральной задачей в Information Retrieval и критически важно для качества смешивания (Blending) в Яндексе.

Важность для SEO

Влияние на SEO значительно (7/10). Патент напрямую влияет на оценку эффективности расширенных сниппетов, специализированных блоков и стандартных результатов. Он подчеркивает риски, связанные с получением визуально больших сниппетов (например, через микроразметку): если такой сниппет не удовлетворяет интент пользователя лучше, чем результаты под ним, он будет генерировать сильные негативные сигналы из-за своего размера, что может привести к потере позиций или самого сниппета.

Детальный разбор

Термины и определения

Content Element (Элемент контента): Элемент на SERP, который может отличаться от традиционных элементов (стандартных сниппетов) размером и/или внешним видом. Часто называется «виджетом». Примеры: блок погоды, музыкальный плеер, карусель изображений. В контексте SEO сюда можно отнести расширенные сниппеты (Rich Snippets) и колдунщики.
MLA (Machine Learning Algorithm / Алгоритм машинного обучения): Система ранжирования. Алгоритм (например, CatBoost), обученный предсказывать оценку полезности элемента на основе его признаков, включая размер и позицию.
Position / Ranking (Позиция / Ранжирование): Положение элемента на SERP. Может определяться как порядковый номер (ранг) или как физическое расстояние (в пикселях) от верха страницы (вертикальная позиция) или от левого края (горизонтальная позиция).
SERP (Search Engine Results Page / Страница результатов поисковой машины): Веб-страница, на которой пользователю представляются результаты поиска.
Size (Размер): Визуальный размер элемента при визуализации на экране. Определяется высотой и/или шириной в пикселях. Высота является ключевым параметром в формулах расчета полезности.
User Interactions (Пользовательские взаимодействия): Действия пользователя на SERP. Включают клики, долгие клики, наведение курсора, взаимодействие с виджетом (воспроизведение аудио/видео).
Utility Score / Assessment (Оценка Полезности / Оценка): Метрика, рассчитываемая во время фазы обучения, которая указывает на фактическую полезность элемента для пользователя на основе его взаимодействий, скорректированную на размер и позицию элемента. Служит целевой переменной (Ground Truth) для обучения MLA.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на учете физических характеристик (размера и позиции) элементов при обучении ранжирования и финальном размещении на SERP.

Claim 1 (Независимый пункт): Описывает основной процесс, состоящий из двух фаз.

Фаза Обучения:

Система получает данные о пользовательских взаимодействиях с первой SERP, содержащей первый элемент контента.
Определяется Оценка (Utility Score) для этого элемента.
Критически важно: Оценка определяется на основе (i) Размера элемента на SERP и (ii) Ранжирования элемента.
Система ранжирования (MLA) обучается предсказывать эту Оценку Полезности.

Фаза Использования:

Система получает новый запрос и генерирует список кандидатов.
Система определяет ранжированную позицию для второго элемента контента.
Критически важно: Позиция определяется на основе (i) Размера второго элемента и (ii) Расстояния между этим элементом и наиболее высоко ранжированным элементом (т.е. вертикальной позиции на SERP).
Элемент размещается на этой позиции, и генерируется финальная SERP.

Claims 2, 3, 4 (Зависимые пункты): Детализируют правила расчета Оценки Полезности во время обучения, формализуя логику интерпретации кликов.

Claim 2: Если пользователь кликнул на элемент ВЫШЕ целевого элемента, Оценка Полезности целевого элемента устанавливается в ноль. (Пользователь нашел ответ раньше).
Claim 3: Если пользователь кликнул на сам целевой элемент, Оценка Полезности устанавливается в единицу. (Элемент полезен).
Claim 4 (Ключевая инновация – Формула Пенализации): Если пользователь кликнул на элемент НИЖЕ целевого элемента (т.е. пропустил целевой элемент):
1. Определяется Высота 1 (целевого элемента).
2. Определяется Высота 2 (кликнутого элемента ниже).
3. Из Оценки Полезности вычитается значение (Высота 1 / Высота 2).
Это означает, что чем больше пропущенный элемент относительно кликнутого, тем сильнее он пенализируется.

Claims 5, 6 (Зависимые пункты): Описывают процесс выбора позиции во время Фазы Использования.

Система предсказывает Оценку Полезности для элемента в КАЖДОЙ возможной позиции на SERP (Claim 5).
Выбирается позиция, которая имеет наивысшую предсказанную Оценку Полезности (Claim 6). Это механизм оптимизации размещения (Blending).

Claim 11 (Независимый пункт): Аналогичен Claim 1, но описывает более общий подход, где метод применяется не только к специфическим «элементам контента», но для определения позиции КАЖДОГО элемента в наборе на основе его размера.

Где и как применяется

Изобретение применяется на поздних стадиях формирования поисковой выдачи, когда определяется финальное ранжирование и верстка SERP.

RANKING – Ранжирование (Уровни L3/L4)
Если система используется для ранжирования всех элементов (Способ 800), то она применяется на этапе финального ранжирования. MLA оценивает кандидатов, используя размер и позицию как факторы для расчета финального скора (Predicted Utility Score).

BLENDER – Метапоиск и Смешивание
Основное применение, описанное в патенте (Способ 700), относится к этапу смешивания (Blending). Система берет предварительно ранжированный список стандартных результатов и определяет оптимальную позицию для вставки «элементов контента» (виджетов/колдунщиков). MLA используется для оценки того, насколько уместен конкретный виджет в той или иной позиции, учитывая его размер.

Входные данные (для MLA): Информация об элементе (тип, размер — высота/ширина), потенциальное ранжирование и/или физическая позиция (расстояние от верха/края SERP).

Выходные данные (от MLA): Предсказанная Оценка Полезности элемента для данной позиции.

На что влияет

Конкретные типы контента: Наибольшее влияние оказывается на элементы, чей размер сильно варьируется: виджеты (погода, музыка), карусели изображений и видео, карты, расширенные сниппеты (FAQ, HowTo, Product).
Специфические запросы: Влияет на все типы запросов, где формируется гетерогенная выдача с элементами разного размера.

Когда применяется

Фаза Использования: Применяется в реальном времени при генерации SERP для каждого запроса, на этапе финального ранжирования или смешивания.
Фаза Обучения: Происходит офлайн или непрерывно на основе собираемых логов пользовательских взаимодействий с SERP.

Пошаговый алгоритм

Процесс А: Фаза Обучения (Training)

Сбор данных: Пользователям отображаются SERP. Записываются все параметры верстки (размеры и позиции всех элементов) и все пользовательские взаимодействия (клики, пропуски).
Расчет Оценки Полезности (Ground Truth): Для каждого элемента в логах рассчитывается фактическая Оценка Полезности по следующим правилам:
- Если кликнут элемент выше: Оценка = 0.
- Если кликнут сам элемент (и сессия успешна): Оценка = 1.
- Если кликнут элемент ниже (Н2), а текущий элемент (Н1) пропущен: Оценка = $ — (H1/H2)$.
- Если кликнут и текущий (Н1), и элемент ниже (Н2): Оценка = $1 — (H1/H2)$.
- Оценка может дополнительно взвешиваться на основе времени взаимодействия (Dwell Time).
Генерация обучающих данных: Формируются помеченные данные, где признаки (размер элемента, позиция, тип элемента) связаны с рассчитанной Оценкой Полезности.
Обучение MLA: Система ранжирования обучается предсказывать Оценку Полезности на основе входных признаков.

Процесс Б: Фаза Использования (Ранжирование/Смешивание)

Получение запроса и кандидатов: Система получает запрос и генерирует набор релевантных элементов (стандартных и/или элементов контента).
Предсказание Полезности: Для элемента контента система использует обученный MLA. Она перебирает различные потенциальные позиции на SERP. Для каждой позиции в MLA подаются признаки: размер элемента и координаты позиции.
Получение Скоров: MLA выводит Предсказанную Оценку Полезности для элемента в каждой протестированной позиции.
Оптимизация Размещения: Выбирается позиция, в которой Предсказанная Оценка Полезности максимальна. (В альтернативном варианте выбирается раскладка, максимизирующая суммарную полезность всей SERP).
Генерация SERP: Формируется финальная выдача с элементом контента на выбранной позиции.

Какие данные и как использует

Данные на входе

Поведенческие факторы (для обучения): Критически важны. Клики (выбор элемента), долгие клики, переходы на веб-ресурс. Время взаимодействия с элементом или время доступа к ресурсу (Dwell Time). Наведение курсора. Взаимодействия с виджетами (воспроизведение аудио/видео).
Технические/Визуальные факторы (для обучения и использования):
- Размер элемента: Высота и/или ширина в пикселях. Высота используется в формулах пенализации.
- Вертикальная позиция: Ранжирование (порядковый номер) или расстояние до элемента от наиболее высоко ранжированного элемента (расстояние от верха SERP).
- Горизонтальная позиция: Расстояние от левой стороны страницы.
Контентные факторы: Тип элемента (изображение, видео, аудио, новости, стандартный ресурс).

Какие метрики используются и как они считаются

Оценка Полезности (Utility Score): Целевая метрика, рассчитываемая во время обучения. Диапазон значений может быть от отрицательного до положительного (максимум 1).
Формулы расчета Оценки Полезности: Патент вводит конкретные формулы, связывающие клики и размеры элементов.
- Формула пенализации при пропуске (если кликнут элемент ниже):
  
  $Utility\ Score = — (\frac{Height_{Current}}{Height_{Clicked}})$
- Формула при клике на текущий и нижний элемент:
  
  $Utility\ Score = 1 — (\frac{Height_{Current}}{Height_{Clicked}})$
Алгоритмы машинного обучения: Используется MLA (Ranking System), обученный методом минимизации разницы (потери) между предсказанной оценкой и фактической Оценкой Полезности из логов.

Выводы

Визуальный размер является фактором ранжирования/смешивания: Яндекс явно использует физические размеры (особенно высоту) элементов SERP при расчете их полезности. Это отход от моделей, которые рассматривают SERP просто как упорядоченный список.
Формализованная пенализация за размер («Large Element Penalty»): Ключевой вывод — это конкретная формула пенализации для больших элементов, которые пользователи пропускают. Чем больше размер пропущенного элемента относительно кликнутого, тем сильнее негативный сигнал. Это математическое выражение интуитивного понимания: большой элемент должен быть очень полезным, чтобы оправдать занимаемое место.
Полезность зависит от позиции: Система не просто рассчитывает общую релевантность элемента, а предсказывает его полезность для конкретной позиции на SERP. Элемент может быть полезен на 3-й позиции, но бесполезен на 1-й.
Оптимизация Blending: Механизм предназначен для нахождения оптимального места вставки виджетов и расширенных сниппетов. Система перебирает все возможные позиции и выбирает ту, которая максимизирует предсказанную полезность.
Интеграция поведенческих и визуальных факторов: Патент демонстрирует, как поведенческие сигналы (клики) интерпретируются в контексте визуальной верстки (размеры и расстояния) для обучения MLA.

Практика

Best practices (это мы делаем)

Обеспечивать максимальную релевантность расширенных сниппетов: При внедрении микроразметки (FAQ, HowTo, Product) для получения расширенных сниппетов критически важно, чтобы они идеально отвечали на запрос пользователя. Если вы получаете визуально большой сниппет, он берет на себя большую ответственность. Если он нерелевантен и пользователи его пропускают, пенализация будет сильной (согласно формуле).
Оптимизировать утилитарность сниппета (Snippet Utility): Фокусируйтесь на том, чтобы стандартный сниппет (Title и Description) был максимально информативным и привлекательным. Ваша задача — либо удовлетворить пользователя сразу (Zero-Click), либо мотивировать его кликнуть на ваш результат, предотвращая скроллинг вниз к конкурентам. Если пользователи уходят ниже, ваш сниппет получает отрицательную оценку полезности.
Анализировать верстку SERP и размеры конкурентов: Понимайте, какие визуальные элементы и какого размера Яндекс показывает по вашим запросам. Если выдача насыщена большими виджетами Яндекса, стандартным сниппетам сложнее конкурировать за внимание, что требует идеальной оптимизации.

Worst practices (это делать не надо)

Искусственное раздувание сниппета без пользы: Попытки манипулировать размером сниппета (например, злоупотребление спецсимволами, избыточное использование Schema только ради вертикального пространства) без предоставления реальной ценности опасны. Механизм пенализации на основе размера накажет за это.
Внедрение микроразметки с нерелевантным контентом: Например, добавление FAQ разметки со слабыми, общими или не соответствующими интенту ответами только для получения расширенного сниппета. Это приведет к пропускам и сильным негативным сигналам.
Игнорирование поведенческих метрик на SERP (CTR): Низкий CTR (особенно если клики уходят на результаты ниже) напрямую ведет к снижению Оценки Полезности, рассчитанной в патенте.

Стратегическое значение

Патент подтверждает, что Яндекс моделирует поведение пользователей на SERP с высокой детализацией, учитывая визуальный контекст. Визуальное представление результата неразрывно связано с поведенческими факторами и ранжированием. Для SEO это означает, что анализ должен выходить за рамки текстовой релевантности и включать понимание того, как результат представлен на выдаче (Snippet Optimization) и оправдывает ли это представление занимаемое пространство с точки зрения пользователя.

Практические примеры

Сценарий: Пенализация расширенного сниппета FAQ

Ситуация: Сайт внедрил разметку FAQ и получил по запросу большой расширенный сниппет (Высота Н1 = 300 пикселей) на позиции 2. Однако ответы в FAQ слишком общие.
Поведение пользователя: Пользователи просматривают FAQ, не находят пользы, пропускают его и кликают на стандартный результат конкурента на позиции 3 (Высота Н2 = 100 пикселей).
Расчет системы (Фаза Обучения): Яндекс рассчитывает Оценку Полезности для сниппета FAQ по формуле: Оценка = $-(H1/H2) = -(300/100) = -3$.
Результат: Это очень сильный негативный сигнал. MLA обучается, что данный большой элемент на этой позиции не полезен. Вероятный исход — потеря расширенного сниппета или понижение в ранжировании.

Сценарий: Сравнение стандартных сниппетов

Ситуация: Два стандартных сниппета примерно одинакового размера (Н1=100px на позиции 1, Н2=100px на позиции 2).
Поведение пользователя: Пользователи пропускают позицию 1 и кликают на позицию 2.
Расчет системы: Оценка Полезности для Позиции 1 = $-(100/100) = -1$.
Сравнение: Пенализация в этом случае (-1) значительно слабее, чем в Сценарии 1 (-3). Это показывает, что система предъявляет более высокие требования к большим элементам.

Вопросы и ответы

В чем суть основного нововведения этого патента?

Основное нововведение — это формализация учета визуального размера (например, высоты) элемента на SERP при расчете его полезности для ранжирования. Патент вводит конкретные формулы, которые пенализируют элементы, если пользователи их пропускают и кликают ниже. При этом чем больше размер пропущенного элемента относительно кликнутого, тем сильнее пенализация. Это позволяет точнее оценивать и оптимально размещать виджеты и расширенные сниппеты.

Как именно рассчитывается штраф, если пользователь пропустил мой сниппет?

Если пользователь пропустил ваш сниппет (Высота 1) и кликнул на результат ниже (Высота 2), то Оценка Полезности вашего сниппета рассчитывается как $-(Высота 1 / Высота 2)$. Например, если ваш сниппет вдвое больше того, на который кликнули ниже, вы получите оценку -2. Если они одинакового размера, оценка будет -1. Это значение используется для обучения модели ранжирования.

Означает ли это, что лучше иметь маленький сниппет, чем большой?

Не обязательно. Большой сниппет (например, расширенный) может привлечь больше внимания и дать больше информации, что увеличивает вероятность клика. Однако патент показывает, что большой сниппет несет и большие риски. Если он нерелевантен интенту, он будет генерировать более сильные негативные сигналы, чем маленький нерелевантный сниппет. Нужно стремиться к большому размеру, только если вы уверены в высокой полезности контента.

Как этот патент влияет на внедрение микроразметки (Schema.org)?

Он делает внедрение микроразметки более ответственным процессом. Получение расширенного сниппета (FAQ, HowTo) значительно увеличивает высоту вашего элемента на SERP. Если контент в этом сниппете слабый или не соответствует запросу, пользователи будут его пропускать, что приведет к сильной пенализации по запатентованной формуле. Внедрять разметку стоит только с качественным и релевантным контентом.

Что такое «Элемент контента» или «Виджет» в контексте патента?

Это любые элементы SERP, которые отличаются от стандартных синих ссылок размером или функциональностью. В патенте приводятся примеры блоков погоды, музыкальных плееров, каруселей изображений или видео. В практике SEO это соответствует колдунщикам Яндекса, а также расширенным сниппетам (Rich Snippets), которые визуально больше стандартных.

Используется ли эта система для ранжирования стандартных результатов или только для вставки виджетов?

Патент описывает оба варианта. Способ 700 описывает использование системы для смешивания (Blending) — определения оптимальной позиции для вставки виджета в уже ранжированный список. Способ 800 и Claim 11 описывают общий подход, где система используется для ранжирования всех элементов (и стандартных, и виджетов) одновременно, учитывая их размер.

Учитывается ли только высота элемента или ширина тоже?

Патент упоминает размер в целом (высота и ширина) и даже горизонтальную позицию как возможные признаки для MLA. Однако в ключевых формулах расчета Оценки Полезности (Claims 4, 14 и параграфы 106-107) используется именно высота (Height). Вертикальный размер является наиболее критичным для анализа поведения при скроллинге.

Как система определяет оптимальную позицию для элемента?

Во время ранжирования система использует обученную модель (MLA), чтобы предсказать Оценку Полезности для элемента в каждой возможной позиции на SERP. Она вводит в модель размер элемента и координаты позиции и получает скор. Затем система выбирает ту позицию, где предсказанная полезность максимальна.

Учитывает ли система время, проведенное на сайте (Dwell Time)?

Да, учитывает. В патенте указано, что Оценка Полезности может определяться на основе, по меньшей мере частично, количества времени, в течение которого пользователь осуществлял доступ к элементу контента или соответствующему ресурсу. Это используется для корректировки базовой оценки, полученной по факту клика.

Что важнее для этой системы: позиция или размер элемента?

Оба фактора критически важны и используются совместно. Система обучается понимать взаимосвязь: насколько полезен элемент данного размера на данной позиции. Позиция влияет на вероятность просмотра (Position Bias), а размер определяет визуальную заметность и величину штрафа в случае пропуска.