Как Яндекс определяет оптимальные позиции для свежего контента (Картинки/Видео) в 2D-выдаче

Яндекс патентует метод ранжирования «свежего» контента (Non-Native Items), по которому еще нет статистики, в 2D-выдаче (например, Яндекс Картинки). Система предсказывает «Оценку Полезности» (Usefulness Score), анализируя, как пользователи взаимодействуют с элементом (Win) и как часто его пропускают, кликая на элементы справа или снизу (Loss). Это позволяет оптимально размещать новый контент среди старого.

Описание

Какую задачу решает

Патент решает проблему «холодного старта» для нового или свежего контента (fresh items или non-native items). Стандартные алгоритмы ранжирования, опирающиеся на исторические поведенческие данные, не могут эффективно оценить такой контент из-за отсутствия статистики взаимодействий (limited previous user interactions). Изобретение предлагает механизм для определения оптимальной позиции нового контента среди уже известных результатов (native items), специфичный для двухмерной (2D) выдачи (например, сетки изображений или видео).

Что запатентовано

Запатентована система и метод для определения ранговых позиций Non-Native Items. Суть изобретения заключается в обучении модели предсказывать Usefulness Score (Оценку Полезности) для нового элемента на конкретной позиции в 2D-выдаче. Эта оценка рассчитывается на основе пространственного анализа взаимодействий пользователя: как с самим элементом (позитивный сигнал), так и с элементами, расположенными горизонтально и вертикально после него (негативный сигнал).

Как это работает

Система работает в двух фазах. В Training Phase (Фаза Обучения) новые элементы искусственно вставляются на разные позиции в 2D-выдачу. Система собирает данные: клик по элементу считается «Win», а клик по элементам справа или снизу (в определенных зонах) считается «Loss» (пропуск). На основе этого рассчитывается Usefulness Score, и обучается модель машинного обучения для его предсказания. В In-Use Phase (Фаза Использования) эта модель в реальном времени предсказывает Usefulness Score для нового контента на всех возможных позициях и выбирает позицию с максимальной предсказанной полезностью.

Актуальность для SEO

Высокая. Быстрая и эффективная интеграция свежего контента, особенно визуального (картинки, видео), критически важна для поисковых систем. Механизмы, учитывающие специфику поведения пользователей в 2D-макетах (Grid Layouts), остаются актуальными для таких сервисов как Яндекс Картинки и Яндекс Видео.

Важность для SEO

Влияние на SEO значительно (7/10), но специфично для вертикалей с 2D-макетом (Картинки, Видео). Патент не применим к стандартному веб-поиску. Для мультимедиа контента он критически важен, так как описывает, как Яндекс оценивает и позиционирует новый контент. Это подчеркивает важность немедленной визуальной привлекательности (CTR тамбнейла): если пользователь пропускает вашу картинку и кликает на соседнюю (Loss), система учится, что ваш контент менее полезен.

Детальный разбор

Термины и определения

Native Items (Родные элементы): «Старый» контент (Used Items), по которому накоплено достаточное количество данных о поведении пользователей. Они могут быть ранжированы стандартным алгоритмом поиска (User-interaction-based ranking algorithm).
Non-Native Items (Неродные элементы / Fresh Items): Свежий контент, недавно добавленный в индекс. По нему мало или нет данных о поведении пользователей, поэтому стандартный алгоритм не может их ранжировать (non-rankable).
Usefulness Score (Оценка Полезности): Ключевая метрика патента. Рассчитывается для Non-Native Item на конкретной визуальной позиции. Отражает баланс между положительными (Win) и отрицательными (Loss) взаимодействиями.
Visual 2-D Arrangement (Визуальное 2D-расположение): Способ отображения результатов поиска в виде сетки, состоящей из строк, где в каждой строке расположено как минимум два элемента по горизонтали. Характерно для поиска по картинкам или видео.
Positive User Interactions (Win): Взаимодействия пользователя с самим Non-Native Item (клик, долгий клик, наведение). Увеличивают Usefulness Score.
Negative User Interactions (Loss): Взаимодействия пользователя с элементами, расположенными горизонтально или вертикально *после* Non-Native Item. Интерпретируется как пропуск (игнорирование) нового элемента. Уменьшают Usefulness Score.
Vertical Proximity Zone (Зона вертикальной близости): Область, используемая для определения вертикальных негативных взаимодействий. Определяется как проекция Non-Native Item на следующую строку (или строки) непосредственно под ним. Клики по элементам в этой зоне считаются Loss.
SERP Features (Признаки SERP): Характеристики страницы выдачи и контекста. Включают признаки запроса (Query Features), размер окна браузера (Window Size) и визуальный размер каждого элемента (Visual Item Size).
Usefulness-Score-Prediction Algorithm: Модель машинного обучения (MLA), обученная предсказывать Usefulness Score.
Visual Group of Non-Native Items (Визуальная группа неродных элементов): Ситуация, когда несколько Non-Native Items расположены непосредственно рядом друг с другом (горизонтально или вертикально). В этом случае анализ взаимодействий и расчет Usefulness Score адаптируется для группы в целом.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методе интеграции контента без истории в ранжирование, основанное на взаимодействиях, специфичном для 2D-выдачи.

Claim 1 (Независимый пункт): Описывает полный цикл работы системы (Обучение + Использование).

Фаза Обучения (Training Phase):

Сбор данных о взаимодействиях с Training SERP. Эта выдача формируется путем ранжирования Native Items и искусственной вставки (artificially inserted) Non-Native Items на выбранные позиции.
Критическое условие: результаты отображаются в Visual 2-D Arrangement.
Генерация Usefulness Score. Ядро изобретения — метод расчета. Он включает анализ взаимодействий с: (i) самим элементом; (ii) элементами, расположенными горизонтально после него; (iii) элементами, расположенными вертикально после него.
Обучение системы ранжирования (модели) предсказывать этот Usefulness Score.

Фаза Использования (In-Use Phase):

Получение запроса и генерация ранжированного списка Native Items.
Определение оптимальной ранговой позиции (Optimal Rank Position) для Non-Native Item с помощью обученной модели.
Вставка Non-Native Item на эту оптимальную позицию.

Claims 11, 12: Детализируют механизм анализа вертикальных взаимодействий.

Описывается концепция Vertical Proximity Zone. Эта зона определяется в строке непосредственно под элементом и ограничена его горизонтальными границами. Взаимодействия с любыми элементами, которые хотя бы частично перекрываются этой зоной, анализируются (и считаются негативными согласно Claim 14).

Claims 14, 15, 16: Определяют природу расчета Usefulness Score.

Взаимодействия с самим элементом считаются позитивными (Win). Взаимодействия с элементами после него (горизонтально/вертикально) — негативными (Loss). Оценка рассчитывается как взвешенная сумма (Claim 15) или с применением Surplus Function (Claim 16).

Где и как применяется

Изобретение применяется в компонентах, отвечающих за финальное формирование выдачи в вертикальных поисках с 2D-макетом (Яндекс.Картинки, Яндекс.Видео).

RANKING – Ранжирование
Основной алгоритм ранжирования используется для сортировки Native Items. Описанный в патенте механизм подключается для оценки и интеграции Non-Native Items.

BLENDER – Метапоиск и Смешивание
Это основной слой применения. Система должна объединить ранжированный список Native Items и набор Non-Native Items. Usefulness-Score-Prediction Algorithm используется для определения оптимальной точки вставки для каждого нового элемента в финальный список.

Входные данные (In-Use Phase): Запрос, ранжированный список Native Items, Non-Native Item(s), SERP Features (размер окна, размеры элементов).

Выходные данные (In-Use Phase): Объединенный ранжированный список, оптимизированный по предсказанной полезности.

На что влияет

Типы контента: Патент явно указывает на применение к image-type item и video-type item. Влияет исключительно на контент, отображаемый в 2D-сетке. Не влияет на стандартный текстовый поиск.
Специфические запросы: Наибольшее влияние на запросы, где важна свежесть. В патенте упоминается анализ частоты запроса (recent submission frequency): если запрос стал популярным недавно (например, новости, тренды), система может активировать этот механизм для показа свежего контента.

Когда применяется

Алгоритм активируется при выполнении следующих условий:

Выдача предполагает Visual 2-D Arrangement (например, поиск по картинкам).
В наборе кандидатов присутствуют Non-Native Items (свежий контент без истории взаимодействий).

Пошаговый алгоритм

Процесс разделен на две фазы: Обучение и Использование.

Фаза 1: Обучение (Training Phase) — Офлайн и Сбор данных

Подготовка данных: Формирование Training SERP. Список Native Items ранжируется стандартным алгоритмом. Non-Native Items вставляются на искусственно выбранные позиции (случайно или по паттерну).
Сбор взаимодействий: Показ Training SERP пользователям в виде 2D-сетки и логирование всех взаимодействий.
Расчет Usefulness Score (Ключевой этап): Для каждого Non-Native Item (NN) на его позиции:
1. Анализ взаимодействий с самим NN (Win / Позитивный сигнал).
2. Анализ взаимодействий с элементами горизонтально после NN (Loss / Негативный сигнал). Обычно анализируется непосредственно следующий элемент.
3. Анализ взаимодействий с элементами вертикально после NN (Loss / Негативный сигнал). Для этого определяется Vertical Proximity Zone (зона под элементом), и учитываются клики внутри нее.
4. Вычисление итоговой оценки по формуле (например, Surplus Function).
Примечание: Если несколько NN образуют Visual Group, расчет Win/Loss производится для группы в целом.
Обучение Модели: Обучение Usefulness-Score-Prediction Algorithm (MLA) предсказывать рассчитанный Usefulness Score, используя признаки элемента, SERP features и контекст окружающих Native Items.

Фаза 2: Использование (In-Use Phase) — Онлайн

Получение запроса: Система получает запрос и SERP Features (например, размер экрана).
Ранжирование Native Items: Стандартный алгоритм ранжирует известные элементы.
Предсказание полезности: Для свежего Non-Native Item обученная модель предсказывает его Usefulness Score на всех возможных позициях вставки.
Определение оптимальной позиции: Выбирается позиция, на которой предсказанный Usefulness Score максимален.
Вставка и Выдача: Non-Native Item вставляется на оптимальную позицию, и формируется финальная 2D-выдача.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Являются основой для расчета Usefulness Score в фазе обучения. Используются: клики (selection), долгие клики (long selection), клики с переходом на ресурс, наведение курсора (hovering action). Критически важно пространственное расположение этих взаимодействий.
Технические и Пользовательские факторы (SERP Features): Определяют визуальное расположение элементов в 2D-сетке. Включают: размер окна браузера (window size), визуальный размер элементов (visual item size). Необходимы для расчета Vertical Proximity Zone.
Запросные и Временные факторы (Query Features): Характеристики запроса. Упоминается recent submission frequency (частота подачи запроса в последнее время) — используется для определения актуальности темы.
Мультимедиа факторы: Характеристики самих изображений/видео. Используются как признаки для обучения модели предсказания Usefulness Score.

Какие метрики используются и как они считаются

Usefulness Score (Оценка Полезности): Основная метрика патента. Рассчитывается с использованием Surplus Function (Функция Излишка), описанной в патенте Формулой 1:
$$ Surplus(win, loss) = a \cdot win + b \cdot loss $$
Win (Выигрыш): Определяется Positive User Interactions (взаимодействия с самим элементом).
Loss (Проигрыш): Определяется Negative User Interactions (взаимодействия с элементами, расположенными после горизонтально и вертикально).
Весовые коэффициенты (a, b): Используются для балансировки Win и Loss. В патенте указано, что ‘b’ обычно имеет противоположный знак к ‘a’ (например, a=1, b=-1.4).

Выводы

Специфичность для 2D-выдачи: Патент описывает механизм, разработанный исключительно для двухмерных интерфейсов (сетка/плитка), таких как поиск по картинкам или видео. Он не применим к стандартному вертикальному веб-поиску.
Решение проблемы «холодного старта» через предсказание поведения: Вместо ожидания накопления статистики, Яндекс использует модель для предсказания того, как пользователи будут взаимодействовать с новым документом на разных позициях.
Оценка качества в 2D-выдаче пространственно-зависима: Релевантность элемента в сетке определяется не только кликами по нему (Win), но и пропусками (Loss) – кликами по элементам справа или снизу от него.
Формализация вертикального пропуска (Vertical Proximity Zone): Система четко определяет зону под элементом, клики в которой считаются негативным сигналом для верхнего элемента.
Важность немедленного вовлечения: Чтобы свежий контент получил хорошую оценку и позицию, он должен немедленно привлекать внимание и генерировать клики. Если пользователи его игнорируют, система быстро это фиксирует как Loss.
Влияние контекста отображения (SERP Features): Размер экрана пользователя и размеры элементов напрямую влияют на расчеты, определяя, что находится «справа» и «снизу».

Практика

Best practices (это мы делаем)

Рекомендации применимы строго к оптимизации под Яндекс.Картинки, Яндекс.Видео и другие сервисы с 2D-интерфейсом.

Максимизация визуальной привлекательности (Image/Video CTR): Основная задача — захватить внимание. Изображение или превью видео должно быть максимально качественным, контрастным и релевантным. Это критично для получения Win и избежания Loss (когда пользователь кликает на соседний элемент).
Быстрая индексация актуального контента: Поскольку система предназначена для Non-Native Items и учитывает трендовость запросов (recent submission frequency), важно максимально быстро создавать и отдавать на индексацию визуальный контент, связанный с текущими событиями.
Оптимизация под разные устройства: Поскольку SERP Features (размер окна, размер элемента) влияют на расчет 2D-расположения и Vertical Proximity Zone, убедитесь, что ваши изображения хорошо читаются при разном масштабировании и на разных устройствах.
Оптимизация под «Долгий клик»: Убедитесь, что изображение/превью точно соответствует содержанию страницы/видео. Патент упоминает long selection как один из типов взаимодействий. Получение клика (Win) важно, но если он короткий, это может негативно сказаться на долгосрочном ранжировании.

Worst practices (это делать не надо)

Использование нечетких, тусклых или мелких изображений: Визуально «слабые» изображения будут проигрывать конкурентам, так как пользователи будут чаще пропускать их и кликать на следующие элементы, генерируя Loss для вашего контента.
Кликбейт в превью (с осторожностью): Использование вводящих в заблуждение превью может помочь выиграть первичный клик (Win). Однако, если контент не соответствует ожиданиям, это приведет к плохим долгосрочным поведенческим сигналам, когда элемент станет Native.
Медленная загрузка визуального контента: Хотя патент явно не упоминает скорость загрузки, если картинка не загрузится быстро в выдаче, пользователь с большой вероятностью кликнет на соседний элемент, что будет засчитано как Loss.

Стратегическое значение

Патент подтверждает, что для вертикалей визуального поиска (Картинки, Видео) поведенческие факторы, измеряемые непосредственно в выдаче с учетом пространственных взаимосвязей (2D-сетка), имеют первостепенное значение для ранжирования свежего контента. Стратегически это означает, что в Image/Video SEO невозможно полагаться только на текстовую оптимизацию; визуальная составляющая и ее способность выигрывать внимание являются определяющими факторами.

Практические примеры

Сценарий: Ранжирование свежего новостного изображения в Яндекс.Картинках

Контекст: Произошло событие, запрос стал трендовым. Сайт новостей опубликовал свежее изображение. Яндекс индексирует его как Non-Native Item.
Действие системы (Фаза Применения): Яндекс генерирует выдачу из старых изображений (Native Items). Модель предсказывает, что свежее изображение получит максимальный Usefulness Score на 4-й позиции в первой строке. Система вставляет его туда.
Анализ взаимодействий:
- Исход 1 (Успех): Изображение яркое. Пользователь кликает на него (Win). Usefulness Score высокий.
- Исход 2 (Провал): Изображение тусклое. Пользователь пропускает его и кликает на 5-е изображение справа (Loss). Usefulness Score низкий.
- Исход 3 (Провал): Пользователь пропускает его и кликает на изображение точно под ним, в Vertical Proximity Zone (Loss). Usefulness Score низкий.
Результат для SEO: Если изображение постоянно генерирует высокий Usefulness Score, оно накапливает статистику, переходит в разряд Native Items и закрепляется в топе стандартного ранжирования.

Вопросы и ответы

Применим ли этот патент к стандартному веб-поиску (10 синих ссылок)?

Нет. Патент явно и многократно подчеркивает, что метод разработан для Visual 2-D Arrangement (двухмерного расположения), где есть строки и колонки (сетка). Это относится к поиску по Картинкам, Видео или, возможно, товарным галереям, но не к стандартной вертикальной веб-выдаче.

Что такое Native и Non-Native Items в контексте этого патента?

Native Items — это контент, по которому у Яндекса уже есть достаточная история поведенческих факторов, позволяющая ранжировать его стандартными алгоритмами. Non-Native Items — это свежий контент, по которому статистики еще нет. Этот патент описывает, как ранжировать Non-Native элементы, пока они не стали Native.

Как рассчитывается Usefulness Score? Что важнее: клики по моему контенту или клики вокруг него?

Оба фактора критичны. Usefulness Score — это взвешенная сумма. Клики по вашему контенту дают Win (Позитивный сигнал). Клики по контенту справа или снизу от вашего дают Loss (Негативный сигнал). Цель — максимизировать Win и минимизировать Loss. В патенте приведен пример весов, где Loss может иметь больший вес, чем Win (например, +1 за Win и -1.4 за Loss).

Что такое «Зона вертикальной близости» (Vertical Proximity Zone)?

Это область непосредственно под вашим изображением в следующей строке выдачи, ограниченная шириной вашего изображения. Если пользователь кликает на любой элемент, который хотя бы частично попадает в эту зону, это засчитывается как Loss для вашего изображения. Это означает, что пользователь пропустил ваш контент и перешел к просмотру нижних строк.

Как система определяет оптимальную позицию для новой картинки?

На этапе применения (In-Use Phase) обученная модель машинного обучения симулирует вставку свежего элемента на все возможные позиции в текущей выдаче. Для каждой позиции она предсказывает, какой Usefulness Score элемент получит. Система выбирает ту позицию, где предсказанная оценка максимальна.

Как этот патент влияет на стратегию оптимизации изображений (Image SEO)?

Он подчеркивает критическую важность визуальной привлекательности и мгновенной релевантности изображений. Стандартные SEO-практики (alt, title) помогают попасть в выборку, но финальное ранжирование свежего контента зависит от того, выиграет ли он визуальную конкуренцию у соседей. Изображения должны быть качественными и мотивирующими к клику.

Учитывает ли система размер экрана пользователя или размер картинки?

Да, это критически важно. Размер окна браузера и размеры самих элементов входят в SERP Features. Они определяют, как именно элементы будут расположены в 2D-сетке и, следовательно, какие элементы окажутся «справа» и «снизу» и как будет рассчитана Vertical Proximity Zone. Модель учитывает эти динамические факторы.

Что происходит, если несколько новых картинок размещены рядом?

Патент предусматривает такую ситуацию и вводит понятие Visual Group of Non-Native Items. В этом случае система анализирует взаимодействия со всей группой как единым целым (Wins), а также анализирует клики сразу после всей группы по горизонтали и вертикали (Losses). Элементы в группе, как правило, получают одинаковый Usefulness Score.

Учитывает ли система трендовость запроса?

Да, патент упоминает «recent submission frequency» (частоту недавних отправок запроса) как один из признаков SERP. Это позволяет системе понять, что запрос связан с актуальными событиями. В таких случаях приоритет может отдаваться показу свежего контента (Non-Native Items), и описанный механизм активно используется для их ранжирования.

Что такое «искусственная вставка» (artificially inserted) в фазе обучения?

Это означает, что для сбора обучающих данных система намеренно размещает новые элементы на различные позиции в выдаче (случайно или по заданному шаблону). Это необходимо, чтобы собрать данные о том, как пользователи реагируют на этот элемент в разных контекстах и на разных позициях, и рассчитать фактический Usefulness Score для обучения модели предсказания.