Яндекс использует машинное обучение для прогнозирования того, насколько интересной будет рекомендуемая статья пользователю (уровень уверенности). В зависимости от этого уровня уверенности система динамически выбирает, как именно отобразить рекомендацию в браузере — от невидимого состояния (низкая уверенность) до крупного, заметного блока (высокая уверенность). Это оптимизирует пользовательский опыт и вовлеченность в рекомендательных системах, таких как Дзен.
Описание
Какую задачу решает
Патент решает проблему оптимизации пользовательского опыта при взаимодействии с системами рекомендаций контента (например, интегрированными в Яндекс Браузер или Дзен). Он устраняет недостатки существующих систем, которые часто показывают рекомендации в неподходящее время или в неоптимальном визуальном формате (например, показывают нерелевантный контент в больших, навязчивых окнах). Изобретение позволяет динамически адаптировать способ отображения рекомендательного блока, делая его более заметным, если контент с высокой вероятностью интересен пользователю, и менее навязчивым (или скрытым), если интерес маловероятен.
Что запатентовано
Запатентована система для динамического определения визуального представления («следующего состояния») блока рекомендаций (recommendation block). Суть изобретения заключается в использовании алгоритма машинного обучения (MLA) для расчета «параметра уровня уверенности» (confidence level parameter) в том, что рекомендация будет интересна пользователю. На основе этого уровня уверенности сервер выбирает конкретную таблицу поиска (lookup table), которая определяет логику поведения и внешний вид рекомендательного блока в ответ на действия пользователя.
Как это работает
Когда пользователь просматривает веб-ресурс, сервер анализирует его характеристики и подбирает дополнительный контент для рекомендации. MLA оценивает вероятность интереса пользователя к этому контенту и выдает confidence level parameter. Если этот параметр превышает порог, сервер выбирает одну из множества заранее подготовленных lookup tables. Выбор зависит от уровня уверенности: высокая уверенность ведет к выбору таблицы, предписывающей более заметное отображение блока. Выбранная таблица отправляется в браузер. Браузер использует эту таблицу, чтобы определить, как именно показать блок рекомендаций (например, как маленький сниппет или большое окно) в ответ на конкретные действия пользователя (например, прокрутку страницы).
Актуальность для SEO
Высокая. Рекомендательные системы (Дзен) являются ключевой частью экосистемы Яндекса, интегрированной в браузер и главную страницу. Динамическая оптимизация интерфейса на основе ML-прогнозов вовлеченности является современным подходом к улучшению пользовательского опыта и метрик контентных платформ.
Важность для SEO
Влияние на SEO (6/10). Патент не относится к ранжированию в органическом поиске. Однако он имеет значительное влияние на трафик из рекомендательных систем (Яндекс Дзен/Браузер). Описанный механизм напрямую определяет видимость (заметность) и потенциальный CTR рекомендуемого контента. Для паблишеров и контентных сайтов, зависящих от рекомендательного трафика, понимание этого механизма критически важно: чтобы получить максимальную видимость, необходимо генерировать высокие оценки уверенности от MLA.
Детальный разбор
Термины и определения
- Confidence Level Parameter (Параметр уровня уверенности)
- Метрика, рассчитываемая MLA. Указывает на вероятность (уверенность), что дополнительный контент будет интересен пользователю.
- Current State (Текущее состояние)
- Текущее состояние блока рекомендаций (например, виртуальное/невидимое или визуальное/сниппет) в момент действия пользователя.
- Lookup Table (LUT) (Таблица поиска)
- Структура данных (алгоритм выбора представления), которая определяет поведение и внешний вид блока рекомендаций. Она сопоставляет комбинацию «Текущее состояние» + «Действие пользователя» с «Следующим состоянием». Сервер выбирает конкретную LUT на основе Confidence Level Parameter.
- Machine Learning Algorithm (MLA) (Алгоритм машинного обучения)
- Модель, обученная прогнозировать интерес пользователя к рекомендуемому контенту на основе характеристик просматриваемого ресурса и других факторов.
- Next State (Следующее состояние)
- Состояние, в которое перейдет блок рекомендаций после обработки действия пользователя с помощью Lookup Table.
- Recommendation Block (Блок рекомендаций)
- Элемент интерфейса браузера (например, всплывающее окно, сниппет), используемый для показа дополнительного контента.
- Supplemental Content (Дополнительный контент)
- Контент (статьи, видео), который система рекомендует пользователю.
- Virtual State (Виртуальное состояние)
- Состояние, при котором блок рекомендаций невидим на дисплее.
- Visual State (Визуальное состояние)
- Состояние, при котором блок рекомендаций виден на дисплее (например, в виде сниппета или в развернутом виде).
Ключевые утверждения (Анализ Claims)
Патент фокусируется не просто на факте показа рекомендации, а на механизме выбора способа ее отображения в зависимости от прогнозируемой ценности для пользователя.
Claim 1 (Независимый пункт): Описывает основной процесс определения следующего состояния блока рекомендаций.
- Сервер получает информацию о просматриваемом веб-ресурсе и дополнительном контенте для рекомендации.
- Сервер определяет множество признаков (features) веб-ресурса.
- Сервер запускает MLA на основе этих признаков для определения Confidence Level Parameter (уверенности, что контент будет интересен).
- Критически важный шаг: Сервер выбирает одну таблицу поиска (Lookup Table) из множества доступных таблиц на основе полученного Confidence Level Parameter.
- Каждая таблица соответствует определенному диапазону уверенности.
- Каждая таблица содержит возможные входы (различные действия пользователя и текущие состояния блока) и выходы (следующие состояния блока). Она определяет, как блок должен выглядеть для каждой комбинации входа.
- Сервер отправляет выбранную Lookup Table в браузер.
- Браузер обрабатывает эту таблицу для определения следующего состояния блока и отображает его соответствующим образом.
Claim 5 (Зависимый от 1): Уточняет взаимодействие с пользователем.
Отправка выбранной Lookup Table сервером происходит в ответ на получение индикации о действии пользователя в браузере. Браузер использует это действие пользователя и текущее состояние блока как входные данные для полученной Lookup Table, чтобы определить следующее состояние.
Claim 7 (Зависимый от 5): Определяет взаимосвязь между уверенностью и заметностью отображения.
Описаны две таблицы: Первая (LUT1) соответствует низкому уровню уверенности, Вторая (LUT2) — высокому уровню уверенности. Для одной и той же комбинации входных данных (Текущее состояние + Действие пользователя), блок рекомендаций будет отображаться более заметно (more prominent), если используется LUT2, по сравнению с LUT1.
Claims 8-11 (Зависимые): Вводят концепцию визуальных и виртуальных состояний.
Состояния могут быть визуальными (блок виден) или виртуальными (блок невидим). Система может отслеживать, просмотрел ли пользователь контент, и в ответ на это изменять текущее состояние блока на виртуальное. Это позволяет использовать Lookup Tables для предотвращения повторного показа уже просмотренных рекомендаций.
Где и как применяется
Этот патент не описывает архитектуру традиционного веб-поиска (Crawling, Indexing, Ranking). Он описывает функциональность на уровне приложения, конкретно — работу систем рекомендации контента, таких как Яндекс Дзен, часто интегрированных в Яндекс Браузер или главную страницу Яндекса.
Взаимодействие компонентов:
- Браузерное приложение (Клиент): Отслеживает состояние приложения, действия пользователя (прокрутка, жесты) и текущее состояние блока рекомендаций. Получает Lookup Table от сервера и исполняет логику отображения.
- Сервер (Backend): Получает данные от браузера. Извлекает признаки (Features) просматриваемого ресурса.
- Сервер рекомендаций контента: Предоставляет дополнительный контент (Supplemental Content).
- MLA (Сервер): Вычисляет Confidence Level Parameter.
- Хранилище Lookup Tables (Сервер): Хранит множество таблиц для разных диапазонов уверенности.
Данные на входе и выходе:
- Вход (для Сервера): Индикация состояния браузера (например, позиция прокрутки), индикация действия пользователя, URL/признаки просматриваемого веб-ресурса.
- Выход (от Сервера к Браузеру): Дополнительный контент и выбранная Lookup Table.
- Вход (для Lookup Table на Клиенте): Текущее состояние блока + Действие пользователя.
- Выход (от Lookup Table на Клиенте): Следующее состояние блока (визуальное или виртуальное).
На что влияет
- Платформы дистрибуции контента: Влияет в первую очередь на видимость контента в рекомендательных системах (Дзен).
- Типы контента: Применимо ко всем типам рекомендуемого контента (статьи, видео, изображения). В патенте упоминается возможность выбора Lookup Table также на основе типа контента (например, оптимизация отображения для видео против текста).
- Типы устройств: В патенте упоминается возможность выбора Lookup Table на основе типа устройства пользователя (например, мобильное устройство или десктоп) для оптимизации отображения.
Когда применяется
Алгоритм активируется при выполнении пользователем определенных действий во время просмотра контента в совместимом приложении (например, Яндекс Браузер).
- Триггеры активации: Конкретные действия пользователя, такие как прокрутка (scrolling action), достижение конца отображаемой страницы, обратная прокрутка (back scroll), жесты на сенсорном экране, нажатия клавиш или кнопок мыши.
- Условия работы: Система должна иметь подготовленный дополнительный контент для рекомендации, а Confidence Level Parameter должен превышать заранее определенный порог вероятности (pre-defined probability threshold).
Пошаговый алгоритм
- Мониторинг (Клиент): Браузер отслеживает действия пользователя и состояние отображения веб-ресурса.
- Триггер (Клиент -> Сервер): Происходит заранее определенное действие пользователя (например, прокрутка до конца страницы). Браузер отправляет на сервер индикацию состояния и действия.
- Извлечение признаков (Сервер): Сервер определяет множество признаков просматриваемого веб-ресурса (например, URL, ключевые слова, автор).
- Выбор контента (Сервер): Сервер рекомендаций предоставляет дополнительный контент на основе этих признаков.
- Прогнозирование уверенности (Сервер/MLA): MLA запускается для определения Recommendation Score и Confidence Level Parameter для этого контента, используя признаки ресурса и состояние браузера.
- Проверка порога (Сервер): Сервер проверяет, превышает ли Confidence Level Parameter установленный порог. Если нет, процесс останавливается.
- Выбор таблицы поиска (Сервер): На основе Confidence Level Parameter (а также, возможно, типа контента и типа устройства) сервер выбирает соответствующую Lookup Table (LUT). Высокая уверенность приводит к выбору LUT, диктующей более заметное отображение.
- Передача данных (Сервер -> Клиент): Сервер отправляет дополнительный контент и выбранную LUT в браузер.
- Обработка на клиенте (Клиент): Браузер использует действие пользователя и текущее состояние блока рекомендаций (Current State) как входные данные для полученной LUT.
- Рендеринг (Клиент): LUT возвращает следующее состояние (Next State). Браузер отображает блок рекомендаций в этом состоянии (например, как заметный блок, если уверенность высока, или как небольшой сниппет, если низка).
- Обратная связь (Опционально): Сервер может получить индикацию того, что пользователь просмотрел контент. В ответ сервер может изменить текущее состояние блока на виртуальное (Virtual State) для предотвращения повторного показа.
Какие данные и как использует
Данные на входе
- Контентные и Технические факторы (Признаки веб-ресурса): Данные, связанные с просматриваемым ресурсом. В примерах патента упоминаются URL, ключевые слова, связанные с контентом, автор и дата публикации.
- Поведенческие факторы:
- Данные о предыдущих действиях пользователя (prior user actions) при взаимодействии с веб-ресурсом.
- Данные о взаимодействии с предыдущими блоками рекомендаций. Эти данные используются для обучения MLA и могут использоваться как признаки для текущих прогнозов.
- Текущее действие пользователя (триггер): прокрутка, жест, нажатие кнопки.
- Пользовательские и Системные факторы:
- Состояние браузерного приложения (browser application state), включая состояние отображения веб-ресурса (например, какая часть страницы видна).
- Тип устройства (упоминается как возможный критерий для выбора Lookup Table).
Какие метрики используются и как они считаются
- Recommendation Score / Confidence Level Parameter: Основная метрика, вычисляемая MLA. Представляет собой вероятность того, что дополнительный контент будет интересен пользователю. MLA обучается на исторических данных о взаимодействии пользователей с тренировочными блоками рекомендаций (оценки асессоров или реальные клики/время просмотра).
- Pre-defined Probability Threshold (Порог вероятности): Заранее определенное значение, которое Confidence Level Parameter должен превысить, чтобы рекомендация была показана.
- Lookup Tables (LUTs): Используются как детерминированный алгоритм выбора представления. Это не метрика, а механизм маппинга, который переводит входные данные (Состояние + Действие) в выходные (Следующее состояние). Таблицы создаются вручную (например, администратором системы) для реализации желаемого поведения интерфейса при разных уровнях уверенности.
Выводы
- Патент относится к рекомендательным системам, а не к органическому поиску: Описанные механизмы влияют на дистрибуцию контента через платформы вроде Яндекс Дзен или интеграции в Яндекс Браузер, но не на ранжирование в SERP.
- Видимость рекомендации напрямую зависит от прогнозируемого интереса: Ключевым элементом системы является MLA, прогнозирующий уровень уверенности (Confidence Level). Чем выше уверенность Яндекса в том, что контент понравится пользователю, тем агрессивнее и заметнее он будет показан.
- Механизм динамической адаптации интерфейса (Lookup Tables): Яндекс использует заранее определенные таблицы (LUTs) для управления поведением интерфейса. Выбор таблицы зависит от уровня уверенности, что позволяет тонко настраивать баланс между вовлечением и навязчивостью.
- Управление повторными показами (Virtual States): Система предусматривает механизм отслеживания просмотренного контента и перевода блоков в «виртуальное» (невидимое) состояние, чтобы не раздражать пользователя повторами.
- Важность качества и вовлеченности контента: Для максимизации трафика из рекомендательных систем необходимо добиваться высоких оценок уверенности от MLA. Поскольку MLA обучается на исторических данных о вовлеченности (клики, время просмотра), качество контента и его способность удерживать внимание критически важны.
Практика
Best practices (это мы делаем)
Рекомендации применимы для оптимизации под трафик из рекомендательных систем (Яндекс Дзен).
- Фокус на метриках вовлеченности (Engagement): MLA прогнозирует уверенность, основываясь на исторических данных. Необходимо создавать контент, который пользователи дочитывают и с которым активно взаимодействуют. Это обучает модель ассоциировать ваш контент с высоким интересом и, следовательно, присваивать более высокие Confidence Levels в будущем.
- Оптимизация заголовков и изображений для высокого CTR: В рекомендательных лентах заголовок и картинка критически важны для получения клика, независимо от размера блока. Высокий CTR в сочетании с хорошим временем на сайте ведет к лучшим показателям Confidence Level.
- Глубокое понимание интересов аудитории: Создавайте контент, который точно соответствует интересам пользователей, просматривающих смежные тематики. Чем точнее попадание в интент, тем выше вероятность получения высокого Confidence Level от MLA и, как следствие, более заметного отображения (more prominent display).
Worst practices (это делать не надо)
- Использование кликбейта: Хотя кликбейт может дать краткосрочный рост CTR, он обычно ведет к низкому времени на сайте и высокому показателю отказов («короткие клики»). Это негативно скажется на обучении MLA, что приведет к снижению Confidence Levels для будущего контента издателя и менее заметному отображению рекомендаций.
- Публикация низкокачественного или вводящего в заблуждение контента: Аналогично кликбейту, это ухудшает поведенческие метрики и снижает вероятность получения высоких оценок уверенности и заметного отображения в рекомендательных блоках.
Стратегическое значение
Патент подтверждает, что Яндекс системно подходит к оптимизации доставки контента в своих рекомендательных системах. Для издателей и SEO-специалистов, работающих с Дзеном, это подчеркивает, что управление трафиком — это не только вопрос попадания в ленту, но и вопрос максимизации видимости внутри нее. Долгосрочная стратегия должна быть направлена на повышение доверия со стороны MLA через стабильно высокие показатели вовлеченности, что напрямую конвертируется в более агрессивное и заметное продвижение контента системой.
Практические примеры
Сценарий 1: Высокий уровень уверенности (High Confidence)
- Ситуация: Пользователь читает статью про электромобили (EV). Сервер рекомендаций предлагает статью «Обзор новой Tesla Model 3».
- Действие MLA: MLA анализирует признаки и исторические данные, прогнозируя 90% вероятность интереса (Confidence Level).
- Выбор LUT: Сервер выбирает Lookup Table, соответствующую диапазону 80-100% («Prominent LUT»).
- Взаимодействие: Пользователь прокручивает страницу до конца (триггер).
- Результат: Браузер использует «Prominent LUT». В ответ на прокрутку появляется большой, занимающий значительную часть экрана блок рекомендаций с обзором Tesla.
Сценарий 2: Низкий уровень уверенности (Low Confidence)
- Ситуация: Пользователь читает статью про электромобили (EV). Сервер рекомендаций предлагает статью «Как выбрать зимние шины» (менее релевантная тема).
- Действие MLA: MLA прогнозирует 15% вероятность интереса. Порог показа (Threshold) составляет 10%.
- Выбор LUT: Сервер выбирает Lookup Table, соответствующую диапазону 10-20% («Subtle LUT»).
- Взаимодействие: Пользователь прокручивает страницу до конца (триггер).
- Результат: Браузер использует «Subtle LUT». В ответ на прокрутку появляется только маленький, ненавязчивый сниппет внизу экрана с рекомендацией статьи о шинах.
Сценарий 3: Использование виртуального состояния (Virtual State)
- Ситуация: Пользователь увидел рекомендацию (как в Сценарии 1 или 2) и кликнул на нее.
- Действие системы: Сервер фиксирует просмотр контента и меняет текущее состояние этого блока рекомендаций на виртуальное (Virtual State).
- Взаимодействие: Пользователь возвращается на исходную страницу и снова прокручивает ее до конца (триггер).
- Результат: Даже если Confidence Level по-прежнему высок, браузер использует Lookup Table, вводя текущее состояние (теперь Виртуальное) + действие (Прокрутка). Таблица сконструирована так, что для этого входа следующее состояние также будет Виртуальным. Рекомендация не показывается повторно.
Вопросы и ответы
Влияет ли этот патент на ранжирование в органическом поиске Яндекса?
Нет, этот патент не описывает механизмы ранжирования в традиционной поисковой выдаче (SERP). Он описывает метод управления отображением блоков в рекомендательных системах контента, таких как Яндекс Дзен, которые часто интегрированы в Яндекс Браузер или на главную страницу Яндекса.
Что такое «Confidence Level Parameter» и как он рассчитывается?
Это показатель уверенности системы в том, что рекомендуемый контент будет интересен пользователю. Он рассчитывается с помощью алгоритма машинного обучения (MLA), который анализирует признаки просматриваемого веб-ресурса, состояние браузера и, вероятно, исторические данные о поведении пользователя. MLA обучается на основе прошлых взаимодействий (кликов, времени просмотра) с рекомендациями.
Как SEO-специалист может повлиять на «Confidence Level Parameter» для своего контента?
Напрямую повлиять нельзя, но можно косвенно. Поскольку MLA обучается на вовлеченности, необходимо максимизировать метрики удержания (время на сайте, глубина просмотра) и минимизировать негативные сигналы (например, быстрые отказы после кликбейтных заголовков). Стабильно высокое качество и вовлеченность контента обучат модель присваивать вашему сайту более высокие уровни уверенности.
Что такое «Lookup Table» (LUT) в контексте этого патента?
Lookup Table — это набор правил, определяющий внешний вид и поведение блока рекомендаций. Сервер выбирает конкретную таблицу на основе уровня уверенности (Confidence Level). Эта таблица диктует браузеру, как именно реагировать на действия пользователя: например, показать большой блок, маленький сниппет или ничего не показывать.
Какая связь между уровнем уверенности и внешним видом рекомендации?
Патент четко устанавливает прямую зависимость: чем выше уровень уверенности (Confidence Level), тем более заметным (more prominent) будет блок рекомендаций. При низкой уверенности система выберет LUT, которая покажет менее навязчивый блок (например, маленький сниппет), а при высокой — LUT, которая покажет крупный и заметный блок.
Что именно запускает показ рекомендации?
Показ запускается комбинацией факторов. Во-первых, MLA должен выдать уровень уверенности выше установленного порога. Во-вторых, пользователь должен совершить определенное действие (триггер), например, прокрутить страницу до конца, выполнить обратную прокрутку или определенный жест на экране.
Что такое «Виртуальное состояние» (Virtual State) блока рекомендаций?
Это состояние, при котором блок рекомендаций невидим для пользователя. Система использует это состояние, например, чтобы скрыть рекомендации, которые пользователь уже просмотрел. Это предотвращает навязчивые повторные показы одного и того же контента.
Влияет ли тип контента (видео, текст) на отображение блока?
Да, в патенте упоминается, что выбор Lookup Table может зависеть не только от уровня уверенности, но и от типа дополнительного контента. Это позволяет системе использовать разные шаблоны отображения, оптимизированные, например, для видео или для текстовых статей.
Если мой контент часто попадает в рекомендации, но в маленьких блоках, что это значит?
Это означает, что система считает ваш контент релевантным для показа (уровень уверенности выше порога), но оценка уверенности находится на низком уровне. Вероятно, пользователи взаимодействуют с вашим контентом не так активно, как с контентом конкурентов. Стоит сфокусироваться на улучшении вовлеченности и удержания аудитории.
Применяется ли эта технология только на мобильных устройствах?
Хотя примеры в патенте показаны на мобильном интерфейсе, технология применима к любому веб-браузеру. В патенте также упоминается, что выбор Lookup Table может зависеть от типа устройства (например, десктоп или смартфон) для адаптации отображения под конкретный экран.