Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс использует подписчиков (основную аудиторию) для определения релевантности нового или нишевого контента для широкой аудитории

    METHOD AND SYSTEM FOR DETERMINING PARAMETER RELEVANCE FOR CONTENT ITEMS (Способ и система определения параметра релевантность для элементов содержимого)
    • RU2714594C1
    • Yandex LLC
    • 2020-02-18
    • 2018-09-14
    2020 Патенты Яндекс Рекомендательные системы Холодный старт Яндекс Дзен

    Яндекс решает проблему «холодного старта» для нишевого контента в рекомендательных системах (например, Дзен). Система определяет основных пользователей (подписчиков) источника контента и искусственно внедряет новый контент этого источника в их ленты. Если основные пользователи взаимодействуют позитивно, Яндекс повышает оценку релевантности контента, увеличивая вероятность его рекомендации широкой аудитории.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему «холодного старта» или «недостатка просмотров» для специализированного (нишевого) контента в рекомендательных системах. Стандартные алгоритмы рекомендаций предпочитают общерелевантный контент, из-за чего нишевый контент не получает достаточно просмотров для оценки его релевантности. Это создает замкнутый круг: нет взаимодействий — нет данных для прогноза релевантности — нет рекомендаций. Патент предлагает механизм для улучшения исследования (exploration) специализированного контента без снижения общего качества системы рекомендаций для основной массы пользователей.

    Что запатентовано

    Запатентован способ определения Параметра Релевантности (Relevance Parameter) для элемента цифрового контента, исходящего из определенного канала (источника). Суть изобретения заключается в использовании Пула Пользователей (Pool of Users или «основные пользователи»), связанных с этим каналом (например, подписчиков), для тестирования и прогнозирования релевантности контента. Система искусственно внедряет контент в ленты этих основных пользователей и использует их взаимодействия для прогнозирования релевантности этого контента для широкой аудитории (пользователей вне пула).

    Как это работает

    Система идентифицирует «основных пользователей» канала (например, подписчиков). Когда такой пользователь запрашивает рекомендации, система «искусственно внедряет» (artificially injects) новый или нишевый контент с этого канала в его ленту, часто на заметную позицию. Система отслеживает взаимодействия этого пользователя с контентом. Если основные пользователи показывают интерес, система повышает Параметр Релевантности этого контента, предполагая, что он может быть интересен и широкой аудитории. Если интереса нет даже у основных пользователей, параметр остается низким.

    Актуальность для SEO

    Высокая. Патент описывает механизмы, критически важные для работы современных рекомендательных систем, таких как Яндекс Дзен, новостные агрегаторы и ленты социальных сетей. Решение проблемы «холодного старта» и балансировка между исследованием нового контента (Exploration) и использованием известного (Exploitation) остаются центральными задачами в этой области.

    Важность для SEO

    Влияние на SEO для основного веб-поиска низкое (3/10). Патент описывает механизмы работы Системы Рекомендаций (например, Яндекс Дзен), фокусируясь на обнаружении контента на основе интересов, а не на ранжировании по конкретным запросам. Однако для специалистов, занимающихся оптимизацией контента внутри Яндекс Дзен или аналогичных платформ, влияние критическое (9/10). Патент раскрывает механизм, как контент переходит от нишевой аудитории к массовой, подчеркивая критическую важность подписчиков для первичного продвижения.

    Детальный разбор

    Термины и определения

    Канал Содержимого (Content Channel)
    Источник цифрового контента. Может быть оригинальным (например, блог, созданный внутри платформы рекомендаций) или внешним (веб-сайт, новостное агентство).
    Пул Пользователей / Основные пользователи (Pool of Users / Core Users)
    Подмножество пользователей системы рекомендаций, которые связаны с определенным Каналом Содержимого. Связь может быть явной (подписка, лайк) или неявной. Эти пользователи используются как тестовая группа для оценки нового контента с этого канала.
    Параметр Релевантности (Relevance Parameter)
    Метрика, используемая для ранжирования элемента цифрового содержимого при его рекомендации пользователям системы. Цель изобретения — спрогнозировать этот параметр для широкой аудитории на основе реакций Пула Пользователей.
    Искусственное Внедрение (Artificial Injection)
    Процесс принудительного включения элемента цифрового содержимого в набор рекомендаций для пользователя из Пула Пользователей. Это делается для исследования (Exploration) релевантности контента, даже если стандартный алгоритм не выбрал бы его.
    Элемент Цифрового Содержимого (Digital Content Item)
    Единица контента (статья, видео, изображение), релевантность которой определяется.
    Явная связь (Explicit Association)
    Активное действие пользователя, указывающее на интерес к каналу: подписка, нажатие кнопки «мне нравится», комментирование предыдущего контента канала.
    Неявная связь (Implicit Association)
    Связь, определяемая системой на основе поведения. Например, если пользователю ранее показывали контент с канала, и он не предоставил указания на отрицательный интерес.

    Ключевые утверждения (Анализ Claims)

    Патент фокусируется на методе использования связанных с источником пользователей для оценки потенциальной релевантности контента этого источника для более широкой аудитории.

    Claim 1 (Независимый пункт): Описывает основной способ определения параметра релевантности.

    1. Идентификация Пула Пользователей, связанных с Каналом Содержимого.
    2. Получение запроса на рекомендацию от Первого Пользователя, принадлежащего к этому Пулу.
    3. Создание стандартного набора рекомендуемых элементов (которые могут не относиться к данному Каналу).
    4. Искусственное внедрение в этот набор Элемента Цифрового Содержимого (с данного Канала).
    5. Сбор данных о взаимодействиях Первого Пользователя с этим набором, указывающих на его предпочтения.
    6. Прогноз Параметра Релевантности этого Элемента для пользователей ВНЕ Пула, основываясь на взаимодействиях Первого Пользователя.

    Ядром изобретения является использование целевой группы (Пул Пользователей) в качестве предиктора интереса для общей массы пользователей, достигаемое через механизм принудительного показа (Искусственное внедрение).

    Claims 3-5 (Зависимые пункты): Уточняют механизм агрегации данных.

    Система может повторять процесс внедрения для других пользователей в Пуле и создавать Дополненный Параметр Релевантности (Augmented Relevance Parameter) на основе агрегированных взаимодействий. Этот дополненный параметр используется для прогноза и может быть смещен вверх (biased upwards) по сравнению с тем, что создал бы стандартный алгоритм.

    Это означает, что положительная реакция Пула Пользователей дает контенту искусственный буст (смещение вверх) для показа широкой аудитории.

    Claims 6-7 (Зависимые пункты): Описывают механизм обратной связи и самокоррекции.

    Система показывает контент Второму Пользователю (вне Пула), основываясь на спрогнозированном Параметре Релевантности. Если взаимодействия Второго Пользователя указывают на низкий интерес (по сравнению с Первым Пользователем), система модифицирует Параметр Релевантности на более низкое значение.

    Это критически важный механизм защиты: даже если подписчики высоко оценили контент, но широкая аудитория его игнорирует, система его пессимизирует.

    Claims 8-10 (Зависимые пункты): Уточняют механику внедрения.

    Искусственное внедрение может происходить через ранжирование на основе прогнозируемого параметра ИЛИ через расположение элемента на заранее определенную позицию. Эта позиция выбирается так, чтобы максимизировать вероятность взаимодействия.

    На практике это часто означает показ нового контента на первых позициях в ленте подписчика.

    Где и как применяется

    Важно отметить, что этот патент НЕ относится к стандартной архитектуре веб-поиска Яндекс (обработка запросов, ранжирование веб-документов). Он применяется исключительно в рамках Систем Рекомендаций (Recommendation Systems), таких как Яндекс Дзен, где контент предлагается пользователю на основе его интересов, а не в ответ на явный поисковый запрос.

    Слой Рекомендаций и Персонализации

    • Взаимодействие с компонентами: Алгоритм реализуется Модулем Исследования Содержимого (Content Exploration Module), который взаимодействует с Модулем Выбора Рекомендуемого Содержимого и Алгоритмом Рекомендаций (MLA).
    • Процесс: Когда система рекомендаций обрабатывает запрос на формирование ленты, Модуль Исследования определяет, является ли пользователь частью «Пула Пользователей» для какого-либо канала. Если да, и контент этого канала требует исследования, модуль инициирует процедуру искусственного внедрения.
    • Входные данные: Запрос на рекомендацию от пользователя; идентификатор пользователя; данные о принадлежности пользователя к Пулам Пользователей; Элемент контента, требующий исследования.
    • Выходные данные: Сформированная лента с внедренным элементом; собранные данные о взаимодействиях; обновленный Параметр Релевантности для элемента.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на «оригинальный контент», создаваемый авторами внутри платформы (например, блогерами в Дзене). Также может применяться и к внешним источникам. Типы медиа включают статьи, изображения, видео.
    • Конкретные ниши или тематики: Наибольшее влияние оказывается на «специализированный» или «нишевый» контент (например, статьи о квантовой механике или старинных фотокамерах), который обычно испытывает трудности с получением начального охвата.
    • Специфические запросы: Не применимо к поисковым запросам, так как работает в системе рекомендаций.

    Когда применяется

    Алгоритм активируется при следующих условиях:

    • Дефицит данных: Когда элемент контента имеет недостаточное количество данных о предыдущих пользовательских взаимодействиях для надежной оценки релевантности.
    • Запрос от Основного Пользователя: Триггером для фазы исследования является получение запроса на рекомендацию от пользователя, который идентифицирован как принадлежащий к «Пулу Пользователей» (основной аудитории), связанному с источником этого контента.
    • Частота применения: Процесс исследования продолжается до тех пор, пока не будет получено достаточно информации о просмотрах.

    Пошаговый алгоритм

    1. Подготовка (Офлайн): Идентификация Каналов Содержимого и связанных с ними Пулов Пользователей (Основных пользователей). Связь определяется на основе явных (подписки, лайки) или неявных сигналов.
    2. Получение Запроса: Система получает запрос на формирование ленты рекомендаций от пользователя.
    3. Идентификация Пользователя: Система определяет, принадлежит ли пользователь к какому-либо Пулу Пользователей.
    4. Ветвление Логики:
      • Если пользователь НЕ принадлежит к пулу (или контент не требует исследования), выполняется стандартная процедура рекомендации.
      • Если пользователь принадлежит к пулу И контент этого канала требует исследования, инициируется «Процедура Исследования Параметра Релевантности».
    5. Фаза Исследования (Exploration):
      1. Генерация Стандартного Набора: Алгоритм рекомендаций создает набор элементов для пользователя.
      2. Искусственное Внедрение: Система принудительно внедряет исследуемый Элемент Контента в этот набор. Внедрение часто происходит на заранее определенную позицию для максимизации вероятности взаимодействия.
      3. Сбор Взаимодействий: Система собирает данные о том, как Основной Пользователь взаимодействует с внедренным элементом (клик, время просмотра, лайк и т.д.).
    6. Расчет Метрик: На основе взаимодействий этого и других пользователей пула рассчитывается Дополненный Параметр Релевантности. Этот параметр может быть смещен вверх (получает буст) по сравнению со стандартной оценкой.
    7. Фаза Использования (Exploitation): Когда пользователи ВНЕ пула запрашивают рекомендации, система использует этот (потенциально завышенный) Параметр Релевантности для ранжирования исследованного элемента.
    8. Обратная Связь и Коррекция: Если широкая аудитория (пользователи вне пула) демонстрирует низкий интерес к элементу, его Параметр Релевантности модифицируется на более низкое значение.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Являются основой всего механизма. Используются для двух целей:
      1. Определение Пула Пользователей: Подписки, лайки, комментарии к предыдущему контенту канала (явные связи); просмотр предыдущего контента без негативной реакции (неявные связи).
      2. Оценка Релевантности: Взаимодействия с внедренным контентом: клики, лайки/дизлайки, репосты, время просмотра (dwell time), прокрутка мимо элемента.
    • Структурные факторы: Структура связей между пользователями и Каналами Содержимого (граф подписок/ассоциаций).
    • Контентные факторы: Сам элемент контента (текст, медиа) и метаданные о его источнике (Идентификатор Канала).

    Какие метрики используются и как они считаются

    • Параметр Релевантности (Relevance Parameter): Ключевая метрика, которую система прогнозирует. Это оценка вероятности того, что контент будет интересен широкой аудитории, основанная на поведении основной аудитории.
    • Дополненный Параметр Релевантности (Augmented Relevance Parameter): Промежуточная метрика, рассчитанная путем агрегации взаимодействий от нескольких пользователей в Пуле. В патенте указано, что этот параметр может быть «смещен вверх» (biased upwards) относительно стандартной оценки алгоритма рекомендаций, что дает контенту начальный буст.
    • Алгоритмы машинного обучения: В патенте упоминается основной Алгоритм Рекомендаций (MLA), который используется для стандартного ранжирования и с которым взаимодействует описанный механизм исследования.

    Выводы

    1. Фокус на Рекомендательных Системах: Патент описывает механизм для систем рекомендаций (типа Яндекс Дзен), а не для основного веб-поиска. Выводы применимы именно к оптимизации контента на таких платформах.
    2. Подписчики как Ли litmus-тест Качества: Система использует «Основных Пользователей» (подписчиков или фанатов канала) как ключевой индикатор потенциальной релевантности и качества контента. Реакция подписчиков определяет начальную судьбу публикации.
    3. Механизм «Искусственного Внедрения» для Исследования: Для преодоления «холодного старта» система принудительно показывает новый/нишевый контент Основным Пользователям, часто на приоритетных позициях в ленте, чтобы гарантированно собрать данные о взаимодействиях.
    4. Буст Релевантности от Подписчиков: Положительная реакция Основных Пользователей приводит к созданию завышенного («смещенного вверх») Параметра Релевантности. Это дает контенту шанс быть показанным широкой аудитории, который он не получил бы при стандартном ранжировании.
    5. Самокоррекция Системы: Патент предусматривает механизм защиты от некачественного контента. Если широкая аудитория реагирует негативно, Параметр Релевантности будет снижен, даже если подписчикам контент понравился. Это защищает общее качество системы.

    Практика

    ВАЖНО: Данный патент описывает работу рекомендательных систем (например, Яндекс Дзен), а не основного веб-поиска Яндекс. Приведенные ниже рекомендации относятся к стратегиям оптимизации контента именно на таких платформах.

    Best practices (это мы делаем)

    • Набор и удержание Основной Аудитории (Подписчиков): Критически важно фокусироваться на привлечении подписчиков и стимулировании явных связей (лайки, комментарии). Именно этот Пул Пользователей является ключом к получению первичной видимости для нового контента.
    • Максимизация Первичного Вовлечения: Контент должен быть максимально привлекательным для подписчиков. Их первые взаимодействия определяют, получит ли контент буст релевантности для широкой аудитории. Важно качество заголовков, изображений и самого контента, релевантного интересам подписчиков.
    • Специализация и Нишевание: Патент подтверждает жизнеспособность нишевых стратегий. Система специально разработана, чтобы помочь качественному специализированному контенту найти свою аудиторию, даже если она невелика.
    • Баланс между Нишей и Широким Интересом: Чтобы добиться максимального охвата, контент должен нравиться подписчикам, но также иметь потенциал заинтересовать более широкую аудиторию. Это позволит избежать снижения Параметра Релевантности на этапе показа широкой аудитории.

    Worst practices (это делать не надо)

    • Игнорирование Подписчиков: Рассматривать платформу только как источник случайного трафика и не работать над формированием базы подписчиков. В этом случае контент лишается механизма буста и конкурирует в общем пуле, что затрудняет продвижение нишевого контента.
    • Кликбейт, Разочаровывающий Широкую Аудиторию: Создание контента, который привлекает клики подписчиков (например, интригующие заголовки), но разочаровывает широкую аудиторию. Хотя это может дать первичный буст, последующие негативные взаимодействия от широкой аудитории приведут к пессимизации.
    • Накрутка Первичных Взаимодействий: Попытки манипулировать первичным вовлечением через ботов или мотивированный трафик в Пуле Пользователей. Если контент некачественный, он все равно будет пессимизирован на этапе показа широкой аудитории из-за механизма самокоррекции.

    Стратегическое значение

    Патент подчеркивает, что в рекомендательных платформах Яндекс приоритет отдается взаимоотношениям между создателями контента и их подписчиками как основному сигналу качества и потенциального охвата. Он демонстрирует стратегию Яндекса по сбалансированному продвижению нишевого контента без ущерба для удовлетворенности общей массы пользователей. Для авторов и издателей это означает, что построение лояльного сообщества является фундаментом для успеха на платформе.

    Практические примеры

    Сценарий: Продвижение нишевого контента в Яндекс Дзен

    1. Ситуация: Автор создает новый канал о «Реставрации советских радиоприемников» (очень нишевая тема). Он публикует несколько статей и набирает 100 подписчиков.
    2. Действие Системы (Подготовка): Яндекс идентифицирует канал и его Пул Пользователей (100 подписчиков) на основе явных связей.
    3. Публикация Новой Статьи: Автор публикует новую статью «Ремонт Ригонды-102». Статья новая, данных о взаимодействиях нет (холодный старт).
    4. Действие Системы (Исследование): Когда подписчики заходят в Дзен, система активирует Процедуру Исследования. Она «искусственно внедряет» новую статью в их ленты на высокие позиции (например, 1-3 место) для максимизации вероятности взаимодействия.
    5. Результат (Позитивный сценарий): 40 подписчиков кликают, долго читают и ставят лайки.
    6. Расчет Метрик: Система фиксирует высокий интерес Основной Аудитории и рассчитывает Дополненный Параметр Релевантности, смещенный вверх (буст).
    7. Использование: Система начинает показывать статью широкой аудитории (например, интересующимся электроникой, историей СССР), используя завышенный параметр релевантности.
    8. Коррекция: Если широкая аудитория также положительно реагирует, охват растет. Если игнорирует — Параметр Релевантности снижается, и показы прекращаются.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в основном веб-поиске Яндекса?

    Нет, напрямую не влияет. Патент описывает способ определения релевантности в рамках Системы Рекомендаций (таких как Яндекс Дзен или похожие ленты контента), где контент предлагается на основе интересов, а не в ответ на поисковый запрос. Механизмы ранжирования веб-поиска отличаются от описанных здесь.

    Что такое «Пул Пользователей» или «Основная Аудитория» в контексте этого патента?

    Это группа пользователей, которые явно или неявно связаны с определенным Каналом Содержимого (источником). Чаще всего это подписчики канала, люди, которые регулярно лайкают или комментируют его контент. В патенте они рассматриваются как тестовая группа, чья реакция на новый контент определяет его потенциал для широкой аудитории.

    Что такое «Искусственное Внедрение» и как оно работает?

    Это принудительное включение нового или нишевого контента в ленту рекомендаций Основных Пользователей (подписчиков). Система делает это, чтобы гарантированно получить данные о взаимодействии с контентом (решить проблему «холодного старта»). Часто контент внедряется на заранее определенные высокие позиции в ленте, чтобы максимизировать вероятность его просмотра.

    Как я могу увеличить шансы того, что мой контент (например, в Дзене) будет показан широкой аудитории?

    Ключевая стратегия, исходя из патента, — это формирование лояльной Основной Аудитории (подписчиков) и создание контента, который вызывает у них максимальное вовлечение. Позитивная реакция подписчиков дает контенту сильный начальный буст («смещение вверх» параметра релевантности), что критически важно для выхода на широкую аудиторию.

    Что произойдет, если мои подписчики любят контент, а широкая аудитория — нет?

    Патент предусматривает механизм самокоррекции. Изначально контент получит буст благодаря подписчикам и будет показан широкой аудитории. Однако, если широкая аудитория демонстрирует низкий интерес или негативную реакцию, система снизит Параметр Релевантности контента, и его показы сократятся. Лояльность подписчиков не гарантирует успеха у массового пользователя.

    Как Яндекс определяет, кто входит в мою «Основную Аудиторию»?

    Система использует Явные и Неявные связи. Явные связи — это подписки, лайки и комментарии к контенту канала. Неявные связи могут включать регулярный просмотр контента канала без негативной реакции (например, без блокировки источника или дизлайков).

    Отдает ли эта система предпочтение нишевому контенту перед популярным?

    Не совсем. Она дает нишевому контенту шанс быть замеченным, уравнивая его стартовые возможности с популярным контентом. Стандартные алгоритмы предпочитают популярный контент. Этот механизм позволяет качественному нишевому контенту преодолеть начальный барьер за счет сильной поддержки со стороны своей Основной Аудитории.

    Какие взаимодействия пользователя наиболее важны на фазе исследования (показа подписчикам)?

    В патенте упоминаются различные взаимодействия, указывающие на предпочтения: клики, лайки/дизлайки, репосты, время, проведенное за изучением элемента (dwell time), и даже прокрутка мимо элемента (как негативный сигнал). Наиболее ценными являются взаимодействия, демонстрирующие глубокий интерес (длительное время просмотра, лайки, репосты).

    Этот механизм применяется только для новых каналов или для устоявшихся тоже?

    Он применяется для любого контента, который нуждается в исследовании релевантности — это может быть новый контент на устоявшемся канале или контент на совершенно новом канале. Ключевым фактором является недостаток данных о предыдущих пользовательских взаимодействиях с конкретным элементом контента.

    Какую главную проблему этот патент решает для Яндекса?

    Он решает проблему «замкнутого круга недостатка просмотров» для специализированного контента. Система позволяет находить качественный нишевый контент и предлагать его пользователям, не снижая при этом общее качество рекомендательной системы для тех, кто не заинтересован в этой нише.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.