Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс использует алгоритм «Heart Beat» для определения следующего эпизода сериала в поисковых подсказках

    PROCESSING A USER REQUEST FOR A WEB RESOURCE ASSOCIATED WITH SEQUENTIALLY LINKED DOCUMENTS (Обработка запроса пользователя к веб-ресурсу, связанному с последовательно связанными документами)
    • WO2016087953A1
    • Yandex LLC
    • 2016-06-09
    • 2015-05-27
    2016 Патенты Яндекс Персонализация Поведенческие факторы Поисковые подсказки

    Яндекс патентует механизм улучшения поисковых подсказок для серийного контента (например, сериалов). Система использует алгоритм «Heart Beat», чтобы определить, действительно ли пользователь завершил просмотр предыдущего эпизода. Завершением считается просмотр до конца или достижение статистически рассчитанного порога потребления. Только если эпизод признан завершенным, следующий по порядку эпизод будет приоритетно предложен в подсказках.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу повышения релевантности поисковых подсказок (Suggests) для контента, потребляемого последовательно (сериалы, аудиокниги). Проблема в том, что стандартные системы могут предложить следующий эпизод, основываясь лишь на факте клика по предыдущему, даже если пользователь его не смотрел (например, быстро закрыл из-за плохого качества). Изобретение предотвращает это, стремясь предложить продолжение только тогда, когда система уверена, что пользователь действительно завершил потребление предыдущей части.

    Что запатентовано

    Запатентована система генерации персонализированных поисковых подсказок для последовательно семантически связанных документов (Sequentially Semantically Linked Documents). Ядро изобретения — метод определения факта завершения потребления (Completed Using). Этот метод анализирует продолжительность использования документа и сравнивает ее с предопределенным порогом использования (Pre-determined Usage Threshold), который рассчитывается с помощью статистического алгоритма Heart Beat.

    Как это работает

    Когда пользователь начинает вводить запрос о сериале, система проверяет его историю просмотров. Ключевым является алгоритм Heart Beat, который определяет последний завершенный эпизод. Завершенным считается просмотр до конца ИЛИ просмотр, превышающий статистически рассчитанный порог (например, 20 минут для часового эпизода). Если последний просмотренный эпизод признан завершенным, система генерирует подсказку для следующего эпизода. Если он не завершен, система приоритетно предложит досмотреть текущий эпизод.

    Актуальность для SEO

    Средняя. Концепция отслеживания потребления контента и персонализации предложений крайне актуальна для медиа-сервисов (например, Кинопоиск, Яндекс.Видео). Однако патент узкоспециализирован на функции поисковых подсказок (саджеста) в интерфейсе поиска, а не на базовых механизмах ранжирования или внутриплатформенных рекомендациях.

    Важность для SEO

    Влияние на SEO низкое (3/10). Патент не описывает алгоритмы ранжирования веб-страниц. Он сфокусирован исключительно на механизме генерации поисковых подсказок. Однако для Video SEO он имеет стратегическое значение, так как подтверждает, что Яндекс детально измеряет и интерпретирует глубину потребления контента (Watch Time, Dwell Time), что является важным поведенческим сигналом.

    Детальный разбор

    Термины и определения

    Completed Using (Завершение использования)
    Состояние, при котором система считает, что пользователь закончил потребление документа (например, досмотрел эпизод). Определяется как достижение конца документа ИЛИ достижение предопределенного порога использования.
    Heart Beat Algorithm (Алгоритм «Heart Beat»)
    Статистический механизм для расчета Pre-determined Usage Threshold. Он анализирует поведение пользователей, чтобы определить вероятность того, что пользователь считает документ просмотренным после определенного временного интервала.
    Pre-determined Usage Threshold (Предопределенный порог использования)
    Минимальная продолжительность использования документа, после которой система считает его потребление завершенным, даже если пользователь не достиг самого конца. Рассчитывается алгоритмом Heart Beat.
    Sequentially Semantically Linked Documents (Последовательно семантически связанные документы)
    Набор документов, предназначенных для последовательного потребления (эпизоды сериала, главы аудиокниги).
    Series Structure Module (Модуль структуры сериала)
    Упомянутая в описании база данных, хранящая структуру известных сериалов: хэш названия, количество сезонов, количество эпизодов в каждом сезоне и параметр качества/кликабельности (Score).
    Suggest (Подсказка)
    Поисковая подсказка (саджест), предлагаемая пользователю в интерфейсе поиска.

    Ключевые утверждения (Анализ Claims)

    Ядро изобретения сосредоточено на точном определении момента, когда следует предложить пользователю следующий элемент последовательности, основываясь на фактическом потреблении контента.

    Claim 1 (Независимый пункт): Описывает основной процесс обработки запроса.

    1. Определение того, что запрос относится к последовательно связанным документам.
    2. Определение конкретного документа, использование которого пользователь завершил (Completed Using).
    3. Критически важно: Завершение определяется одним из двух способов: (i) пользователь достиг конца документа; ИЛИ (ii) если конец не достигнут, пользователь достиг Предопределенного порога использования.
    4. Генерация подсказки (Suggest), включающей следующий по порядку документ.

    Claim 2 (Зависимый от 1): Описывает логику для ситуации, когда использование документа НЕ было завершено.

    Если последний использованный документ не был завершен (порог не достигнут), система генерирует подсказку, представляющую этот незавершенный документ. Эта подсказка ранжируется ВЫШЕ, чем подсказка для следующего документа. То есть система предлагает пользователю сначала закончить текущий эпизод.

    Claim 6, 7, 8 (Зависимые): Детализируют расчет порога использования.

    Порог рассчитывается с помощью алгоритма Heart Beat (Claim 6) офлайн, до получения запроса (Claim 7). Процесс расчета Heart Beat (Claim 8) включает:

    1. Сбор статистики о завершении использования документов данного типа.
    2. Определение временных интервалов использования.
    3. Для каждого интервала – присвоение параметра вероятности того, что после этого интервала пользователь считает документ завершенным.
    4. Расчет параметра Heart Beat с учетом этих вероятностей.

    Claim 9 (Зависимый от 8): Указывает, что Heart Beat может быть персонализирован для конкретного пользователя на основе его личной статистики.

    Где и как применяется

    Изобретение применяется исключительно на этапе обработки запроса, в момент генерации поисковых подсказок.

    QUERY PROCESSING – Понимание Запросов (Генерация Саджеста)

    Основное место применения. Когда пользователь начинает вводить запрос:

    1. Идентификация интента: Система определяет, что запрос связан с сериалом (используя Query Detection Module и Video Listing Module, упомянутые в описании).
    2. Персонализация: Система использует User ID для доступа к истории просмотров.
    3. Анализ потребления: Применяется алгоритм Heart Beat для определения последнего завершенного эпизода.
    4. Генерация подсказки: Система использует Series Structure Module, чтобы определить следующий эпизод, и формирует персонализированный Suggest.

    Офлайн-процессы (Индексация и Аналитика)

    Значительная часть работы происходит офлайн:

    • Индексация видеоресурсов и построение базы структуры сериалов (Series Structure Module).
    • Сбор статистики просмотров и расчет пороговых значений для алгоритма Heart Beat (Claim 7, 8).

    На что влияет

    • Типы контента: Влияет на поисковые подсказки для видеоконтента (сериалы, многосерийные фильмы). Потенциально применяется к аудиокнигам или другим последовательным форматам.
    • Специфические запросы: Влияет на запросы, содержащие названия известных сериалов.
    • Ниши: Медиа, развлечения, стриминговые сервисы.

    Когда применяется

    • Условия работы: Алгоритм активируется в момент ввода запроса пользователем в поисковую строку.
    • Триггеры активации: (1) Запрос идентифицирован как относящийся к известному сериалу; (2) Пользователь идентифицирован, и у него есть история взаимодействия с этим сериалом.

    Пошаговый алгоритм

    Процесс А: Обработка запроса в реальном времени

    1. Получение данных: Система получает частичный поисковый запрос и User ID.
    2. Идентификация сериала: Система определяет, к какому сериалу относится запрос.
    3. Извлечение истории: Система извлекает историю просмотров пользователя для этого сериала и определяет последний открытый эпизод.
    4. Определение статуса последнего эпизода (Heart Beat Check): Проверяется продолжительность просмотра последнего эпизода.
    5. Проверка порога: Продолжительность сравнивается с Pre-determined Usage Threshold. Определяется статус: Завершен (Completed) или Не завершен.
    6. Ветвление логики генерации подсказок:
      • Если Завершен: Система определяет следующий эпизод и генерирует подсказку для него, ранжируя ее на первом месте (Claim 1).
      • Если Не завершен: Система генерирует подсказку для текущего незавершенного эпизода и ранжирует ее выше, чем подсказку для следующего эпизода (Claim 2).
    7. Отображение: Персонализированный список подсказок отправляется пользователю.

    Процесс Б: Офлайн-расчет Heart Beat Threshold

    1. Сбор статистики: Агрегация данных о продолжительности просмотра эпизодов пользователями.
    2. Анализ вероятностей: Для различных временных интервалов (например, 5 мин, 20 мин) рассчитывается вероятность того, что пользователь считает эпизод просмотренным.
    3. Определение порога: Устанавливается Pre-determined Usage Threshold на основе этих вероятностей. Порог может быть общим или персонализированным (Claim 9).

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Критически важные данные. User ID, история просмотров конкретного сериала, продолжительность просмотра (Watch Time / Viewing Duration) каждого эпизода.
    • Контентные факторы: Текст вводимого поискового запроса.
    • Структурные факторы (Системные данные): Данные из Series Structure Module: структура сериала (сезоны, эпизоды), хэши названий. В Claim 12 также упоминается Score (оценка) для каждого документа.

    Какие метрики используются и как они считаются

    • Pre-determined Usage Threshold (Порог использования): Метрика времени. Рассчитывается офлайн алгоритмом Heart Beat. Определяет минимальное время просмотра для зачета эпизода как завершенного.
    • Probability Parameter (Параметр вероятности): Вероятность того, что просмотр в течение определенного интервала означает завершение потребления контента. Пример из патента: 1 мин = 0.1; 20 мин = 0.9.
    • Time Intervals (Временные интервалы): Фактическое время просмотра. Патент (Claim 11) упоминает, что это время может определяться путем периодического опроса приложения (например, плеера), чтобы подтвердить активность пользователя.

    Выводы

    1. Различие между Кликом и Потреблением: Яндекс четко различает факт открытия документа (клик) и факт его реального потребления («Completed Using»). Для навигации по сериальному контенту используется именно факт потребления.
    2. Алгоритм Heart Beat: Завершение потребления определяется статистически на основе продолжительности просмотра. Если время просмотра превышает порог Heart Beat, контент считается потребленным, даже если он не досмотрен до конца.
    3. Управление вниманием пользователя: Если пользователь не завершил просмотр (не достиг порога), система приоритетно предложит ему досмотреть этот эпизод, а не начинать следующий (Claim 2).
    4. Узкая специализация патента: Патент сфокусирован исключительно на генерации поисковых подсказок (саджеста) для последовательного контента. Он не дает информации об алгоритмах ранжирования в основном поиске.
    5. Важность поведенческих данных (Watch Time): Патент демонстрирует, как Яндекс использует данные о времени просмотра для улучшения UX, подтверждая важность метрик удержания в экосистеме поиска.

    Практика

    Best practices (это мы делаем)

    Практическое применение для SEO ограничено, но для владельцев видеоплатформ и сайтов с сериальным контентом выводы критически важны:

    • Оптимизация удержания пользователя (Retention/Watch Time): Алгоритм Heart Beat основан на времени просмотра. Необходимо максимизировать вовлеченность и минимизировать факторы, вызывающие ранний отказ (низкое качество видео, медленная загрузка, избыток рекламы). Длительное время просмотра является позитивным поведенческим сигналом и гарантирует, что пользователь достигнет порога Heart Beat.
    • Четкая и консистентная структура: Убедитесь, что названия, номера сезонов и эпизодов указаны четко и единообразно. Это поможет Яндексу корректно построить Series Structure Module.
    • Использование микроразметки: Внедряйте Schema.org (TVSeries, TVSeason, Episode) для разметки сериалов. Это помогает поисковым системам лучше понять структуру вашего контента.

    Worst practices (это делать не надо)

    • Кликбейт и низкое качество контента: Привлечение пользователей на видео, которое они сразу закрывают. Это приводит к коротким сессиям (ниже порога Heart Beat) и генерирует негативные поведенческие сигналы.
    • Запутанная структура и именование: Использование разных форматов для обозначения эпизодов или нечеткое указание названия может помешать Яндексу идентифицировать последовательный характер контента.
    • Игнорирование технических проблем воспроизведения: Медленная загрузка или ошибки плеера ведут к прерыванию просмотра и потере позитивных сигналов удержания.

    Стратегическое значение

    Патент подтверждает стратегический приоритет Яндекса на анализ поведения пользователей внутри документа. Он демонстрирует, что Яндекс анализирует не только факт посещения, но и качество взаимодействия (продолжительность и завершенность просмотра). Хотя этот патент узкоспециализирован на подсказках, он вписывается в общую стратегию оценки качества пользовательского опыта, где время взаимодействия (Dwell Time, Engagement Time) играет важную роль, особенно в Video SEO.

    Практические примеры

    Сценарий 1: Успешное завершение просмотра (Claim 1)

    1. Предпосылка: Пользователь посмотрел «Игра Престолов, Сезон 3, Эпизод 9» в течение 45 минут. Порог Heart Beat для этого типа контента составляет 20 минут.
    2. Действие системы: Яндекс фиксирует время просмотра и определяет, что порог превышен. Эпизод помечается как Завершенный (Completed Using).
    3. Следующий поиск: Пользователь начинает вводить «Игра Престолов».
    4. Результат: Первая поисковая подсказка будет: «Игра Престолов, Сезон 3, Эпизод 10».

    Сценарий 2: Незавершенный просмотр (Claim 2)

    1. Предпосылка: Пользователь открыл «Игра Престолов, Сезон 4, Эпизод 1», но закрыл через 3 минуты. Порог 20 минут не достигнут.
    2. Действие системы: Яндекс определяет, что порог не достигнут. Эпизод помечается как Не завершенный.
    3. Следующий поиск: Пользователь начинает вводить «Игра Престолов».
    4. Результат: Первая поисковая подсказка будет: «Игра Престолов, Сезон 4, Эпизод 1». Подсказка для следующего эпизода («Сезон 4, Эпизод 2») будет ранжироваться ниже. Система предлагает досмотреть начатое.

    Вопросы и ответы

    Что такое алгоритм «Heart Beat»?

    Это статистический алгоритм, который определяет, можно ли считать просмотр контента завершенным. Вместо того чтобы требовать просмотра до самого конца, он устанавливает временной порог (например, 20 минут), основанный на анализе поведения множества пользователей. Если пользователь смотрел контент дольше этого порога, система считает, что просмотр завершен.

    Влияет ли этот патент на ранжирование моего сайта в поиске Яндекса?

    Нет, напрямую не влияет. Патент описывает исключительно механизм генерации поисковых подсказок (саджеста) для сериалов и другого последовательного контента. Он не описывает факторы, влияющие на позицию сайта в основной поисковой выдаче (SERP).

    Как этот патент влияет на Video SEO?

    Он критически важен для понимания того, как Яндекс оценивает поведение пользователей при просмотре видео. Патент подтверждает важность метрик удержания (Watch Time). Если пользователи быстро бросают ваше видео (до порога Heart Beat), это сигнализирует о низком качестве взаимодействия. Оптимизация времени просмотра становится ключевой задачей.

    Как Яндекс рассчитывает порог завершения просмотра (Heart Beat)?

    Расчет происходит офлайн на основе анализа больших данных. Система изучает статистику просмотров для контента данного типа, определяет временные интервалы (например, 5, 10, 20 минут) и рассчитывает вероятность того, что просмотр считается завершенным для каждого интервала. Порог устанавливается на уровне высокой вероятности.

    Меняется ли порог Heart Beat для разных пользователей?

    Да, патент предусматривает такую возможность (Claim 9). Heart Beat может быть персонализирован для пользователя и рассчитываться на основе его личной статистики. Например, если пользователь обычно смотрит эпизоды по 30 минут, порог для него может быть адаптирован.

    Что произойдет, если пользователь начал смотреть эпизод, но быстро закрыл его?

    Если время просмотра не достигло порога Heart Beat, система пометит эпизод как незавершенный. При следующем поиске этого сериала система приоритетно предложит в подсказках этот же незавершенный эпизод, а не следующий по порядку (согласно Claim 2).

    Применяется ли этот механизм только к видео и сериалам?

    В патенте в качестве основного примера приводятся сериалы. Однако технология описана для любых «последовательно семантически связанных документов». Теоретически, это может применяться к главам аудиокниг, частям длинных лекций или многостраничным статьям, если система сможет определить их последовательную структуру.

    Как Яндекс узнает, что и как долго я смотрел?

    Система собирает статистику о поведении пользователей. В патенте (Claim 11) упоминается механизм периодического опроса приложения (например, медиаплеера), чтобы подтвердить, что пользователь все еще использует документ. Эти данные агрегируются и используются для персонализации.

    Как я могу использовать эту информацию, если у меня сайт с видеоконтентом?

    Главный вывод – необходимо обеспечить высокое качество контента и UX для удержания зрителя. Также критически важно иметь четкую структуру (название, сезон, эпизод) и использовать микроразметку (Schema.org), чтобы помочь Яндексу корректно индексировать последовательность контента и применять этот механизм подсказок.

    Связан ли этот патент с факторами E-E-A-T или метрикой Proxima?

    Нет. E-E-A-T и Proxima – это метрики для оценки качества, авторитетности и достоверности контента, используемые в ранжировании. Данный патент описывает механизм персонализации поисковых подсказок на основе истории потребления контента и не связан с оценкой качества самого источника.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.