Яндекс патентует метод улучшения поисковых подсказок (саджеста) для сериального контента. Система статистически вычисляет порог просмотра («Heart Beat»), после которого эпизод считается досмотренным, даже если пользователь не дошел до конца файла. Это позволяет точнее предлагать пользователю следующий эпизод при повторном поиске, улучшая пользовательский опыт.
Описание
Какую задачу решает
Патент решает задачу повышения точности персонализированных поисковых предложений (подсказок/саджеста) для контента, который потребляется последовательно (например, сериалы, аудиокниги). Проблема заключается в том, что существующие системы неточно определяют, действительно ли пользователь завершил просмотр предыдущего элемента. Пользователь мог открыть серию, посмотреть несколько секунд и закрыть (например, из-за плохого качества или отвлекшись). Предложение следующей серии в таком случае нерелевантно. Изобретение улучшает UX, точно определяя факт завершения просмотра.
Что запатентовано
Запатентован способ обработки запросов, связанных с последовательно семантически связанными документами (сериальным контентом). Суть изобретения заключается в методе определения того, был ли документ полностью просмотрен. Это определение базируется не только на достижении конца файла, но и на достижении статистически вычисляемого порога просмотра. Этот механизм в патенте называется «Heart Beat» (или Показатель просмотра).
Как это работает
Система работает в два этапа. Офлайн собирается статистика о длительности просмотра пользователями сериального контента. На основе вероятностного анализа этих данных рассчитывается порог «Heart Beat» — время, после которого эпизод считается завершенным. Онлайн, когда пользователь ищет сериал, система проверяет его историю. Если длительность просмотра последнего эпизода превысила порог «Heart Beat» (или пользователь дошел до конца), система помечает его как «просмотренный» и приоритетно предлагает следующий по порядку эпизод в поисковых подсказках.
Актуальность для SEO
Средняя. Механизмы отслеживания прогресса просмотра медиаконтента являются стандартом для стриминговых сервисов. Применение этого механизма непосредственно в поисковых подсказках (саджесте) с использованием статистически выведенного порога («Heart Beat») остается актуальным для улучшения пользовательского опыта и удержания пользователей в экосистеме Яндекса (например, Яндекс Видео, Кинопоиск).
Важность для SEO
Влияние на SEO низкое (2/10). Этот патент не описывает алгоритмы ранжирования веб-документов в основном поиске. Он описывает исключительно функцию улучшения пользовательского опыта (UX) в рамках поисковых подсказок (саджеста) для очень специфического типа контента — последовательного медиа. Прямых действий для SEO-специалистов, направленных на улучшение позиций сайта, из этого патента не следует.
Детальный разбор
Термины и определения
- Heart Beat / Показатель просмотра
- Ключевой термин патента. Статистически рассчитанный коэффициент или временной порог. Если длительность просмотра документа (например, видео) превышает этот порог, документ считается просмотренным пользователем, даже если он не был досмотрен до физического конца файла.
- Последовательно семантически связанные документы
- Набор документов, предполагающих последовательное потребление, где содержание следующего документа связано с предыдущим (например, серии сериала, главы аудиокниги).
- Предварительно определенный порог использования (просмотра)
- Временной порог, определяемый с помощью Показателя просмотра (Heart Beat). Если длительность просмотра превышает этот порог, документ считается полностью просмотренным.
- Параметр вероятности
- Статистическая оценка вероятности того, что пользователь считает документ просмотренным до конца по прошествии определенного временного интервала.
- Предложение (Suggestion)
- Поисковая подсказка или автодополнение запроса, отображаемое пользователю при вводе текста в поисковую строку.
Ключевые утверждения (Анализ Claims)
Ядром изобретения является метод определения завершенности просмотра контента с использованием статистического порога для формирования релевантных подсказок.
Claim 1 (Независимый пункт): Описывает основной способ обработки запроса и детальный механизм расчета порога просмотра.
- Сервер получает запрос пользователя.
- Определяется, что запрос связан с множеством последовательно семантически связанных документов (сериалом).
- Определяется последний документ, полностью просмотренный пользователем.
- Критически важный момент определения «полностью просмотрен»:
- Определение достижения конца документа; ИЛИ
- Определение достижения предварительно определенного порога использования (если конец не достигнут).
- Механизм определения порога (Heart Beat):
- Сбор статистики о пользователях, завершающих просмотр документов этой категории.
- Определение временных интервалов просмотра.
- Назначение для каждого интервала параметра вероятности того, что документ считается просмотренным до конца.
- Определение Показателя просмотра на основе этих вероятностей.
- Формирование предложения (подсказки) для отображения пользователю следующего по порядку документа.
Claim 7 (Зависимый): Уточняет, что показатель просмотра (Heart Beat) может быть персонализирован для конкретного пользователя на основе его индивидуальной статистической информации.
Claim 10 (Зависимый): Описывает данные, необходимые для идентификации сериального контента. Система должна получить информацию, содержащую: значение хэш названия, число сезонов, число серий в каждом сезоне и показатель, связанный с каждым документом.
Где и как применяется
Изобретение применяется на ранних этапах взаимодействия пользователя с поисковой строкой, до основного этапа ранжирования.
QUERY PROCESSING – Понимание Запросов (Генерация подсказок)
Это основной этап применения патента. Когда пользователь начинает вводить запрос, система должна распознать, что он относится к последовательному контенту (сериалу). Система генерации подсказок взаимодействует с историей пользователя и базой данных о структуре контента.
- Входные данные: Частичный или полный поисковый запрос, Идентификатор пользователя, История просмотров пользователя (последний эпизод и длительность просмотра), Значение порога Heart Beat (рассчитанное офлайн).
- Выходные данные: Приоритезированное предложение в выпадающем списке подсказок (саджесте), указывающее на следующий логический эпизод.
Офлайн-процессы и обработка данных
Значительная часть работы происходит офлайн:
- Сбор статистики просмотров пользователей (логи поведения).
- Расчет показателя просмотра (Heart Beat) на основе статистического анализа вероятностей. Этот расчет может быть глобальным или персональным (Claim 7).
- Индексация и структурирование сериального контента (сбор данных о сезонах и эпизодах, как указано в Claim 10).
На что влияет
- Конкретные типы контента: Влияет исключительно на последовательно семантически связанный контент. В патенте прямо указаны видеосериалы и аудиокниги.
- Специфические запросы: Влияет на навигационные и повторные запросы, связанные с потреблением медиа (например, пользователь возвращается к поиску, чтобы продолжить просмотр).
- Ниши: Кино, ТВ, стриминговые сервисы, онлайн-кинотеатры, потенциально образовательные курсы.
Когда применяется
- Триггеры активации: Алгоритм активируется при одновременном выполнении условий:
- Пользователь вводит запрос в поисковую строку.
- Запрос идентифицирован как название последовательного контента (сериала).
- У системы есть история просмотров этого контента для данного пользователя.
- Пороговые значения: Ключевым порогом является Показатель просмотра (Heart Beat). Если длительность просмотра последнего эпизода превышает этот порог, система предлагает следующий эпизод.
Пошаговый алгоритм
Процесс А: Офлайн-расчет Показателя Просмотра (Heart Beat)
- Сбор данных: Сбор статистической информации о длительности просмотра документов из категории последовательного контента (в автономном режиме).
- Определение интервалов: Определение временных интервалов (например, 1 мин, 5 мин, 10 мин, 20 мин).
- Расчет вероятностей: Для каждого интервала рассчитывается параметр вероятности того, что если пользователь просмотрел столько времени, он считается завершившим просмотр. (Пример из патента: 20 мин = 0.9 вероятности).
- Определение порога: Вычисление финального значения Показателя просмотра (Heart Beat) на основе этих вероятностей. Этот процесс может быть персонализированным (Claim 7).
Процесс Б: Обработка запроса и генерация предложения (Онлайн)
- Получение запроса: Сервер получает запрос (полный или частичный) и идентификатор пользователя.
- Идентификация контента: Определение того, что запрос относится к последовательному контенту (сериалу).
- Извлечение истории: Получение данных о последнем просмотренном документе (эпизоде) этим пользователем и длительности просмотра.
- Определение статуса просмотра: Проверка, был ли документ «полностью просмотрен»:
- Условие 1: Достиг ли пользователь конца документа?
- Условие 2: Если нет, превысила ли длительность просмотра рассчитанный порог Heart Beat?
- Выбор предложения:
- Если «полностью просмотрен»: Определяется следующий по порядку документ.
- Если «не просмотрен»: Определяется тот же самый документ (согласно Claim 2).
- Генерация подсказки: Создание предложения (например, «Сериал X Сезон 2 Серия 3») и его приоритизация в списке поисковых подсказок. Может также включать указание на последний просмотренный эпизод.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Критически важные данные. Используется длительность просмотра (время взаимодействия с контентом), история завершенных просмотров. Эти данные собираются для расчета Heart Beat. В Claim 11 также упоминается использование показателя, основанного на «возможности активации щелчком указателя мыши» (кликабельности) при индексации структуры контента.
- Структурные факторы: Данные о структуре контента (Claim 10): название (в виде хэш-значения), число сезонов, число серий в каждом сезоне. Это необходимо для определения последовательности.
- Пользовательские факторы: Идентификатор пользователя для доступа к истории просмотров. В патенте (Claim 7) упоминается возможность персонализации Показателя просмотра на основе индивидуальной статистики пользователя.
- Контентные факторы: Текст запроса пользователя для идентификации названия сериала.
Какие метрики используются и как они считаются
- Показатель просмотра (Heart Beat): Статистически выведенный временной порог завершения просмотра. Рассчитывается на основе функции вероятности для разных временных интервалов.
- Параметр вероятности: Метрика, назначаемая для каждого временного интервала, указывающая вероятность того, что документ считается просмотренным до конца по прошествии этого времени.
- Временные интервалы: Измерения длительности просмотра. В патенте (Claim 9) описан механизм их измерения через периодическую отправку запроса приложению (плееру) для подтверждения того, что пользователь все еще смотрит контент.
Выводы
- Это патент про UX подсказок, а не про ранжирование: Основной вывод для SEO-специалистов — этот патент не описывает факторы ранжирования в органическом поиске. Он фокусируется на улучшении взаимодействия пользователя с поисковыми подсказками (саджестом) для медиаконтента.
- Статистический подход к определению завершенности («Heart Beat»): Яндекс использует поведенческие данные и вероятностный анализ, чтобы определить, когда контент можно считать потребленным. Это более сложный подход, чем просто проверка достижения конца файла.
- Персонализация опыта: Механизм основан на истории конкретного пользователя и может адаптировать пороги просмотра (Heart Beat) персонально (Claim 7).
- Требование к структурированным данным: Для работы этой системы Яндекс должен иметь четкое представление о структуре контента (сезоны, эпизоды, их порядок). Это подчеркивает важность корректной индексации медиаконтента (Claim 10).
- Использование кликабельности при индексации: В патенте указано (Claim 11), что при индексации структуры сериала может учитываться показатель, основанный на кликабельности (CTR) каждого документа.
Практика
Best practices (это мы делаем)
Патент является инфраструктурным и фокусируется на UX потребления медиаконтента. Прямых SEO-рекомендаций для повышения ранжирования он не дает. Однако можно выделить практики для сайтов с видеоконтентом (кинотеатры, образовательные платформы), которые помогут Яндексу корректно индексировать контент.
- Четкая структура последовательного контента: Если вы публикуете сериалы, курсы или аудиокниги, убедитесь, что структура (сезоны/части, эпизоды/главы) абсолютно ясна. Используйте понятные URL, хлебные крошки и заголовки (например, «Сериал X — Сезон 2, Эпизод 5»).
- Использование микроразметки для видео: Применяйте разметку Schema.org (например, VideoObject, TVSeries, TVSeason, Episode). Это поможет Яндексу извлечь данные о структуре контента (Claim 10), что является необходимым условием для работы описанного механизма.
- Оптимизация качества видео и плеера (Удержание): Поскольку система опирается на продолжительность просмотра («Heart Beat»), обеспечение высокой скорости загрузки и качества трансляции критически важно для удержания пользователя и достижения порога.
- Оптимизация CTR видео: Так как кликабельность упоминается как показатель при индексации (Claim 11), работайте над привлекательными заголовками и значками видео (thumbnails).
Worst practices (это делать не надо)
- Обфускация структуры контента: Сокрытие порядка эпизодов или использование неинформативных названий (например, «Видео 1», «Видео 2» вместо названий серий) помешает Яндексу понять последовательность контента.
- Медленная загрузка и плохое качество видео: Это приводит к быстрым отказам. Пользователь не достигнет порога Heart Beat, и система не будет считать контент просмотренным, что ухудшает общий поведенческий профиль взаимодействия.
Стратегическое значение
Патент подтверждает стратегический фокус Яндекса на глубоком анализе поведения пользователей для улучшения качества сервисов и удержания аудитории. Он демонстрирует, как поведенческие данные (длительность просмотра, CTR) используются для интерпретации удовлетворенности пользователя. Для SEO это еще одно напоминание о том, что Яндекс стремится понимать структуру и качество контента так же хорошо, как и специализированные стриминговые платформы.
Практические примеры
Сценарий: Оптимизация онлайн-кинотеатра
- Задача: Улучшить индексацию сериалов на сайте и повысить возвращаемость пользователей через поиск Яндекса.
- Действия на основе патента:
- Внедрение детальной микроразметки TVSeries/Episode для всех сериалов, четко указывая порядок и принадлежность к сезонам (для выполнения требований Claim 10).
- Оптимизация скорости работы видеоплеера и качества CDN для минимизации отказов на старте просмотра (для достижения порога Heart Beat).
- Ожидаемый результат: Яндекс корректно индексирует структуру сериалов. Пользователи, начавшие смотреть сериал на сайте, при повторном поиске в Яндексе видят в саджесте точную подсказку следующего эпизода (благодаря механизму Heart Beat). Это повышает вероятность возврата пользователя на сайт.
Вопросы и ответы
Влияет ли этот патент на ранжирование моего сайта в органической выдаче?
Нет, прямого влияния на ранжирование этот патент не оказывает. Он описывает механизм работы поисковых подсказок (саджеста) для специфического типа контента — сериалов и другого последовательного медиа. Он не вводит новых факторов ранжирования для основного поиска.
Что такое «Heart Beat» (Показатель просмотра) в контексте этого патента?
«Heart Beat» — это статистически рассчитанный временной порог. Если пользователь просмотрел видео дольше этого порога, система считает, что эпизод был просмотрен до конца, даже если пользователь не дошел до финальных титров. Это нужно для того, чтобы точно определить, когда можно предлагать следующий эпизод в подсказках.
Как Яндекс рассчитывает порог «Heart Beat»?
Он рассчитывается офлайн путем сбора статистики о поведении пользователей при просмотре сериалов. Система анализирует разные временные интервалы (например, 5, 10, 20 минут) и определяет вероятность того, что просмотр можно считать завершенным для каждого из них. На основе этих вероятностей выводится финальный порог.
Может ли порог «Heart Beat» быть разным для разных пользователей?
Да, в патенте (Claim 7) прямо указана возможность персонализации Показателя просмотра. Если пользователь А обычно смотрит сериалы до самых титров, а пользователь Б часто выключает раньше, система может рассчитать для них разные индивидуальные пороги на основе их личной статистики.
Какая польза от этого патента для владельца онлайн-кинотеатра?
Хотя патент не улучшает ранжирование, он улучшает пользовательский опыт для вашей аудитории. Если Яндекс корректно отслеживает прогресс просмотра, пользователи будут получать точные подсказки следующей серии при повторном поиске. Это повышает удобство и увеличивает вероятность того, что пользователь вернется для продолжения просмотра.
Что нужно сделать на сайте, чтобы эта система работала с моим контентом?
Необходимо обеспечить максимально четкую структуру вашего последовательного контента. Используйте информативные заголовки (с указанием сезона и серии), логичную структуру URL и, самое главное, внедрите микроразметку Schema.org (например, TVSeries, Episode). Это поможет Яндексу понять структуру вашего контента (Claim 10).
Упоминается ли в патенте CTR (кликабельность)?
Да. В Claim 11 указано, что показатель, связанный с каждым документом (который используется при индексации структуры сериала согласно Claim 10), может определяться на основе «возможности активации щелчком указателя мыши», что является синонимом кликабельности (CTR). Это важно для VSEO.
Что произойдет, если пользователь посмотрел серию всего 2 минуты и ушел?
Если 2 минуты — это меньше рассчитанного порога «Heart Beat», система определит, что эпизод не был «полностью просмотрен». При следующем поиске этого сериала система в приоритетном порядке предложит пользователю тот же самый эпизод, а не следующий (Claim 2).
Где именно пользователь видит результат работы этого алгоритма?
Результат виден в выпадающем списке поисковых подсказок (саджесте), когда пользователь начинает вводить название сериала в поисковую строку Яндекса (или Яндекс Видео). Подсказка будет содержать точное указание на следующий эпизод.
Как этот патент связан с поведенческими факторами в SEO?
Он косвенно подтверждает важность анализа поведения пользователей Яндексом. Система использует длительность просмотра и паттерны потребления контента для принятия решений. Для SEO это сигнал о том, что удержание пользователя на странице (в данном случае, в плеере) и обеспечение качественного опыта просмотра критически важны.