
Google использует интерфейс для поиска медиаконтента, объединяющий прокручиваемый список результатов и специальную «область фокуса» для автоматического воспроизведения превью. Система анализирует жесты пользователя (свайпы, касания) в реальном времени, используя персонализированное машинное обучение для определения заинтересованности, и мгновенно показывает соответствующее превью, не требуя перехода на другую страницу.
Патент решает проблему неэффективности традиционного поиска медиаконтента (например, видео). В стандартном сценарии пользователю недостаточно статических миниатюр и текста для оценки контента, что вынуждает его переходить на страницу просмотра и возвращаться обратно в выдачу (pogo-sticking). Этот процесс затратен по времени, неэффективно расходует сетевые ресурсы и особенно неудобен на мобильных устройствах. Изобретение призвано улучшить пользовательский опыт, позволяя быстро оценить релевантность контента через динамическое превью прямо в SERP.
Запатентован метод и система отображения результатов поиска медиаконтента на клиентском устройстве. Интерфейс разделен на прокручиваемую область результатов (Scrollable Search Result Area) и зону фокусировки (Focus Area) для показа превью. Ключевым элементом является интеллектуальная система интерпретации жестов пользователя в реальном времени, которая определяет заинтересованность в конкретном результате и динамически обновляет превью в Focus Area без необходимости навигации на другую страницу.
Система функционирует преимущественно на клиентском устройстве:
Focus Area для превью.Высокая. Патент опубликован в 2023 году и описывает механизмы, которые активно используются в современных интерфейсах Google и YouTube, особенно в мобильных приложениях. Автоматическое воспроизведение превью при прокрутке результатов поиска является стандартом UX для медиаконтента, и этот патент детализирует его техническую реализацию, включая персонализацию на основе ML.
Влияние на SEO оценивается как значительное (65/100), особенно для Video SEO (VSEO). Хотя патент не описывает алгоритмы ранжирования, он фундаментально меняет способ взаимодействия пользователя с результатами поиска медиаконтента. Решение о клике теперь основывается на качестве и вовлекающей способности самого превью, а не только на заголовке и миниатюре. Это напрямую влияет на поведенческие сигналы (вовлеченность, CTR) и смещает фокус оптимизации на первые секунды видео.
video trailer), коротким фрагментом (video clip/subsection) или полным видео (the video). Может быть в низком разрешении и без звука.Tap (касание), Swipe (свайп, быстрое движение), Drag (перетаскивание, медленное движение) и Press-and-hold (нажатие и удержание).Claim 1 (Независимый пункт): Описывает основной метод работы системы на клиентском устройстве.
concurrently presented) показаны: (а) прокручиваемая область с результатами и (б) Focus Area с превью одного из результатов.user swipe gesture, вызывающий вертикальное смещение).user selection) второго результата. Ключевой момент: это определение основывается на ранее полученных жестах пользователя (based on previously received user gestures associated with a user).Focus Area, продолжая одновременно отображать прокручиваемую область.Ядром изобретения является не просто показ превью при прокрутке, а интеллектуальная интерпретация жестов (включая свайпы) на основе истории поведения конкретного пользователя (что подразумевает персонализированное машинное обучение) для управления динамическим превью.
Claim 5 (Зависимый от 1): Указывает на адаптивность выбора типа превью.
Тип отображаемого превью (например, трейлер или фрагмент) может основываться на ранее показанном контенте и/или взаимодействиях пользователя с ним. Это подтверждает механизм персонализации показа превью.
Claim 9 (Зависимый от 1): Детализирует механизм интерпретации жестов.
Определение выбора результата основывается как минимум на одном из параметров: скорости движения (speed of movement) ввода или продолжительности времени (duration of time) ввода. Это позволяет различать разные типы жестов.
Изобретение относится к финальным этапам обработки поискового запроса и реализуется на стороне клиента (Client-Side Presentation). Оно не затрагивает этапы CRAWLING, INDEXING или RANKING.
METASEARCH – Метапоиск и Смешивание / RERANKING (Презентационный слой)
На этом этапе формируется структура поисковой выдачи. Система внедряет специализированный пользовательский интерфейс (UI) для медиа-результатов.
Scrollable Area и Focus Area.Gesture Component на клиенте анализирует ввод пользователя в реальном времени, используя Machine Learning Model.Preview Component) для динамического получения видеопотока превью и обновления Focus Area без перезагрузки страницы.Входные данные:
Выходные данные:
Focus Area.CTR и снижая показатель pogo-sticking.speed threshold) и продолжительности (duration threshold) для различения жестов (например, Swipe vs Drag). Эти пороги могут быть адаптированы для конкретного пользователя с помощью машинного обучения.Процесс А: Инициализация UI
Scrollable Search Result Area и Focus Area.Focus Area отображается миниатюра (thumbnail) для первого результата.Focus Area.Процесс Б: Взаимодействие пользователя
Scrollable Search Result Area.Gesture Component анализирует параметры ввода (скорость, продолжительность). Интерпретация учитывает индивидуальные особенности пользователя (на основе исторических данных/ML), чтобы точно определить тип жеста и намерение.Focus Area.Focus Area. Focus Area (возможно одновременное отображение двух превью).Focus Area интерпретируется как намерение посмотреть полный медиаконтент, что инициирует воспроизведение.Патент фокусируется на данных, необходимых для работы интерфейса и интерпретации действий пользователя.
speed of movement), продолжительность касания (duration of time).previously received user gestures) используется для обучения модели интерпретации жестов (Claim 1). История взаимодействий с разными типами превью используется для выбора предпочтительного формата (Claim 5).overlaying) поверх превью.video trailers), фрагменты (video clips). Упоминается возможность использования видео в низком разрешении (low-resolution videos) без звука (without sound) для экономии трафика.user-specific threshold values) с помощью машинного обучения на основе истории пользователя.Focus Area, используется для расчета пропорционального отображения превью (обеспечивает бесшовный переход).predict user interest) на основе жестов и определения предпочтительного типа превью.CTR).Focus Area) меняет требования к контенту. Способность видео захватить внимание в режиме автовоспроизведения становится критически важной.Для SEO-специалистов, работающих с видеоконтентом (VSEO), этот патент имеет прямое практическое применение в оптимизации контента.
Focus Area.without sound), визуальный ряд должен быть самодостаточным. Используйте текст, субтитры или яркие визуальные образы в начале видео, чтобы передать суть контента.Focus Area до загрузки видео-превью (Claim 6). Они должны быть привлекательными и релевантными.Focus Area на мобильном устройстве (мелкий текст, плохая видимость деталей).Патент подтверждает стратегию Google по трансформации SERP из списка ссылок в интерактивную среду потребления контента. Для Video SEO это означает, что конкуренция смещается от борьбы за позицию к борьбе за внимание пользователя непосредственно в выдаче через качество превью. Если контент не может захватить внимание за несколько секунд автовоспроизведения, он теряет трафик. Также подчеркивается глубокая интеграция машинного обучения в UI для персонализации пользовательского опыта на самом базовом уровне взаимодействия.
Сценарий: Оптимизация видеообзора гаджета для мобильной выдачи
Focus Area, необходимо изменить структуру видео для мгновенного захвата внимания.Влияет ли этот патент на алгоритмы ранжирования Google?
Напрямую нет. Патент описывает пользовательский интерфейс (UI/UX) и логику взаимодействия с результатами на клиентском устройстве, а не серверные алгоритмы ранжирования. Однако он может влиять косвенно: если благодаря качественным превью улучшаются поведенческие факторы (пользователи чаще кликают и дольше смотрят видео), это может положительно сказаться на ранжировании контента.
Как система определяет, что показывать в превью: трейлер или фрагмент видео?
Патент указывает, что выбор адаптивен (Claim 5). Система использует машинное обучение, анализируя, как пользователь реагировал на разные типы превью ранее. Например, если пользователь часто пропускает трейлеры, система может предпочесть показать реальный фрагмент видео. Также выбор зависит от типа контента.
Что более важно для VSEO в контексте этого патента: миниатюра (thumbnail) или само превью?
Оба элемента критически важны. Миниатюра может отображаться первой, пока превью загружается (Claim 6), и привлекает первоначальное внимание. Однако, как только превью начинает воспроизводиться в Focus Area, именно оно становится основным фактором для принятия решения о клике. Превью должно удержать внимание, привлеченное миниатюрой.
Что означает использование "истории жестов пользователя" (Claim 1) для интерпретации действий?
Это ключевая часть патента. Система использует машинное обучение для анализа того, как конкретный пользователь взаимодействует с интерфейсом. Она учится различать его индивидуальные паттерны моторики — например, отличить быстрый свайп (прокрутка) от медленного перетаскивания (изучение). Это позволяет системе точнее интерпретировать его намерения.
Как система отличает быструю прокрутку (Swipe) от намеренного выбора результата (Drag)?
Система анализирует параметры жестов, такие как скорость (speed of movement) и продолжительность (duration) (Claim 9). Быстрый свайп интерпретируется как прокрутка. Медленное перетаскивание или остановка интерпретируется как интерес. Пороговые значения для этого различения персонализируются с помощью машинного обучения.
Воспроизводятся ли превью со звуком?
Патент упоминает, что превью могут быть без звука (without sound) и в низком разрешении для экономии трафика и ускорения загрузки. Это означает, что SEO-специалистам необходимо оптимизировать визуальный ряд так, чтобы он был понятен и привлекателен без аудиосопровождения.
Делает ли этот патент кликбейт менее эффективным?
Да, значительно. Поскольку пользователь видит реальное превью контента до клика в Focus Area, несоответствие между кликбейтным заголовком/миниатюрой и содержанием видео станет очевидным сразу. Это может привести к снижению CTR и ухудшению поведенческих сигналов для такого контента.
Как оптимизировать видео под этот механизм?
Ключевая стратегия — оптимизация первых секунд видео (Hook). Они должны быть максимально динамичными, визуально привлекательными и точно отражать тему ролика. Избегайте долгих заставок и неинформативных вступлений. Контент должен мгновенно "продавать" себя через визуальный ряд.
Применяется ли этот механизм только на мобильных устройствах?
Патент в первую очередь сфокусирован на устройствах с сенсорным вводом, описывая интерпретацию жестов (свайпы, касания). Хотя базовый принцип автовоспроизведения может применяться и на десктопах, описанная модель взаимодействия с Focus Area и Scrollable Area наиболее актуальна для смартфонов и планшетов.
Может ли система показывать два превью одновременно?
Да. В патенте описан сценарий (и показан на FIG. 4F), когда во время медленного перетаскивания (Drag) два результата частично перекрывают Focus Area. В этом случае система может отображать соответствующие части превью обоих видео одновременно для обеспечения бесшовного перехода.

Семантика и интент
Мультимедиа
Персонализация

SERP
Поведенческие сигналы

Мультимедиа
Свежесть контента

Персонализация
Поведенческие сигналы
SERP

SERP
Мультимедиа
Семантика и интент

Knowledge Graph
SERP
Семантика и интент

EEAT и качество
Индексация
Семантика и интент

Ссылки
EEAT и качество
Антиспам

Поведенческие сигналы
Ссылки
SERP

SERP
Поведенческие сигналы

Семантика и интент
Индексация
Мультимедиа

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы

Ссылки
SERP
Техническое SEO

Поведенческие сигналы
Ссылки
SERP
