Как Google оптимизирует показ контента в лентах рекомендаций (Discover, News), балансируя кликабельность (CTR) и доходность (RPV)

Google использует систему для оптимизации контента на портальных страницах (например, Discover или News). Система рассчитывает «полезность» каждой статьи, комбинируя вероятность клика (CTR) и ожидаемый доход (RPV) или время вовлечения на целевой странице. Цель – максимизировать доход при минимальной потере кликабельности, персонализируя ленту для каждого пользователя.

Описание

Какую задачу решает

Патент решает задачу выбора и упорядочивания контента (например, статей) на персонализированной портальной странице или в ленте рекомендаций (graphical display page). Цель — оптимизировать показ для достижения нескольких, часто конфликтующих, целей: вовлеченности пользователей (User Experience Utility) и монетизации (Economic Utility). Система устраняет проблему, когда максимизация только кликабельности (CTR) приводит к показу кликбейтного, но низкодоходного или некачественного контента, или когда агрессивная максимизация дохода отталкивает пользователей.

Что запатентовано

Запатентована система ранжирования и представления контента на основе функции полезности (Utility Function). Эта функция агрегирует оценку пользовательского опыта (например, прогнозируемый CTR и ожидаемое время на целевой странице) и экономическую ценность (например, прогнозируемый доход от рекламы на целевой странице — RPV). Система использует машинное обучение и данные о пользователе для прогнозирования этих метрик и позволяет динамически настраивать баланс между ними для достижения бизнес-целей.

Как это работает

Система работает следующим образом:

Сбор данных и Моделирование: Система собирает пул доступных статей и рекламы. ML-модели, обученные на исторических данных, прогнозируют CTR и RPV (или время вовлечения) для каждой статьи для конкретного пользователя, учитывая его характеристики, контент и контекст.
Расчет полезности: Для каждой статьи вычисляется общая оценка полезности (Utility Score). Используется формула, комбинирующая прогнозируемые метрики с настраиваемым весовым коэффициентом (λ), который определяет баланс между вовлеченностью и доходом.
Ранжирование и Ограничения: Статьи ранжируются по оценке полезности. Затем применяются бизнес-правила и редакционные ограничения (например, разнообразие контента, обязательные показы).
Показ: Лучшие статьи отображаются в ленте в виде превью-иконок (preview icons). При наведении курсора может показываться расширенное превью.

Актуальность для SEO

Высокая. Патент описывает фундаментальные механизмы работы современных систем рекомендаций контента, таких как Google Discover и Google News. Управление балансом между вовлеченностью пользователей и доходностью платформы является ключевой задачей для агрегаторов контента и порталов.

Важность для SEO

Влияние на традиционное SEO (веб-поиск) минимальное, так как патент описывает не поиск по запросу, а систему рекомендаций. Однако он имеет критическое значение для издателей и SEO-специалистов, фокусирующихся на трафике из Google Discover и Google News. Патент показывает, что для ранжирования в этих системах важна не только кликабельность заголовка (CTR), но и способность контента генерировать доход для Google (RPV) и/или удерживать пользователя на целевой странице (Downstream Engagement).

Детальный разбор

Термины и определения

Article (Статья)

Единица контента, включающая основное содержание (Article Content), превью-иконку (Preview Icon) и, опционально, расширенное превью (Expanded Preview Window).

Constraint Optimization (Оптимизация с учетом ограничений)

Модуль, применяющий редакционные или бизнес-правила (например, разнообразие, обязательное размещение) к ранжированному списку контента.

CTR (Click-Through Rate)

Кликабельность. В контексте патента — прогнозируемая вероятность того, что пользователь выберет (кликнет) превью статьи.

Downstream Engagement (Последующее вовлечение)

Метрики взаимодействия пользователя с контентом после перехода с портальной страницы. Примеры: время, проведенное на целевой странице, количество просмотров страниц за сессию.

Economic Utility Value (Экономическая полезность)

Ожидаемая коммерческая ценность показа контента. Обычно рассчитывается как RPV.

Features (Признаки)

Атрибуты, используемые для моделирования и прогнозирования. Включают:

User Features: возраст, пол, местоположение, интересы, история взаимодействий.
Content Features: тема, ключевые слова, источник, автор.
Context Features: время суток, тип устройства, размер экрана.

Graphical Display Page (Страница графического отображения)

Интерфейс, на котором представляется контент. В патенте используется как синоним веб-портала или ленты рекомендаций (например, Google Discover, Google News).

Modeling Module (Модуль моделирования)

Система машинного обучения, которая прогнозирует метрики (CTR, RPV, Downstream Engagement) на основе Features.

Preview Icon (Превью-иконка)

Иконка, заголовок или краткое описание статьи в ленте, служащее ссылкой на полный контент.

RPV (Revenue Per View)

Доход за просмотр. Ожидаемый доход (обычно от рекламы), который будет получен при показе целевой страницы с контентом.

User Experience Utility Value (Полезность для пользовательского опыта)

Оценка качества взаимодействия пользователя с контентом. Рассчитывается на основе CTR и/или Downstream Engagement.

Utility Function (Функция полезности)

Формула для расчета общей оценки контента путем комбинирования User Experience Utility и Economic Utility.

λ (Lambda / Лямбда)

Весовой коэффициент в функции полезности, определяющий баланс между вовлеченностью и доходом.

Ключевые утверждения (Анализ Claims)

Примечание: Claim 1 в предоставленном документе помечен как «(canceled)». Анализ фокусируется на активных пунктах, начиная с Claim 2.

Claim 2 (Независимый пункт): Описывает основной метод работы системы рекомендаций.

Система идентифицирует два или более элемента контента для отображения на первой графической странице (портале).
Система ранжирует каждый элемент контента на основе ДВУХ факторов:
1. Вероятности того, что пользователь выберет этот контент на первой странице (CTR).
2. Ожидаемого количества времени, которое пользователь проведет на ВТОРОЙ графической странице (целевой странице), на которую ведет ссылка (Downstream Engagement).
Система предоставляет инструкции для показа превью-иконок для набора элементов с наивысшим рейтингом на первой странице в порядке, основанном на ранжировании.
Система также описывает UI-взаимодействие: обнаружение наведения курсора на иконку, показ расширенного превью в ответ на наведение, обнаружение взаимодействия (клика) с превью и навигация на вторую страницу.

Ядром изобретения является метод ранжирования, который учитывает не только вероятность клика на рекомендацию, но и прогнозируемое время вовлечения на сайте назначения.

Вариативность реализации (Embodiments):

Хотя Claim 2 фокусируется на CTR и времени вовлечения, детальное описание патента (в частности, описание алгоритма) предлагает альтернативную реализацию функции полезности, где вместо времени вовлечения используется экономическая ценность (RPV):

U(u, aj) = λ * C(u, aj) + (1-λ) * R(u, aj)

Где C – это CTR, R – это RPV, а λ – коэффициент баланса.

Система спроектирована для оптимизации любой комбинации этих метрик (CTR, RPV, Downstream Engagement) в зависимости от бизнес-целей.

Где и как применяется

Этот патент описывает работу автономной системы рекомендаций, которая функционирует параллельно основному веб-поиску. Он применим к таким продуктам, как Google Discover, Google News или New Tab Page в Chrome.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит сбор статей (Article Pool) и рекламы (Ads). Извлекаются Content Features и Ad Parameters (ставки, таргетинг).

MODELING (Офлайн-процесс, не входящий в стандартную архитектуру поиска)
Система анализирует логи действий пользователей (User Actions). На основе этих данных и признаков (User/Content/Context) обучаются ML-модели для прогнозирования CTR, RPV и Downstream Engagement.

RANKING – Ранжирование (В реальном времени)
Когда пользователь загружает страницу рекомендаций:

Система получает User Features и Context Features.
Utility Ranking Module использует обученные модели для оценки каждой статьи из пула для данного пользователя.
Вычисляется Utility Score на основе функции полезности и текущего значения λ.
Формируется предварительный ранжированный список.

RERANKING – Переранжирование (В реальном времени)
Constraint Optimization модуль применяет бизнес-правила и редакционные ограничения к ранжированному списку (например, обеспечивает разнообразие тем или источников, гарантирует показ определенной статьи).

Входные данные:

Запрос пользователя на отображение страницы.
User Features, Context Features.
Пул доступных статей (Article Pool) и их Content Features.
Пул рекламы и их параметры.
Обученные ML-модели.
Бизнес-настройки (значение λ, ограничения).

Выходные данные:

Финальный ранжированный список превью-иконок для показа пользователю.

На что влияет

Типы контента: Влияет на все типы контента, которые могут быть представлены в ленте рекомендаций (статьи, новости, видео, возможно, товары).
Специфические запросы: Не применимо к поиску по запросам. Применимо к просмотру контента на основе интересов (queryless search).
Ниши и тематики: Влияет на все ниши. Баланс λ может меняться в зависимости от тематики (например, в YMYL может быть выше вес у вовлеченности/качества, чем у дохода).

Когда применяется

Условия работы: Алгоритм применяется при каждой загрузке или обновлении пользователем страницы рекомендаций (портала).
Триггеры активации: Запрос на рендеринг страницы.

Пошаговый алгоритм

Процесс ранжирования контента в реальном времени:

Получение запроса: Пользователь посещает страницу рекомендаций, инициируя запрос на ранжирование.
Получение пула контента: Система извлекает доступный пул статей (Article Pool) из хранилища.
Извлечение признаков: Система получает User Features (идентифицируя пользователя или используя общие данные, например, IP), Content Features для статей в пуле и Context Features (время, устройство).
Получение бизнес-настроек: Извлекаются текущие критерии оптимизации (значение λ) и бизнес-правила/ограничения (Constraints).
Получение моделей: Загружаются актуальные ML-модели для прогнозирования CTR, RPV и/или Downstream Engagement.
Расчет прогнозов: Модели применяются к признакам для прогнозирования метрик (C и R) для каждой пары (пользователь, статья).
Расчет полезности: Для каждой статьи вычисляется Utility Score (U) по формуле: U = λ * C + (1-λ) * R.
Ранжирование: Статьи сортируются по убыванию Utility Score.
Применение ограничений: Constraint Optimization модуль корректирует список для удовлетворения бизнес-правил (разнообразие, обязательные показы).
Показ контента: Лучшие N статей выбираются и отображаются пользователю в виде превью-иконок.

Какие данные и как использует

Данные на входе

Система использует широкий спектр данных для моделирования и ранжирования:

Пользовательские факторы (User Features): Демографические данные (возраст, пол), местоположение, явно указанные интересы, история взаимодействий с контентом (клики, время просмотра), история поиска.
Контентные факторы (Content Features): Тема статьи, ключевые слова, источник (домен), автор, дата публикации, тип контента (текст, видео).
Контекстные факторы (Context Features): Время суток, день недели, тип устройства пользователя (мобильный/десктоп), размер экрана, тип сети.
Экономические факторы (Ad Parameters): Данные о рекламе, которая может быть показана на целевой странице, и ее коммерческая ценность (ставки рекламодателей, CPC, CPM).
Поведенческие факторы (User Actions): Логи взаимодействий пользователей с лентой (показы, клики, наведения курсора) и с целевыми страницами (время на сайте, глубина просмотра). Эти данные используются для обучения моделей.

Какие метрики используются и как они считаются

CTR (Click-Through Rate): Прогнозируемая вероятность клика пользователя на превью статьи. Рассчитывается ML-моделью на основе признаков. Является компонентом User Experience Utility.
RPV (Revenue Per View): Прогнозируемый доход от показа целевой страницы (в основном от рекламы). Рассчитывается ML-моделью с учетом потенциальных рекламных показов и их ставок. Является компонентом Economic Utility.
Downstream Engagement: Прогнозируемое время, которое пользователь проведет на целевой странице, или количество просмотренных страниц. Рассчитывается ML-моделью. Является альтернативным или дополнительным компонентом User Experience Utility.
Utility Score (U): Общая оценка полезности статьи. Рассчитывается как взвешенная сумма прогнозируемых метрик.
λ (Lambda): Весовой коэффициент, устанавливаемый бизнес-менеджерами. Определяет баланс между метриками. Например, высокое значение λ (близкое к 1) оптимизирует выдачу для максимизации CTR, низкое (близкое к 0) — для максимизации RPV.

Выводы

Ранжирование в рекомендациях принципиально отличается от веб-поиска: Система оптимизирует показ контента на основе интересов пользователя и бизнес-целей платформы, а не релевантности запросу.
Баланс между вовлеченностью и доходом: Ключевой механизм патента — функция полезности с коэффициентом λ. Google может динамически управлять лентой, жертвуя небольшой долей кликабельности (CTR) ради значительного увеличения дохода (RPV), и наоборот.
Критическая важность событий после клика: Система оценивает не только привлекательность превью (CTR), но и то, что происходит на целевой странице. Учитывается как экономическая ценность (RPV), так и качество взаимодействия (Downstream Engagement — время на сайте).
Персонализация как основа ранжирования: User Features являются ключевым входом для ML-моделей. Ранжирование глубоко персонализировано для каждой пары пользователь-контент.
Внешний контроль над алгоритмом: Патент явно предусматривает интерфейсы для ручного управления: бизнес-менеджеры настраивают приоритеты оптимизации (λ), а редакторы могут применять ограничения (Constraints), переопределяя алгоритмическое ранжирование.

Практика

Best practices (это мы делаем)

Рекомендации направлены на оптимизацию под Google Discover и Google News.

Оптимизация кликабельности превью (CTR): Работайте над привлекательными, но честными заголовками и качественными, релевантными изображениями (Preview Icons). Это первый компонент функции полезности.
Максимизация вовлечения на целевой странице (Downstream Engagement): Это второй ключевой компонент (особенно согласно Claim 2). Улучшайте качество контента, скорость загрузки и удобство чтения, чтобы увеличить время пребывания пользователя на странице.
Увеличение глубины просмотра: Используйте качественную внутреннюю перелинковку и блоки похожих статей, чтобы стимулировать дальнейшую навигацию по сайту. Это улучшает метрики Downstream Engagement.
Оптимизация монетизации (RPV): Патент указывает, что ожидаемый доход Google (RPV) является фактором ранжирования. Сайты, которые обеспечивают хороший доход для Google (например, через AdSense/Ad Manager) при сохранении хорошего UX, могут иметь преимущество. Необходимо балансировать количество рекламы и скорость загрузки.
Фокус на тематическую авторитетность и интересы: Создавайте контент, который соответствует интересам вашей аудитории. Система использует User Features (интересы) для персонализации, поэтому важно быть признанным источником в определенной нише.

Worst practices (это делать не надо)

Кликбейт без удержания: Использование обманчивых заголовков для повышения CTR неэффективно в долгосрочной перспективе. Если время на сайте (Downstream Engagement) низкое, общая полезность (Utility Score) будет снижена.
Медленные страницы с агрессивной рекламой: Перегрузка страниц рекламой может увеличить RPV в краткосрочной перспективе, но снизит Downstream Engagement и CTR из-за плохого пользовательского опыта, что приведет к пессимизации.
Игнорирование технических аспектов и скорости: Технические проблемы снижают Downstream Engagement, что напрямую влияет на ранжирование согласно патенту.

Стратегическое значение

Патент подтверждает, что Google Discover и Google News — это не просто источники новостей, а платформы для вовлечения и монетизации. Для успеха в этих системах необходимо удовлетворять как потребности пользователя (обеспечивая высокое вовлечение), так и бизнес-цели Google (обеспечивая доходность). Стратегия должна фокусироваться на создании качественного, привлекательного контента, который способен удерживать аудиторию и эффективно монетизироваться без ущерба для UX.

Практические примеры

Сценарий: Оптимизация статьи для Google Discover

Задача: Увеличить охват статьи о новом смартфоне в Discover.
Действия по патенту:
- Оптимизация CTR: Выбрать яркое, уникальное изображение высокого разрешения для превью. Создать интригующий, но релевантный заголовок (например, «7 скрытых функций нового смартфона X, о которых не сказали на презентации»).
- Оптимизация Downstream Engagement: Убедиться, что страница загружается мгновенно (оптимизация Core Web Vitals). Структурировать статью для легкого чтения (списки, подзаголовки). Добавить качественное видео по теме. Разместить ссылки на сравнение с конкурентами и обзоры аксессуаров для увеличения глубины просмотра.
- Оптимизация RPV: Настроить рекламные блоки так, чтобы они были видимыми (high viewability), но не мешали чтению (например, избегать interstitial ads при входе). Это обеспечивает доход без снижения вовлеченности.
Ожидаемый результат: Система прогнозирует высокий CTR за счет превью и высокий Downstream Engagement/RPV за счет качества страницы. Общий Utility Score увеличивается, что приводит к более высокому ранжированию и большему охвату в Discover.

Вопросы и ответы

Описывает ли этот патент алгоритмы ранжирования в основном веб-поиске Google?

Нет. Патент сфокусирован на системах представления контента на «портальных страницах» или в лентах рекомендаций, таких как Google Discover или Google News. Описанные механизмы (баланс CTR и RPV/Вовлеченности) не применяются для ранжирования результатов в ответ на конкретный поисковый запрос в традиционном поиске.

Что такое RPV (Revenue Per View) и почему это важно для моего сайта?

RPV — это прогнозируемый доход за просмотр страницы. Это важно, потому что Google учитывает ожидаемый доход при ранжировании контента в рекомендательных системах. Если ваш контент позволяет Google хорошо зарабатывать (например, через рекламу на вашем сайте), сохраняя при этом хорошее вовлечение, он может получить более высокие позиции в Discover/News.

Как система определяет «Downstream Engagement» (Последующее вовлечение)?

Патент определяет это как метрики взаимодействия после клика на превью. Ключевые показатели — это ожидаемое время, проведенное пользователем на целевой странице (явно указано в Claim 2), и количество просмотров страниц за сессию. Система использует ML-модели для прогнозирования этих показателей на основе исторических данных.

Что важнее для попадания в Google Discover: высокий CTR или долгое время на сайте?

Важны оба показателя. Система рассчитывает общую полезность (Utility Score), комбинируя их. Однако баланс между ними может меняться с помощью коэффициента λ. Если Google решит максимизировать вовлечение, время на сайте будет важнее. Если максимизировать клики — CTR будет важнее.

Может ли Google намеренно понизить мой CTR, чтобы заработать больше денег?

Да, механизм, описанный в патенте, позволяет это делать. Система может предпочесть показать статью с чуть более низким прогнозируемым CTR, если ее прогнозируемый RPV значительно выше. Графики в патенте показывают, что система стремится найти оптимальный баланс, например, потерять 1-2% CTR ради 20% прироста дохода.

Как на практике улучшить «Downstream Engagement» для SEO?

Необходимо фокусироваться на качестве контента и пользовательском опыте. Это включает быструю загрузку страниц (Core Web Vitals), удобство чтения на мобильных устройствах, наличие полезного и интересного контента, который удерживает внимание, а также использование внутренней перелинковки для увеличения глубины просмотра.

Что такое коэффициент λ (Лямбда) и могу ли я на него повлиять?

λ — это весовой коэффициент, который определяет баланс между вовлеченностью и доходом в функции полезности. Он устанавливается внутренними бизнес-менеджерами Google в зависимости от текущих целей компании. SEO-специалисты не могут напрямую влиять на значение λ, но должны понимать его существование и оптимизировать свои сайты под обе составляющие (вовлеченность и доходность).

Учитывает ли система качество сайта или источника?

Патент напрямую не упоминает Site Quality Score, но он использует Content Features, которые включают источник (source) контента. Эти признаки используются ML-моделями для прогнозирования CTR и вовлеченности. Авторитетные источники, как правило, имеют лучшие поведенческие метрики, что косвенно учитывается системой.

Что такое «Constraint Optimization» и как это влияет на выдачу?

Это модуль, который применяет правила поверх алгоритмического ранжирования. Он позволяет редакторам или бизнес-правилам гарантировать показ определенной статьи, ограничить показ другой или обеспечить разнообразие (variety constraint) тем и источников в ленте, даже если это снижает общую прогнозируемую полезность.

Эффективен ли кликбейт в свете этого патента?

Кликбейт, направленный только на получение клика (высокий CTR), но не обеспечивающий удержания пользователя на странице (низкий Downstream Engagement), будет неэффективен. Система обнаружит низкое время вовлечения и понизит общий Utility Score такого контента.