Google использует систему для оптимизации контента на портальных страницах (например, Discover или News). Система рассчитывает «полезность» каждой статьи, комбинируя вероятность клика (CTR) и ожидаемый доход (RPV) или время вовлечения на целевой странице. Цель – максимизировать доход при минимальной потере кликабельности, персонализируя ленту для каждого пользователя.
Описание
Какую задачу решает
Патент решает задачу выбора и упорядочивания контента (например, статей) на персонализированной портальной странице или в ленте рекомендаций (graphical display page). Цель — оптимизировать показ для достижения нескольких, часто конфликтующих, целей: вовлеченности пользователей (User Experience Utility) и монетизации (Economic Utility). Система устраняет проблему, когда максимизация только кликабельности (CTR) приводит к показу кликбейтного, но низкодоходного или некачественного контента, или когда агрессивная максимизация дохода отталкивает пользователей.
Что запатентовано
Запатентована система ранжирования и представления контента на основе функции полезности (Utility Function). Эта функция агрегирует оценку пользовательского опыта (например, прогнозируемый CTR и ожидаемое время на целевой странице) и экономическую ценность (например, прогнозируемый доход от рекламы на целевой странице — RPV). Система использует машинное обучение и данные о пользователе для прогнозирования этих метрик и позволяет динамически настраивать баланс между ними для достижения бизнес-целей.
Как это работает
Система работает следующим образом:
- Сбор данных и Моделирование: Система собирает пул доступных статей и рекламы. ML-модели, обученные на исторических данных, прогнозируют CTR и RPV (или время вовлечения) для каждой статьи для конкретного пользователя, учитывая его характеристики, контент и контекст.
- Расчет полезности: Для каждой статьи вычисляется общая оценка полезности (Utility Score). Используется формула, комбинирующая прогнозируемые метрики с настраиваемым весовым коэффициентом (λ), который определяет баланс между вовлеченностью и доходом.
- Ранжирование и Ограничения: Статьи ранжируются по оценке полезности. Затем применяются бизнес-правила и редакционные ограничения (например, разнообразие контента, обязательные показы).
- Показ: Лучшие статьи отображаются в ленте в виде превью-иконок (preview icons). При наведении курсора может показываться расширенное превью.
Актуальность для SEO
Высокая. Патент описывает фундаментальные механизмы работы современных систем рекомендаций контента, таких как Google Discover и Google News. Управление балансом между вовлеченностью пользователей и доходностью платформы является ключевой задачей для агрегаторов контента и порталов.
Важность для SEO
Влияние на традиционное SEO (веб-поиск) минимальное, так как патент описывает не поиск по запросу, а систему рекомендаций. Однако он имеет критическое значение для издателей и SEO-специалистов, фокусирующихся на трафике из Google Discover и Google News. Патент показывает, что для ранжирования в этих системах важна не только кликабельность заголовка (CTR), но и способность контента генерировать доход для Google (RPV) и/или удерживать пользователя на целевой странице (Downstream Engagement).
Детальный разбор
Термины и определения
- Article (Статья)
- Единица контента, включающая основное содержание (Article Content), превью-иконку (Preview Icon) и, опционально, расширенное превью (Expanded Preview Window).
- Constraint Optimization (Оптимизация с учетом ограничений)
- Модуль, применяющий редакционные или бизнес-правила (например, разнообразие, обязательное размещение) к ранжированному списку контента.
- CTR (Click-Through Rate)
- Кликабельность. В контексте патента — прогнозируемая вероятность того, что пользователь выберет (кликнет) превью статьи.
- Downstream Engagement (Последующее вовлечение)
- Метрики взаимодействия пользователя с контентом после перехода с портальной страницы. Примеры: время, проведенное на целевой странице, количество просмотров страниц за сессию.
- Economic Utility Value (Экономическая полезность)
- Ожидаемая коммерческая ценность показа контента. Обычно рассчитывается как RPV.
- Features (Признаки)
- Атрибуты, используемые для моделирования и прогнозирования. Включают:
- User Features: возраст, пол, местоположение, интересы, история взаимодействий.
- Content Features: тема, ключевые слова, источник, автор.
- Context Features: время суток, тип устройства, размер экрана.
- Graphical Display Page (Страница графического отображения)
- Интерфейс, на котором представляется контент. В патенте используется как синоним веб-портала или ленты рекомендаций (например, Google Discover, Google News).
- Modeling Module (Модуль моделирования)
- Система машинного обучения, которая прогнозирует метрики (CTR, RPV, Downstream Engagement) на основе Features.
- Preview Icon (Превью-иконка)
- Иконка, заголовок или краткое описание статьи в ленте, служащее ссылкой на полный контент.
- RPV (Revenue Per View)
- Доход за просмотр. Ожидаемый доход (обычно от рекламы), который будет получен при показе целевой страницы с контентом.
- User Experience Utility Value (Полезность для пользовательского опыта)
- Оценка качества взаимодействия пользователя с контентом. Рассчитывается на основе CTR и/или Downstream Engagement.
- Utility Function (Функция полезности)
- Формула для расчета общей оценки контента путем комбинирования User Experience Utility и Economic Utility.
- λ (Lambda / Лямбда)
- Весовой коэффициент в функции полезности, определяющий баланс между вовлеченностью и доходом.
Ключевые утверждения (Анализ Claims)
Примечание: Claim 1 в предоставленном документе помечен как «(canceled)». Анализ фокусируется на активных пунктах, начиная с Claim 2.
Claim 2 (Независимый пункт): Описывает основной метод работы системы рекомендаций.
- Система идентифицирует два или более элемента контента для отображения на первой графической странице (портале).
- Система ранжирует каждый элемент контента на основе ДВУХ факторов:
- Вероятности того, что пользователь выберет этот контент на первой странице (CTR).
- Ожидаемого количества времени, которое пользователь проведет на ВТОРОЙ графической странице (целевой странице), на которую ведет ссылка (Downstream Engagement).
- Система предоставляет инструкции для показа превью-иконок для набора элементов с наивысшим рейтингом на первой странице в порядке, основанном на ранжировании.
- Система также описывает UI-взаимодействие: обнаружение наведения курсора на иконку, показ расширенного превью в ответ на наведение, обнаружение взаимодействия (клика) с превью и навигация на вторую страницу.
Ядром изобретения является метод ранжирования, который учитывает не только вероятность клика на рекомендацию, но и прогнозируемое время вовлечения на сайте назначения.
Вариативность реализации (Embodiments):
Хотя Claim 2 фокусируется на CTR и времени вовлечения, детальное описание патента (в частности, описание алгоритма) предлагает альтернативную реализацию функции полезности, где вместо времени вовлечения используется экономическая ценность (RPV):
U(u, aj) = λ * C(u, aj) + (1-λ) * R(u, aj)
Где C – это CTR, R – это RPV, а λ – коэффициент баланса.
Система спроектирована для оптимизации любой комбинации этих метрик (CTR, RPV, Downstream Engagement) в зависимости от бизнес-целей.
Где и как применяется
Этот патент описывает работу автономной системы рекомендаций, которая функционирует параллельно основному веб-поиску. Он применим к таким продуктам, как Google Discover, Google News или New Tab Page в Chrome.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит сбор статей (Article Pool) и рекламы (Ads). Извлекаются Content Features и Ad Parameters (ставки, таргетинг).
MODELING (Офлайн-процесс, не входящий в стандартную архитектуру поиска)
Система анализирует логи действий пользователей (User Actions). На основе этих данных и признаков (User/Content/Context) обучаются ML-модели для прогнозирования CTR, RPV и Downstream Engagement.
RANKING – Ранжирование (В реальном времени)
Когда пользователь загружает страницу рекомендаций:
- Система получает User Features и Context Features.
- Utility Ranking Module использует обученные модели для оценки каждой статьи из пула для данного пользователя.
- Вычисляется Utility Score на основе функции полезности и текущего значения λ.
- Формируется предварительный ранжированный список.
RERANKING – Переранжирование (В реальном времени)
Constraint Optimization модуль применяет бизнес-правила и редакционные ограничения к ранжированному списку (например, обеспечивает разнообразие тем или источников, гарантирует показ определенной статьи).
Входные данные:
- Запрос пользователя на отображение страницы.
- User Features, Context Features.
- Пул доступных статей (Article Pool) и их Content Features.
- Пул рекламы и их параметры.
- Обученные ML-модели.
- Бизнес-настройки (значение λ, ограничения).
Выходные данные:
- Финальный ранжированный список превью-иконок для показа пользователю.
На что влияет
- Типы контента: Влияет на все типы контента, которые могут быть представлены в ленте рекомендаций (статьи, новости, видео, возможно, товары).
- Специфические запросы: Не применимо к поиску по запросам. Применимо к просмотру контента на основе интересов (queryless search).
- Ниши и тематики: Влияет на все ниши. Баланс λ может меняться в зависимости от тематики (например, в YMYL может быть выше вес у вовлеченности/качества, чем у дохода).
Когда применяется
- Условия работы: Алгоритм применяется при каждой загрузке или обновлении пользователем страницы рекомендаций (портала).
- Триггеры активации: Запрос на рендеринг страницы.
Пошаговый алгоритм
Процесс ранжирования контента в реальном времени:
- Получение запроса: Пользователь посещает страницу рекомендаций, инициируя запрос на ранжирование.
- Получение пула контента: Система извлекает доступный пул статей (Article Pool) из хранилища.
- Извлечение признаков: Система получает User Features (идентифицируя пользователя или используя общие данные, например, IP), Content Features для статей в пуле и Context Features (время, устройство).
- Получение бизнес-настроек: Извлекаются текущие критерии оптимизации (значение λ) и бизнес-правила/ограничения (Constraints).
- Получение моделей: Загружаются актуальные ML-модели для прогнозирования CTR, RPV и/или Downstream Engagement.
- Расчет прогнозов: Модели применяются к признакам для прогнозирования метрик (C и R) для каждой пары (пользователь, статья).
- Расчет полезности: Для каждой статьи вычисляется Utility Score (U) по формуле: U = λ * C + (1-λ) * R.
- Ранжирование: Статьи сортируются по убыванию Utility Score.
- Применение ограничений: Constraint Optimization модуль корректирует список для удовлетворения бизнес-правил (разнообразие, обязательные показы).
- Показ контента: Лучшие N статей выбираются и отображаются пользователю в виде превью-иконок.
Какие данные и как использует
Данные на входе
Система использует широкий спектр данных для моделирования и ранжирования:
- Пользовательские факторы (User Features): Демографические данные (возраст, пол), местоположение, явно указанные интересы, история взаимодействий с контентом (клики, время просмотра), история поиска.
- Контентные факторы (Content Features): Тема статьи, ключевые слова, источник (домен), автор, дата публикации, тип контента (текст, видео).
- Контекстные факторы (Context Features): Время суток, день недели, тип устройства пользователя (мобильный/десктоп), размер экрана, тип сети.
- Экономические факторы (Ad Parameters): Данные о рекламе, которая может быть показана на целевой странице, и ее коммерческая ценность (ставки рекламодателей, CPC, CPM).
- Поведенческие факторы (User Actions): Логи взаимодействий пользователей с лентой (показы, клики, наведения курсора) и с целевыми страницами (время на сайте, глубина просмотра). Эти данные используются для обучения моделей.
Какие метрики используются и как они считаются
- CTR (Click-Through Rate): Прогнозируемая вероятность клика пользователя на превью статьи. Рассчитывается ML-моделью на основе признаков. Является компонентом User Experience Utility.
- RPV (Revenue Per View): Прогнозируемый доход от показа целевой страницы (в основном от рекламы). Рассчитывается ML-моделью с учетом потенциальных рекламных показов и их ставок. Является компонентом Economic Utility.
- Downstream Engagement: Прогнозируемое время, которое пользователь проведет на целевой странице, или количество просмотренных страниц. Рассчитывается ML-моделью. Является альтернативным или дополнительным компонентом User Experience Utility.
- Utility Score (U): Общая оценка полезности статьи. Рассчитывается как взвешенная сумма прогнозируемых метрик.
- λ (Lambda): Весовой коэффициент, устанавливаемый бизнес-менеджерами. Определяет баланс между метриками. Например, высокое значение λ (близкое к 1) оптимизирует выдачу для максимизации CTR, низкое (близкое к 0) — для максимизации RPV.
Выводы
- Ранжирование в рекомендациях принципиально отличается от веб-поиска: Система оптимизирует показ контента на основе интересов пользователя и бизнес-целей платформы, а не релевантности запросу.
- Баланс между вовлеченностью и доходом: Ключевой механизм патента — функция полезности с коэффициентом λ. Google может динамически управлять лентой, жертвуя небольшой долей кликабельности (CTR) ради значительного увеличения дохода (RPV), и наоборот.
- Критическая важность событий после клика: Система оценивает не только привлекательность превью (CTR), но и то, что происходит на целевой странице. Учитывается как экономическая ценность (RPV), так и качество взаимодействия (Downstream Engagement — время на сайте).
- Персонализация как основа ранжирования: User Features являются ключевым входом для ML-моделей. Ранжирование глубоко персонализировано для каждой пары пользователь-контент.
- Внешний контроль над алгоритмом: Патент явно предусматривает интерфейсы для ручного управления: бизнес-менеджеры настраивают приоритеты оптимизации (λ), а редакторы могут применять ограничения (Constraints), переопределяя алгоритмическое ранжирование.
Практика
Best practices (это мы делаем)
Рекомендации направлены на оптимизацию под Google Discover и Google News.
- Оптимизация кликабельности превью (CTR): Работайте над привлекательными, но честными заголовками и качественными, релевантными изображениями (Preview Icons). Это первый компонент функции полезности.
- Максимизация вовлечения на целевой странице (Downstream Engagement): Это второй ключевой компонент (особенно согласно Claim 2). Улучшайте качество контента, скорость загрузки и удобство чтения, чтобы увеличить время пребывания пользователя на странице.
- Увеличение глубины просмотра: Используйте качественную внутреннюю перелинковку и блоки похожих статей, чтобы стимулировать дальнейшую навигацию по сайту. Это улучшает метрики Downstream Engagement.
- Оптимизация монетизации (RPV): Патент указывает, что ожидаемый доход Google (RPV) является фактором ранжирования. Сайты, которые обеспечивают хороший доход для Google (например, через AdSense/Ad Manager) при сохранении хорошего UX, могут иметь преимущество. Необходимо балансировать количество рекламы и скорость загрузки.
- Фокус на тематическую авторитетность и интересы: Создавайте контент, который соответствует интересам вашей аудитории. Система использует User Features (интересы) для персонализации, поэтому важно быть признанным источником в определенной нише.
Worst practices (это делать не надо)
- Кликбейт без удержания: Использование обманчивых заголовков для повышения CTR неэффективно в долгосрочной перспективе. Если время на сайте (Downstream Engagement) низкое, общая полезность (Utility Score) будет снижена.
- Медленные страницы с агрессивной рекламой: Перегрузка страниц рекламой может увеличить RPV в краткосрочной перспективе, но снизит Downstream Engagement и CTR из-за плохого пользовательского опыта, что приведет к пессимизации.
- Игнорирование технических аспектов и скорости: Технические проблемы снижают Downstream Engagement, что напрямую влияет на ранжирование согласно патенту.
Стратегическое значение
Патент подтверждает, что Google Discover и Google News — это не просто источники новостей, а платформы для вовлечения и монетизации. Для успеха в этих системах необходимо удовлетворять как потребности пользователя (обеспечивая высокое вовлечение), так и бизнес-цели Google (обеспечивая доходность). Стратегия должна фокусироваться на создании качественного, привлекательного контента, который способен удерживать аудиторию и эффективно монетизироваться без ущерба для UX.
Практические примеры
Сценарий: Оптимизация статьи для Google Discover
- Задача: Увеличить охват статьи о новом смартфоне в Discover.
- Действия по патенту:
- Оптимизация CTR: Выбрать яркое, уникальное изображение высокого разрешения для превью. Создать интригующий, но релевантный заголовок (например, «7 скрытых функций нового смартфона X, о которых не сказали на презентации»).
- Оптимизация Downstream Engagement: Убедиться, что страница загружается мгновенно (оптимизация Core Web Vitals). Структурировать статью для легкого чтения (списки, подзаголовки). Добавить качественное видео по теме. Разместить ссылки на сравнение с конкурентами и обзоры аксессуаров для увеличения глубины просмотра.
- Оптимизация RPV: Настроить рекламные блоки так, чтобы они были видимыми (high viewability), но не мешали чтению (например, избегать interstitial ads при входе). Это обеспечивает доход без снижения вовлеченности.
- Ожидаемый результат: Система прогнозирует высокий CTR за счет превью и высокий Downstream Engagement/RPV за счет качества страницы. Общий Utility Score увеличивается, что приводит к более высокому ранжированию и большему охвату в Discover.
Вопросы и ответы
Описывает ли этот патент алгоритмы ранжирования в основном веб-поиске Google?
Нет. Патент сфокусирован на системах представления контента на «портальных страницах» или в лентах рекомендаций, таких как Google Discover или Google News. Описанные механизмы (баланс CTR и RPV/Вовлеченности) не применяются для ранжирования результатов в ответ на конкретный поисковый запрос в традиционном поиске.
Что такое RPV (Revenue Per View) и почему это важно для моего сайта?
RPV — это прогнозируемый доход за просмотр страницы. Это важно, потому что Google учитывает ожидаемый доход при ранжировании контента в рекомендательных системах. Если ваш контент позволяет Google хорошо зарабатывать (например, через рекламу на вашем сайте), сохраняя при этом хорошее вовлечение, он может получить более высокие позиции в Discover/News.
Как система определяет «Downstream Engagement» (Последующее вовлечение)?
Патент определяет это как метрики взаимодействия после клика на превью. Ключевые показатели — это ожидаемое время, проведенное пользователем на целевой странице (явно указано в Claim 2), и количество просмотров страниц за сессию. Система использует ML-модели для прогнозирования этих показателей на основе исторических данных.
Что важнее для попадания в Google Discover: высокий CTR или долгое время на сайте?
Важны оба показателя. Система рассчитывает общую полезность (Utility Score), комбинируя их. Однако баланс между ними может меняться с помощью коэффициента λ. Если Google решит максимизировать вовлечение, время на сайте будет важнее. Если максимизировать клики — CTR будет важнее.
Может ли Google намеренно понизить мой CTR, чтобы заработать больше денег?
Да, механизм, описанный в патенте, позволяет это делать. Система может предпочесть показать статью с чуть более низким прогнозируемым CTR, если ее прогнозируемый RPV значительно выше. Графики в патенте показывают, что система стремится найти оптимальный баланс, например, потерять 1-2% CTR ради 20% прироста дохода.
Как на практике улучшить «Downstream Engagement» для SEO?
Необходимо фокусироваться на качестве контента и пользовательском опыте. Это включает быструю загрузку страниц (Core Web Vitals), удобство чтения на мобильных устройствах, наличие полезного и интересного контента, который удерживает внимание, а также использование внутренней перелинковки для увеличения глубины просмотра.
Что такое коэффициент λ (Лямбда) и могу ли я на него повлиять?
λ — это весовой коэффициент, который определяет баланс между вовлеченностью и доходом в функции полезности. Он устанавливается внутренними бизнес-менеджерами Google в зависимости от текущих целей компании. SEO-специалисты не могут напрямую влиять на значение λ, но должны понимать его существование и оптимизировать свои сайты под обе составляющие (вовлеченность и доходность).
Учитывает ли система качество сайта или источника?
Патент напрямую не упоминает Site Quality Score, но он использует Content Features, которые включают источник (source) контента. Эти признаки используются ML-моделями для прогнозирования CTR и вовлеченности. Авторитетные источники, как правило, имеют лучшие поведенческие метрики, что косвенно учитывается системой.
Что такое «Constraint Optimization» и как это влияет на выдачу?
Это модуль, который применяет правила поверх алгоритмического ранжирования. Он позволяет редакторам или бизнес-правилам гарантировать показ определенной статьи, ограничить показ другой или обеспечить разнообразие (variety constraint) тем и источников в ленте, даже если это снижает общую прогнозируемую полезность.
Эффективен ли кликбейт в свете этого патента?
Кликбейт, направленный только на получение клика (высокий CTR), но не обеспечивающий удержания пользователя на странице (низкий Downstream Engagement), будет неэффективен. Система обнаружит низкое время вовлечения и понизит общий Utility Score такого контента.