Как Google адаптирует ранжирование контента под частоту посещений пользователя, балансируя между важностью и новизной

Google использует механизм для персонализации лент контента (например, Новости, Discover). Система анализирует, как часто пользователь запрашивает контент. Для частых посетителей приоритет отдается новизне, чтобы избежать повторов. Для редких посетителей приоритет отдается важности контента, чтобы они не пропустили ключевые материалы, даже если они были опубликованы давно.

Описание

Какую задачу решает

Патент решает проблему неоптимального ранжирования контента в агрегированных лентах (например, новостных сайтах, социальных сетях), где стандартная приоритизация основана только на важности и дате публикации. Это приводит к двум проблемам:

Для частых пользователей: Они вынуждены просматривать одни и те же важные, но уже виденные материалы, чтобы найти новый контент.
Для редких пользователей: Они могут пропустить важный контент, так как он вытесняется большим количеством нового, но менее значимого материала.

Изобретение улучшает пользовательский опыт, адаптируя логику ранжирования к индивидуальным паттернам потребления контента.

Что запатентовано

Запатентована система, которая персонализирует приоритизацию контента путем введения фактора Request Frequency Score (или User Frequency Score). Этот показатель рассчитывается на основе того, как часто конкретный пользователь запрашивает контент у сервиса. Система использует эту оценку для динамического изменения весов между Importance Score (важность контента) и Age Score (новизна контента) при расчете финального Priority Score.

Как это работает

Ключевой механизм заключается в адаптивном балансировании весов. Когда пользователь запрашивает контент, система анализирует его историю запросов (Request History) и вычисляет Request Frequency Score.

Если пользователь посещает сервис часто (высокий Frequency Score), система увеличивает вес Age Score. Новизна становится приоритетом, а важность учитывается меньше.
Если пользователь посещает сервис редко (низкий Frequency Score), система увеличивает вес Importance Score. Важность становится приоритетом, а новизна учитывается меньше.

Этот механизм гарантирует, что частые пользователи видят свежий контент, а редкие пользователи — самый важный контент, который они пропустили.

Актуальность для SEO

Высокая. Персонализация и оптимизация контентных лент являются критически важными для вовлечения пользователей. Этот механизм напрямую применим к таким продуктам, как Google Discover, Google News и различным персонализированным фидам. По мере того как Google смещает фокус с традиционного поиска на предиктивное предоставление контента (queryless search), актуальность таких алгоритмов возрастает.

Важность для SEO

Влияние на SEO – среднее-высокое (6.5/10), но сильно зависит от типа площадки. Патент не описывает ранжирование в основном веб-поиске (10 синих ссылок), но критически важен для понимания видимости в Google Discover и Google News. Он показывает, что универсальной стратегии ранжирования в этих лентах не существует; видимость контента зависит от индивидуального поведения пользователя. Это влияет на стратегию публикаций: баланс между своевременным и вечнозеленым контентом, а также важность сигналов вовлеченности (Importance Score).

Детальный разбор

Термины и определения

Age Score (Оценка возраста): Метрика, основанная на времени, прошедшем с момента создания или публикации элемента контента. Рассчитывается как разница между текущим временем и временем публикации.
Content Item (Элемент контента): Любой цифровой контент, предоставляемый сервисом: статья, фото, видео, блог, сообщение, обновление статуса, уведомление и т.д.
Importance Score (Оценка важности): Метрика, определяющая значимость или популярность элемента контента. Рассчитывается на основе различных факторов: темы, ключевых слов, количества просмотров, репостов, социальных одобрений (likes), источника контента.
Priority Score (Оценка приоритета): Финальная оценка, используемая для ранжирования и определения позиции элемента контента в пользовательском интерфейсе. Рассчитывается на основе Age Score, Importance Score и Request Frequency Score.
Request Frequency Score / User Frequency Score (Оценка частоты запросов пользователя): Метрика, указывающая, как часто конкретный пользователь взаимодействует с сервисом или запрашивает контент. Рассчитывается на основе анализа Request History.
Request History (История запросов): Журнал предыдущих взаимодействий пользователя с сервисом, содержащий записи о запросах контента с метками времени (timestamps).

Ключевые утверждения (Анализ Claims)

Патент содержит несколько независимых пунктов (Claim 1, 10, 17), которые описывают базовый механизм с разных сторон (метод, система, носитель).

Claim 1 (Независимый пункт): Описывает метод приоритизации контента.

Система получает запрос на пользовательский интерфейс с контентом.
В ответ извлекается набор элементов контента.
Система определяет, что было получено несколько экземпляров запроса от этого пользователя.
Вычисляется Request Frequency Score, определяющий частоту получения этих запросов.
Определяется, превышает ли Request Frequency Score пороговое значение (threshold value).
Корректируется Priority Score для контента на основе Age Score и Importance Score, при этом:
- Если Frequency Score превышает порог (частый пользователь): Age Score получает больший вес, чем Importance Score.
- Если Frequency Score не превышает порог (редкий пользователь): Importance Score получает больший вес, чем Age Score.
Контент предоставляется пользователю на основе скорректированного Priority Score.

Claim 2 (Зависимый от 1): Детализирует расчет Age Score и Importance Score.

Age Score рассчитывается на основе текущей даты/времени и даты/времени публикации.
Importance Score рассчитывается на основе хотя бы одного из: темы, ключевых слов, количества просмотров, количества репостов, количества социальных одобрений или источника контента.

Claim 3 (Зависимый от 1): Детализирует расчет Request Frequency Score.

Идентифицируются записи в Request History за определенный период времени.
Определяется среднее количество запросов за этот период.
Request Frequency Score рассчитывается на основе этого среднего значения.

Claim 9 (Зависимый от 1): Уточняет эффект высокого Request Frequency Score.

Более высокий Request Frequency Score связан с тем, что Priority Score рассчитывается с меньшим акцентом на Importance Score по отношению к Age Score.

Где и как применяется

Изобретение применяется в системах, где необходимо персонализировать порядок отображения агрегированного контента.

CRAWLING – Сканирование и Сбор данных (Data Acquisition)
На этом этапе система собирает не только сам контент, но и данные о взаимодействии пользователей с сервисом. Каждое посещение пользователя или запрос контента регистрируется в Request History с меткой времени.

INDEXING – Индексирование и извлечение признаков
Для каждого элемента контента предварительно рассчитываются статические сигналы:

Извлекается время публикации для последующего расчета Age Score.
Предварительно рассчитываются или агрегируются сигналы для Importance Score (например, анализ темы, источника).

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента происходит во время ранжирования контента для конкретного пользователя в ответ на его запрос.

Расчет пользовательского контекста: Система анализирует Request History пользователя и вычисляет его текущий Request Frequency Score.
Расчет динамических признаков контента: Вычисляется текущий Age Score и обновляется Importance Score (с учетом новых взаимодействий, просмотров, лайков).
Адаптивное взвешивание и Расчет Priority Score: Система использует Request Frequency Score для определения весовых коэффициентов для Age Score и Importance Score. Затем рассчитывается финальный Priority Score для каждого элемента контента.
Финальная сортировка: Контент сортируется для отображения пользователю.

Входные данные:

Запрос пользователя на контент.
Request History пользователя (метки времени предыдущих запросов).
Набор релевантных элементов контента.
Данные для расчета Importance Score (просмотры, лайки, репосты, источник).
Время публикации контента.

Выходные данные:

Персонализированный, отсортированный список элементов контента (Prioritized list).

На что влияет

Конкретные типы контента: Наибольшее влияние оказывается на контент в лентах, где важен баланс новизны и значимости: новости, статьи, обновления в социальных сетях, блоги. Меньше влияет на контент, где новизна не критична (например, справочная информация) или где важность минимальна.
Специфические запросы: Влияет на запросы без явного интента или запросы на просмотр ленты (например, открытие приложения Google News или ленты Discover). Не применяется к конкретным поисковым запросам, где пользователь ищет определенный факт или документ.
Конкретные ниши или тематики: Сильно влияет на быстро меняющиеся ниши (Breaking News, Технологии, Спорт), где объем нового контента высок.

Когда применяется

Триггеры активации: Алгоритм активируется, когда пользователь запрашивает ленту контента и система имеет достаточную историю его взаимодействий (в патенте указано условие: «Is there more than one entry in the request history?»).
Пороговые значения: Ключевым элементом является сравнение Request Frequency Score с пороговым значением (threshold value). Это порог определяет, будет ли пользователь считаться «частым» или «редким», и соответственно меняет логику взвешивания важности и новизны. Патент также описывает варианты реализации, где изменение весов может быть не бинарным (по порогу), а непрерывным (по формуле).

Пошаговый алгоритм

Процесс приоритизации контента:

Получение запроса: Система получает запрос на элементы контента от пользователя.
Регистрация запроса: В Request History пользователя сохраняется запись о текущем запросе с меткой времени.
Извлечение контента: Система извлекает набор релевантных элементов контента.
Проверка истории: Система проверяет, содержит ли Request History пользователя более одной записи.
- Если НЕТ: Переход к Шагу 8 (Стандартное ранжирование).
- Если ДА: Переход к Шагу 5.
Расчет частоты пользователя: Вычисляется Request Frequency Score на основе записей в Request History (например, среднее количество запросов за период времени).
Расчет метрик контента: Для каждого элемента контента вычисляются Age Score (на основе времени публикации) и Importance Score (на основе сигналов вовлеченности и значимости).
Адаптивный расчет приоритета: Вычисляется Priority Score для каждого элемента контента с использованием Age Score, Importance Score и Request Frequency Score.
- Вариант А (Пороговый, согласно Claims): Сравнение Frequency Score с порогом. Если порог превышен, вес Age Score увеличивается; если нет, вес Importance Score увеличивается.
- Вариант Б (Непрерывный, согласно Description): Использование формул, где Frequency Score напрямую модулирует влияние Age Score (например, используется как экспонента для Age Score).
Стандартное ранжирование (Fallback): Если истории недостаточно, Priority Score рассчитывается только на основе Age Score, Importance Score и других стандартных факторов, без учета частоты пользователя.
Предоставление результатов: Набор элементов контента сортируется по Priority Score и предоставляется пользователю для отображения.

Какие данные и как использует

Данные на входе

Система использует три основных типа данных:

1. Поведенческие факторы (Пользовательские данные):

Request History: Журнал запросов пользователя к сервису.
Timestamps: Метки времени каждого запроса в истории. Критически важны для расчета частоты.

2. Временные факторы (Данные о контенте):

Publication Date/Time: Время создания или публикации контента. Используется для расчета Age Score.

3. Факторы вовлеченности и качества (Данные о контенте):
Эти факторы используются для расчета Importance Score:

Поведенческие (Глобальные): Количество просмотров (views), количество репостов/перепубликаций (republished), количество социальных одобрений (socially endorsed, likes, +1), комментарии и их тональность.
Контентные: Тема (subject) контента, ключевые слова (keywords).
Авторитетность: Источник (source) контента, автор контента (и его связь с пользователем, например, в социальных сетях).

Какие метрики используются и как они считаются

Система вычисляет четыре ключевые метрики:

Request Frequency Score (f(u)): Рассчитывается путем определения среднего количества запросов за определенный период времени на основе Request History. Может использоваться взвешенное среднее, отдающее предпочтение недавней активности.
Age Score (a(c)): Измерение времени, прошедшего с момента публикации. (Текущее время — Время публикации).
Importance Score (i(c)): Агрегированная оценка значимости на основе факторов вовлеченности, контента и авторитетности.
Priority Score: Финальная оценка ранжирования. Патент предлагает несколько вариантов расчета, демонстрирующих взаимодействие метрик.

Примеры формул из патента:

Условные обозначения: i(c) = Importance Score, a(c) = Age Score, f(u) = Request Frequency Score.

Equation 1:

Выводы

Персонализация ранжирования в лентах: Патент подтверждает, что в агрегированных лентах (Google News, Discover) не существует единого ранжирования. Порядок контента динамически адаптируется под индивидуальные паттерны поведения пользователя (частоту посещений).
Динамический баланс Важность vs. Новизна: Ключевой вывод — Google активно управляет балансом между Importance Score и Age Score. Частые пользователи получают приоритет новизны, редкие — приоритет важности.
Importance Score как многофакторная оценка: Importance Score — это не просто авторитетность источника. Он включает сигналы вовлеченности (просмотры, лайки, репосты), контентные сигналы (темы, ключевые слова) и авторитетность источника. Это подчеркивает важность создания контента, который генерирует взаимодействие.
Вариативность реализации: Система может использовать как пороговые значения для переключения логики ранжирования, так и непрерывные математические функции (формулы) для более плавной модуляции весов.
Влияние на жизненный цикл контента: Контент имеет разный «срок жизни» для разных сегментов аудитории. Важный контент может оставаться видимым для редких пользователей значительно дольше, чем для частых.

Практика

Best practices (это мы делаем)

Рекомендации применимы в первую очередь для оптимизации под Google Discover и Google News.

Стимулирование вовлеченности для повышения Importance Score: Создавайте контент, который вызывает реакцию (лайки, шеры, комментарии на разных платформах). Патент явно указывает эти сигналы как компоненты Importance Score. Высокий Importance Score критически важен для охвата редких пользователей.
Сбалансированная стратегия публикаций: Необходимо сочетать высокочастотные обновления (Новости, Тренды) и глубокий, важный контент (Evergreen, Аналитика).
- Новостной контент позволит охватить частых пользователей (приоритет новизны).
- Важный контент позволит дольше оставаться в ленте редких пользователей (приоритет важности).
Оптимизация под пиковую важность: Для ключевых материалов стремитесь максимизировать Importance Score в первые часы/дни после публикации (через дистрибуцию, социальные сети). Это повысит базовый Priority Score для всех сегментов пользователей.
Анализ аудитории по частоте взаимодействия: Если возможно (например, через аналитику сайта или email-рассылок), сегментируйте аудиторию на частых и редких посетителей и анализируйте, какой контент потребляет каждый сегмент. Это поможет лучше понять, как алгоритмы Google могут приоритизировать ваш контент для них.

Worst practices (это делать не надо)

Публикация только новостного контента низкого качества (Низкий Importance Score): Такой контент будет быстро исчезать из ленты. Частые пользователи увидят его один раз, а редкие пользователи могут не увидеть его вовсе, так как он будет вытеснен более важным контентом от конкурентов.
Игнорирование сигналов вовлеченности: Полагаться только на авторитетность бренда или SEO-оптимизацию текста недостаточно. Если контент не генерирует просмотры, лайки и шеры, его Importance Score будет низким, что снизит его видимость, особенно для редких пользователей.
Слишком редкие публикации важного контента: Если публиковать только важный контент, но редко, система может не иметь достаточного количества свежего материала для показа частым пользователям, что снизит общий охват.

Стратегическое значение

Этот патент подчеркивает стратегическую важность персонализации в экосистеме Google, особенно в контексте queryless-поиска (Discover). Для SEO-специалистов это означает необходимость выхода за рамки традиционной оптимизации под ключевые слова и понимания того, как алгоритмы управляют вниманием пользователя. Стратегия должна быть направлена на максимизацию Importance Score через качество и вовлеченность, а также на поддержание оптимального темпа публикаций для охвата разных сегментов аудитории с разной частотой потребления контента.

Практические примеры

Сценарий: Оптимизация видимости статьи в Google Discover

Задача: Максимизировать охват новой аналитической статьи «Будущее электромобилей».

Действия по повышению Importance Score: Сразу после публикации запускается активная дистрибуция: email-рассылка, посты в социальных сетях с призывом к обсуждению, возможно, таргетированная реклама. Цель — быстро набрать просмотры, лайки и шеры.
Ожидаемый результат для редких пользователей: Пользователь, который открывает Discover раз в неделю, имеет низкий Request Frequency Score. Алгоритм применит больший вес к Importance Score. Благодаря активной дистрибуции, статья имеет высокий Importance Score и будет показана этому пользователю вверху ленты, даже если ей уже 3-4 дня.
Ожидаемый результат для частых пользователей: Пользователь, который открывает Discover 5 раз в день, имеет высокий Request Frequency Score. Алгоритм применит больший вес к Age Score (новизне). Он увидит статью в первые часы после публикации. Через день алгоритм, скорее всего, понизит эту статью в его ленте в пользу более свежего контента (даже менее важного), чтобы избежать повторов.

Вопросы и ответы

Описывает ли этот патент ранжирование в основном поиске Google?

Нет, патент не описывает алгоритмы ранжирования для традиционного веб-поиска («10 синих ссылок»). Он фокусируется на приоритизации контента в агрегированных лентах или сервисах, таких как новостные сайты, социальные сети или персонализированные фиды. Наиболее вероятные области применения в экосистеме Google — это Google Discover и Google News.

Что такое Importance Score и как на него повлиять?

Importance Score — это оценка значимости контента. Согласно патенту, он рассчитывается на основе темы, ключевых слов, источника контента и сигналов вовлеченности: количества просмотров, репостов и социальных одобрений (лайков). Чтобы на него повлиять, необходимо создавать качественный контент по актуальным темам и активно стимулировать взаимодействие пользователей с ним через дистрибуцию и социальные сети.

Почему я вижу старые статьи в Google Discover?

Это может быть прямым следствием работы описанного алгоритма. Если вы редко пользуетесь Discover, система определяет ваш Request Frequency Score как низкий. В этом случае алгоритм отдает приоритет Importance Score над Age Score. Система показывает вам самые важные материалы, которые вы пропустили, даже если они были опубликованы несколько дней назад.

Почему мой контент быстро исчезает из лент пользователей?

Это может происходить по двум причинам, связанным с этим патентом. Во-первых, если у контента низкий Importance Score, он быстро вытесняется более важными материалами. Во-вторых, для частых пользователей (высокий Frequency Score) система агрессивно понижает уже виденный или устаревший контент в пользу новизны, чтобы лента оставалась свежей.

Как система определяет, как часто я пользуюсь сервисом?

Система ведет Request History — журнал всех ваших запросов контента с метками времени. Анализируя этот журнал за определенный период (например, за последнюю неделю или месяц), система рассчитывает среднюю частоту ваших посещений. Это значение и есть ваш Request Frequency Score.

Лучше публиковать много новостей или мало, но качественных статей?

Для максимального охвата необходим баланс. Много новостей (свежий контент) позволят охватить частых пользователей, для которых приоритетна новизна. Мало, но качественных статей (высокий Importance Score) позволят охватить редких пользователей, для которых приоритетна важность. Оптимальная стратегия сочетает оба подхода.

Использует ли система бинарное переключение (частый/редкий) или плавную настройку?

Патент описывает оба варианта. В основных пунктах (Claims) описан механизм с использованием порогового значения (threshold value) для переключения весов между важностью и новизной. Однако в описании (Description) приведены формулы, позволяющие осуществлять непрерывную (плавную) модуляцию весов в зависимости от точного значения Request Frequency Score.

Влияет ли E-E-A-T на этот алгоритм?

Патент напрямую не упоминает E-E-A-T, но указывает «источник контента» (source of the content item) как один из факторов для расчета Importance Score. Авторитетность и надежность источника (компоненты E-E-A-T) логично вписываются в оценку важности контента, повышая его базовый Importance Score.

Является ли этот механизм формой персонализации?

Да, это чистая форма поведенческой персонализации. Ранжирование контента адаптируется не под демографические данные или заявленные интересы пользователя, а под его фактические паттерны потребления контента (частоту взаимодействия с сервисом). Два пользователя с одинаковыми интересами увидят разный порядок контента, если один посещает сервис часто, а другой редко.

Что важнее для видимости в Discover: свежесть или вовлеченность?

Оба фактора критически важны, но их относительная важность зависит от сегмента аудитории. Для активной аудитории, часто проверяющей ленту, свежесть (Age Score) имеет больший вес. Для менее активной аудитории вовлеченность и значимость (Importance Score) имеют больший вес. Необходимо оптимизировать оба параметра.