Как Google адаптирует ранжирование контента под частоту посещений пользователя, балансируя между важностью и новизной

PRIORITIZING CONTENT BASED ON USER FREQUENCY (Приоритизация контента на основе частоты взаимодействия пользователя)

US9477376B1
Google LLC
2012-12-19
2016-10-25

Google использует механизм для персонализации лент контента (например, Новости, Discover). Система анализирует, как часто пользователь запрашивает контент. Для частых посетителей приоритет отдается новизне, чтобы избежать повторов. Для редких посетителей приоритет отдается важности контента, чтобы они не пропустили ключевые материалы, даже если они были опубликованы давно.

Какую проблему решает

Патент решает проблему неоптимального ранжирования контента в агрегированных лентах (например, новостных сайтах, социальных сетях), где стандартная приоритизация основана только на важности и дате публикации. Это приводит к двум проблемам:

Для частых пользователей: Они вынуждены просматривать одни и те же важные, но уже виденные материалы, чтобы найти новый контент.
Для редких пользователей: Они могут пропустить важный контент, так как он вытесняется большим количеством нового, но менее значимого материала.

Изобретение улучшает пользовательский опыт, адаптируя логику ранжирования к индивидуальным паттернам потребления контента.

Что запатентовано

Запатентована система, которая персонализирует приоритизацию контента путем введения фактора Request Frequency Score (или User Frequency Score). Этот показатель рассчитывается на основе того, как часто конкретный пользователь запрашивает контент у сервиса. Система использует эту оценку для динамического изменения весов между Importance Score (важность контента) и Age Score (новизна контента) при расчете финального Priority Score.

Как это работает

Ключевой механизм заключается в адаптивном балансировании весов. Когда пользователь запрашивает контент, система анализирует его историю запросов (Request History) и вычисляет Request Frequency Score.

Если пользователь посещает сервис часто (высокий Frequency Score), система увеличивает вес Age Score. Новизна становится приоритетом, а важность учитывается меньше.
Если пользователь посещает сервис редко (низкий Frequency Score), система увеличивает вес Importance Score. Важность становится приоритетом, а новизна учитывается меньше.

Этот механизм гарантирует, что частые пользователи видят свежий контент, а редкие пользователи — самый важный контент, который они пропустили.

Актуальность для SEO

Высокая. Персонализация и оптимизация контентных лент являются критически важными для вовлечения пользователей. Этот механизм напрямую применим к таким продуктам, как Google Discover, Google News и различным персонализированным фидам. По мере того как Google смещает фокус с традиционного поиска на предиктивное предоставление контента (queryless search), актуальность таких алгоритмов возрастает.

Важность для SEO

Влияние на SEO – среднее-высокое (6.5/10), но сильно зависит от типа площадки. Патент не описывает ранжирование в основном веб-поиске (10 синих ссылок), но критически важен для понимания видимости в Google Discover и Google News. Он показывает, что универсальной стратегии ранжирования в этих лентах не существует; видимость контента зависит от индивидуального поведения пользователя. Это влияет на стратегию публикаций: баланс между своевременным и вечнозеленым контентом, а также важность сигналов вовлеченности (Importance Score).

Термины и определения

Age Score (Оценка возраста): Метрика, основанная на времени, прошедшем с момента создания или публикации элемента контента. Рассчитывается как разница между текущим временем и временем публикации.
Content Item (Элемент контента): Любой цифровой контент, предоставляемый сервисом: статья, фото, видео, блог, сообщение, обновление статуса, уведомление и т.д.
Importance Score (Оценка важности): Метрика, определяющая значимость или популярность элемента контента. Рассчитывается на основе различных факторов: темы, ключевых слов, количества просмотров, репостов, социальных одобрений (likes), источника контента.
Priority Score (Оценка приоритета): Финальная оценка, используемая для ранжирования и определения позиции элемента контента в пользовательском интерфейсе. Рассчитывается на основе Age Score, Importance Score и Request Frequency Score.
Request Frequency Score / User Frequency Score (Оценка частоты запросов пользователя): Метрика, указывающая, как часто конкретный пользователь взаимодействует с сервисом или запрашивает контент. Рассчитывается на основе анализа Request History.
Request History (История запросов): Журнал предыдущих взаимодействий пользователя с сервисом, содержащий записи о запросах контента с метками времени (timestamps).

Ключевые утверждения (Анализ Claims)

Патент содержит несколько независимых пунктов (Claim 1, 10, 17), которые описывают базовый механизм с разных сторон (метод, система, носитель).

Claim 1 (Независимый пункт): Описывает метод приоритизации контента.

Система получает запрос на пользовательский интерфейс с контентом.
В ответ извлекается набор элементов контента.
Система определяет, что было получено несколько экземпляров запроса от этого пользователя.
Вычисляется Request Frequency Score, определяющий частоту получения этих запросов.
Определяется, превышает ли Request Frequency Score пороговое значение (threshold value).
Корректируется Priority Score для контента на основе Age Score и Importance Score, при этом:
- Если Frequency Score превышает порог (частый пользователь): Age Score получает больший вес, чем Importance Score.
- Если Frequency Score не превышает порог (редкий пользователь): Importance Score получает больший вес, чем Age Score.
Контент предоставляется пользователю на основе скорректированного Priority Score.

Claim 2 (Зависимый от 1): Детализирует расчет Age Score и Importance Score.

Age Score рассчитывается на основе текущей даты/времени и даты/времени публикации.
Importance Score рассчитывается на основе хотя бы одного из: темы, ключевых слов, количества просмотров, количества репостов, количества социальных одобрений или источника контента.

Claim 3 (Зависимый от 1): Детализирует расчет Request Frequency Score.

Идентифицируются записи в Request History за определенный период времени.
Определяется среднее количество запросов за этот период.
Request Frequency Score рассчитывается на основе этого среднего значения.

Claim 9 (Зависимый от 1): Уточняет эффект высокого Request Frequency Score.

Более высокий Request Frequency Score связан с тем, что Priority Score рассчитывается с меньшим акцентом на Importance Score по отношению к Age Score.

Где и как применяется

Изобретение применяется в системах, где необходимо персонализировать порядок отображения агрегированного контента.

CRAWLING – Сканирование и Сбор данных (Data Acquisition)
На этом этапе система собирает не только сам контент, но и данные о взаимодействии пользователей с сервисом. Каждое посещение пользователя или запрос контента регистрируется в Request History с меткой времени.

INDEXING – Индексирование и извлечение признаков
Для каждого элемента контента предварительно рассчитываются статические сигналы:

Извлекается время публикации для последующего расчета Age Score.
Предварительно рассчитываются или агрегируются сигналы для Importance Score (например, анализ темы, источника).

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента происходит во время ранжирования контента для конкретного пользователя в ответ на его запрос.

Расчет пользовательского контекста: Система анализирует Request History пользователя и вычисляет его текущий Request Frequency Score.
Расчет динамических признаков контента: Вычисляется текущий Age Score и обновляется Importance Score (с учетом новых взаимодействий, просмотров, лайков).
Адаптивное взвешивание и Расчет Priority Score: Система использует Request Frequency Score для определения весовых коэффициентов для Age Score и Importance Score. Затем рассчитывается финальный Priority Score для каждого элемента контента.
Финальная сортировка: Контент сортируется для отображения пользователю.

Входные данные:

Запрос пользователя на контент.
Request History пользователя (метки времени предыдущих запросов).
Набор релевантных элементов контента.
Данные для расчета Importance Score (просмотры, лайки, репосты, источник).
Время публикации контента.

Выходные данные:

Персонализированный, отсортированный список элементов контента (Prioritized list).

На что влияет

Конкретные типы контента: Наибольшее влияние оказывается на контент в лентах, где важен баланс новизны и значимости: новости, статьи, обновления в социальных сетях, блоги. Меньше влияет на контент, где новизна не критична (например, справочная информация) или где важность минимальна.
Специфические запросы: Влияет на запросы без явного интента или запросы на просмотр ленты (например, открытие приложения Google News или ленты Discover). Не применяется к конкретным поисковым запросам, где пользователь ищет определенный факт или документ.
Конкретные ниши или тематики: Сильно влияет на быстро меняющиеся ниши (Breaking News, Технологии, Спорт), где объем нового контента высок.

Когда применяется

Триггеры активации: Алгоритм активируется, когда пользователь запрашивает ленту контента и система имеет достаточную историю его взаимодействий (в патенте указано условие: "Is there more than one entry in the request history?").
Пороговые значения: Ключевым элементом является сравнение Request Frequency Score с пороговым значением (threshold value). Это порог определяет, будет ли пользователь считаться "частым" или "редким", и соответственно меняет логику взвешивания важности и новизны. Патент также описывает варианты реализации, где изменение весов может быть не бинарным (по порогу), а непрерывным (по формуле).

Пошаговый алгоритм

Процесс приоритизации контента:

Получение запроса: Система получает запрос на элементы контента от пользователя.
Регистрация запроса: В Request History пользователя сохраняется запись о текущем запросе с меткой времени.
Извлечение контента: Система извлекает набор релевантных элементов контента.
Проверка истории: Система проверяет, содержит ли Request History пользователя более одной записи.
- Если НЕТ: Переход к Шагу 8 (Стандартное ранжирование).
- Если ДА: Переход к Шагу 5.
Расчет частоты пользователя: Вычисляется Request Frequency Score на основе записей в Request History (например, среднее количество запросов за период времени).
Расчет метрик контента: Для каждого элемента контента вычисляются Age Score (на основе времени публикации) и Importance Score (на основе сигналов вовлеченности и значимости).
Адаптивный расчет приоритета: Вычисляется Priority Score для каждого элемента контента с использованием Age Score, Importance Score и Request Frequency Score.
- Вариант А (Пороговый, согласно Claims): Сравнение Frequency Score с порогом. Если порог превышен, вес Age Score увеличивается; если нет, вес Importance Score увеличивается.
- Вариант Б (Непрерывный, согласно Description): Использование формул, где Frequency Score напрямую модулирует влияние Age Score (например, используется как экспонента для Age Score).
Стандартное ранжирование (Fallback): Если истории недостаточно, Priority Score рассчитывается только на основе Age Score, Importance Score и других стандартных факторов, без учета частоты пользователя.
Предоставление результатов: Набор элементов контента сортируется по Priority Score и предоставляется пользователю для отображения.

Какие данные и как использует

Данные на входе

Система использует три основных типа данных:

1. Поведенческие факторы (Пользовательские данные):

Request History: Журнал запросов пользователя к сервису.
Timestamps: Метки времени каждого запроса в истории. Критически важны для расчета частоты.

2. Временные факторы (Данные о контенте):

Publication Date/Time: Время создания или публикации контента. Используется для расчета Age Score.

3. Факторы вовлеченности и качества (Данные о контенте):
Эти факторы используются для расчета Importance Score:

Поведенческие (Глобальные): Количество просмотров (views), количество репостов/перепубликаций (republished), количество социальных одобрений (socially endorsed, likes, +1), комментарии и их тональность.
Контентные: Тема (subject) контента, ключевые слова (keywords).
Авторитетность: Источник (source) контента, автор контента (и его связь с пользователем, например, в социальных сетях).

Какие метрики используются и как они считаются

Система вычисляет четыре ключевые метрики:

Request Frequency Score (f(u)): Рассчитывается путем определения среднего количества запросов за определенный период времени на основе Request History. Может использоваться взвешенное среднее, отдающее предпочтение недавней активности.
Age Score (a(c)): Измерение времени, прошедшего с момента публикации. (Текущее время - Время публикации).
Importance Score (i(c)): Агрегированная оценка значимости на основе факторов вовлеченности, контента и авторитетности.
Priority Score: Финальная оценка ранжирования. Патент предлагает несколько вариантов расчета, демонстрирующих взаимодействие метрик.

Примеры формул из патента:

Условные обозначения: i(c) = Importance Score, a(c) = Age Score, f(u) = Request Frequency Score.

Equation 1:

Персонализация ранжирования в лентах: Патент подтверждает, что в агрегированных лентах (Google News, Discover) не существует единого ранжирования. Порядок контента динамически адаптируется под индивидуальные паттерны поведения пользователя (частоту посещений).
Динамический баланс Важность vs. Новизна: Ключевой вывод — Google активно управляет балансом между Importance Score и Age Score. Частые пользователи получают приоритет новизны, редкие — приоритет важности.
Importance Score как многофакторная оценка: Importance Score — это не просто авторитетность источника. Он включает сигналы вовлеченности (просмотры, лайки, репосты), контентные сигналы (темы, ключевые слова) и авторитетность источника. Это подчеркивает важность создания контента, который генерирует взаимодействие.
Вариативность реализации: Система может использовать как пороговые значения для переключения логики ранжирования, так и непрерывные математические функции (формулы) для более плавной модуляции весов.
Влияние на жизненный цикл контента: Контент имеет разный "срок жизни" для разных сегментов аудитории. Важный контент может оставаться видимым для редких пользователей значительно дольше, чем для частых.

Best practices (это мы делаем)

Рекомендации применимы в первую очередь для оптимизации под Google Discover и Google News.

Стимулирование вовлеченности для повышения Importance Score: Создавайте контент, который вызывает реакцию (лайки, шеры, комментарии на разных платформах). Патент явно указывает эти сигналы как компоненты Importance Score. Высокий Importance Score критически важен для охвата редких пользователей.
Сбалансированная стратегия публикаций: Необходимо сочетать высокочастотные обновления (Новости, Тренды) и глубокий, важный контент (Evergreen, Аналитика).
- Новостной контент позволит охватить частых пользователей (приоритет новизны).
- Важный контент позволит дольше оставаться в ленте редких пользователей (приоритет важности).
Оптимизация под пиковую важность: Для ключевых материалов стремитесь максимизировать Importance Score в первые часы/дни после публикации (через дистрибуцию, социальные сети). Это повысит базовый Priority Score для всех сегментов пользователей.
Анализ аудитории по частоте взаимодействия: Если возможно (например, через аналитику сайта или email-рассылок), сегментируйте аудиторию на частых и редких посетителей и анализируйте, какой контент потребляет каждый сегмент. Это поможет лучше понять, как алгоритмы Google могут приоритизировать ваш контент для них.

Worst practices (это делать не надо)

Публикация только новостного контента низкого качества (Низкий Importance Score): Такой контент будет быстро исчезать из ленты. Частые пользователи увидят его один раз, а редкие пользователи могут не увидеть его вовсе, так как он будет вытеснен более важным контентом от конкурентов.
Игнорирование сигналов вовлеченности: Полагаться только на авторитетность бренда или SEO-оптимизацию текста недостаточно. Если контент не генерирует просмотры, лайки и шеры, его Importance Score будет низким, что снизит его видимость, особенно для редких пользователей.
Слишком редкие публикации важного контента: Если публиковать только важный контент, но редко, система может не иметь достаточного количества свежего материала для показа частым пользователям, что снизит общий охват.

Стратегическое значение

Этот патент подчеркивает стратегическую важность персонализации в экосистеме Google, особенно в контексте queryless-поиска (Discover). Для SEO-специалистов это означает необходимость выхода за рамки традиционной оптимизации под ключевые слова и понимания того, как алгоритмы управляют вниманием пользователя. Стратегия должна быть направлена на максимизацию Importance Score через качество и вовлеченность, а также на поддержание оптимального темпа публикаций для охвата разных сегментов аудитории с разной частотой потребления контента.

Практические примеры

Сценарий: Оптимизация видимости статьи в Google Discover

Задача: Максимизировать охват новой аналитической статьи "Будущее электромобилей".

Действия по повышению Importance Score: Сразу после публикации запускается активная дистрибуция: email-рассылка, посты в социальных сетях с призывом к обсуждению, возможно, таргетированная реклама. Цель — быстро набрать просмотры, лайки и шеры.
Ожидаемый результат для редких пользователей: Пользователь, который открывает Discover раз в неделю, имеет низкий Request Frequency Score. Алгоритм применит больший вес к Importance Score. Благодаря активной дистрибуции, статья имеет высокий Importance Score и будет показана этому пользователю вверху ленты, даже если ей уже 3-4 дня.
Ожидаемый результат для частых пользователей: Пользователь, который открывает Discover 5 раз в день, имеет высокий Request Frequency Score. Алгоритм применит больший вес к Age Score (новизне). Он увидит статью в первые часы после публикации. Через день алгоритм, скорее всего, понизит эту статью в его ленте в пользу более свежего контента (даже менее важного), чтобы избежать повторов.

Описывает ли этот патент ранжирование в основном поиске Google?

Нет, патент не описывает алгоритмы ранжирования для традиционного веб-поиска ("10 синих ссылок"). Он фокусируется на приоритизации контента в агрегированных лентах или сервисах, таких как новостные сайты, социальные сети или персонализированные фиды. Наиболее вероятные области применения в экосистеме Google — это Google Discover и Google News.

Что такое Importance Score и как на него повлиять?

Importance Score — это оценка значимости контента. Согласно патенту, он рассчитывается на основе темы, ключевых слов, источника контента и сигналов вовлеченности: количества просмотров, репостов и социальных одобрений (лайков). Чтобы на него повлиять, необходимо создавать качественный контент по актуальным темам и активно стимулировать взаимодействие пользователей с ним через дистрибуцию и социальные сети.

Почему я вижу старые статьи в Google Discover?

Это может быть прямым следствием работы описанного алгоритма. Если вы редко пользуетесь Discover, система определяет ваш Request Frequency Score как низкий. В этом случае алгоритм отдает приоритет Importance Score над Age Score. Система показывает вам самые важные материалы, которые вы пропустили, даже если они были опубликованы несколько дней назад.

Почему мой контент быстро исчезает из лент пользователей?

Это может происходить по двум причинам, связанным с этим патентом. Во-первых, если у контента низкий Importance Score, он быстро вытесняется более важными материалами. Во-вторых, для частых пользователей (высокий Frequency Score) система агрессивно понижает уже виденный или устаревший контент в пользу новизны, чтобы лента оставалась свежей.

Как система определяет, как часто я пользуюсь сервисом?

Система ведет Request History — журнал всех ваших запросов контента с метками времени. Анализируя этот журнал за определенный период (например, за последнюю неделю или месяц), система рассчитывает среднюю частоту ваших посещений. Это значение и есть ваш Request Frequency Score.

Лучше публиковать много новостей или мало, но качественных статей?

Для максимального охвата необходим баланс. Много новостей (свежий контент) позволят охватить частых пользователей, для которых приоритетна новизна. Мало, но качественных статей (высокий Importance Score) позволят охватить редких пользователей, для которых приоритетна важность. Оптимальная стратегия сочетает оба подхода.

Использует ли система бинарное переключение (частый/редкий) или плавную настройку?

Патент описывает оба варианта. В основных пунктах (Claims) описан механизм с использованием порогового значения (threshold value) для переключения весов между важностью и новизной. Однако в описании (Description) приведены формулы, позволяющие осуществлять непрерывную (плавную) модуляцию весов в зависимости от точного значения Request Frequency Score.

Влияет ли E-E-A-T на этот алгоритм?

Патент напрямую не упоминает E-E-A-T, но указывает "источник контента" (source of the content item) как один из факторов для расчета Importance Score. Авторитетность и надежность источника (компоненты E-E-A-T) логично вписываются в оценку важности контента, повышая его базовый Importance Score.

Является ли этот механизм формой персонализации?

Да, это чистая форма поведенческой персонализации. Ранжирование контента адаптируется не под демографические данные или заявленные интересы пользователя, а под его фактические паттерны потребления контента (частоту взаимодействия с сервисом). Два пользователя с одинаковыми интересами увидят разный порядок контента, если один посещает сервис часто, а другой редко.

Что важнее для видимости в Discover: свежесть или вовлеченность?

Оба фактора критически важны, но их относительная важность зависит от сегмента аудитории. Для активной аудитории, часто проверяющей ленту, свежесть (Age Score) имеет больший вес. Для менее активной аудитории вовлеченность и значимость (Importance Score) имеют больший вес. Необходимо оптимизировать оба параметра.

Как Google персонализирует, локализует и ранжирует новостной контент для Google News и Discover

Google использует систему для персонализации новостного контента, анализируя темы (используя Knowledge Graph), местоположения и даты публикации статей. Система создает динамические профили пользователей на основе истории чтения, применяя механизм «затухания» для устаревших интересов. Ранжирование учитывает релевантность, качество источника, популярность (количество просмотров) и свежесть контента.

US9569547B2
2017-02-14

Персонализация
Свежесть контента
Knowledge Graph

Как Google переранжирует результаты поиска в реальном времени, скрывая контент, который пользователь уже видел на других сайтах

Google использует механизм оценки новизны информации для динамической корректировки поисковой выдачи во время сессии пользователя. Система вычисляет «Information Gain Score» для непросмотренных документов, определяя, сколько новой информации они содержат по сравнению с уже посещенными сайтами. Результаты с уникальной информацией повышаются, а повторяющийся контент понижается, чтобы уменьшить избыточность.

US11354342B2
2022-06-07

SERP
Семантика и интент
Персонализация

Как Google использует контент, который вы сейчас просматриваете, для фильтрации и уточнения вашей поисковой выдачи

Google анализирует контекст веб-страницы или документа, который просматривает пользователь, чтобы определить основную тему (топик). Когда пользователь вводит запрос, система фильтрует результаты поиска, отдавая предпочтение тем документам, которые соответствуют этой контекстной теме, тем самым уточняя выдачу для неоднозначных запросов.

US8762368B1
2014-06-24

Семантика и интент
SERP
Персонализация

Как Google персонализирует рекомендации популярных запросов на основе истории поиска и браузинга пользователя

Google анализирует глобальные тренды поисковых запросов и сопоставляет их с индивидуальной историей пользователя (посещенные сайты, прошлые запросы, категории интересов). Если популярный запрос соответствует выявленным интересам пользователя, он будет рекомендован. Система также применяет фильтры, исключающие запросы, которые пользователь вводил недавно.

US9443022B2
2016-09-13

Персонализация
Поведенческие сигналы
Свежесть контента

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий

Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.

US9881077B1
2018-01-30

Семантика и интент
Поведенческие сигналы

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам

Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).

US9135317B2
2015-09-15

Поведенческие сигналы
Мультимедиа
Семантика и интент

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)

Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.

US20250005303A1
2025-01-02

SERP
EEAT и качество
Персонализация

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений

Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.

US8065611B1
2011-11-22

Поведенческие сигналы
Семантика и интент
Мультимедиа

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи

Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.

US10579687B2
2020-03-03

SERP
Семантика и интент
Ссылки

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи

Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.

US9940367B1
2018-04-10

SERP
Семантика и интент
EEAT и качество

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах

Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.

US20180113919A1
2018-04-26

Семантика и интент
SERP
Поведенческие сигналы

Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика

Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.

US7716225B1
2010-05-11

Ссылки
Поведенческие сигналы
SERP

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)

Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.

US9223868B2
2015-12-29

Поведенческие сигналы
SERP
Антиспам

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)

Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.

US8478519B2
2013-07-02

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции

Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.

US8938463B1
2015-01-20

Поведенческие сигналы
SERP