Как Google определяет "Задачи" пользователя и предлагает контент для следующих шагов на основе агрегированных поведенческих данных

Google анализирует последовательности действий пользователей («Action Trails»), чтобы выявить общие «Задачи» (например, планирование отпуска). Система кластеризует эти данные и определяет ключевые темы и лучшие ресурсы для каждого этапа задачи на основе агрегированного поведения. Это позволяет предлагать пользователю контент по смежным темам, которые он еще не искал, но которые релевантны его текущей задаче.

Описание

Какую задачу решает

Патент решает проблему фрагментированного поиска при выполнении сложных задач (Tasks), которые охватывают несколько сессий и тем. Пользователи часто не знают, какие запросы вводить дальше, или могут упустить важные аспекты задачи (например, необходимость прививок при планировании путешествия). Традиционный поиск фокусируется на ответе на текущий запрос, а не на поддержке пользователя в выполнении всей задачи.

Что запатентовано

Запатентована система агрегации задач (Task Aggregation System), которая использует «краудсорсинг» поведения пользователей. Система анализирует последовательности действий пользователей (Action Trails), кластеризует похожие траектории для выявления общих задач и связанных с ними тем (Topics). Затем она ранжирует наиболее полезные ресурсы для каждой темы на основе агрегированных данных об активности.

Как это работает

Система работает в двух режимах:

Офлайн-агрегация: Анализируются Action Trails множества пользователей. Схожие траектории кластеризуются, формируя Action Trail Clusters, которые соответствуют определенным задачам. Внутри кластера определяются темы и ранжируются ресурсы (например, по Click Through Rate).
Онлайн-обслуживание: Когда пользователь вводит запрос, система определяет, вовлечен ли он в задачу (engaged in a task). Если да, система идентифицирует соответствующий кластер. В ответ на запрос система предоставляет не только релевантные запросу ресурсы (Query-Relevant Resources), но и лучшие ресурсы из смежных тем в рамках той же задачи (Task-Relevant Resources).

Актуальность для SEO

Высокая. Понимание пути пользователя (User Journey) и переход от ответа на отдельные запросы к помощи в выполнении комплексных задач является стратегическим направлением развития поиска (например, концепция Google Journeys). Описанный механизм, позволяющий задачам «возникать» из поведенческих данных без заранее определенной онтологии, крайне актуален для современных поисковых систем.

Важность для SEO

Влияние на SEO значительно (85/100). Патент описывает механизм, с помощью которого Google определяет полезность и авторитетность ресурсов в контексте конкретной задачи, основываясь на агрегированных поведенческих данных (упоминаются CTR и время просмотра). Это подчеркивает критическую важность построения тематического авторитета (Topical Authority), охватывающего всю задачу пользователя, и оптимизации под метрики вовлеченности.

Детальный разбор

Термины и определения

Action Trail (Траектория действий): Последовательность действий пользователя (веб-история), сгруппированная на основе семантических и временных критериев. Соответствует определенной задаче или теме для конкретного пользователя. Включает запросы, просмотренные ресурсы, клики и т.д.
Action Trail Cluster (Кластер траекторий действий): Группа схожих Action Trails от разных пользователей, соответствующая определенной задаче. Кластер формируется на основе схожести ресурсов и тем в траекториях.
Action Trail Data Store (Хранилище данных траекторий действий): База данных, хранящая сгенерированные Action Trails пользователей.
Aggregated Task Data Store (Хранилище агрегированных данных о задачах): База данных, хранящая Action Trail Clusters и ранжированные списки ресурсов для каждой темы.
Task (Задача): Процесс сбора информации по одной или нескольким связанным темам. Задача может охватывать несколько сессий и запросов (например, «Планирование поездки в Кению»).
Task Aggregation System (Система агрегации задач): Система, которая кластеризует Action Trails и ранжирует ресурсы на основе агрегированных данных.
Topic (Тема): Подраздел задачи. Например, для задачи «Поездка в Кению» темами могут быть «Авиабилеты», «Отели», «Прививки».
Query-Relevant Resource (Ресурс, релевантный запросу): Ресурс, который система определила как отзывчивый на текущий запрос пользователя.
Task-Relevant Resource (Ресурс, релевантный задаче): Ресурс, соответствующий Action Trail в кластере, связанном с текущей задачей пользователя. Может не быть напрямую релевантным тексту текущего запроса, но релевантен задаче в целом.

Ключевые утверждения (Анализ Claims)

Патент US20220147551A1 является продолжением (continuation) более ранних патентов. Claims 1-20 описывают метод предоставления результатов поиска.

Claim 1 (Независимый пункт): Описывает основной процесс реагирования на запрос в контексте задачи.

Система получает поисковый запрос от пользователя.
Определяется, что пользователь вовлечен в определенную Задачу (engaged in a given task). Эта задача связана как минимум с Первой Темой (Topic 1) и Второй Темой (Topic 2).
На основе терминов запроса определяется, что запрос связан с Первой Темой (Topic 1).
В ответ на эти определения система предоставляет пользователю набор ресурсов, включающий: (i) Ресурсы, релевантные запросу (Query-Relevant Resources), связанные с Первой Темой; И (ii) Дополнительные ресурсы, связанные со Второй Темой (Topic 2).

Ядром изобретения является механизм проактивного предложения контента из связанной, но отличной темы (Topic 2), когда пользователь ищет информацию по другой теме (Topic 1), основываясь на распознавании того, что обе темы являются частью одной и той же Задачи, в которую вовлечен пользователь.

Claim 2, 3, 5 (Зависимые): Детализируют, как определяется вовлеченность в задачу.

Определение вовлеченности основывается на семантическом анализе веб-истории пользователя, показывающем, что пользователь ранее отправлял запросы, связанные с Topic 1 или Topic 2. Также учитывается временной анализ (temporal analysis) – эти предыдущие запросы были отправлены в течение той же или недавней поисковой сессии.

Claim 4 (Зависимый): Альтернативный способ определения вовлеченности.

Вовлеченность может быть определена на основе явной обратной связи от пользователя (explicit user feedback), подтверждающего, что он выполняет данную задачу.

Claim 9, 10 (Зависимые): Описывают способ представления результатов.

Результаты могут быть представлены в виде «Среды тем» (Topic Environment Display), которая включает отдельные метки для Первой и Второй Темы. Отображение разделено на части: первая часть содержит ресурсы для Topic 1 (включая Query-Relevant), вторая часть – ресурсы для Topic 2.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя офлайн-анализ поведения для влияния на онлайн-ранжирование и представление результатов.

CRAWLING & INDEXING (Сбор и обработка данных)
На этом этапе собираются данные о поведении пользователей (веб-история), которые служат основой для генерации Action Trails. Эти данные сохраняются в Action Trail Data Store.

INDEXING & Feature Extraction (Офлайн-анализ)
Task Aggregation System работает преимущественно офлайн. Она выполняет:

Кластеризацию Action Trails для выявления общих задач.
Идентификацию тем (Topics) внутри каждой задачи.
Ранжирование ресурсов для каждой темы на основе агрегированных метрик (например, CTR).

Результаты сохраняются в Aggregated Task Data Store.

QUNDERSTANDING & RANKING (Понимание запросов и Ранжирование)
В реальном времени поисковая система анализирует текущий запрос и недавнюю историю пользователя (используя семантический и временной анализ), чтобы определить, вовлечен ли пользователь в задачу (engaged in a task).

METASEARCH & RERANKING (Метапоиск и Переранжирование)
Если задача идентифицирована, система извлекает данные из соответствующего Action Trail Cluster. Происходит смешивание стандартных результатов (Query-Relevant) и результатов, релевантных задаче (Task-Relevant), в том числе из смежных тем. Система также может генерировать специальное представление (Topic Environment).

Входные данные:

Текущий запрос пользователя.
Веб-история пользователя (для генерации Action Trails и определения вовлеченности).
Aggregated Task Data Store (кластеры и ранжированные ресурсы).

Выходные данные:

Модифицированная страница результатов поиска (SERP), включающая Task-Relevant Resources из смежных тем, или специализированный интерфейс Topic Environment.

На что влияет

Специфические запросы и ниши: Наибольшее влияние на сложные информационные и коммерческие задачи, требующие многоэтапного исследования (например, планирование путешествий, крупные покупки, исследования здоровья – YMYL). Меньшее влияние на простые навигационные запросы или поиск фактов.
Типы контента: Повышает значимость контента, который удовлетворяет потребности пользователя на разных этапах задачи (обзоры, сравнения, руководства, инструменты планирования).

Когда применяется

Алгоритм применяется при выполнении следующих условий:

Триггер активации: Система должна определить, что пользователь «вовлечен в задачу» (engaged in a task).
Условия срабатывания: Это определение основывается на достаточном количестве недавних действий пользователя, которые семантически и темпорально связаны (согласно Claims 2, 3, 5), или на явном подтверждении от пользователя (Claim 4).
Наличие данных: Должен существовать сформированный Action Trail Cluster, соответствующий задаче пользователя.

Пошаговый алгоритм

Процесс А: Офлайн-агрегация (Task Aggregation System)

Сбор данных: Доступ к данным Action Trails из хранилища.
Кластеризация: Кластеризация траекторий на основе схожести (similarity threshold) ресурсов и тем. В результате формируются Action Trail Clusters, соответствующие задачам.
Идентификация тем: Внутри каждого кластера определяются связанные группы ресурсов, формирующие Темы (Topics).
Ранжирование ресурсов: Для каждой Темы ресурсы ранжируются на основе агрегированных метрик (например, Click Through Rate, время просмотра, авторитетность).
Сохранение: Кластеры и ранжированные списки сохраняются в Aggregated Task Data Store.

Процесс Б: Онлайн-обработка запроса (Search System)

Получение запроса: Пользователь вводит запрос.
Определение вовлеченности в задачу: Система анализирует запрос и недавнюю веб-историю пользователя (семантический и временной анализ). Определяется, вовлечен ли пользователь в Задачу (например, «Поездка в Кению»).
Идентификация темы запроса: Определяется, к какой теме относится запрос (например, «Авиабилеты»).
Поиск кластера: Если пользователь вовлечен в задачу, система находит соответствующий Action Trail Cluster.
Идентификация ресурсов: Система определяет:
- Query-Relevant Resources (стандартные результаты по теме «Авиабилеты»).
- Task-Relevant Resources (лучшие ресурсы из смежных тем кластера, например, «Отели» и «Прививки»).
Формирование выдачи: Система предоставляет объединенный набор ресурсов пользователю (в виде стандартной SERP или специализированного Topic Environment).

Какие данные и как использует

Данные на входе

Ключевыми данными в этом патенте являются поведенческие сигналы.

Поведенческие факторы: Критически важны. Используется веб-история пользователей: отправленные запросы, посещенные ресурсы (page views), клики по результатам поиска и ссылкам. Эти данные формируют Action Trails.
Временные факторы: Используются для сегментации истории в Action Trails (темпоральные критерии) и для определения текущей вовлеченности пользователя в задачу (temporal analysis).
Контентные факторы: Используются косвенно для определения семантической схожести между ресурсами и запросами при кластеризации и определении тем.

Какие метрики используются и как они считаются

Similarity Threshold (Порог схожести): Используется для кластеризации Action Trails в Задачи и группировки ресурсов в Темы. Определяется на основе семантической схожести или пересечения ресурсов/тем в траекториях.
Метрики ранжирования ресурсов (внутри темы): Патент явно указывает на использование агрегированных поведенческих метрик для определения лучших ресурсов:
- Click Through Rate (CTR): Частота выбора ресурса при показе в ответ на запрос.
- Average time spent viewing a resource (Среднее время просмотра ресурса / Dwell Time).
- Также упоминаются: Authority score (оценка авторитетности) и User ratings (пользовательские рейтинги).
Метрики вовлеченности в задачу: Основаны на семантическом и временном анализе недавней истории пользователя для определения того, выполняет ли он сейчас задачу.

Выводы

Переход от запросов к задачам (Tasks): Патент подтверждает стратегический сдвиг Google от анализа отдельных запросов к пониманию более широких задач пользователя (User Journeys). Система стремится помочь пользователю выполнить задачу, а не просто ответить на текущий вопрос.
«Краудсорсинг» пути пользователя: Задачи и Темы не определяются заранее (нет предопределенной онтологии). Они «возникают» (emerge) из анализа агрегированного поведения пользователей (Action Trails). То, как люди исследуют тему, определяет структуру задачи для Google.
Поведенческие факторы как основа ранжирования полезности: Для определения того, какой ресурс является лучшим для конкретной темы в рамках задачи, используются агрегированные поведенческие сигналы (CTR, время просмотра). Это прямой механизм использования User Engagement для ранжирования.
Проактивное предложение смежных тем: Ключевой механизм – это предложение Task-Relevant Resources из тем, которые пользователь еще не искал, но которые, согласно агрегированным данным, являются частью той же задачи. Google подсказывает пользователю следующий шаг.
Важность контекста и состояния пользователя: Система активируется только тогда, когда распознает, что пользователь находится в состоянии выполнения задачи (engaged in a task), используя для этого временной и семантический анализ недавней активности.

Практика

Best practices (это мы делаем)

Построение Тематического Авторитета (Topical Authority) вокруг Задач: Необходимо создавать контент, который покрывает не отдельные ключевые слова, а все темы (Topics), входящие в Задачу пользователя. Если задача – «Поездка в Кению», нужно покрыть авиабилеты, отели, визы, прививки, сафари. Это увеличивает вероятность попадания в Action Trail Clusters.
Оптимизация под поведенческие метрики (CTR и Вовлеченность): Так как ресурсы внутри каждой темы ранжируются по агрегированным поведенческим данным (CTR, время просмотра), критически важно оптимизировать сниппеты для повышения кликабельности и создавать контент, который максимально удерживает пользователя и решает его проблему.
Исследование Пути Пользователя (User Journey Mapping): SEO-стратегия должна основываться на понимании того, как пользователи выполняют задачи в вашей нише. Анализируйте смежные темы и последовательность их изучения, чтобы соответствовать паттернам, которые Google ищет в Action Trails.
Создание Контент-Хабов для Задач: Создавайте страницы или разделы, которые агрегируют лучший контент для разных этапов задачи. Это соответствует структуре Topic Environment, которую Google может показывать пользователю.

Worst practices (это делать не надо)

Фокус на изолированных ключевых словах: Оптимизация страниц под отдельные запросы без учета их связи с более широкой задачей пользователя становится менее эффективной. Система может предпочесть ресурсы, которые являются частью сильного тематического кластера.
Игнорирование качества контента и метрик вовлеченности: Создание контента, который не удовлетворяет интент пользователя (низкий CTR, малое время взаимодействия), приведет к низкому ранжированию ресурса внутри Action Trail Cluster, даже если он технически релевантен теме.
Создание фрагментированного контента: Распределение информации по множеству мелких страниц без четкой структуры, охватывающей всю задачу, затруднит системе ассоциацию вашего сайта с комплексной задачей.

Стратегическое значение

Этот патент имеет высокое стратегическое значение, так как он описывает инфраструктуру для реализации поиска, ориентированного на задачи (Task-based Search). Он показывает, как агрегированные поведенческие данные используются для моделирования пути пользователя и прямого ранжирования ресурсов. Для SEO это означает, что успех зависит от способности сайта стать лучшим ресурсом для одной или нескольких тем в рамках задачи, что измеряется через удовлетворенность пользователей (Engagement Metrics).

Практические примеры

Сценарий: Оптимизация сайта по продаже автомобилей

Идентификация Задачи: Задача пользователя – «Покупка нового автомобиля».
Анализ Тем (Topics): На основе исследования определяются темы: (A) Исследование моделей и обзоры, (B) Сравнение цен, (C) Варианты финансирования/кредитования, (D) Автострахование.
Стратегия Контента: Сайт создает высококачественный контент для каждой темы, оптимизированный под вовлеченность.
Применение механизма Google: Пользователь ищет «Лучшие SUV 2025» (Тема A). Google распознает, что пользователь вовлечен в задачу «Покупка нового автомобиля».
Результат: В выдаче Google показывает стандартные результаты обзоров SUV (Query-Relevant). Дополнительно, в блоке «Вам также может быть интересно» или в Topic Environment, Google показывает лучшие ресурсы по Теме C («Варианты финансирования SUV») и Теме D («Стоимость страховки SUV»), так как агрегированные данные показывают, что это следующие шаги пользователя. Если ваш сайт имеет лучший (по метрикам CTR/Dwell time) контент по финансированию, он будет показан на этом этапе.

Вопросы и ответы

Как Google определяет, что такое «Задача» (Task)?

В патенте указано, что Задачи не обязательно определяются заранее через онтологию. Они «возникают» (emerge) из данных. Система анализирует последовательности действий (Action Trails) множества пользователей и кластеризует их на основе схожести. Группа схожих траекторий от разных людей и формирует то, что система считает Задачей (например, «Планирование поездки в Кению»).

Какие метрики используются для ранжирования ресурсов внутри кластера задач?

Патент явно упоминает агрегированные поведенческие метрики. Ключевыми являются Click Through Rate (CTR) и среднее время просмотра ресурса (Dwell Time). Также упоминаются возможность использования оценок авторитетности (Authority score) и пользовательских рейтингов. По сути, ранжирование основано на том, насколько полезным ресурс оказался для других пользователей, выполнявших ту же задачу.

Что такое «Action Trail»?

Action Trail – это сегментированная веб-история конкретного пользователя. Это последовательность действий (запросы, клики, просмотры страниц), которые семантически и темпорально связаны между собой и относятся к выполнению определенной задачи или исследованию темы. Это основная единица данных, которую система агрегирует.

Как система определяет, что пользователь сейчас выполняет задачу?

Это определяется в реальном времени с помощью анализа текущего запроса и недавней активности пользователя. Система использует семантический и временной анализ (semantic and temporal analysis), чтобы увидеть, соответствуют ли недавние действия паттернам известной задачи. Также патент упоминает возможность явного подтверждения от пользователя (explicit user feedback).

Как этот патент влияет на стратегию ключевых слов?

Стратегия должна сместиться от таргетинга изолированных ключевых слов к таргетингу Тем (Topics) в рамках Задачи (Task). Необходимо понимать весь путь пользователя и создавать контент для каждого этапа. Важно не просто ранжироваться по запросу, а стать лучшим ресурсом для соответствующей темы, чтобы система предлагала ваш контент на разных этапах задачи.

В чем разница между Query-Relevant и Task-Relevant ресурсами?

Query-Relevant – это стандартные результаты поиска, которые отвечают на текущий введенный запрос. Task-Relevant – это ресурсы, которые релевантны общей задаче пользователя, но могут не быть напрямую релевантны тексту текущего запроса. Например, при запросе «авиабилеты в Кению», статья о прививках будет Task-Relevant, но не Query-Relevant.

Как это влияет на сайты с высоким Тематическим Авторитетом (Topical Authority)?

Это дает значительное преимущество таким сайтам. Если сайт качественно покрывает множество тем в рамках одной задачи, он с большей вероятностью будет включен в Action Trail Clusters и его контент будет предлагаться пользователям на разных этапах их пути, даже если они ищут смежные темы.

Где пользователь увидит эти предложенные ресурсы?

Патент описывает несколько вариантов. Это может быть специальный интерфейс Topic Environment, организованный по темам (FIG. 4A). Также это может быть отдельный блок на стандартной странице выдачи, например, с заголовком «Вам также может быть интересно…» (FIG. 4B), или же они могут быть смешаны со стандартными результатами.

Использует ли система персональные данные?

Система использует веб-историю для генерации Action Trails и определения текущей вовлеченности в задачу (при условии согласия пользователя). Однако основной механизм агрегации основан на кластеризации данных множества пользователей, которые могут быть анонимизированы. Ценность системы именно в агрегации, а не в персонализации на основе профиля.

Может ли система учитывать контекст пользователя при предложении ресурсов?

Да. В патенте упоминается возможность идентификации Task-Relevant Resources только из Action Trails пользователей, которые имеют пороговую степень сходства с текущим пользователем. Например, если пользователь из США планирует поездку, система может предпочесть данные от других пользователей из США (определяя это по IP или профилю).

Как Google определяет «Задачи» пользователя и предлагает контент для следующих шагов на основе агрегированных поведенческих данных