Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google отслеживает, анализирует и использует историю поведения пользователя для персонализации поиска и визуализации активности

    SYSTEMS AND METHODS FOR PROVIDING A GRAPHICAL DISPLAY OF SEARCH ACTIVITY (Системы и методы предоставления графического отображения поисковой активности)
    • US7694212B2
    • Google LLC
    • 2010-04-06
    • 2005-03-31
    2005 Патенты Google Персонализация

    Патент Google описывает инфраструктуру для сбора и анализа истории действий пользователя (запросы, клики по органике и рекламе, просмотры страниц). Система использует эти данные, включая метрики вовлеченности вроде «stay-time», для определения «предпочитаемых местоположений» и персонализации выдачи. Также описан метод графической визуализации объема этой активности.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу организации, визуализации и использования обширной истории поисковой и браузерной активности пользователя. Он направлен на улучшение пользовательского опыта путем предоставления инструментов для анализа прошлой активности (графическая визуализация) и использования этих данных для повышения релевантности текущих результатов поиска через персонализацию и определение предпочтений пользователя (Preferred Locations).

    Что запатентовано

    Запатентована комплексная система для сбора, хранения и анализа истории действий пользователя. Хотя описание (Description) охватывает широкую инфраструктуру персонализации, ядром изобретения (согласно Claims) является конкретный метод графического отображения объема активности пользователя за определенные периоды времени. Этот метод использует visually distinctive indicators (например, интенсивность цвета в календаре) для обозначения различных диапазонов объема активности.

    Как это работает

    Система функционирует в нескольких направлениях:

    • Сбор данных: Активность пользователя (запросы, клики, просмотр страниц, stay-time) отслеживается (например, через Client Assistant или серверные логи) и сохраняется как Event-Based Data в User Information Database.
    • Анализ и Обработка: Система обрабатывает сырые данные для генерации Derived Data, таких как профили интересов, Query Sessions (группы связанных запросов) и Preferred Locations (на основе частоты посещений и stay-time).
    • Визуализация (Claims): По запросу система рассчитывает объем активности за периоды времени и генерирует графическое отображение с индикаторами интенсивности.
    • Персонализация (Description): История и производные данные используются для модификации результатов поиска, например, путем повышения позиций ранее посещенных или предпочитаемых сайтов.

    Актуальность для SEO

    Средняя/Высокая. Патент подан в 2005 году. Хотя конкретные реализации пользовательского интерфейса (визуализация истории) и методы сбора данных (например, зависимость от тулбаров) эволюционировали, базовые принципы сбора поведенческих данных, анализа сессий (Query Sessions) и их использования для глубокой персонализации остаются фундаментальными и высоко актуальными для понимания работы поиска в 2025 году.

    Важность для SEO

    Патент имеет важное значение (6/10) для понимания инфраструктуры персонализации Google. Он не описывает глобальные алгоритмы ранжирования, но детально подтверждает сбор и использование индивидуальных поведенческих сигналов (клики, частота визитов, stay-time) для модификации выдачи конкретного пользователя. Для SEO это подчеркивает стратегическую важность удержания пользователя и стимулирования повторных визитов для получения преимуществ в персонализированном поиске.

    Детальный разбор

    Термины и определения

    Activity Number (Число активности)
    Метрика, представляющая объем активности пользователя за период времени. Может быть простым подсчетом или взвешенной суммой событий разных типов.
    Client Assistant (Клиентский помощник)
    Локальная программа на клиенте (например, тулбар или плагин), предназначенная для мониторинга действий пользователя и передачи их на сервер.
    Derived Data (Производные данные)
    Информация, вычисленная на основе Event-Based Data. Примеры: профили интересов, Preferred Locations, агрегированные оценки (Scores).
    Event-Based Data (Данные на основе событий)
    Сырые записи о действиях пользователя. Включают Query Event, Result Click Event, Ad Click Event, Browsing Event.
    History Score (Оценка истории)
    Ранжирующее значение, присваиваемое событию. Может быть основано на времени (time-based ranking value) и уменьшаться по мере устаревания события.
    Preferred Locations (Предпочитаемые местоположения)
    Набор локаций (сайтов, документов), автоматически идентифицированных как предпочтительные для пользователя на основе его прошлой активности (частота, stay-time).
    Query Session (Сессия запросов)
    Группа связанных запросов и кликов, выполненных в течение ограниченного периода времени (browsing session).
    Session Group (Группа сессий)
    Объединение связанных Query Sessions из разных временных периодов, обычно объединенных общей темой или задачей.
    Stay-time (Время пребывания)
    Метрика, оценивающая продолжительность просмотра пользователем контента. Используется как показатель заинтересованности при расчете Preferred Locations.
    User Information Database (База данных информации о пользователе)
    Хранилище, содержащее записи активности пользователя и производные данные.
    Visually distinctive indicators (Визуально различимые индикаторы)
    Графические элементы (цвет, интенсивность, размер), используемые для отображения объема активности (Activity Number) в интерфейсе.
    Visit Score (Оценка посещения)
    Агрегированная метрика для ранжирования Preferred Locations. Может быть суммой оценок отдельных посещений (instance visit scores), которые могут учитывать давность визита.

    Ключевые утверждения (Анализ Claims)

    Хотя описание патента (Description) охватывает широкую систему персонализации, защищенное ядро изобретения (Claims) фокусируется строго на методе графического отображения активности.

    Claim 1 (Независимый пункт): Описывает метод предоставления графического отображения компьютерной активности пользователя.

    1. Система получает запрос на отображение активности пользователя за unit of time (единицу времени, например, месяц), которая состоит из sub-units of time (подиниц, например, дней). Запрос может включать типы активности и критерии фильтрации (user-specified criteria).
    2. Идентифицируется история активности пользователя, соответствующая заданным критериям.
    3. Для каждой подиницы времени вычисляется first activity number (объем активности), соответствующий критериям.
    4. Каждой подинице времени присваивается один из visually distinctive indicators (визуально различимых индикаторов) в соответствии с вычисленным объемом активности. Каждый индикатор соответствует определенному диапазону значений объема.
    5. Система предоставляет информацию для графического отображения единицы времени и подиниц, где каждая подиница отображается с соответствующим индикатором.

    Claim 3 (Зависимый от 1): Уточняет, что объем активности (activity number) может быть взвешенной комбинацией событий разных типов, где каждый тип имеет свой вес.

    Claim 12 (Зависимый от 1): Описывает механизм интерактивной детализации (expand). При выборе подиницы времени (например, дня) система может сгенерировать новое графическое отображение для ее составляющих (например, часов), используя тот же механизм визуализации объема.

    Claim 13 (Зависимый от 1): Описывает альтернативный механизм детализации. При выборе подиницы времени система отображает список конкретных событий (запросов, кликов), произошедших в этот период.

    Где и как применяется

    Изобретение затрагивает инфраструктуру сбора данных, обработку истории и этапы персонализации.

    Сбор данных (Data Acquisition — эквивалент CRAWLING для пользовательских данных)
    Критический этап. Client Assistant на устройстве пользователя или серверные логи фиксируют действия (Event-Based Data: запросы, клики, просмотры) и метрики вовлеченности (stay-time). Данные передаются в User Information Database.

    INDEXING (Обработка пользовательских данных)
    Собранные данные обрабатываются. Система вычисляет Derived Data (History Score, Visit Score, Preferred Locations) и кластеризирует активность в Query Sessions и Session Groups. Этот процесс может происходить периодически или в офлайн-режиме.

    QUNDERSTANDING – Понимание Запросов
    Анализ истории запросов и их группировка в сессии помогает системе лучше понять контекст, тематические интересы и эволюцию намерений пользователя, что может использоваться для интерпретации текущих запросов.

    RERANKING – Переранжирование (Персонализация)
    Ключевое применение данных истории (описанное в Description). На этом этапе стандартный набор результатов модифицируется для конкретного пользователя. Результаты могут быть переупорядочены (повышение посещенных или предпочитаемых сайтов), визуально выделены или отображены в отдельном блоке на основе History Score и статуса Preferred Location.

    Интерфейс пользователя (UI/UX — Слой представления)
    Основное применение патента (Claims). Система генерирует графическое отображение (визуализацию) истории активности пользователя по его запросу (например, в интерфейсе истории поиска).

    Входные данные:

    • События пользователя (запросы, клики, просмотры) с метками времени и ContentID.
    • Идентификаторы (User Identifier, Client Identifier).
    • Запрос на визуализацию или стандартный поисковый запрос.

    Выходные данные:

    • Графическое отображение объема активности (например, календарь).
    • Персонализированная поисковая выдача (SERP).
    • Рассчитанные Derived Data (профили, предпочтения).

    На что влияет

    • Персонализация выдачи: Влияет на результаты поиска для пользователей, чья активность отслеживается (например, залогиненных пользователей или идентифицированных через Client Identifier). Влияние проявляется в изменении порядка результатов или добавлении индикаторов прошлых посещений.
    • Типы контента и запросов: Влияет на все типы контента и запросов, по которым у пользователя есть релевантная история активности.

    Когда применяется

    • Сбор данных: Происходит постоянно, если пользователь не отключил сбор (unsubscribe или snooze — функция временной приостановки записи).
    • Визуализация (Claims): Генерируется по явному запросу пользователя на просмотр его истории активности в графическом формате.
    • Персонализация (Description): Применяется во время обработки поискового запроса, если пользователь идентифицирован и у него есть релевантная история.

    Пошаговый алгоритм

    Алгоритм генерации графического отображения активности (согласно Claims)

    1. Получение запроса: Система получает запрос на отображение активности за период (Unit of Time), разбитый на подиницы (Sub-units of Time), с указанием фильтров (типы событий, критерии).
    2. Идентификация и фильтрация истории: Из User Information Database извлекается история пользователя, соответствующая заданным параметрам.
    3. Вычисление объема активности: Для каждой подиницы времени (например, дня) система рассчитывает Activity Number (объем активности). Этот объем может быть взвешенной суммой разных типов событий (Claim 3).
    4. Определение диапазонов и индикаторов: Система определяет диапазоны объема активности (например, 1-5, 6-50 событий) и соответствующие им Visually distinctive indicators (например, интенсивность цвета).
    5. Присвоение индикаторов: Каждой подинице времени присваивается индикатор, соответствующий ее рассчитанному объему.
    6. Формирование и предоставление ответа: Генерируется графическое отображение (например, календарь), где подиницы отображаются с присвоенными индикаторами, и отправляется пользователю.
    7. Обработка взаимодействия (Опционально): При клике на подиницу система либо генерирует более детальный отчет (Claim 12), либо показывает список событий (Claim 13).

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании поведенческих данных, собранных системой.

    • Поведенческие факторы: Являются основными данными. Включают:
      • Query Events (текст запроса).
      • Result Clicks (клики по результатам выдачи).
      • Ad Clicks (клики по рекламе).
      • Browsing Events (посещение страниц вне выдачи).
      • Stay-time (время пребывания на странице).
    • Временные факторы: Временные метки (Timestamp) для всех событий. Критичны для определения сессий, расчета свежести и построения визуализации.
    • Пользовательские факторы: User Identifier (аккаунт) и Client Identifier (устройство/браузер). Используются для агрегации данных между устройствами (FIG. 16).
    • Дополнительные данные (Additional Data): Пользовательские аннотации, метки (labels) и ручные корректировки рейтингов предпочтений.

    Какие метрики используются и как они считаются

    • Activity Number (Объем активности): Количество или взвешенная сумма событий за определенный период времени. Используется для генерации графического отображения. Может рассчитываться как:

    Выводы

    1. Детальное отслеживание поведения: Google обладает надежной инфраструктурой для детального отслеживания индивидуального поведения пользователя, включая запросы, клики (органика и реклама), просмотры страниц и метрики вовлеченности (stay-time).
    2. Поведенческие данные как основа персонализации: Патент явно описывает использование этой истории для модификации результатов поиска. Preferred Locations (сайты, часто посещаемые или с длительным stay-time) используются для корректировки выдачи пользователя.
    3. Анализ задач и интентов (Сессии): Система анализирует взаимосвязи между действиями, группируя их в Query Sessions (краткосрочные задачи) и Session Groups (долгосрочные интересы). Это указывает на способность системы понимать контекст и эволюцию намерений пользователя во времени.
    4. Многоканальный и многоплатформенный сбор: Описан механизм сбора данных из разных источников (поиск, браузинг) и синхронизации истории между разными устройствами путем ассоциации Client Identifiers с User Identifier.
    5. Визуализация активности как ключевое изобретение: Основное защищенное изобретение (Claims) — это функция пользовательского интерфейса: визуализация объема активности в виде временной шкалы или календаря с использованием индикаторов интенсивности.

    Практика

    Best practices (это мы делаем)

    • Приоритет вовлеченности и удовлетворенности пользователя (Stay-time): Патент подтверждает, что Google отслеживает stay-time как показатель интереса. Необходимо создавать контент, который удерживает пользователя и стимулирует длительное взаимодействие. Это повышает вероятность того, что сайт будет классифицирован как Preferred Location и получит бустинг в персонализированной выдаче этого пользователя.
    • Стимулирование повторных визитов и лояльности: Работа над построением бренда и возвращаемостью аудитории критически важна. Часто посещаемые сайты получают преимущество в персонализированном ранжировании. Необходимо становиться ресурсом, к которому пользователь регулярно возвращается.
    • Оптимизация под сессионный интент (Topical Authority): Учитывая, что Google группирует активность в Query Sessions, стратегия контента должна быть направлена на полное удовлетворение задачи пользователя в рамках всей сессии. Создание кластеров контента, отвечающих на смежные вопросы, помогает стать авторитетным источником на протяжении всего исследования пользователя.
    • Оптимизация SERP CTR: В описании патента указано, что score (оценка) результата может быть негативно затронута, если пользователь видел результат в выдаче, но не выбрал его. Работа над привлекательностью сниппетов критически важна для поддержания хороших персональных оценок.

    Worst practices (это делать не надо)

    • Использование кликбейта и генерация низкокачественного трафика: Привлечение кликов, которые приводят к быстрому уходу пользователя (низкий stay-time). В контексте этого патента, такое поведение снижает Visit Score для данного пользователя и уменьшает будущую видимость сайта в его персонализированной выдаче.
    • Игнорирование поведенческих метрик: Фокусировка исключительно на позициях без анализа времени на сайте и отказов рискованна, так как эти сигналы используются для оценки качества визита в профиле пользователя.

    Стратегическое значение

    Патент подтверждает стратегическую важность поведенческих факторов в экосистеме Google, как минимум, для целей персонализации. Он демонстрирует, что Google измеряет не только факт посещения, но и качество этого посещения (через stay-time). Долгосрочная SEO-стратегия должна фокусироваться не только на привлечении нового трафика, но и на качестве взаимодействия пользователя с контентом (вовлеченность, решение задачи), чтобы формировать положительные поведенческие сигналы в истории пользователя и строить лояльную аудиторию.

    Практические примеры

    Сценарий: Улучшение видимости в персонализированной выдаче через Stay-time и Preferred Locations

    1. Первое взаимодействие: Пользователь ищет «лучшие треккинговые ботинки». Он кликает на результат Сайта А и проводит на странице 7 минут, изучая детальный обзор. Система регистрирует Result Click Event и длительный stay-time.
    2. Обработка данных: Система обновляет Derived Data. Благодаря длительному stay-time, Сайт А получает высокий Visit Score и может быть включен в Preferred Locations пользователя по теме туризма.
    3. Второе взаимодействие (через неделю): Пользователь ищет «обзор рюкзаков Osprey».
    4. Ранжирование и Персонализация: Хотя в глобальном ранжировании Сайт А может уступать Сайту Б, для данного пользователя Сайт А получит персонализированное повышение (boosting), так как он уже имеет высокий Visit Score в профиле пользователя.
    5. Результат: В персонализированной выдаче пользователя Сайт А отображается выше Сайта Б.

    Вопросы и ответы

    Что такое «Stay-time» в контексте этого патента и как он влияет на SEO?

    Stay-time — это продолжительность времени, которое пользователь тратит на просмотр контента. В патенте он рассматривается как показатель интереса пользователя: чем дольше время пребывания, тем важнее сайт для пользователя. Для SEO это означает, что необходимо не просто привлечь трафик, но и удержать пользователя на странице, предоставляя ценный контент. Высокий Stay-time способствует тому, что сайт будет классифицирован как Preferred Location, что улучшает его позиции в персонализированной выдаче.

    Что такое «Preferred Locations» и как мой сайт может им стать?

    Preferred Locations (Предпочитаемые местоположения) — это сайты, которые система идентифицирует как важные для пользователя на основе его истории. В отличие от закладок, это происходит неявно. Чтобы сайт стал Preferred Location, он должен демонстрировать высокую частоту посещений пользователем, недавние визиты и высокий Stay-time. Работа над качеством контента и удовлетворенностью пользователя — лучший способ достичь этого статуса.

    Означает ли этот патент, что каждый пользователь видит совершенно разную поисковую выдачу?

    Не обязательно совершенно разную, но значительно персонализированную. Патент описывает механизмы для корректировки стандартной выдачи на основе истории пользователя. Это может включать повышение позиций ранее посещенных сайтов, их визуальное выделение (например, указание даты последнего визита) или добавление результатов из истории. Степень персонализации зависит от объема и релевантности истории пользователя по данному запросу.

    Что такое «Query Session» и почему это важно для SEO?

    Query Session — это группа связанных запросов, сделанных пользователем в течение одной сессии браузинга. Это важно, потому что показывает, как Google анализирует контекст и пытается понять задачу пользователя, а не просто отвечает на изолированные запросы. SEO-специалистам следует фокусироваться на создании контента, который отвечает на серию связанных вопросов в рамках одной темы (Topical Authority), поддерживая пользователя на протяжении всей его поисковой сессии.

    Как графическая визуализация активности (основной Claim патента) влияет на SEO?

    Сама по себе визуализация (например, тепловая карта активности в календаре) — это функция пользовательского интерфейса для анализа истории и прямого влияния на SEO не оказывает. Однако она демонстрирует, что Google систематически собирает, категоризирует и анализирует временные паттерны поведения пользователей. Понимание того, какие данные собираются и как они структурируются, помогает лучше понять механизмы персонализации.

    Отслеживает ли эта система пользователей, которые не вошли в аккаунт Google?

    Да. Патент описывает использование Client Identifier (идентификатора клиента), который может быть связан с конкретной установкой клиентского приложения или помощника (например, через cookie). Активность может отслеживаться по этому идентификатору. Однако патент также описывает механизм связывания нескольких Client Identifier с одним User Identifier (аккаунтом) для агрегации данных с разных устройств.

    Может ли сайт быть понижен в выдаче на основе истории пользователя?

    Да. В описании патента (Description) упоминается, что score (оценка) контента может быть негативно затронута, если пользователь видел контент в результатах поиска, но не выбрал его. Это подчеркивает важность высокого SERP CTR. Также, низкий stay-time (быстрый отказ) может привести к снижению персональной оценки сайта для этого пользователя.

    Чем «Stay-time» отличается от Dwell Time или Time on Page в аналитике?

    Концептуально они очень похожи. Stay-time в патенте — это время, проведенное за просмотром контента. Dwell Time обычно измеряется как время между кликом на выдаче и возвратом на нее. Time on Page в аналитике измеряет время между загрузками страниц на одном сайте. Патент описывает методы измерения Stay-time как с помощью клиентского приложения (Client Assistant), так и на сервере (аналогично измерению Dwell Time).

    Что патент говорит о важности повторных визитов?

    Повторные визиты критически важны. Они являются одним из ключевых факторов (наряду с давностью и Stay-time) для определения Preferred Locations. Сайты, которые пользователи посещают часто, получают значительное преимущество в персонализированном ранжировании для этих пользователей. Это подчеркивает важность построения лояльности и бренда.

    Как я могу использовать концепцию «Session Groups» в своей контент-стратегии?

    Session Groups объединяют связанные поисковые сессии, произошедшие в разное время. Это указывает на долгосрочные интересы или сложные задачи пользователя (например, планирование отпуска в течение нескольких недель). В контент-стратегии это означает необходимость создания хабов контента, которые поддерживают пользователя на разных этапах его пути (от начального исследования до принятия решения), позволяя ему возвращаться и продолжать исследование в рамках вашего сайта.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.