Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google строит граф интересов пользователя и классифицирует их как краткосрочные или долгосрочные для персонализации выдачи

    DETERMINING AND INFERRING USER ATTRIBUTES (Определение и вывод атрибутов пользователя)
    • US20160292299A1
    • Google LLC
    • 2016-10-06
    • 2014-01-29
    2014 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

    Google анализирует активность пользователя (поиск, email, карты, календарь) для построения персонального графа интересов (User Attribute Graph). Система классифицирует эти интересы как краткосрочные (например, планирование отпуска) или долгосрочные (например, хобби). При ранжировании Google отдает приоритет результатам, соответствующим текущим краткосрочным намерениям пользователя.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу повышения релевантности поиска и рекомендаций путем глубокого понимания контекста пользователя. Система стремится уйти от статичного профилирования к динамической модели, которая различает сиюминутные потребности (краткосрочные интересы) и устоявшиеся предпочтения (долгосрочные интересы), используя разрозненные данные об активности пользователя в различных приложениях.

    Что запатентовано

    Запатентована система для создания и управления коллекцией атрибутов пользователя (интересов, предпочтений), представленной в виде графа (User Attribute Graph). Система определяет атрибуты на основе действий пользователя и выводит (infer) связанные атрибуты. Ключевой механизм — это классификация атрибутов как краткосрочных (short-term) или долгосрочных (long-term) на основе частоты и продолжительности подтверждения (corroboration) этих интересов. Эта классификация используется для персонализации выдачи.

    Как это работает

    Система работает в несколько этапов:

    • Сбор данных: Агрегируется активность пользователя из разных источников (поиск, календарь, карты, медиа).
    • Построение графа: На основе активности определяются атрибуты и выводятся связанные атрибуты, формируя граф интересов.
    • Оценка уверенности (Confidence): Каждому атрибуту присваивается оценка уверенности. Последующие действия, подтверждающие интерес, увеличивают эту оценку. Изменение распространяется на связанные атрибуты.
    • Временная классификация: На основе динамики оценок уверенности атрибуты классифицируются как short-term (текущий интерес) или long-term (устойчивый интерес).
    • Персонализация: При обработке запроса система отдает предпочтение (favors) краткосрочным атрибутам над долгосрочными при ранжировании и генерации поисковых подсказок.

    Актуальность для SEO

    Высокая. Персонализация и понимание контекста пользователя, особенно временного аспекта его намерений (User Journey), остаются центральными задачами поиска. Описанные механизмы фундаментальны для того, как Google адаптирует результаты под текущие задачи и долгосрочные интересы пользователя, используя данные из всей экосистемы.

    Важность для SEO

    Патент имеет высокое значение (85/100) для SEO-стратегии. Он раскрывает механизмы, как Google динамически адаптирует выдачу под изменяющиеся интересы пользователя. Это подчеркивает важность понимания не только статической релевантности, но и контекста пути пользователя (Customer Journey). SEO-стратегии должны учитывать, что пользователи в фазе активного исследования (short-term интерес) могут видеть выдачу, отличную от пользователей с устоявшимися предпочтениями.

    Детальный разбор

    Термины и определения

    User Attribute (Атрибут пользователя)
    Интерес, предпочтение, вкус, поведенческий паттерн или характеристика пользователя.
    User Attribute Graph (Граф атрибутов пользователя)
    Структура данных, представляющая коллекцию атрибутов конкретного пользователя. Узлы — атрибуты, ребра — связи между ними.
    Confidence Score (Оценка уверенности)
    Вес или метрика, показывающая, насколько вероятно, что атрибут действительно применим к пользователю.
    Corroboration (Подтверждение)
    Действие пользователя, которое поддерживает существующий атрибут. Подтверждение увеличивает Confidence Score.
    Inferred User Attribute (Выведенный/Инферированный атрибут)
    Потенциальный атрибут, который не был напрямую определен из действий, а выведен на основе других атрибутов и/или агрегированных данных.
    Aggregate User Attribute Graph (Агрегированный граф атрибутов пользователя)
    Граф, представляющий атрибуты и связи между ними для популяции пользователей. Используется для вывода потенциальных атрибутов для конкретного пользователя.
    Short-term Attribute (Краткосрочный атрибут)
    Атрибут, классифицированный как представляющий непосредственный или временный интерес пользователя.
    Long-term Attribute (Долгосрочный атрибут)
    Атрибут, представляющий устойчивый интерес. Формируется, если атрибут поддерживает высокий Confidence Score в течение длительного времени.
    Decay (Затухание)
    Процесс уменьшения Confidence Score атрибута с течением времени, если он не получает подтверждений (Corroboration).
    Propagation (Распространение)
    Процесс, при котором изменение Confidence Score одного атрибута влияет на оценки связанных с ним атрибутов.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс использования временной классификации атрибутов для ранжирования поиска.

    1. Система определяет множество атрибутов пользователя на основе его активности (некоторые выводятся из других).
    2. Система классифицирует атрибуты как short-term или long-term на основе подтверждения (corroboration) этого атрибута во времени.
    3. После классификации система получает поисковый запрос от пользователя.
    4. Система определяет, что запрос связан с short-term attribute.
    5. Система ранжирует результаты поиска, отдавая предпочтение (favors) атрибуту, классифицированному как short-term, над атрибутом, классифицированным как long-term.

    Ключевой механизм: Ранжирование динамически ориентируется на текущие (краткосрочные) интересы пользователя, ставя их выше его долгосрочных предпочтений.

    Claim 14 (Независимый пункт): Аналогичен Claim 1, но применяется к выбору альтернативных предложений запроса (alternative query suggestions).

    Система выбирает поисковые подсказки, отдавая предпочтение short-term атрибутам над long-term, если текущий ввод связан с краткосрочным интересом.

    Claim 4, 5, 6 (Зависимые): Уточняют механизм вывода атрибутов.

    Вывод атрибута основывается на другом атрибуте и на данных, существовавших до активности (preexisting data), таких как агрегированные данные популяции пользователей (Aggregate User Attribute Graph). Это позволяет прогнозировать интересы на основе поведения похожих пользователей.

    Claim 11 (Зависимый): Описывает механизм «повышения» атрибута.

    Система переклассифицирует short-term атрибут в long-term, если его Confidence Score удовлетворяет пороговому значению в течение определенного временного интервала.

    Claim 12 и 13 (Зависимые): Описывают механизм затухания.

    Система уменьшает (decaying) Confidence Score долгосрочного атрибута между случаями его подтверждения. Если оценка падает ниже порога, атрибут деклассифицируется.

    Где и как применяется

    Изобретение затрагивает несколько ключевых этапов поиска, связанных с профилированием пользователя и персонализацией.

    INDEXING (Feature Extraction) и Хранение Данных (Офлайн/Фоновый режим)
    Это не индексирование веба, а непрерывное профилирование пользователя. Graph Engine обрабатывает User Activity (логи поиска, данные локаций, email, календарь) для построения и обновления User Attribute Graph. Здесь происходит расчет Confidence Scores и классификация атрибутов.

    QUNDERSTANDING – Понимание Запросов (Реальное время)
    Система интерпретирует запрос в контексте User Attribute Graph. Alternative Query Suggestion Engine использует классификацию атрибутов для генерации персонализированных подсказок, отдавая предпочтение short-term атрибутам (Claim 14).

    RANKING / RERANKING – Ранжирование и Переранжирование (Реальное время)
    Ranking Engine использует классификацию атрибутов для корректировки весов результатов. Если запрос связан с short-term attribute, система активно повышает результаты, релевантные этому атрибуту, по сравнению с результатами, релевантными только long-term attributes (Claim 1).

    Входные данные:

    • Активность пользователя (User Activity) из множества источников.
    • Агрегированные данные о поведении пользователей (Aggregate User Attribute Graph).
    • Поисковый запрос пользователя.

    Выходные данные:

    • Обновленный User Attribute Graph с оценками Confidence и классификацией.
    • Персонализированные результаты поиска.
    • Персонализированные предложения альтернативных запросов.

    На что влияет

    • Специфические запросы: Наибольшее влияние на запросы, связанные с планированием, исследованиями, покупками или событиями, где у пользователя формируется выраженный краткосрочный интерес. Также влияет на неоднозначные запросы, где интент зависит от контекста.
    • Конкретные ниши: Путешествия, e-commerce, финансы, недвижимость, образование — ниши, где путь пользователя включает фазы активного исследования.

    Когда применяется

    Система профилирования работает непрерывно. Механизм приоритезации в поиске активируется при выполнении условий:

    • У пользователя существуют атрибуты, классифицированные как short-term и long-term.
    • Триггер активации: Поступивший запрос явно или неявно связан с одним из short-term attributes. Это запускает логику приоритезации краткосрочных интересов над долгосрочными.

    Пошаговый алгоритм

    Процесс А: Построение и обновление графа атрибутов (Фоновый режим)

    1. Обнаружение активности: Система обнаруживает новое действие пользователя.
    2. Проверка подтверждения (Corroboration): Определяется, подтверждает ли это действие существующий атрибут.
      • Если ДА: Увеличивается Confidence Score этого атрибута. Изменение распространяется (Propagation) на связанные выведенные атрибуты.
    3. Определение нового атрибута: Определяется, достаточно ли данных для создания нового атрибута.
      • Если ДА: Создается новый узел в графе с начальным Confidence Score.
    4. Вывод связанных атрибутов (Inference): На основе нового атрибута и Aggregate User Attribute Graph выводятся потенциальные связанные атрибуты (с низким Confidence Score).
    5. Временная классификация и Затухание (Периодически):
      • Атрибуты с высокой активностью за короткий период классифицируются как Short-term.
      • Если Short-term атрибут поддерживает высокий Confidence Score длительное время, он переклассифицируется в Long-term.
      • Confidence Score атрибутов уменьшается (Decay), если нет подтверждений.

    Процесс Б: Обработка запроса (Реальное время)

    1. Получение запроса: Пользователь вводит запрос.
    2. Анализ атрибутов: Система обращается к User Attribute Graph пользователя.
    3. Определение связи с атрибутами: Определяется, связан ли запрос с Short-term или Long-term атрибутами.
    4. Применение приоритезации: Если запрос связан с Short-term атрибутом, система активирует режим ранжирования (или выбора подсказок), который отдает предпочтение Short-term атрибутам над Long-term.
    5. Генерация SERP: Формируется персонализированная выдача.

    Какие данные и как использует

    Данные на входе

    Система использует широкий спектр данных об активности пользователя для построения графа атрибутов:

    • Поведенческие факторы: История поиска (search history), клики (click through rates), игры, потребляемый медиаконтент.
    • Контентные факторы (Пользовательский контент): Содержание электронных писем, текстовых сообщений, сообщений в социальных сетях (при наличии разрешений).
    • Временные факторы: Расписание пользователя в календаре (calendar).
    • Географические факторы: Посещенные пользователем локации (данные карт).
    • Транзакционные факторы: История покупок (purchase history).

    Какие метрики используются и как они считаются

    • Confidence Score (Оценка уверенности): Числовая оценка вероятности принадлежности атрибута пользователю. Увеличивается при подтверждении (Corroboration) и может уменьшаться со временем (Decay).
    • Порог для определения нового атрибута: Минимальный уровень активности или ясности контекста, необходимый для создания нового атрибута.
    • Confidence Threshold (Порог уверенности для классификации): Уровень Confidence Score, который атрибут должен поддерживать в течение определенного времени (predetermined time interval), чтобы быть классифицированным как Long-term.
    • Степень связи между атрибутами: Определяется на основе Aggregate User Attribute Graph. Используется для вывода новых атрибутов и распространения (Propagation) изменений Confidence Score.

    Выводы

    1. Динамическое профилирование пользователя: Google активно строит детальный граф интересов (User Attribute Graph) для каждого пользователя, используя данные из всех доступных источников. Это не статический профиль, а постоянно обновляемая структура.
    2. Время как ключевой фактор классификации: Система формально различает сиюминутные увлечения (Short-term) и устойчивые интересы (Long-term). Классификация зависит от частоты и продолжительности подтверждения интереса действиями пользователя.
    3. Приоритет текущего контекста (Short-term) в ранжировании: Ключевой вывод — система намеренно отдает предпочтение краткосрочным интересам над долгосрочными, если запрос связан с текущей задачей пользователя. Это радикально меняет понимание персонализации.
    4. Уверенность требует подтверждения и подвержена затуханию: Интересы должны постоянно подтверждаться (Corroboration), иначе их вес затухает (Decay). Повторное взаимодействие с темой усиливает ее значимость в профиле.
    5. Вывод и распространение интересов: Система активно достраивает профиль, выводя потенциальные интересы (Inference) и распространяя изменения уверенности по графу (Propagation). Активность в одной узкой теме влияет на восприятие пользователя в более широком контексте.

    Практика

    Best practices (это мы делаем)

    • Оптимизация под Customer Journey и фазы интереса: Разрабатывайте контент, соответствующий фазе активного исследования (когда формируются Short-term Attributes). Понимание того, что пользователь ищет *сейчас* (например, планирует покупку), позволяет предоставить контент, который получит приоритет в ранжировании благодаря механизму приоритезации краткосрочных интересов.
    • Стимулирование повторного взаимодействия (Corroboration): Используйте ремаркетинг, email-рассылки и внутреннюю перелинковку, чтобы побуждать пользователя возвращаться к теме. Повторные взаимодействия увеличивают Confidence Score связанных атрибутов в профиле пользователя, повышая шансы на классификацию интереса как Long-term.
    • Построение Topical Authority и охват связанных интересов: Поскольку интересы связаны в графе и уверенность распространяется (Propagation), необходимо широко освещать основную тему и подтемы. Это увеличивает вероятность того, что ваш контент будет релевантен как прямым, так и выведенным (Inferred) атрибутам пользователя.
    • Использование сезонности и трендов: Активно работайте с трендовыми темами, которые генерируют всплески краткосрочных интересов. Своевременное создание релевантного контента позволяет воспользоваться приоритетным ранжированием по этим темам.

    Worst practices (это делать не надо)

    • Игнорирование текущего контекста пользователя: Предложение контента, основанного только на общих предположениях или долгосрочных интересах, без учета текущих задач пользователя. Например, показывать общую информацию, когда пользователь активно ищет конкретный продукт для покупки.
    • Фокус только на статичном «вечнозеленом» контенте: Создание только статического контента без учета динамики интересов или появления новых трендов. Это приводит к упущенным возможностям в моменты пикового краткосрочного интереса.
    • Пренебрежение удержанием аудитории: Рассматривать трафик как набор разовых визитов. Если пользователь не возвращается, связанные с вашим сайтом атрибуты в его профиле будут затухать (Decay), и вы потеряете преимущества персонализации.

    Стратегическое значение

    Патент подтверждает стратегическую важность понимания пользователя за пределами конкретного запроса. Google стремится понять *намерение* и *контекст*, используя временную динамику интересов. Для SEO это означает переход от оптимизации страниц к оптимизации под путь пользователя (Customer Journey). Долгосрочная стратегия должна быть направлена на построение отношений с пользователем и адаптацию контента под различные фазы его интереса — от мимолетного исследования до формирования устойчивого предпочтения.

    Практические примеры

    Сценарий: Оптимизация для пользователя, планирующего отпуск (Краткосрочный интерес)

    1. Активность пользователя: Пользователь начинает искать «отели на Крите», просматривает карты Крита и добавляет даты поездки в календарь.
    2. Действия Google: Google создает Short-term Attribute «Планирование поездки на Крит» с высоким Confidence Score. Выводятся связанные атрибуты: «Пляжный отдых», «Достопримечательности Греции».
    3. Изменение ранжирования: Когда этот пользователь ищет «лучшие рестораны Крит», Google отдаст приоритет результатам, связанным с его краткосрочным интересом (поездка), а не его долгосрочным интересом (например, «Итальянская кухня», которой он обычно интересуется).
    4. Действия SEO: Туристический сайт должен иметь кластер контента, покрывающий все этапы планирования поездки на Крит. Необходимо активно продвигать этот контент в период планирования, чтобы попасть в поле зрения пользователя, когда его краткосрочный интерес дает приоритет в выдаче.

    Вопросы и ответы

    Как Google определяет, является ли интерес краткосрочным или долгосрочным?

    Это определяется на основе подтверждения (Corroboration) интереса во времени. Если пользователь активно взаимодействует с темой (высокий Confidence Score) в течение короткого периода, интерес классифицируется как Short-term. Если высокий Confidence Score поддерживается в течение длительного предопределенного интервала времени, интерес может быть повышен до Long-term.

    Почему Google отдает приоритет краткосрочным интересам над долгосрочными?

    Система предполагает, что краткосрочные интересы отражают текущую задачу или намерение пользователя. Для обеспечения максимальной полезности в данный момент Google стремится предоставить информацию, которая наиболее релевантна этой текущей задаче, даже если она не соответствует обычным долгосрочным предпочтениям пользователя.

    Что происходит, когда интерес пользователя угасает?

    Если пользователь перестает взаимодействовать с темой, Confidence Score атрибута начнет снижаться. Патент описывает механизм затухания (Decay) для долгосрочных атрибутов. Если уверенность падает ниже определенного порога, атрибут может потерять свой статус или даже быть удален из графа пользователя.

    Какие данные Google использует для построения этого графа интересов?

    Патент упоминает широкий спектр данных: историю поиска, клики, содержание электронных писем и сообщений (при наличии разрешений), расписание в календаре, историю покупок, посещенные локации (данные карт) и потребляемый медиаконтент. Используется активность пользователя во всей экосистеме Google.

    Как SEO-специалист может повлиять на граф интересов пользователя?

    Создавая контент, который вовлекает пользователя и стимулирует его к повторному взаимодействию с темой на вашем сайте. Чем чаще пользователь возвращается и подтверждает свой интерес (Corroboration), тем выше будет Confidence Score связанного атрибута в его профиле и тем вероятнее, что ваш сайт будет ассоциироваться с этим интересом.

    Что такое «выведенный» (Inferred) атрибут и как он используется?

    Выведенный атрибут — это интерес, который система предполагает у пользователя на основе его прямых действий и агрегированных данных о поведении других людей (Aggregate User Attribute Graph). Например, если пользователь ищет «лыжные перчатки», система может вывести интерес к «зимнему спорту». Изначально у таких атрибутов низкий Confidence Score, но он может расти при подтверждении.

    Как этот патент влияет на стратегию работы с ключевыми словами?

    Он снижает зависимость от точного совпадения ключевых слов и повышает важность понимания интента и контекста. Вместо фокуса на отдельных запросах, необходимо фокусироваться на темах и этапах пути пользователя (Customer Journey), чтобы соответствовать его формирующимся краткосрочным и долгосрочным интересам.

    Что такое «распространение уверенности» (Propagation) в графе атрибутов?

    Это механизм, при котором увеличение Confidence Score одного атрибута приводит к увеличению Confidence Score связанных с ним атрибутов. Например, если подтверждается интерес к «лыжным перчаткам» (дочерний узел), это также увеличивает уверенность в интересе к «зимнему спорту» (родительский узел).

    Как работа с сезонным спросом связана с этим патентом?

    Сезонный спрос является отличным примером формирования массовых краткосрочных интересов. Оптимизация под сезонные темы позволяет воспользоваться механизмом приоритезации Short-term атрибутов. Важно начинать работу заранее, чтобы «захватить» интерес пользователя на этапе его формирования.

    Влияет ли этот механизм на локальный поиск?

    Да, патент упоминает использование данных о локации (Map App). Например, если у пользователя есть краткосрочный интерес к «итальянской кухне», и он ищет ресторан, система может отдать приоритет итальянским ресторанам поблизости, даже если обычно он предпочитает азиатскую кухню (долгосрочный интерес).

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.