Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи

Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.

Описание

Какую задачу решает

Патент решает задачу понимания неявного намерения пользователя (Implicit Intent), особенно когда он ищет личную информацию без явного указания (например, вводит [airline] вместо [my flights on airline]). Система улучшает точность интерпретации запроса путем устранения неоднозначности на основе личного контекста пользователя (например, понимая, что [Max] — это контакт пользователя, а не математическая функция). Это также позволяет экономить вычислительные ресурсы за счет определения намерения до выполнения дорогостоящих поисковых операций по личным данным.

Что запатентовано

Запатентована система для генерации персонализированной модели пользователя (User Model) и ее использования для аннотирования поисковых запросов. User Model создается на основе контента, сгенерированного пользователем (user-generated content) в различных сервисах (почта, контакты, соцсети). Модель содержит извлеченные термины (n-grams), аннотированные контекстом их использования. Эта модель применяется для определения намерения пользователя (личное или общее) и уточнения запроса для предоставления персонализированных результатов.

Как это работает

Система работает в двух режимах:

Офлайн (Создание модели): Система извлекает n-grams из личного контента пользователя, фильтрует стоп-слова, аннотирует термины контекстом (например, «имя», «дата», «местоположение») и сохраняет их в User Model с метками свежести.
Онлайн (Обработка запроса): При получении запроса компонент Implicit Intent Trigger обращается к User Model. На основе совпадения терминов, их свежести (Freshness Score) и временного контекста (Interest Window) определяется намерение пользователя. Если обнаружено личное намерение (Personal Intent), компонент Query Annotator уточняет запрос, используя аннотации из модели. Затем система выполняет поиск по аннотированному запросу.

Актуальность для SEO

Высокая. Понимание личного контекста и предоставление проактивных, персонализированных ответов является ядром стратегии Google (например, Google Assistant, интеграция данных Gmail/Workspace в Поиск). Описанные механизмы интерпретации запросов на основе личных данных крайне актуальны для понимания того, как Google обрабатывает запросы аутентифицированных пользователей.

Важность для SEO

Патент имеет значительное влияние на SEO-стратегию (7.5/10). Хотя он фокусируется на личных данных, он критически важен для понимания того, как Google интерпретирует запросы залогиненных пользователей. Система определяет, являются ли органические веб-результаты основным ответом или приоритет отдается личной информации (например, деталям бронирования из почты). Это напрямую влияет на видимость и кликабельность органических результатов в персонализированной выдаче.

Детальный разбор

Термины и определения

Annotations (Аннотации): Метки, присваиваемые терминам (n-grams) в User Model, указывающие на контекст использования термина. Примеры: имя, фамилия, адрес, человек (Person), объект, тема, дата, время, местоположение (Location). Структурируют данные в модели.
Freshness Score (Оценка свежести): Метрика, связанная с n-gram в User Model, основанная на возрасте исходного контента (например, давности электронного письма). Используется при определении намерения.
General Intent (Общее намерение) / Web-based Intent: Намерение пользователя получить общие результаты поиска (из интернета), не специфичные для его личных данных.
Implicit Intent (Неявное намерение): Истинное намерение пользователя при отправке запроса, определяемое системой без явных указаний со стороны пользователя.
Implicit Intent Trigger (Триггер неявного намерения): Компонент системы, который анализирует запрос и User Model для определения, ищет ли пользователь личные или общие результаты. Рассчитывает Intent Score.
Interest Window (Окно интереса): Период времени между событием в User Model (например, бронированием рейса) и моментом запроса. Используется для определения актуальности личного намерения (например, рейс в ближайшие 24 часа).
N-grams: Последовательности из одного или нескольких терминов, извлеченные из user-generated content и сохраненные в User Model.
Personal Intent (Личное намерение): Намерение пользователя получить персонализированные результаты поиска (personal search results), основанные на его личном контенте.
Query Annotator (Аннотатор запросов): Компонент, который модифицирует входящий запрос, добавляя к его терминам аннотации, взятые из User Model, создавая annotated search query (персональный запрос).
User-Generated Content (Контент, сгенерированный пользователем): Личные данные пользователя из различных сервисов: электронные письма, чаты, контакты, посты в социальных сетях, блоги, документы.
User Model (Модель пользователя): Персонализированная модель данных, специфичная для конкретного пользователя. Содержит n-grams, извлеченные из его личного контента, вместе с аннотациями контекста и оценками свежести.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод использования модели пользователя для аннотирования запроса.

Система получает поисковый запрос от пользователя.
Система обращается к User Model, специфичной для этого пользователя. Модель содержит n-grams, причем термины в них аннотированы контекстом их использования.
Система аннотирует один или несколько терминов в поисковом запросе, используя аннотации из User Model, создавая annotated search query.
Система получает результаты поиска, релевантные аннотированному поисковому запросу.

Ядро изобретения — использование персональной контекстуальной модели (User Model) для модификации (аннотирования) запроса перед поиском.

Claim 2 (Зависимый от 1): Уточняет процесс аннотирования.

Определяется, что термины в запросе соответствуют терминам в n-grams модели пользователя.
Аннотирование происходит с использованием аннотаций, связанных с этими соответствующими терминами в модели.

Это механизм сопоставления запроса с моделью для переноса личного контекста.

Claim 4 (Зависимый от 1): Определяет источник данных для User Model.

N-grams в модели получены из множества документов, связанных с пользователем и сгенерированных с использованием множества компьютерных сервисов (почта, контакты и т.д.).

Claim 6 (Зависимый от 1): Добавляет этап определения намерения.

Система сначала определяет user intent, связанное с запросом. Аннотирование запроса выполняется в ответ на это определенное намерение. Это указывает на то, что аннотирование может быть выборочным и активируется при обнаружении определенного интента (например, Personal Intent, как указано в Claim 7).

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поисковой архитектуры, в основном связанных с обработкой запроса и персонализацией.

INDEXING – Индексирование (Личных данных)
На этом этапе (обычно офлайн или в фоновом режиме) происходит обработка User-Generated Content (почта, контакты и т.д.). Система User Model Generator извлекает n-grams, аннотирует их контекстом и создает User Model. Эти данные сохраняются в хранилище User Models и индексируются в User Content Index.

QUNDERSTANDING – Понимание Запросов
Основной этап применения патента. Когда аутентифицированный пользователь вводит запрос:

Определение намерения: Система (Intent System), в частности Implicit Intent Trigger, анализирует запрос в контексте User Model для определения Implicit Intent (Personal vs General).
Аннотирование запроса: Если обнаружено личное намерение, Query Annotator использует контекстуальные аннотации из User Model для уточнения и обогащения запроса (устранение неоднозначности).

METASEARCH / RERANKING – Метапоиск и Переранжирование
На этом этапе принимается решение о том, как представить результаты пользователю. Если Intent Score для личного намерения высок, персонализированные результаты (из User Content Index) отображаются на более заметных позициях, чем общие веб-результаты (из Search Index), и наоборот.

Входные данные:

Исходный запрос пользователя.
Идентификатор аутентифицированного пользователя.
User Model пользователя (n-grams, аннотации, Freshness Scores).
Текущее время (для расчета Interest Window).
Исторические данные о кликах пользователя (Historical Data).

Выходные данные:

Определенное намерение пользователя (Intent Score).
Аннотированный поисковый запрос (Annotated Search Query).
Набор результатов поиска (персонализированных и/или общих), отсортированных с учетом намерения.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы, где личный контекст может радикально изменить интерпретацию (например, [Jaguar] как машина, животное или название кафе, где у пользователя назначена встреча). Также влияет на запросы, связанные с сущностями, известными пользователю лично (имена контактов, названия проектов).
Конкретные типы контента: Влияет на отображение личного контента (письма, документы, события календаря) в результатах поиска.
Временные запросы: Запросы, связанные с предстоящими событиями (путешествия, бронирования, встречи), где срабатывает Interest Window.

Когда применяется

Условия работы: Алгоритм применяется только для аутентифицированных (залогиненных) пользователей, для которых существует User Model и которые дали разрешение на использование их данных для персонализации (как указано в разделе о приватности патента).
Триггеры активации: Активируется, когда термины запроса совпадают с n-grams в User Model.
Пороговые значения: Активация личного поиска зависит от Intent Score, который должен превысить определенный порог. Этот балл рассчитывается на основе качества совпадения, Freshness Score, исторических данных о кликах и того, попадает ли запрос в Interest Window.

Пошаговый алгоритм

Процесс А: Генерация модели пользователя (Офлайн / Фоновый режим)

Сбор данных: Получение доступа к User-Generated Content из различных сервисов (почта, контакты, соцсети, документы).
Извлечение информации: Идентификация потенциально интересных терминов и концепций (например, имен собственных) и генерация n-grams. Фильтрация стоп-слов.
Аннотирование: Анализ контекста использования терминов в исходных документах (например, поле «От кого» в письме, запись в контактах). Присвоение аннотаций (например, ‘Person’, ‘Location’, ‘Date’, ‘Sender’).
Оценка свежести: Присвоение Freshness Score на основе возраста исходного контента.
Сохранение модели: Сохранение аннотированных n-grams в User Model, специфичной для пользователя.
Обновление: Периодическое обновление модели, удаление устаревших n-grams (чья свежесть ниже порога) или удаление данных при удалении исходного контента пользователем.

Процесс Б: Обработка запроса (Онлайн)

Получение запроса: Получение запроса от аутентифицированного пользователя.
Доступ к модели: Извлечение соответствующей User Model.
Определение намерения (Implicit Intent Trigger):
- Сравнение терминов запроса с n-grams в модели (включая синонимы).
- Расчет оценок совпадения (Closeness of Match). Точное совпадение оценивается выше синонима.
- Учет Freshness Score совпадающих n-grams.
- Анализ Interest Window (близость к событиям).
- Учет исторических данных о кликах пользователя по личным/общим результатам для похожих запросов.
- Расчет итогового Intent Score.
Принятие решения: Сравнение Intent Score с порогами для определения типа интента (Личный, Общий или Смешанный).
Аннотирование запроса (Query Annotator): Если определен Личный или Смешанный интент:
- Идентификация терминов запроса, которые есть в модели.
- Применение аннотаций из модели к терминам запроса (например, запрос [Max] аннотируется как ‘Person’).
Выполнение поиска: Отправка аннотированного запроса в поисковую систему для получения результатов (из User Content Index и/или Search Index). Может включать сопоставление с грамматическими шаблонами (например, [emails from /Sender/]).
Формирование выдачи: Объединение и ранжирование результатов с учетом определенного намерения (например, показ личных результатов выше при высоком Intent Score).

Какие данные и как использует

Данные на входе

Контентные факторы (Личные / User-Generated Content): Текст, темы и метаданные (отправитель, получатель) электронных писем; данные контактной книги; посты и взаимодействия в социальных сетях; события календаря; личные документы.
Поведенческие факторы: Исторические данные о кликах пользователя (Selection data). Учитывается, выбирал ли пользователь ранее личные или общие результаты в ответ на похожие запросы.
Временные факторы: Возраст личного контента (используется для Freshness Score). Текущее время относительно времени события, упомянутого в личном контенте (используется для Interest Window).
Пользовательские факторы: Идентификатор пользователя для доступа к его персональной User Model.

Какие метрики используются и как они считаются

Intent Score (Оценка намерения): Агрегированная метрика для определения типа интента. Рассчитывается как взвешенная комбинация различных оценок (свежесть, качество совпадения, исторические данные, окно интереса).
Freshness Score (Оценка свежести): Метрика, уменьшающаяся со временем с момента создания исходного контента. Недавний контент имеет более высокий балл и сильнее влияет на интент.
Interest Window (Окно интереса): Временная метрика, основанная на близости времени запроса к времени события. Попадание в окно значительно увеличивает вероятность Personal Intent.
Closeness of Match (Близость совпадения): Оценка того, насколько точно термины запроса совпадают с n-grams в модели (точное совпадение vs синоним).

Выводы

Персонализация через приватные данные: Google активно создает детализированные профили (User Models) на основе частных данных пользователя (почта, контакты, документы), формируя персональный граф знаний для глубокого понимания его индивидуального контекста.
Контекст и аннотации как ключ к пониманию: Система полагается на аннотации (понимание типа сущности и контекста ее использования в личных данных), чтобы устранять неоднозначность запросов в реальном времени. Это подтверждает важность сущностного подхода к поиску.
Динамическое определение интента: Намерение пользователя (Личное vs Общее) определяется динамически. Временные факторы — Freshness (недавняя активность) и Interest Window (предстоящие события) — являются сильными сигналами для активации персонального поиска.
Личные результаты конкурируют с органикой: Если система определяет сильное Personal Intent, персонализированные результаты (например, информация о рейсе из Gmail) могут занять приоритетные позиции, значительно понижая или вытесняя стандартные органические веб-результаты для данного пользователя.
Интерпретация запроса индивидуальна: Один и тот же запрос будет интерпретирован по-разному для разных пользователей (или даже для одного пользователя в разное время) в зависимости от содержания их User Model и текущего временного контекста.

Практика

Best practices (это мы делаем)

Использование Email-маркетинга для попадания в User Model: Это ключевая практическая рекомендация. Поощряйте взаимодействие пользователей с вашим брендом через электронную почту (подтверждения заказов, бронирования, информационные рассылки). Это позволяет сущностям вашего бренда (название компании, номера рейсов, названия продуктов) попасть в User Model пользователя. Это увеличивает вероятность того, что при последующих запросах система правильно идентифицирует Personal Intent, связанный с вашим брендом.
Внедрение разметки для писем (Gmail Markup): Для транзакционных писем (бронирования, покупки, события) используйте разметку (например, JSON-LD в письмах). Это помогает Google корректно извлекать и аннотировать данные из писем, что повышает качество User Model и вероятность показа персонализированных блоков (например, статус рейса) в поиске пользователя.
Оптимизация под сущности (Entity Optimization): Хотя патент использует личные данные, описанный механизм аннотирования и контекстуализации подтверждает фокус Google на сущностях. Необходимо продолжать работу над четким определением сущностей на сайте и их взаимосвязей (использование Schema.org), чтобы облегчить системам (как общим, так и персональным) правильную интерпретацию контента.
Анализ неоднозначности запросов: При исследовании семантики учитывайте, что интерпретация неоднозначных запросов может сильно варьироваться для залогиненных пользователей в зависимости от их недавней активности и личных данных.

Worst practices (это делать не надо)

Игнорирование персонализации при анализе позиций и трафика: Оценка эффективности SEO только по «чистой» выдаче (в режиме инкогнито) может привести к неверным выводам, так как значительная часть пользователей видит персонализированную выдачу, сформированную под влиянием их User Model.
Фокус только на ключевых словах без учета интента и контекста: Стратегии, основанные на объеме ключевых слов без понимания того, как личный контекст может полностью изменить интент пользователя (с Общего на Личный), будут неэффективны.
Игнорирование Email как канала влияния на поиск: Рассмотрение email-маркетинга в отрыве от поисковой стратегии является ошибкой, так как email является ключевым источником данных для формирования User Model и влияния на персонализированный поиск.

Стратегическое значение

Патент подтверждает стратегический курс Google на гиперперсонализацию и проактивное предоставление информации. Для SEO это означает, что конкуренция происходит не только между веб-сайтами, но и между органической выдачей и личными данными пользователя. Личный контекст пользователя может радикально изменить SERP, отдавая приоритет прямой информации (из Gmail, Календаря) перед органическими ссылками. Долгосрочная стратегия должна включать укрепление присутствия бренда в личном информационном пространстве пользователя (например, через email).

Практические примеры

Сценарий 1: Влияние Interest Window на выдачу в Travel/E-commerce

Действие пользователя: Пользователь бронирует рейс авиакомпании «Airline X» на 15 октября и получает подтверждение по почте.
Создание User Model: Google обрабатывает письмо, извлекает n-grams («Airline X», «15 октября») и аннотирует их как ‘Organization’, ‘Date’, ‘Flight’.
Запрос (5 октября): Пользователь вводит запрос [Airline X].
Анализ интента: Система проверяет User Model. Совпадение есть, но до рейса 10 дней. Interest Window (например, 72 часа до рейса) не активирован. Intent Score низкий.
Результат: Система определяет General Intent. Пользователь видит стандартную выдачу с официальным сайтом Airline X на первом месте.
Запрос (14 октября): Пользователь вводит тот же запрос [Airline X].
Анализ интента: Совпадение есть, и Interest Window активирован (до рейса менее 24 часов). Intent Score высокий.
Результат: Система определяет Personal Intent. Пользователь видит блок с деталями своего рейса (время вылета, терминал) над всеми органическими результатами.

Сценарий 2: Дисамбигуация запроса на основе User Model

Контекст пользователя А: В его контактах есть «Max Ivanov». Он часто получает от него письма. В User Model «Max» аннотирован как ‘Person’, ‘Sender’.
Контекст пользователя Б: Он студент-математик и часто ищет информацию о функции «max». У него нет контактов с именем Max.
Запрос: Оба пользователя вводят запрос [Max].
Результат для А: Система определяет Personal Intent и аннотирует запрос как [Person: Max]. В выдаче могут быть показаны последние письма от Max Ivanov или его контактная информация.
Результат для Б: Система определяет General Intent. В выдаче будут результаты о математической функции или другие общие значения слова «max».

Вопросы и ответы

Что такое User Model и откуда Google берет для нее данные?

User Model — это персональный профиль пользователя, содержащий ключевые термины (n-grams) из его личного контента и контекст их использования (аннотации). Данные берутся из User-Generated Content: электронных писем (Gmail), контактов, чатов, документов и событий календаря. Это приватные данные пользователя, используемые для персонализации его поиска.

Как этот патент влияет на традиционное SEO, если он работает с личными данными?

Влияние значительно и заключается в двух аспектах. Во-первых, это конкуренция за место на SERP: если система определяет Personal Intent, то личные результаты (например, детали рейса из Gmail) могут занять топовые позиции, смещая органическую выдачу вниз. Во-вторых, это интерпретация запроса: User Model помогает Google устранять неоднозначность запросов для залогиненных пользователей, что напрямую влияет на то, какие сайты будут признаны релевантными.

Что такое «Interest Window» (Окно интереса) и как он работает?

Это механизм учета времени для определения намерения. Если у пользователя есть предстоящее событие (например, бронь столика или рейс), и он вводит связанный запрос незадолго до этого события (например, за 24 часа до рейса), система с большей вероятностью определит личное намерение. Если же до события еще много времени, интент скорее всего будет признан общим.

Что такое аннотирование запроса в контексте этого патента?

Это процесс обогащения запроса контекстом из User Model. Например, если пользователь вводит [встреча с Max], а в его модели «Max» аннотирован как ‘Person’ (потому что он есть в контактах), система будет интерпретировать «Max» именно как человека, а не как математическую функцию или название бренда. Это позволяет выполнить более точный поиск.

Как SEO-специалист может повлиять на User Model пользователя?

Напрямую повлиять нельзя, так как это личные данные. Однако можно действовать стратегически через Email-маркетинг. Отправляя пользователям полезные, хорошо структурированные письма (подтверждения заказов, бронирования), вы увеличиваете вероятность попадания сущностей вашего бренда в их User Model. Использование разметки Gmail Markup особенно полезно для этого.

Что означает «Freshness Score» (Оценка свежести) для User Model?

Freshness Score указывает, насколько недавно пользователь взаимодействовал с определенным контентом. Если n-gram был извлечен из вчерашнего письма, его оценка свежести будет высокой, и он будет сильнее влиять на определение текущего намерения. Старые данные постепенно теряют вес и могут быть удалены из модели.

Применяется ли этот алгоритм ко всем пользователям?

Нет, он применяется только к аутентифицированным (залогиненным) пользователям, которые используют сервисы Google (такие как Gmail, Календарь) и для которых система смогла сгенерировать User Model. Пользователи в режиме инкогнито или те, кто не пользуется этими сервисами, увидят стандартную, не персонализированную таким образом выдачу.

Учитывает ли система историческое поведение пользователя при определении интента?

Да, патент упоминает использование исторических данных о кликах (Selection data). Если пользователь ранее выбирал личные результаты в ответ на определенные запросы, система с большей вероятностью классифицирует будущие похожие запросы как Personal Intent.

Значит ли это, что анализ позиций в режиме инкогнито больше не актуален?

Он остается актуальным для понимания базового ранжирования и общей конкуренции в нише. Однако для оценки реальной видимости сайта необходимо учитывать, что значительная доля пользователей видит сильно персонализированную выдачу, на которую влияют механизмы, описанные в этом патенте. Полная картина требует анализа обоих сценариев.

Как система определяет, какой интент важнее, если запрос смешанный?

Система рассчитывает Intent Score на основе множества факторов (свежесть данных, точность совпадения с моделью, окно интереса, исторические клики). Этот балл сравнивается с пороговыми значениями. Если балл высок, приоритет отдается личному интенту. Если средний — выдача может быть смешанной с равной заметностью личных и общих результатов. Если низкий — приоритет отдается общему интенту.