Google автоматически создает и обновляет детальный профиль пользователя («Personal Data Book»), извлекая данные (адреса, интересы, финансы) из истории поиска, активности браузера и email. Эта информация динамически ранжируется на основе контекста (время, местоположение, частота использования, «эмоциональная ценность») для обеспечения функций автозаполнения и глубокой персонализации.
Описание
Какую задачу решает
Патент решает проблему ручного управления персональными данными (адресные книги, списки интересов, финансовые портфели) и неудобства повторного ввода информации. Он автоматизирует сбор и обновление этих данных, анализируя активность пользователя в различных приложениях, и предоставляет динамическое автозаполнение полей ввода, основанное на текущем контексте.
Что запатентовано
Запатентована система и метод для автоматического создания и поддержания хранилища персональных данных (Personal Data Book) путем мониторинга активности пользователя (Usage Data) в поиске, картах, email и браузере. Система извлекает структурированные данные (адреса, темы, сущности), оценивает их важность с помощью динамической схемы ранжирования (Dynamic Ranking Scheme) и использует их для автозаполнения в реальном времени с учетом контекста (время, местоположение).
Как это работает
Система работает путем непрерывного сбора и анализа поведения пользователя:
- Сбор данных: Мониторинг структурированных поисковых запросов (например, адреса в картах), активности браузера (user browsing activity) и данных из email.
- Извлечение и Агрегация: Извлечение сущностей (Structured Data) и сбор метаданных (время, IP-адрес, контекст использования).
- Ранжирование: Присвоение ранговых сигналов (Ranking Signals). Учитывается частота использования (Usage Rank с временным затуханием), «эмоциональная ценность» (Emotional Rank, например, для домашнего адреса) и цикличность/сезонность.
- Определение местоположения: Оценка текущего и частого местоположения пользователя (Locale) на основе IP-адреса и паттернов поиска (например, часто используемых стартовых адресов).
- Динамическое автозаполнение: Когда требуется ввод данных, система предлагает наиболее релевантные варианты из Personal Data Book, ранжированные в соответствии с текущим контекстом (например, предлагать рабочие контакты в рабочее время).
Актуальность для SEO
Высокая. Патент описывает фундаментальные механизмы глубокой персонализации, основанной на кросс-платформенном поведении пользователя. Отслеживание активности в Поиске, Картах, Gmail и браузере для создания детального профиля является центральной частью стратегии Google. Описанные методы динамического ранжирования на основе контекста активно применяются.
Важность для SEO
Влияние на SEO критически важное (8.5/10), хотя и косвенное. Патент не описывает ранжирование веб-документов, но детально раскрывает, как Google собирает, анализирует и ранжирует данные о поведении и интересах пользователя. Это инфраструктура персонализации. Понимание этих механизмов необходимо для разработки стратегий в эпоху персонализированного поиска. Если система классифицирует сайт как важный для пользователя (высокий персональный Usage Rank), это с высокой вероятностью повлияет на его видимость в персональной выдаче этого пользователя.
Детальный разбор
Термины и определения
- Dynamic Ranking Scheme (Динамическая схема ранжирования)
- Метод ранжирования персональных данных, который адаптируется к текущему контексту пользователя, включая его географическое местоположение (Locale), время использования и контекст приложения.
- Emotional Rank Signal (Сигнал эмоционального ранга)
- Метрика, оценивающая, насколько личными или важными являются данные для пользователя (например, домашний адрес имеет более высокий Emotional Rank). Патент предлагает ограничивать накопление этого сигнала с течением времени.
- Locality / Locale (Локальность / Местоположение)
- Оценка географического местоположения пользователя, определяемая на основе IP-адреса или анализа адресов, используемых в поисковых запросах (например, «start address» в картах).
- Location Estimator Module (Модуль оценки местоположения)
- Компонент системы, отвечающий за оценку текущих и частых физических местоположений пользователя (например, дом, работа).
- Metadata (Метаданные)
- Неявные данные, связанные с действиями пользователя: время поиска, IP-адрес, контекст поиска, данные HTTP-заголовков и cookies.
- Personal Data Book / Personal Data Store (Книга / Хранилище персональных данных)
- База данных, содержащая извлеченные и структурированные персональные данные пользователя (адреса, контакты, интересы, избранные блоги и т.д.).
- Ranking Signals (Ранговые сигналы)
- Метрики для оценки важности записи в Personal Data Book. Включают Emotional Rank, Usage Rank и темпоральные сигналы (сезонность, цикличность).
- Structured Data (Структурированные данные)
- Данные, которые могут быть извлечены в структурированную форму. Примеры: адреса, введенные в карты; тикеры акций; email адреса.
- Usage Data (Данные об использовании)
- Данные, генерируемые пользователем при взаимодействии с приложениями, включая поисковые запросы и активность в браузере (user browsing activity), например, клики по ссылкам.
- Usage Rank Signal (Сигнал ранга использования)
- Метрика, основанная на частоте использования данных. К ней применяется временной спад (aging/time decay) с использованием экспоненциального затухания.
- Vector Quantization (Векторное квантование)
- Метод для анализа циклических временных данных (например, распорядка дня). Время разбивается на интервалы (bins) для построения статистического распределения использования данных.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает метод динамического автозаполнения поля ввода в любом из множества независимых компьютерных приложений.
- Мониторинг данных об использовании (Usage Data), направленных в любое из независимых приложений.
- Извлечение контактной информации из этих данных.
- Сохранение информации в адресной книге пользователя.
- Определение, что в поле ввода одного из приложений требуются данные и определение допустимого типа записи.
- Ранжирование записей допустимого типа в адресной книге, основанное, по крайней мере частично, на активности браузера пользователя (user browsing activity), для определения кандидатов.
- Автозаполнение поля ввода одним из кандидатов.
Ключевой момент для SEO: Активность браузера (user browsing activity) явно используется как сигнал для ранжирования персональных данных пользователя, что подтверждает использование поведенческих факторов для оценки предпочтений.
Claim 15 (Независимый пункт): Описывает аналогичный процесс для более широкого набора данных (Personal Data Book) и конкретизирует источники (карты, email).
- Мониторинг Usage Data в приложениях (включая карты и email).
- Извлечение контактной или адресной информации.
- Сохранение информации в Personal Data Book.
- Определение потребности во вводе данных и допустимого типа.
- Ранжирование записей допустимого типа, основанное, по крайней мере частично, на контексте использования (usage context) этих записей.
- Автозаполнение поля ввода.
Ключевой момент: Контекст использования (usage context), включающий время, местоположение, частоту и тип приложения, определяет релевантность персональных данных в конкретный момент.
Где и как применяется
Этот патент описывает инфраструктуру персонализации, которая работает параллельно с основным поисковым процессом, собирая и анализируя данные о пользователе.
CRAWLING & INDEXING (Сбор и Индексирование Персональных Данных)
Система постоянно сканирует и индексирует не веб-контент, а активность пользователя (Usage Data) в различных сервисах (Поиск, Карты, Email, Браузер). Извлекаются Structured Data и Metadata. Location Estimator Module определяет местоположение. Вычисляются и обновляются Ranking Signals (Emotional, Usage, Temporal). Все данные сохраняются в Personal Data Store.
QUNDERSTANDING – Понимание Запросов (и Контекста)
Когда пользователь взаимодействует с полем ввода (включая поисковую строку), система определяет контекст: тип требуемых данных, текущее время и Locale. Это используется для активации механизма Autocomplete и формирования персонализированных подсказок (Query Shaping).
RANKING (Ранжирование персональных данных)
Система динамически ранжирует записи в Personal Data Book для автозаполнения, используя Dynamic Ranking Scheme. Ранжирование зависит от текущего контекста и накопленных Ranking Signals.
RERANKING – Переранжирование (Персонализация Поиска)
Хотя патент сфокусирован на автозаполнении, создаваемый профиль пользователя (Personal Data Book и Ranking Signals) является ключевым источником данных для персонализации веб-поиска. На этапе RERANKING система может использовать эти данные для повышения в выдаче ресурсов, которые идентифицированы как важные или часто используемые данным пользователем.
Входные данные:
- Поисковые запросы пользователя (особенно структурированные).
- Активность в браузере (user browsing activity, клики).
- Данные из Email (контакты, адреса).
- Метаданные (IP-адрес, время, HTTP-заголовки, Cookies).
Выходные данные:
- Personal Data Book: структурированный профиль пользователя.
- Ranking Signals: оценки важности записей.
- Предложения для автозаполнения (включая поисковые подсказки).
На что влияет
- Специфические запросы: Наибольшее влияние на запросы, где контекст пользователя критичен — локальные запросы (используется Locale) и запросы, связанные с личными интересами (используется история поведения).
- Конкретные типы контента: Влияет на видимость контента, который система связывает с профилем пользователя: избранные блоги, новостные источники, локальные бизнесы.
- Формирование запросов (Query Shaping): Напрямую влияет на то, как пользователи формулируют запросы через персонализированные предложения Autocomplete.
Когда применяется
- Триггеры активации: Сбор данных происходит непрерывно при взаимодействии пользователя с сервисами. Автозаполнение активируется при взаимодействии с полем ввода.
- Временные рамки: Ранжирование динамически пересчитывается при каждом запросе на автозаполнение с учетом текущего времени и местоположения.
Пошаговый алгоритм
Процесс А: Сбор и обработка данных (Фоновый режим)
- Мониторинг активности: Система получает Usage Data из поиска, карт, email, браузера.
- Извлечение данных: Извлекаются Structured Data (адреса, сущности) и Metadata (время, IP).
- Присвоение меток: Данным присваиваются метки (например, имена контактов, «дом»/«работа»).
- Оценка местоположения: Location Estimator Module оценивает Locale пользователя на основе метаданных и паттернов поиска (например, частые «start address»).
- Расчет ранговых сигналов:
- Присваивается Emotional Rank (насколько данные личные).
- Присваивается Usage Rank (частота использования).
- Применяется временной спад (aging/time decay) с использованием экспоненциального затухания.
- Рассчитываются темпоральные сигналы (цикличность, сезонность) с использованием Vector Quantization.
- Компактизация и хранение: Данные, метки и сигналы компактируются в единую запись и сохраняются в Personal Data Store.
- Обновление: Записи инкрементально обновляются при получении новых данных.
Процесс Б: Динамическое автозаполнение (Реальное время)
- Обнаружение ввода: Система обнаруживает, что пользователю требуется ввод данных.
- Определение контекста: Определяется тип требуемых данных, текущее время и оценивается текущее Locale.
- Идентификация кандидатов: Из Personal Data Store выбираются кандидаты соответствующего типа.
- Динамическое ранжирование: Кандидаты ранжируются с использованием Dynamic Ranking Scheme на основе накопленных сигналов и текущего контекста (например, повышение ранга рабочих контактов днем).
- Автозаполнение: Наиболее релевантные кандидаты предлагаются пользователю для автозаполнения.
Какие данные и как использует
Данные на входе
Система использует широкий спектр данных о поведении пользователя для построения профиля:
- Контентные факторы (из запросов и email): Тексты запросов, адреса, имена, тикеры акций, темы обсуждений, контакты из email.
- Технические факторы: IP-адреса (для определения Locale), данные HTTP-заголовков, Cookies (для идентификации пользователя).
- Поведенческие факторы (Usage Data): Активность в браузере (user browsing activity, как указано в Claim 1), клики по ссылкам (например, «driving directions»), частота использования определенных данных или сервисов.
- Временные факторы: Время и дата совершения действий (используются для определения цикличности, сезонности и применения Time Decay).
- Географические факторы: Адреса, введенные в карты (особенно «start address»), IP-геолокация.
Какие метрики используются и как они считаются
- Emotional Rank Signal: Присваивается на основе типа данных или контекста использования (например, «start address» получает высокий ранг). Накопление ограничивается функцией времени, чтобы избежать переоценки из-за многократного использования за короткий период.
- Usage Rank Signal: Основан на частоте использования. К нему применяется инкрементальное экспоненциальное затухание (exponential decay) для снижения веса старых использований.
- Темпоральные сигналы (Цикличность/Сезонность): Статистическое агрегирование времени использования. Используется Vector Quantization (разбиение времени на интервалы/bins) для инкрементального учета циклических переменных (день/неделя/год).
- Locality Estimation (Оценка местоположения): Вычисляется путем анализа IP-адресов и часто используемых адресов. Используются маски IP-адресов для уплотнения данных.
- Use Specific Ranking (Ранжирование по специфике использования): Динамическая корректировка ранга в зависимости от текущего контекста (близость к текущему Locale, время суток, тип приложения).
Выводы
- Глубокое профилирование через экосистему: Google активно собирает и агрегирует данные о поведении пользователя во всех своих продуктах (Поиск, Карты, Email) и через активность браузера для создания детального профиля (Personal Data Book).
- Персонализация основана на контексте и поведении: Система динамически ранжирует важность данных в зависимости от времени, местоположения (Locale) и частоты использования. Это основа для глубокой контекстной персонализации выдачи и подсказок.
- Активность браузера как прямой сигнал ранжирования: Патент явно указывает (Claim 1), что user browsing activity используется для ранжирования персональных данных. Это подтверждает важность поведенческих факторов (посещения сайтов, клики) для оценки релевантности ресурсов пользователю.
- Концепция «Эмоциональной ценности» и Затухания: Google алгоритмически определяет субъективную важность (Emotional Rank) и актуальность (Time Decay) данных, моделируя человеческое восприятие интересов.
- Фокус на сущностях (Structured Data): Система полагается на извлечение Structured Data (сущностей) из активности пользователя, что подчеркивает стратегическую важность понимания сущностей в современном поиске.
Практика
Best practices (это мы делаем)
Патент раскрывает стратегию персонализации Google. SEO-стратегия должна быть направлена на то, чтобы сайт стал значимой частью Personal Data Book пользователя.
- Построение бренда и лояльности аудитории: Необходимо стимулировать повторные визиты, прямой трафик и брендовые запросы. Если пользователь часто посещает сайт (user browsing activity) или ищет его (Usage Data), система зафиксирует это и присвоит ресурсу высокий персональный ранг (Usage Rank).
- Стимулирование вовлеченности и регулярного потребления контента: Используйте email-рассылки, подписки и регулярные обновления. Активность, связанная с сайтом (например, переходы из email, которые также отслеживаются), усиливает его значимость в профиле пользователя.
- Оптимизация под сущности (Entity Optimization): Убедитесь, что Google четко понимает ключевые сущности вашего бизнеса (локации, продукты, темы). Система извлекает Structured Data, поэтому наличие четкой структуры и микроразметки критично для корректного распознавания.
- Локальная оптимизация (Local SEO): Учитывая акцент на определении Locale (с помощью Location Estimator Module) и использовании адресов, точность и полнота локальных данных (NAP) имеют первостепенное значение. Это облегчает включение вашего бизнеса в локальный контекст пользователя.
- Создание полезного и «эмоционально ценного» контента: Создавайте контент, который решает важные задачи пользователя и к которому он будет возвращаться регулярно. Это повышает вероятность присвоения высокого Usage Rank и Emotional Rank в его профиле.
Worst practices (это делать не надо)
- Фокус на одноразовом трафике: Стратегии, направленные на привлечение случайного трафика без попыток удержать пользователя или сформировать лояльность, неэффективны в контексте глубокой персонализации.
- Игнорирование поведенческих факторов: Оптимизация только под ключевые слова без учета того, как пользователь взаимодействует с сайтом (user browsing activity), снижает потенциал ранжирования в персонализированной выдаче.
- Манипуляции с краткосрочными сигналами: Попытки симулировать частоту использования без реальной ценности будут неэффективны, так как система использует временной спад (Time Decay) и ограничение накопления ранга.
- Неконсистентные локальные данные: Различия в адресах и названиях компании могут привести к ошибкам распознавания сущностей системой профилирования.
Стратегическое значение
Патент подтверждает, что персонализация является не надстройкой, а фундаментальной частью инфраструктуры Google. Система детально профилирует пользователей на основе их кросс-платформенной активности. Для успешного SEO необходимо не просто быть релевантным запросу, но и стать авторитетным и регулярно используемым источником для целевой аудитории. Победа в персонализированном поиске достигается за счет построения долгосрочных отношений с пользователем и понимания его контекста.
Практические примеры
Сценарий: Повышение видимости сайта через персонализацию и Autocomplete
- Действие пользователя: Пользователь регулярно ищет информацию по теме «инвестиции в биотехнологии» и часто переходит на сайт «BioTechInvest.com». Также он подписан на их email-рассылку.
- Работа системы (Мониторинг и Извлечение): Система фиксирует поисковые запросы (Structured Data: тема «инвестиции в биотехнологии») и активность в браузере/email (Usage Data: посещения «BioTechInvest.com»).
- Работа системы (Ранжирование): Сайту «BioTechInvest.com» присваивается высокий Usage Rank и, возможно, Emotional Rank в Personal Data Book пользователя по этой теме.
- Результат (Autocomplete/Query Shaping): Когда пользователь начинает вводить «BioT…» или даже «инвестиции» в строке поиска, система динамически ранжирует и предлагает «BioTechInvest.com» или связанные с ним запросы в качестве подсказок.
- Результат (Персонализация Поиска — Гипотеза): Когда пользователь ищет общие запросы по биотехнологиям, система на этапе RERANKING с высокой вероятностью повысит позиции «BioTechInvest.com» в его персональной выдаче, так как он идентифицирован как предпочитаемый источник.
Вопросы и ответы
Описывает ли этот патент алгоритмы ранжирования веб-поиска?
Нет, напрямую патент описывает ранжирование персональных данных пользователя для целей автозаполнения. Однако он детально раскрывает, какие данные Google собирает о пользователе (поиски, email, активность браузера) и какие сигналы использует для оценки их важности. Эта инфраструктура сбора и анализа данных является основой для персонализации, которая влияет на финальное ранжирование веб-результатов.
Что такое «Emotional Rank Signal» и как он влияет на SEO?
Emotional Rank — это попытка алгоритмически оценить, насколько важны данные для пользователя (например, домашний адрес). В контексте SEO это означает, что ресурсы, которые система считает критически важными для пользователя (например, рабочий портал, любимый новостной ресурс), получат более сильный буст в персонализированной выдаче, чем просто часто посещаемые развлекательные сайты.
Патент упоминает «user browsing activity». Значит ли это, что Google отслеживает все посещения сайтов?
Claim 1 явно указывает на использование user browsing activity для ранжирования персональных данных. Это подразумевает, что система использует данные об активности пользователя в браузере (вероятно, через Chrome, Android или данные о кликах из SERP) для понимания его интересов. Для SEO это критически подчеркивает важность поведенческих факторов и лояльности аудитории.
Как система определяет местоположение пользователя (Locale)?
Система использует комбинацию методов (Location Estimator Module): анализ IP-адреса, из которого пришел запрос, и анализ структурированных данных, введенных пользователем. В частности, адреса, которые пользователь часто вводит в поле «start address» (откуда ехать) в Картах, считаются сильным индикатором его текущего или частого местоположения (дома или на работе).
Что такое «Usage Context» и почему он важен?
Usage Context (Claim 15) — это текущая ситуация пользователя: время суток, день недели, его местоположение и приложение, которое он использует. Система динамически переранжирует данные в зависимости от контекста. Это означает, что релевантность ресурса не статична; сайт может быть высоко релевантен утром с рабочего компьютера и менее релевантен вечером из дома.
Как SEO-специалист может повлиять на сигналы, описанные в этом патенте?
Основной способ влияния — это построение лояльности и стимулирование регулярного взаимодействия с сайтом. Необходимо поощрять повторные визиты, прямой трафик, брендовые запросы и взаимодействие через разные каналы. Цель — сделать ваш ресурс частью привычек пользователя, чтобы он попал в его Personal Data Book с высоким рангом.
Что означает «временной спад» (aging/time decay) ранговых сигналов?
Система применяет экспоненциальный спад к сигналу Usage Rank. Это означает, что недавние взаимодействия имеют больший вес, чем старые. Если пользователь перестал интересоваться темой или посещать сайт, его персональный ранг будет постепенно снижаться. Это требует постоянной работы над удержанием аудитории.
Патент фокусируется на структурированных данных (адреса, акции). Как это относится к информационным сайтам?
В описании патента упоминается, что система может генерировать списки «favorite blogs», «favorite news sources». Для информационных сайтов Structured Data — это темы, категории и сущности, которыми интересуется пользователь. Если пользователь часто читает статьи на определенную тему на вашем сайте, эта тема и ваш сайт как источник будут зафиксированы в его профиле.
Использует ли система данные из Gmail для персонализации?
Да, патент явно указывает на извлечение данных из различных приложений, включая email (Claim 15). Система может извлекать контакты, адреса из подписей, а также анализировать темы переписки (например, частое обсуждение определенной темы или компании) для пополнения Personal Data Book пользователя и понимания его интересов.
Какова главная стратегическая мысль этого патента для SEO?
Главная мысль заключается в том, что Google строит детальный поведенческий профиль для каждого пользователя, интегрируя данные из всех доступных источников. В эпоху глубокой персонализации выигрывают те ресурсы, которые смогли доказать свою ценность для конкретного пользователя и стали частью его регулярной активности, а не те, кто просто оптимизирован под общие ключевые слова.