Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete

    SYSTEM AND METHOD FOR PERSONALIZING QUERY SUGGESTIONS BASED ON USER INTEREST PROFILE (Система и метод персонализации поисковых подсказок на основе профиля интересов пользователя)
    • US20140108445A1
    • Google LLC
    • 2014-04-17
    • 2013-04-10
    2013 Патенты Google Персонализация Поведенческие сигналы

    Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неоптимальности стандартных поисковых подсказок (Autocomplete), которые часто основаны преимущественно на общей популярности запросов и могут не соответствовать текущим намерениям или сфере интересов конкретного пользователя. Изобретение улучшает работу поиска, предлагая персонализированные подсказки, адаптированные под индивидуальный профиль интересов, тем самым ускоряя поиск и повышая его эффективность.

    Что запатентовано

    Запатентована система для персонализации списка предлагаемых полных запросов (подсказок) в ответ на частично введенный запрос. Суть изобретения заключается в переранжировании стандартного набора подсказок с использованием Interest Profile (профиля интересов) пользователя. Этот профиль строится на основе его предыдущей поисковой активности (запросов и кликов) и сравнивается с тематической классификацией потенциальных подсказок.

    Как это работает

    Система работает в двух режимах:

    • Офлайн (Построение профиля): Система анализирует историю поиска пользователя (Query Log). Используя тематическую классификацию запросов и URL, на которые кликал пользователь, система формирует его Interest Profile — вектор категорий и весов. При этом применяется временное взвешивание (time weighting), отдавая приоритет недавней активности.
    • Онлайн (Обработка запроса): Когда пользователь вводит частичный запрос, система получает кандидатов (полные запросы). Система вычисляет оценку релевантности, сравнивая Interest Profile пользователя с тематическим профилем (Classification Profile) каждого кандидата (например, используя скалярное произведение векторов — dot product). Кандидаты переупорядочиваются на основе этих оценок, и персонализированный список отправляется пользователю.

    Актуальность для SEO

    Высокая. Персонализация поискового опыта является стратегическим направлением Google. Механизмы, описанные в патенте, лежат в основе работы современного Autocomplete, который явно учитывает историю поиска и контекст пользователя для формирования подсказок. Это фундаментальный механизм для повышения релевантности поиска на самом раннем этапе взаимодействия.

    Важность для SEO

    Влияние на SEO оценивается как значительное (6.5/10). Патент не описывает ранжирование в SERP, но он критически важен для оптимизации под поисковые подсказки (Search Box Optimization) и понимания формирования спроса. Он напрямую влияет на то, какой именно запрос пользователь в итоге отправит. Если тематика сайта совпадает с устоявшимися интересами пользователя, система с большей вероятностью предложит ему подсказки, ведущие на этот сайт.

    Детальный разбор

    Термины и определения

    Classification Profile (Профиль классификации)
    Тематический профиль запроса (Query Profile) или URL (URL Profile). Представляет собой список категорий (Category ID) и соответствующих им весов (Weight), отражающих релевантность категории данному объекту.
    Click Data (Данные о кликах)
    Информация о том, какие результаты поиска были выбраны пользователем. Используется для построения Interest Profile.
    Complete Query (Полный запрос)
    Завершенный поисковый запрос, ранее отправленный пользователями. Используется как кандидат для подсказки.
    Dot Product (Скалярное произведение)
    Математическая операция, предложенная для сравнения Interest Profile пользователя и Classification Profile запроса. Позволяет численно оценить степень их совпадения.
    Interest Profile (Профиль интересов)
    Часть профиля пользователя (User Profile), представляющая его интересы. Состоит из списка категорий и весов, агрегированных на основе его исторической активности (поиска и кликов).
    Partial Query (Частичный запрос)
    Неполный запрос, вводимый пользователем в реальном времени до момента отправки.
    Query Log Database (База данных журнала запросов)
    Хранилище исторических данных о поисковой активности пользователей (запросы, показы, клики).
    Supplemental Complete Queries (Дополнительные полные запросы)
    Подсказки, отобранные на основе критериев, отличных от персонализации (например, по глобальной популярности), и добавляемые к основному списку.
    Time Weighted (Взвешенный по времени)
    Метод обработки Interest Profile, при котором недавним событиям придается больший вес, чем более старым.
    User-History Complete Queries (Полные запросы из истории пользователя)
    Запросы, которые данный пользователь отправлял ранее и которые соответствуют текущему частичному запросу.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод персонализации подсказок.

    1. Система получает частичный запрос (partial search query) от пользователя до завершения ввода.
    2. Система получает набор полных запросов (complete queries), соответствующих частичному запросу.
    3. Система генерирует оценки (scores) для этих полных запросов в соответствии с профилем интересов (interest profile) пользователя.
    4. Система упорядочивает полные запросы в соответствии с этими сгенерированными оценками и другими критериями ранжирования (ranking criteria).
    5. Система отправляет упорядоченный набор пользователю в качестве подсказок.

    Claim 3 (Зависимый от 1): Определяет основу для профиля интересов.

    Interest profile определяется на основе предыдущих запросов, показанных результатов поиска (search results/impressions) и выбранных результатов поиска (search result selections/clicks), записанных для данного пользователя.

    Claim 4 (Зависимый от 1): Вводит временной фактор.

    Interest profile взвешивается по времени (time weighted). Недавним событиям придается больший вес, чем более старым событиям.

    Claim 6 и 9 (Зависимые): Описывают механизм генерации оценки.

    Генерация оценки для конкретного запроса включает сравнение interest profile пользователя с профилем классификации (classification profile) этого запроса. Конкретный метод сравнения, указанный в Claim 9, — это формирование скалярного произведения (dot product) между этими двумя профилями.

    Claim 10 (Зависимый от 1): Добавляет подсказки из истории пользователя.

    Система также идентифицирует user-history complete queries (запросы, которые пользователь уже вводил ранее) и отправляет их пользователю в дополнение к основному набору подсказок.

    Claim 15 и 16 (Зависимые от 1): Добавляет дополнительные (supplemental) подсказки.

    Система идентифицирует supplemental complete queries и упорядочивает их по вторым критериям ранжирования, отличным от первых. Claim 16 уточняет, что эти вторые критерии — это критерии популярности (popularity criteria) среди сообщества пользователей.

    Где и как применяется

    Изобретение применяется в компонентах, отвечающих за обработку запросов и формирование поисковых подсказок (Autocomplete/Autosuggest).

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит классификация контента (формирование URL Profiles) и классификация запросов (формирование Query Profiles). Эти данные необходимы для последующего построения и сравнения профилей.

    QUNDERSTANDING – Понимание Запросов
    Основное место применения патента. Процесс разделен на две части:

    1. Офлайн-обработка: User Profile Manager использует данные из Query Log Database для построения и регулярного обновления User Profile Database (в частности, Interest Profile), применяя временное взвешивание.
    2. Онлайн-обработка (Real-time): Partial Query Processor активируется в момент ввода пользователем запроса. Он взаимодействует с Complete Query Database для получения кандидатов и с базами профилей пользователей и запросов для их персонализированного ранжирования.

    Входные данные:

    • Частичный запрос (Partial Query).
    • Идентификатор пользователя или сессии.
    • Набор полных запросов-кандидатов (Complete Queries).
    • Interest Profile пользователя.
    • Classification Profiles для запросов-кандидатов.

    Выходные данные:

    • Упорядоченный список персонализированных поисковых подсказок.
    • Опционально: подсказки из истории пользователя, популярные подсказки (supplemental), персонализированные URL, реклама или контакты.

    На что влияет

    • Типы запросов: Наибольшее влияние оказывается на неоднозначные или широкие запросы, где контекст пользователя помогает уточнить интент (например, ввод «apple» пользователем, интересующимся гаджетами, против пользователя, интересующегося кулинарией).
    • Формирование запроса: Основное влияние — это смещение выбора пользователя от общепопулярных формулировок к тем, которые соответствуют его личным интересам и истории поиска.

    Когда применяется

    • Условия применения: Алгоритм применяется в реальном времени, когда пользователь вводит запрос в поисковую строку и функция Autocomplete активна.
    • Триггеры активации: Ввод символов в поисковую строку. Персонализация активируется, если для данного пользователя (или сессии) существует достаточно данных для формирования Interest Profile.

    Пошаговый алгоритм

    Процесс А: Генерация профиля интересов пользователя (Офлайн)

    1. Сбор данных: Извлечение информации из Query Log Database для конкретного пользователя (введенные запросы, показы, клики).
    2. Идентификация активности: Определение набора запросов, отправленных пользователем, и URL-адресов, которые он выбрал.
    3. Получение классификации: Получение Classification Profiles (категории и веса) для выбранных URL и, опционально, для введенных запросов.
    4. Агрегация: Агрегирование всех полученных данных классификации в единый Interest Profile пользователя.
    5. Взвешивание по времени: Применение временного взвешивания (time weighting), при котором недавней активности придается больший вес.
    6. Хранение: Сохранение обновленного Interest Profile в User Profile Database.

    Процесс Б: Обработка частичного запроса (Онлайн)

    1. Получение ввода: Система получает частичный запрос от пользователя.
    2. Получение кандидатов: Извлечение набора полных запросов (кандидатов), соответствующих частичному запросу.
    3. Получение профилей: Извлечение Interest Profile пользователя и Classification Profiles для каждого кандидата.
    4. Вычисление персонализированных оценок: Для каждого кандидата вычисляется оценка путем сравнения Interest Profile и Classification Profile. Конкретный метод сравнения — скалярное произведение (dot product) двух векторов.
    5. Ранжирование: Переупорядочивание кандидатов на основе вычисленных персонализированных оценок (возможно, в комбинации с исходными критериями ранжирования, например, популярностью).
    6. Формирование списка подсказок (Blending): Опциональное добавление других типов подсказок (user-history queries, supplemental queries, URL, контакты).
    7. Ответ: Отправка финального упорядоченного списка подсказок клиенту.

    Какие данные и как использует

    Данные на входе

    Система использует преимущественно поведенческие и пользовательские данные.

    • Поведенческие факторы: Критически важные данные.
      • Query Log: История запросов, отправленных пользователем.
      • Click Data: История кликов пользователя по результатам поиска.
      • Impression Data: История показанных пользователю результатов.
      • Опционально упоминаются другие источники: закладки (bookmarks), посещения через тулбар (toolbar visits), активность в социальных сетях.
    • Временные факторы: Временные метки активности используются для time weighting, отдавая приоритет недавним событиям.
    • Пользовательские факторы:
      • User ID, Session ID или Cookie для идентификации профиля.
      • Опционально: Список контактов пользователя (Contacts) и оценка их важности (Affinity value) для генерации подсказок контактов.
    • Системные данные (Классификация): Предварительно вычисленные классификации контента (URL Profiles) и запросов (Query Profiles).

    Какие метрики используются и как они считаются

    • Interest Profile (Профиль интересов): Вектор, состоящий из пар [Категория ID, Вес]. Вес рассчитывается путем агрегации классификационных данных из истории активности пользователя с применением time weighting.
    • Classification Profile (Профиль классификации): Вектор, состоящий из пар [Категория ID, Вес] для конкретного запроса или URL.
    • Персонализированная оценка (Personalization Score): Рассчитывается для определения соответствия между интересами пользователя и тематикой подсказки. В патенте явно указан метод расчета: скалярное произведение (Dot Product) между векторами Interest Profile и Classification Profile.

    Выводы

    1. Autocomplete активно персонализируется: Порядок поисковых подсказок не основан только на популярности. Он активно адаптируется под интересы конкретного пользователя.
    2. Поведение пользователя формирует его профиль: Interest Profile строится на основе исторических данных о поведении: предыдущих запросах и, критически важно, кликах по результатам (Click Data). Система определяет интересы по потребляемому контенту.
    3. Векторное моделирование интересов и тематик: Интересы пользователя и тематика запросов моделируются как векторы в пространстве категорий. Это позволяет использовать математические методы (dot product) для вычисления релевантности между пользователем и подсказкой.
    4. Важность недавней активности (Time Weighting): Система придает больший вес недавним действиям. Текущие интересы пользователя влияют на подсказки сильнее, чем долгосрочная история.
    5. Смешанная модель подсказок: Финальный набор Autocomplete — это результат смешивания (blending) персонализированных подсказок, запросов из личной истории пользователя (user-history queries) и глобально популярных запросов (supplemental queries).

    Практика

    Best practices (это мы делаем)

    • Укрепление тематической авторитетности (Topical Authority): Гарантируйте, что ваш контент четко классифицируется Google в нужных категориях. Это повышает вероятность того, что пользователи, интересующиеся данной темой (имеющие высокий вес этой категории в Interest Profile), увидят подсказки, ведущие к вашему контенту.
    • Стимулирование CTR и удовлетворение интента: Клики пользователя — основной сигнал для формирования его Interest Profile. Высокий CTR и успешное удовлетворение интента «обучают» профиль пользователя ассоциировать вашу тематику со своими интересами, что увеличивает вероятность показа релевантных подсказок в будущем.
    • Анализ вариативности Autocomplete: Изучайте, как меняются поисковые подсказки для одних и тех же частичных запросов в зависимости от истории поиска. Используйте «чистые» профили (инкогнито) для оценки глобальной популярности и профили с насыщенной историей в вашей нише, чтобы понять, какие формулировки Google ассоциирует с интересами целевой аудитории.
    • Оптимизация под путешествие пользователя (User Journey): Учитывайте, что текущий поиск часто является продолжением предыдущих. Создавайте контент, отвечающий на последовательные запросы в рамках одной темы, так как это влияет на формирование Interest Profile в реальном времени (профиль сессии) и долгосрочно.

    Worst practices (это делать не надо)

    • Игнорирование персонализации при анализе спроса: Ошибочно предполагать, что Autocomplete показывает одинаковые результаты всем пользователям. Ориентация только на частотность запросов из планировщиков без учета персонализации может привести к неверной оценке спроса и интента.
    • Использование кликбейта: Привлечение нецелевых кликов или кликов, которые не приводят к удовлетворению пользователя, может негативно сказаться на формировании Interest Profile пользователя в отношении вашей тематики или источника.

    Стратегическое значение

    Патент подтверждает стратегию Google на глубокое понимание пользователя и предсказание его поведения. Google активно формирует поисковый спрос, а не просто реагирует на него. Для SEO это означает, что важно не только ранжироваться по запросам, но и влиять на сам процесс формирования запроса у пользователя. Долгосрочная стратегия должна фокусироваться на построении сильного тематического бренда и формировании устойчивой ассоциации между сайтом и конкретными интересами пользователя.

    Практические примеры

    Сценарий: Персонализация неоднозначного запроса

    1. Пользователь 1 (История и Профиль): Регулярно ищет рецепты, кликает на кулинарные сайты. Interest Profile имеет высокий вес в категории «Кулинария».
    2. Пользователь 2 (История и Профиль): Недавно искал информацию о новом iPhone, кликает на технологические сайты. Interest Profile имеет высокий вес в категории «Технологии».
    3. Ввод частичного запроса: Оба пользователя вводят «Apple».
    4. Результат для Пользователя 1: Система вычисляет высокий Dot Product для запросов, связанных с кулинарией. Подсказки: «apple pie recipe», «apple varieties».
    5. Результат для Пользователя 2: Система вычисляет высокий Dot Product для запросов, связанных с технологиями. Подсказки: «apple store», «apple iphone», «apple stock».
    6. Режим Инкогнито (Без персонализации): Подсказки будут основаны только на самых частых запросах (Query Popularity) в регионе.

    Вопросы и ответы

    Влияет ли этот патент напрямую на ранжирование сайтов в поисковой выдаче (SERP)?

    Нет, напрямую не влияет. Патент описывает исключительно механизм ранжирования поисковых подсказок (Autocomplete), который работает до того, как пользователь отправит запрос и увидит SERP. Однако он оказывает сильное косвенное влияние, так как формирует и направляет запросы, которые пользователи в итоге отправляют в поиск.

    Как именно Google строит «Профиль интересов» (Interest Profile) пользователя?

    Согласно патенту, Interest Profile строится путем анализа журнала запросов (Query Log). Система учитывает предыдущие запросы пользователя и, что особенно важно, результаты, на которые он кликнул (Click Data). Тематика (Classification Profile) этих запросов и URL агрегируется для формирования профиля интересов.

    Учитывается ли недавняя активность пользователя больше, чем старая?

    Да, патент явно указывает на использование временного взвешивания (time weighting). Недавние поисковые запросы и клики имеют больший вес при формировании текущего Interest Profile, что позволяет системе адаптироваться к меняющимся или краткосрочным интересам пользователя.

    Что такое «Скалярное произведение» (Dot Product) и как оно используется в этом патенте?

    Dot Product — это математический способ сравнения двух векторов. В данном случае, Interest Profile пользователя и Classification Profile запроса представлены как векторы категорий и весов. Скалярное произведение позволяет быстро вычислить единое числовое значение (Score), которое показывает, насколько сильно совпадают эти два профиля.

    Может ли мой сайт появиться в Autocomplete как URL-подсказка?

    Да. Патент описывает возможность добавления URL в список подсказок. Это могут быть глобально популярные URL для данного запроса или URL, которые персонализированы для пользователя — например, если пользователь часто переходит на этот URL или если URL получил высокую оценку при сравнении его тематического профиля с Interest Profile пользователя.

    Как SEO-специалист может повлиять на персонализированные подсказки?

    Напрямую повлиять сложно. Стратегически нужно работать над тем, чтобы ваш контент четко классифицировался в нужных категориях и привлекал клики целевой аудитории. Успешное удовлетворение интента пользователя укрепляет его Interest Profile в вашей тематике, что повышает шансы на показ релевантных подсказок в будущем.

    Работает ли эта персонализация, если пользователь не залогинен?

    Да, может работать. Патент упоминает возможность использования Session ID и Cookie. Система может генерировать временный профиль интересов на основе активности в текущей сессии (session profile) или использовать данные, сохраненные в файлах cookie с предыдущих визитов.

    В чем разница между персонализированными подсказками и подсказками из истории поиска?

    Подсказки из истории поиска (user-history complete queries) — это точное повторение запросов, которые пользователь уже вводил ранее. Персонализированные подсказки — это часто новые для пользователя запросы, которые популярны среди других людей, но были повышены в списке специально для этого пользователя, так как они соответствуют его тематическим интересам.

    Учитывает ли система только поисковую активность для построения профиля интересов?

    Основной источник данных — это поисковая активность (запросы и клики). Однако в патенте также упоминаются опциональные источники для генерации Interest Profile, такие как закладки пользователя (bookmarks), посещения через тулбар (toolbar visits) и рекомендации в социальных сетях, при условии согласия пользователя на использование этих данных.

    Что означает использование «скалярного произведения» (dot product) для SEO?

    Это указывает на то, что Google использует векторные представления для интересов и тематик. Для SEO это подтверждает важность построения сильной и четкой тематической релевантности контента (Topical Authority), чтобы его Classification Profile максимально «совпадал» (имел высокое скалярное произведение) с Interest Profile целевой аудитории.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.