Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google анализирует необычные или повторяющиеся запросы для определения демографии и интересов пользователя

    INFERRING MEMBERSHIP IN A GROUP (Вывод о принадлежности к группе)
    • US10657165B1
    • Google LLC
    • 2020-05-19
    • 2012-06-07
    2012 Патенты Google Персонализация Поведенческие сигналы

    Google анализирует не только тему запроса, но и его характеристики, такие как чрезмерная длина (специфичность) или частое повторение. Обнаружение этих нетипичных паттернов позволяет системе сделать вывод о принадлежности пользователя к определенной группе (например, студенты ВУЗа или жители города). Затем характеристики этой группы приписываются пользователю для более точного таргетинга контента и рекламы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу идентификации демографических характеристик, интересов и принадлежности пользователя к определенным группам, когда пользователь явно не предоставил эту информацию. Это необходимо для повышения релевантности распространяемого электронного контента (electronic content), такого как персонализированные ленты, посты в социальных сетях и таргетированная реклама.

    Что запатентовано

    Запатентована система для вывода (inferring) о членстве пользователя в группе на основе анализа его запросов (поисковых, картографических и т.д.). Система ищет запросы с отличительной особенностью (distinguishing feature), не зависящей от тематики (например, необычная длина или частота повторения). Обнаружение такой особенности служит триггером для анализа тематики запроса (subject matter) и вывода о принадлежности к группе. Характеристики этой группы затем приписываются пользователю для таргетинга.

    Как это работает

    Механизм работает путем анализа входящих запросов пользователя для выявления аномалий или паттернов:

    • Идентификация особенности: Система ищет признаки, не связанные с содержанием. Примеры: запрос необычно длинный и специфичный (превышает порог) или пользователь многократно вводит один и тот же термин, например, адрес в навигаторе (превышает порог повторения).
    • Вывод о группе: Если особенность обнаружена, анализируется тематика запроса. Например, повторяющийся адрес в Бостоне указывает на группу «Жители Бостона». Специфический вопрос из экзамена по экономике указывает на группу «Студенты курса экономики».
    • Атрибуция характеристик (Smearing): Характеристики, типичные для группы (например, интерес к местным спортивным командам для жителей Бостона), приписываются пользователю.
    • Таргетинг контента: Пользователь выбирается для получения целевого контента (рекламы, рекомендаций), соответствующего этим выведенным характеристикам.

    Актуальность для SEO

    Высокая. Точное профилирование пользователей и персонализация контента (включая рекламу и ленты типа Google Discover) являются ключевыми для Google. Методы вывода демографии и интересов на основе поведения (first-party data) приобретают особое значение в контексте усиления конфиденциальности и отказа от сторонних cookies.

    Важность для SEO

    Влияние на традиционное органическое ранжирование (10 синих ссылок) минимальное. Патент не описывает алгоритмы ранжирования веб-страниц. Однако он имеет высокое стратегическое значение (6.5/10) для понимания того, как Google строит профиль пользователя (User Profiling). Это критически важно для стратегий, направленных на персонализированные каналы доставки контента (например, Google Discover) и для глубокого анализа целевой аудитории при разработке контент-стратегии.

    Детальный разбор

    Термины и определения

    Distinguishing Feature (Отличительная особенность)
    Характеристика запроса, которая не зависит от его тематики (independent of a subject matter) и выделяет его среди других запросов пользователя. Служит триггером для запуска процесса вывода. Примеры: длина запроса, частота повторения.
    Group (Группа)
    Набор пользователей, объединенных общими характеристиками (демография, интересы, местоположение). Примеры: «Жители Бостона», «Студенты ВУЗа X».
    Inference (Вывод, предположение)
    Процесс заключения о принадлежности пользователя к группе на основе анализа его запросов.
    Subject Matter (Тематика запроса)
    Смысловое содержание запроса. Анализируется только после того, как был обнаружен Distinguishing Feature.
    Query Specificity (Специфичность запроса)
    Уровень детализации запроса, часто определяемый его длиной (количеством слов). Высокая специфичность может быть Distinguishing Feature.
    Repetition Frequency (Частота повторения)
    Частота, с которой пользователь повторяет запрос или определенную информацию (например, адрес). Высокая частота может быть Distinguishing Feature.
    Clustering Process (Процесс кластеризации)
    Метод, используемый для идентификации повторяющейся информации в нескольких различных запросах одного пользователя.
    Smearing (Приписывание / «Размазывание»)
    Неформальный термин из описания патента, обозначающий процесс приписывания (атрибуции) характеристик группы конкретному пользователю.

    Ключевые утверждения (Анализ Claims)

    Патент описывает несколько способов идентификации «отличительных» запросов.

    Claim 1 (Независимый пункт): Описывает основной метод, где триггером является сравнение частот ввода запросов.

    1. Система получает запрос от пользователя в течение периода времени.
    2. Система идентифицирует этот запрос как «отличающийся» (distinguished) от других запросов пользователя. Это делается путем сравнения частоты ввода полученного запроса с частотой ввода другого запроса за этот период. Если разница между частотами удовлетворяет пороговому значению, запрос считается отличающимся.
    3. В ответ на это система определяет, что пользователь является членом группы. Это основано на: (i) Тематике запроса (subject matter) и (ii) Частоте ввода схожих по тематике запросов другими членами этой группы в течение этого периода (сравнение с групповым поведением).
    4. Система приписывает пользователю характеристики группы.
    5. На основе этих характеристик пользователь идентифицируется для распространения цифрового контента (например, созданного членами группы), и ему предоставляется доступ к этому контенту.

    Claim 2 и 3 (Зависимые): Определяют альтернативный триггер — размер (длина) запроса.

    Запрос может быть идентифицирован как отличающийся, если его размер (например, количество слов) превышает пороговое значение (threshold size). Это механизм реакции на высокую специфичность.

    Claim 4 и 5 (Зависимые): Определяют альтернативный триггер — повторение информации.

    Система анализирует несколько запросов пользователя на предмет повторяющейся информации. Используется процесс кластеризации (clustering process) для выявления этой информации. Если информация (например, слова) повторяется в более чем пороговом количестве запросов, это служит триггером.

    Claim 6 и 7 (Зависимые): Уточняют источники запросов.

    Запросы могут быть не только поисковыми, но и данными (начальная/конечная точка), введенными в систему определения географического местоположения (картографический сервис).

    Где и как применяется

    Изобретение применяется в системах профилирования пользователей для улучшения таргетинга контента и рекламы.

    QUNDERSTANDING – Понимание Запросов (и Понимание Пользователя)
    Это основной этап применения. Система анализирует входящие запросы и историю запросов для выявления Distinguishing Features. Это включает анализ структуры запроса (длина) и паттернов (частота, повторения). На основе этих данных происходит профилирование пользователя (User Profiling) и обновление его профиля выведенными характеристиками.

    INDEXING (Пользовательских данных)
    Система использует базу данных, которая коррелирует тематику запросов с характеристиками групп. Выведенные характеристики пользователя (демография, интересы) сохраняются (индексируются) в его профиле.

    RANKING / RERANKING (в контексте персонализированных лент и рекламы)
    Выведенные характеристики используются для выбора и ранжирования контента, предназначенного для пользователя. Это касается рекламных блоков, персонализированных лент (Google Discover) или лент социальных сетей, но не основного органического ранжирования.

    Входные данные:

    • Входящий запрос пользователя (поиск, карты).
    • История запросов пользователя (Query Logs).
    • База данных корреляций тематик и характеристик групп.
    • Данные о поведении известных групп.

    Выходные данные:

    • Обновленный профиль пользователя с выведенными характеристиками.
    • Таргетированный контент или реклама, доставленная пользователю.

    На что влияет

    • Персонализация: Влияет на точность персонализации рекламы и рекомендательных лент контента.
    • Специфические запросы: Влияет на интерпретацию очень длинных (Long-Tail) запросов или часто повторяющихся запросов (например, навигационных).
    • Типы контента: В патенте явно упоминаются посты в социальных сетях (social network posts) и рекламный контент (advertising content).

    Когда применяется

    Алгоритм активируется при обнаружении Distinguishing Feature в запросе пользователя. Триггеры активации:

    • Специфичность (Длина): Когда количество слов в запросе превышает установленный порог.
    • Повторение (Индивидуальное): Когда определенная информация (например, адрес) повторяется в серии запросов пользователя больше порогового числа раз (выявляется через кластеризацию).
    • Аномальная частота: Когда частота ввода определенного запроса значительно отличается от частоты ввода других запросов этим пользователем (Claim 1).

    Пошаговый алгоритм

    Процесс вывода о принадлежности к группе:

    1. Получение запроса: Система получает один или несколько запросов от пользователя.
    2. Идентификация отличительной особенности (Триггер): Система анализирует запрос(ы) на наличие признаков, не зависящих от тематики:
      • Проверка длины запроса на превышение порога специфичности.
      • Использование кластеризации для поиска повторяющихся терминов в истории запросов и проверка частоты повторения.
      • Сравнение частоты ввода текущего запроса с частотой других запросов пользователя.
    3. Определение принадлежности к группе: Если Distinguishing Feature обнаружен, система анализирует тематику (Subject Matter) запроса. Тематика используется для идентификации группы. Может использоваться сравнение с поведением известных членов группы.
    4. Идентификация характеристик группы: Система извлекает характеристики (демография, интересы), связанные с идентифицированной группой, из базы данных.
    5. Приписывание характеристик пользователю (Smearing): Выявленные характеристики группы приписываются пользователю.
    6. Распространение контента: Система распространения контента (Content Distribution Engine) использует эти характеристики для выбора и доставки целевого контента пользователю.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: История запросов пользователя (Query Logs). Анализируются паттерны: частота ввода различных запросов, количество повторений конкретных терминов или адресов.
    • Контентные факторы (Запроса): Текст запроса используется для определения тематики (subject matter) и для анализа длины (количества слов).
    • Географические факторы: Данные, вводимые в картографические сервисы (geographic location system), такие как начальные или конечные точки маршрута.

    Какие метрики используются и как они считаются

    • Query Size/Length (Размер/Длина запроса): Количество слов в запросе.
    • Threshold Size (Пороговый размер): Предопределенное значение, превышение которого классифицирует запрос как специфичный (Distinguishing Feature).
    • Repetition Frequency (Частота повторения): Количество повторений информации в серии запросов.
    • Threshold Number (Пороговое число повторений): Минимальное количество повторений для срабатывания триггера.
    • Frequency Difference Threshold (Порог разницы частот): Метрика из Claim 1, определяющая, насколько должна отличаться частота ввода одного запроса от другого, чтобы он считался «отличительным».
    • Clustering Process (Процесс кластеризации): Алгоритмы для идентификации повторяющейся информации в различных запросах.

    Выводы

    1. Профилирование на основе поведения, а не только содержания: Google активно анализирует не только что ищут пользователи (тематику), но и как они это делают (паттерны запросов). Структурные особенности и частота запросов служат триггерами для профилирования.
    2. Аномалии как ключевой триггер: Система ищет запросы, которые выделяются из обычной активности пользователя — необычно длинные (специфичные) или часто повторяющиеся. Эти аномалии запускают механизм вывода о принадлежности к группе.
    3. Механизм атрибуции (Smearing): Патент подтверждает использование механизма приписывания характеристик. Если система относит пользователя к группе, ему автоматически приписываются типичные характеристики этой группы (демография, интересы).
    4. Использование данных из разных сервисов: Для профилирования агрегируются данные из разных источников, включая веб-поиск и карты (географические системы).
    5. Цель — таргетинг контента и рекламы: Основная цель механизма — улучшение персонализации при доставке электронного контента (рекламы, рекомендаций), а не ранжирование результатов в основном веб-поиске.

    Практика

    Best practices (это мы делаем)

    Хотя патент не дает прямых рекомендаций по органическому ранжированию, он дает важные инсайты для контент-стратегии и понимания аудитории.

    • Глубокий анализ и таргетинг Long-Tail запросов: Уделяйте особое внимание сверхспецифичным, длинным запросам. Согласно патенту, такие запросы являются сильным сигналом для Google о намерениях и демографии пользователя. Создание контента под эти запросы позволяет охватить аудиторию с четко выраженными интересами.
    • Создание контента для жизненных событий и специфичных групп: Разрабатывайте контент, ориентированный на пользователей, проходящих через важные жизненные этапы (переезд, учеба, смена работы), так как они часто генерируют «отличающиеся» запросы. Это увеличивает релевантность сайта для этих сегментов.
    • Оптимизация под персонализированные ленты (Google Discover): Поскольку патент фокусируется на распространении контента на основе выведенных интересов, эти данные критичны для Discover. Стратегия должна включать создание контента, соответствующего устойчивым интересам идентифицированных целевых групп.
    • Интеграция SEO и PPC стратегий: Используйте инсайты о поведении и сегментации пользователей для координации SEO и платной рекламы. Данные из SEO-аналитики о специфичных запросах могут улучшить таргетинг в Google Ads, так как Google использует схожие механизмы для профилирования аудитории.

    Worst practices (это делать не надо)

    • Игнорирование специфики запросов: Фокусироваться исключительно на высокочастотных общих запросах. Общие запросы дают меньше информации о пользователе и реже запускают механизмы глубокого профилирования, описанные в патенте.
    • Попытки манипулировать профилированием: Не пытайтесь искусственно создавать шаблоны запросов (например, через ботов), чтобы повлиять на профилирование. Это не повлияет на ранжирование и может быть классифицировано как недействительный трафик.

    Стратегическое значение

    Стратегическое значение патента заключается в подтверждении того, насколько продвинутыми являются методы Google в области профилирования пользователей (User Understanding). Система анализирует мета-данные о поведении пользователя (частоту, специфичность) для построения его профиля. Это подчеркивает важность перехода от оптимизации под «запросы» к оптимизации под «аудиторию» и ее контекст во всех аспектах цифрового маркетинга, включая SEO и особенно персонализированные каналы.

    Практические примеры

    Сценарий 1: Определение нового жителя города (Локальный таргетинг)

    1. Поведение пользователя: Пользователь начинает многократно вводить адрес «Улица А, Город Б» в качестве отправной точки в Google Maps.
    2. Активация механизма (Триггер): Система обнаруживает Distinguishing Feature — высокую частоту повторения термина «Улица А, Город Б» (идентифицировано через Clustering process).
    3. Вывод (Inference): Система делает вывод, что пользователь является членом группы «Жители Города Б».
    4. Атрибуция характеристик (Smearing): Пользователю приписываются характеристики: интерес к местным новостям, локальным услугам.
    5. Результат: Система начинает показывать пользователю в Google Discover новости Города Б и рекламу локальных бизнесов, расположенных рядом с Улицей А.

    Сценарий 2: Идентификация студента (Демографический таргетинг)

    1. Поведение пользователя: Пользователь вводит очень длинный запрос: «Какова форма кривой спроса на аддиктивный продукт в модели X?».
    2. Активация механизма (Триггер): Система обнаруживает Distinguishing Feature — длина запроса превышает порог специфичности.
    3. Вывод (Inference): Система анализирует содержание и определяет, что этот запрос совпадает с вопросом на экзамене курса Экономика 101 в Университете Y. Делается вывод, что пользователь член группы «Студенты Университета Y».
    4. Атрибуция характеристик (Smearing): Пользователю приписывается возраст, ожидаемый год выпуска, интерес к экономике.
    5. Результат: Пользователю показывается реклама, ориентированная на студентов (например, доставка еды в кампус, учебные материалы).

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в органическом поиске (10 синих ссылок)?

    Нет, напрямую не влияет. Патент не описывает алгоритмы ранжирования веб-страниц. Он фокусируется на том, как Google профилирует пользователя — делает выводы о его демографии и интересах на основе паттернов его запросов. Эти данные затем используются для таргетинга рекламы и персонализации контента в лентах рекомендаций (например, Google Discover).

    Что такое «Distinguishing Feature» (Отличительная особенность) запроса?

    Это характеристика запроса, не связанная с его смыслом, которая выделяет его на фоне других запросов пользователя. Патент приводит три основных примера: 1) Необычно большая длина запроса (высокая специфичность). 2) Частое повторение одного и того же термина в разных запросах (например, адреса в картах). 3) Значительное изменение частоты ввода запроса по сравнению с обычным поведением пользователя.

    Как система использует эти отличительные особенности?

    Они служат триггером. Когда система обнаруживает такую особенность, она запускает процесс анализа содержания запроса (Subject Matter), чтобы сделать вывод о принадлежности пользователя к определенной группе (например, демографической или по интересам). Без этого триггера глубокий анализ для профилирования может не запускаться.

    Что такое «Smearing» (Приписывание характеристик)?

    Это процесс, при котором характеристики, типичные для группы, автоматически приписываются пользователю, которого система отнесла к этой группе. Например, если система решила, что вы житель Бостона, она может автоматически приписать вам интерес к местной спортивной команде Red Sox, даже если вы никогда ее не искали.

    Какую пользу SEO-специалист может извлечь из этого патента?

    Хотя патент не о ранжировании, он помогает понять, как Google сегментирует аудиторию. SEO-специалисты могут использовать это для разработки контент-стратегий, нацеленных на пользователей, переживающих определенные жизненные события (переезд, поступление в ВУЗ), так как эти пользователи генерируют запросы с «отличительными особенностями». Это также важно для оптимизации под Google Discover.

    Может ли система определить, что я переехал, на основе этого патента?

    Да, это один из ключевых примеров. Если вы начнете регулярно использовать новый адрес в качестве отправной или конечной точки в Google Maps (geographic location system), система обнаружит этот повторяющийся паттерн. Затем она проанализирует содержание (адрес) и сделает вывод, что вы теперь житель этого места.

    Как система узнает, какие характеристики присущи той или иной группе?

    Патент упоминает использование базы данных, которая хранит корреляции между тематикой запросов и характеристиками групп (Claim 10). Эта база данных может формироваться автоматически путем анализа поведения множества пользователей или заполняться вручную на основе известных демографических сведений.

    Если я введу очень длинный (Long-Tail) запрос, Google начнет меня профилировать?

    Потенциально да. Если длина запроса превысит определенный порог специфичности, это может послужить триггером для анализа содержания и попытки отнести вас к определенной группе. Для SEO это подчеркивает важность оптимизации под long-tail запросы как способ таргетинга на узкие, хорошо определенные группы пользователей.

    Что такое процесс кластеризации, упомянутый в патенте?

    Он используется для идентификации повторяющейся информации в серии различных запросов. Например, пользователь вводит «пицца рядом с [Адрес]» и «погода [Адрес]». Кластеризация (Clustering process) позволяет системе определить, что «[Адрес]» является часто повторяющимся элементом, даже если сами запросы разные.

    Как этот патент связан с конфиденциальностью и отказом от cookies?

    Этот механизм приобретает особое значение в мире без сторонних cookies. Он позволяет Google строить профили пользователей на основе собственных (first-party) данных — истории поисковых запросов и взаимодействия с Картами, — не полагаясь на отслеживание на сторонних сайтах. Это способ сохранить возможности таргетинга при усилении мер конфиденциальности.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.