Патент Google, описывающий фундаментальные механизмы персонализированной рекламы. Система объединяет информацию о текущем запросе пользователя (поисковый запрос или просматриваемый документ) с накопленными данными о нем (профиль, история поведения, интересы). Используя методы сравнения векторов признаков и динамические веса важности, система вычисляет оценку релевантности рекламы и корректирует будущие показы на основе обратной связи.
Описание
Какую задачу решает
Патент решает проблему ограниченной релевантности онлайн-рекламы, когда таргетинг основан исключительно на непосредственном контексте запроса (например, ключевых словах поиска или тематике страницы), игнорируя персональные интересы пользователя. Изобретение направлено на улучшение производительности рекламы (click-through rate, conversion rate) путем учета персональной информации о пользователе для более точного определения его намерений в момент запроса.
Что запатентовано
Запатентована система для таргетинга рекламы, которая вычисляет оценку (score) для объявлений, используя одновременно два типа входных данных: User Information (информация о пользователе, включая поведение и профиль) и Request Information (информация, связанная с текущим запросом пользователя). Система использует эту комбинированную оценку для выбора наиболее релевантных объявлений или наиболее подходящего креатива.
Как это работает
Система использует методы Information Retrieval (IR) для сопоставления рекламы с пользователем и его запросом:
- Представление данных: Информация о пользователе, запросе и рекламе представляется в виде векторов признаков (feature vectors) или N-грамм (n-grams).
- Вычисление схожести: Система вычисляет степень схожести между вектором (Пользователь + Запрос) и вектором Рекламы. Упоминаются метрики вроде косинусного расстояния (cosine distance) или TF-IDF.
- Весовые коэффициенты: Каждому признаку присваивается вес важности (importance weight).
- Машинное обучение: Веса важности динамически корректируются на основе эффективности показанной рекламы (например, был ли клик) – это механизм обратной связи.
- Оптимизация: Система может приоритизировать обработку признаков по их важности для соблюдения ограничений по времени ответа (latency constraint).
Актуальность для SEO
Критически высокая. Описанные методы являются фундаментом современных систем персонализированной рекламы, включая Google Ads. Использование поведенческих данных, профилирования пользователей, векторных представлений и машинного обучения на основе производительности остается центральным элементом цифрового маркетинга.
Важность для SEO
Прямое влияние на органическое SEO минимальное (3.5/10). Патент описывает исключительно систему показа рекламы (Ad Serving Operations) и не затрагивает ранжирование органических результатов. Однако он имеет высокое стратегическое значение, поскольку детально раскрывает технические возможности Google по глубокому профилированию пользователей, использованию векторных пространств для определения релевантности и применению поведенческих сигналов для обучения системы.
Детальный разбор
Термины и определения
- Ad Features (Признаки объявления)
- Внутренние характеристики объявления: текст, ссылка, медиафайлы, а также критерии таргетинга (ключевые слова, демография, география).
- Feature Vector (Вектор признаков)
- Способ представления информации (о пользователе, запросе или рекламе) в виде вектора пар «признак-значение». Используется для математического вычисления схожести.
- Importance Weight (Вес важности)
- Весовой коэффициент, присваиваемый отдельному признаку. Определяет его значимость при расчете релевантности. Динамически корректируется на основе производительности (performance) рекламы.
- N-grams (N-граммы)
- Последовательности слов. Используются как способ представления текстовой информации (например, из посещенных пользователем страниц или текста рекламы).
- Request Information (Информация о запросе)
- Информация, связанная с текущим действием пользователя (поисковый запрос или запрос документа). Включает ключевые слова, тематику документа, время запроса.
- User Information (Информация о пользователе)
- Любая информация о пользователе. Включает User Behavior Information (поведение: история запросов, посещений, покупок) и User Profile Information (профиль: демография, география, психографика).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Определяет основной метод работы.
- Система принимает информацию, связанную с запросом пользователя (Request Information).
- Система принимает информацию о пользователе (User Information).
- Система определяет оценку (score) для объявления, используя ОБА типа принятой информации.
Ядро изобретения — защита комбинации текущего контекста и персональных данных для скоринга рекламы.
Claim 5 (Зависимый от 4): Детализирует метод вычисления схожести.
- Информация об объявлении представлена как первый вектор признаков (first feature vector).
- Комбинация информации о запросе и пользователе представлена как второй вектор признаков (second feature vector).
- Схожесть определяется с использованием косинусного расстояния (cosine distance) между этими векторами.
Claim 11 (Зависимый от 4): Описывает механизм машинного обучения и обратной связи.
- Признаки (items of information) имеют связанные веса важности (importance weights).
- Эти веса определяются на основе прошлой эффективности (performance) рекламы, которая была оценена с использованием этих признаков.
Система адаптируется: если признак способствовал успешному показу рекламы (например, клику), его вес увеличивается.
Claim 19 (Зависимый от 1): Уточняет состав User Information, включая поведенческую информацию (предыдущие запросы, клики по рекламе, просмотренные документы, покупки).
Claim 25 и 26 (Зависимые от 1): Описывают оптимизацию производительности.
Процесс определения оценки обрабатывает признаки в порядке их весов важности (Claim 25). Процесс может быть прерван при наступлении события (например, таймера), даже если не все признаки были учтены (Claim 26). Это позволяет системе работать в условиях жестких ограничений по времени ответа (latency).
Где и как применяется
Патент описывает работу системы показа рекламы (Ad System), а не органического поиска. Однако мы можем концептуально сопоставить описанные процессы с общей архитектурой поиска.
INDEXING – Индексирование (Сбор и обработка данных)
На этом этапе происходит сбор, обработка и хранение Ad Information и User Information. Это включает офлайн-процессы для расчета и обновления Importance Weights на основе прошлой эффективности рекламы (Feedback Loop).
QUNDERSTANDING – Понимание Запросов
Анализ текущего User Request для извлечения Request Information. Также User Information может использоваться на этом этапе для разрешения неоднозначности запроса (Query Disambiguation) при выборе рекламы.
RANKING – Ранжирование (Рекламное ранжирование)
Основной этап применения патента. Происходит в реальном времени.
- Процесс: Система формирует векторы признаков и вычисляет схожесть (Similarity Score) между вектором (Пользователь + Запрос) и векторами кандидатов рекламы. Используются методы оптимизации (обработка по приоритету весов).
RERANKING (Переранжирование)
Патент описывает возможность двухэтапного процесса: сначала определение общей релевантности (на основе запроса), а затем переранжирование на основе User Information.
Входные данные:
- Request Information (текст запроса, контент документа).
- User Information (профиль и история поведения).
- Ad Information (база данных объявлений и их признаки).
Выходные данные:
- Набор рекламных объявлений, отсортированных по персонализированной оценке (Score).
На что влияет
- Типы контента: Влияет исключительно на выбор, ранжирование и генерацию креативов рекламных объявлений. Не влияет на ранжирование органической выдачи.
- Специфические запросы: Особенно сильно влияет на неоднозначные запросы (например, «jaguar» или «blues»), где история пользователя помогает уточнить интент и выбрать соответствующую рекламу.
- Выбор креатива (Ad Creative Selection): Система может выбрать конкретный креатив внутри кампании, который лучше соответствует профилю пользователя (например, реклама минивэна для пользователя с детьми).
Когда применяется
- Условия работы: Алгоритм применяется при каждом запросе на показ рекламы, инициированном пользователем, при условии доступности User Information (которая может храниться на сервере, клиенте (cookies) или у третьих лиц).
- Ограничения: Система учитывает ограничения по времени ответа (latency), используя приоритизацию обработки признаков.
Пошаговый алгоритм
Процесс А: Таргетинг рекламы в реальном времени
- Прием данных о запросе: Система принимает Request Information.
- Прием данных о пользователе: Система принимает User Information. Данные обрабатываются в порядке их Importance Weights.
- Формирование векторов (Неявно): Формируется представление запроса и пользователя (second feature vector) и идентифицируются кандидаты рекламы (first feature vector).
- Вычисление оценок (Scoring): Для кандидатов вычисляется оценка (Score) на основе схожести (например, cosine distance). Процесс может быть прерван по таймеру (Claim 26).
- Ранжирование и выбор: Объявления ранжируются или выбираются на основе оценок. Может также происходить выбор конкретного креатива.
Процесс Б: Управление весами (Feedback Loop)
- Мониторинг эффективности: Система отслеживает производительность (Performance) показанной рекламы (клики, конверсии).
- Корректировка весов: Importance Weights признаков, которые способствовали показу этой рекламы, корректируются. При положительном результате (клик) веса увеличиваются, при отрицательном — могут уменьшаться.
Какие данные и как использует
Данные на входе
Патент описывает использование широкого спектра данных:
Поведенческие факторы (User Behavior Information):
- Контент (слова, Anchortext) посещенных веб-сайтов.
- Предыдущие поисковые запросы пользователя.
- История взаимодействия с рекламой (показы, клики).
- История покупок (previous purchasing behavior).
- Информация из просмотренных или отредактированных документов.
Пользовательские и Географические факторы (User Profile Information):
- Демография (возраст, доход, семейное положение, образование, наличие детей).
- География (страна, город, почтовый индекс, точные координаты).
- Психографика (социальный класс, образ жизни, интересы).
Контентные и Технические факторы (Request/Ad Information):
- Текст запроса или контент запрашиваемого документа.
- Текст рекламного креатива и сайта рекламодателя.
- Ключевые слова таргетинга.
- Тип браузера пользователя.
Какие метрики используются и как они считаются
- Представление данных: Используются Feature Vectors и N-grams.
- Similarity Score (Оценка схожести): Основная метрика для ранжирования. Вычисляется между вектором (Пользователь+Запрос) и вектором Рекламы.
- Методы расчета: Cosine distance (косинусное расстояние), Hamming distance, TF-IDF, системы на основе правил (Rule-based).
- Importance Weight (Вес важности): Вес отдельного признака.
- Методы расчета: Динамически корректируется на основе эффективности рекламы (Feedback Loop). Может учитывать глобальные или групповые веса (насколько часто признак успешен у похожих пользователей).
- Feature Selection (Отбор признаков): Для оптимизации система может отбирать наиболее важные признаки, используя статистические методы (например, Mutual Information, корреляция) или просто выбирая признаки с наивысшим Importance Weight.
Выводы
- Патент относится к рекламе, не к органическому SEO: Описанные механизмы предназначены исключительно для системы показа рекламы (Google Ads). Они не описывают алгоритмы ранжирования органического поиска.
- Сложное профилирование пользователей: Google использует детализированные данные о пользователях (User Information), включающие демографию, историю поиска, посещенные сайты, клики по рекламе и покупки, для создания профиля интересов.
- Комбинированный скоринг релевантности: Релевантность рекламы определяется не только текущим запросом, но и комбинацией запроса и профиля пользователя. Это позволяет персонализировать выдачу и разрешать неоднозначности запросов (Query Disambiguation).
- Векторные представления и IR-методы: Патент подтверждает использование Feature Vectors для представления пользователей, запросов и рекламы. Ранжирование основано на вычислении схожести (например, cosine distance, TF-IDF).
- Машинное обучение через обратную связь (Importance Weights): Система обучается в процессе работы. Веса признаков динамически корректируются на основе реальной эффективности рекламы (кликов/конверсий). Это подтверждает критическую важность поведенческих сигналов для оценки релевантности в системах Google.
- Оптимизация производительности: Система оптимизирована для работы в условиях низких задержек, приоритизируя обработку наиболее важных признаков и используя возможность раннего прекращения вычислений.
Практика
ВАЖНО: Патент описывает внутренние механизмы рекламной системы Google (Google Ads). Прямых рекомендаций для органического SEO в нем нет. Однако он предоставляет критически важное понимание того, как Google анализирует пользователей и определяет релевантность.
Best practices (это мы делаем)
- Фокус на удовлетворении долгосрочного интента и понимании аудитории: Понимать, что Google обладает технологиями для глубокого профилирования пользователей. SEO-стратегия должна учитывать целостный профиль целевой аудитории, а не только изолированные ключевые слова. Создавайте контент, соответствующий смежным интересам и поведенческим паттернам вашей аудитории.
- Построение Тематического Авторитета (Topical Authority): Использование векторных представлений для моделирования интересов подчеркивает важность широкого семантического охвата темы. Развитие сайта как авторитетного источника увеличивает вероятность его соответствия профилям интересов целевых пользователей.
- Оптимизация под поведенческие факторы (User Engagement): Патент демонстрирует, как Google использует обратную связь (производительность результатов) для машинного обучения и корректировки весов (Importance Weights). Это косвенно подтверждает важность оптимизации контента для улучшения поведенческих сигналов и удовлетворенности пользователей в органическом поиске.
Worst practices (это делать не надо)
- Узкая оптимизация под текст запроса: Стратегии, основанные исключительно на текстовой релевантности запросу (Request Information), игнорирующие контекст и профиль пользователя (User Information), будут менее эффективны в персонализированной среде.
- Игнорирование неоднозначности запросов: Не учитывать различные интенты для одного и того же запроса. Google использует контекст для разрешения неоднозначности (Query Disambiguation); контент должен четко сигнализировать о своем интенте.
Стратегическое значение
Патент подтверждает, что персонализация, основанная на глубоком анализе поведения пользователей, является фундаментальным компонентом систем Google. Он демонстрирует техническую реализацию профилирования, использования векторных пространств и машинного обучения на основе обратной связи. Для SEO это означает, что релевантность динамична и зависит от контекста пользователя. Стратегия должна быть направлена на построение авторитетности в глазах целевой аудитории и обеспечение положительного пользовательского опыта.
Практические примеры
Практических примеров для органического SEO нет. Примеры ниже относятся к работе рекламной системы, как описано в патенте.
Сценарий 1: Дисамбигуация запроса (на основе FIG. 11 патента)
- Запрос: Пользователь вводит «jaguar».
- Проблема: Неясно, интересует ли его автомобиль, ОС Apple или футбольная команда.
- User Information: В профиле пользователя есть данные о недавнем посещении автомобильных сайтов (например, Edmunds) и высокий доход.
- Действие системы: Система вычисляет Similarity Score, учитывая User Information. Оценка для рекламы автомобилей Jaguar оказывается выше.
- Результат: Показывается реклама автомобилей Jaguar.
Сценарий 2: Выбор креатива на основе профиля (на основе FIG. 13 патента)
- Запрос: Пользователь вводит «Honda». Система выбирает кампанию Honda, в которой есть креативы для седана (Accord) и минивэна (Odyssey).
- User Information: В профиле указано «женат», а также есть данные о недавних покупках детских товаров. Система делает вывод: «есть дети».
- Действие системы: Система выбирает креатив, который лучше соответствует профилю «семья с детьми».
- Результат: Показывается реклама минивэна Honda Odyssey.
Вопросы и ответы
Влияет ли этот патент на органическое ранжирование (SEO)?
Нет, напрямую не влияет. Патент US8352499B2 описывает исключительно систему показа рекламы (Google Ads). Он не содержит информации об алгоритмах, используемых для ранжирования органических результатов поиска. Все механизмы скоринга и персонализации в патенте относятся к выбору рекламных объявлений.
Какая польза от этого патента для SEO-специалиста, если он про рекламу?
Польза стратегическая. Патент детально раскрывает, как Google профилирует пользователей, какие данные собирает (история запросов, посещения, покупки, демография) и как обрабатывает их (векторы признаков, веса важности). Это помогает SEO-специалистам понять возможности Google по интерпретации интересов аудитории на глубоком уровне, за пределами отдельных ключевых слов.
Что такое «Importance Weight» (Вес важности) и как он определяется?
Это весовой коэффициент, присваиваемый каждому признаку в профиле пользователя. Он определяет значимость этого признака при расчете релевантности. Ключевая особенность — он динамический: если использование признака привело к успешному показу рекламы (клику или конверсии), его вес увеличивается. Это механизм машинного обучения через обратную связь.
Что патент говорит об использовании векторов (Feature Vectors)?
Патент описывает представление информации о пользователе, текущем запросе и рекламе в виде feature vectors. Для определения наилучшей рекламы система вычисляет схожесть между вектором (Пользователь + Запрос) и вектором Рекламы. В качестве метрики схожести явно упоминается косинусное расстояние (cosine distance).
Подтверждает ли этот патент использование поведенческих факторов в ранжировании?
Да, в контексте рекламной системы он это прямо подтверждает. Эффективность (performance), которая является поведенческим сигналом (клик/не клик), используется для корректировки весов признаков (Importance Weights), которые определяют будущее ранжирование рекламы. Это сильный индикатор того, что Google активно использует поведенческие сигналы для обучения своих систем.
Как патент предлагает решать проблему неоднозначных запросов (например, «Jaguar»)?
Патент явно указывает на использование User Information для разрешения неоднозначности (Query Disambiguation). История предыдущих запросов и посещений сайтов помогает системе понять, интересует ли пользователя операционная система, автомобиль или животное, и показать соответствующую рекламу.
Учитывает ли система ограничения по скорости ответа (latency)?
Да, патент описывает механизм оптимизации (Claims 25, 26). Система обрабатывает признаки в порядке их весов важности. Если время обработки превышает заданный лимит, процесс может быть прерван, и решение будет принято на основе уже обработанных (наиболее важных) признаков, обеспечивая быстрый ответ.
Где хранится информация о пользователе (User Information)?
Патент упоминает гибкость хранения: на стороне сервера (server-side storage), на стороне клиента (client-side storage, например, в cookies браузера) или у третьих лиц (third party storage). Информация может передаваться на сервер вместе с запросом пользователя.
Использует ли система демографические данные?
Да. Патент явно включает демографические данные (возраст, доход, семейное положение), географические и психографические данные в состав User Profile Information. Эти данные используются наравне с поведенческими для расчета оценки релевантности рекламы.
Описывает ли патент выбор конкретного креатива внутри рекламной кампании?
Да. Система может не только определить релевантную кампанию, но и использовать User Information для выбора наиболее подходящего креатива. Например, выбрать рекламу минивэна, а не спорткара, если профиль пользователя идентифицирован как «семейный» (FIG. 13).