Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов

Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.

Описание

Какую задачу решает

Патент решает три основные задачи, преимущественно в контексте рекламных систем:

Генерация ключевых слов: Сложность идентификации всех релевантных ключевых слов (keywords) для продукта или услуги, включая менее очевидные ассоциации.
Гео-таргетинг: Повышение эффективности географического таргетинга рекламы на основе реального поведения и предпочтений пользователей.
Борьба с низкокачественным контентом (MFA): Обнаружение и противодействие manipulated articles (манипулятивных статей или сайтов MFA — Made for Advertising), которые содержат мало полезной информации и созданы исключительно для генерации дохода от рекламы.

Что запатентовано

Запатентована система (Document Engine), которая анализирует пути навигации пользователей (Path Navigation Information) и данные о взаимодействии с элементами на странице (Selection Data, например, CTR рекламы). Изобретение включает три механизма: генерацию новых рекламных ключевых слов на основе контекста навигации, сопоставление рекламы со страницами на основе географических предпочтений, выведенных из поведения пользователей, и идентификацию манипулятивных статей по аномально высокому CTR рекламы.

Как это работает

Система реализует три ключевых механизма:

Механизм 1 (Генерация ключевых слов): Если реклама на странице имеет значительный CTR (выше порога), система анализирует путь, которым пользователь пришел на эту страницу (поисковые запросы, клики). Термины из этого пути ассоциируются с рекламируемым продуктом и устанавливаются как новые ключевые слова.
Механизм 2 (Гео-таргетинг): Система определяет географическую привязку страницы и рекламы на основе IP-адресов пользователей, которые с ними взаимодействуют (Selection Data). Реклама подбирается так, чтобы ее географическая ассоциация совпадала с географической ассоциацией страницы.
Механизм 3 (Обнаружение MFA): Система анализирует CTR рекламы на странице. Аномально высокий CTR интерпретируется как признак manipulated article, так как пользователи часто кликают по рекламе, чтобы покинуть страницу с низким информационным содержанием.

Актуальность для SEO

Средняя. Патент подан в 2004 году. Технологии генерации ключевых слов и гео-таргетинга, вероятно, эволюционировали в сторону сложных нейросетевых моделей. Однако механизм обнаружения MFA-сайтов через анализ поведенческих сигналов (в частности, CTR рекламы как индикатора неудовлетворенности контентом) остается высоко актуальным и концептуально соответствует современным системам оценки качества контента (например, Helpful Content System).

Важность для SEO

Влияние на SEO значительно, но косвенное (6/10). Хотя патент в первую очередь описывает AdTech, он критически важен для понимания оценки качества контента. Ключевое значение имеет Механизм 3: он прямо указывает, что аномальное взаимодействие с рекламой на сайте (слишком высокий CTR) может быть использовано как сигнал низкого качества контента (manipulated article) и потенциально вести к пессимизации сайта в органическом поиске.

Детальный разбор

Термины и определения

Article (Статья): Любой документ в сети (веб-страница, PDF-файл и т.д.). В контексте патента чаще всего это веб-страница, на которой размещается реклама.
Click-through Data (Данные о кликах): Тип Selection Data. Отражает частоту кликов по элементу (рекламе). Используется для расчета CTR (отношение кликов к показам).
Document Engine (Обработчик документов): Система, отвечающая за анализ статей, подбор рекламы, анализ путей навигации и данных о взаимодействии.
Geographical Location (Географическое местоположение): Ассоциация статьи, элемента или пользователя с географическим регионом, часто определяемая по IP-адресу.
Item (Элемент): Содержимое статьи, с которым может взаимодействовать пользователь (например, реклама, баннеры, ссылки).
Keyword (Ключевое слово): Слово или фраза, используемые в рекламных системах для таргетинга объявлений.
Manipulated Article (Манипулятивная статья): Статья (веб-страница), созданная для искусственного завышения позиций или исключительно для генерации дохода от рекламы. Характеризуется низким информационным содержанием. Соответствует термину MFA (Made for Advertising).
Path / Path Navigation Information (Путь / Информация о пути навигации): Последовательность статей (страниц) или действий (ввод поискового запроса, клики по элементам), которые пользователь совершил перед тем, как попасть на текущую статью.
Selection Data (Данные о взаимодействии/выборе): Данные, отражающие взаимодействие пользователя с элементами (Items) на странице. Включает Click-through data.
Term (Термин): Слово или фраза, извлеченные из пути навигации (например, из поискового запроса, текста ссылки), которые потенциально могут стать ключевым словом (Keyword).

Ключевые утверждения (Анализ Claims)

Важно отметить, что формула изобретения (Claims) защищает только Механизм 1 (Генерация ключевых слов). Механизмы 2 (Гео-таргетинг) и 3 (Обнаружение MFA) подробно описаны в тексте патента (Description), но не являются частью защищенного ядра изобретения, описанного в Claims 1-23.

Claim 1 и Claim 7 (Независимые пункты): Описывают основной процесс генерации ключевых слов.

Система идентифицирует статью/веб-страницу, содержащую рекламу продукта или услуги.
Определяется или получается описание пути (path), которым пользователь пришел к этой статье. Путь включает предыдущие элементы (рекламу), статьи или введенный пользователем текст (поисковый запрос).
Система (используя Term Processor) определяет термин (term), связанный с этим путем.
Система устанавливает ключевое слово (keyword) на основе этого термина для обозначения продукта или услуги из рекламы на целевой странице.

Зависимые пункты (Claims 4-6, 8-11): Уточняют источники термина в пути навигации:

Текст рекламы, по которой был совершен переход.
Ключевое слово, связанное с рекламой на предыдущей странице.
Поисковый запрос, введенный пользователем.
Термин в ссылке (анкор), по которой был совершен переход.

Зависимые пункты (Claims 12-17): Уточняют процесс «установления ключевого слова»:

Включение термина в список ключевых слов для продукта.
Расширение существующего списка.
Представление списка рекламодателю в качестве рекомендаций.

Где и как применяется

Патент описывает механизмы, которые в первую очередь относятся к рекламной экосистеме (Google Ads/AdSense), но имеют важные последствия для органического поиска в части оценки качества.

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)

Механизм 1 (Генерация ключевых слов): Анализ логов поведения пользователей для понимания взаимосвязи между путями навигации (включая запросы) и конечными продуктами. Это помогает системе устанавливать семантические связи между терминами.

INDEXING – Индексирование и извлечение признаков

Механизм 3 (Обнаружение MFA): На этом этапе могут агрегироваться поведенческие данные (Selection Data), такие как CTR рекламы на страницах сайта. Эти данные используются для вычисления признаков качества и определения вероятности того, что страница является manipulated article.

RANKING / RERANKING – Ранжирование / Переранжирование

Механизм 3 (Обнаружение MFA): Если статья идентифицирована как манипулятивная на основе анализа Selection Data, эта информация может быть использована алгоритмами качества для понижения ее рейтинга в органической выдаче.

Рекламная система (Ad Serving)

Механизм 2 (Гео-таргетинг): Применяется в момент выбора рекламы (Matching Processor). Система использует вычисленные географические ассоциации статьи и доступных объявлений (Geographical Processor) для оптимального таргетинга.

Входные данные:

Пути навигации пользователей (URL, запросы, клики).
Данные о взаимодействии (Selection Data / CTR) с рекламой.
IP-адреса пользователей.

Выходные данные:

Новые ключевые слова (Механизм 1).
Выбранное рекламное объявление с учетом географии (Механизм 2).
Оценка вероятности того, что статья является манипулятивной (Механизм 3).

На что влияет

Конкретные типы контента: Наибольшее влияние оказывается на сайты, монетизируемые с помощью контекстной рекламы (информационные сайты, блоги, обзорные ресурсы). Особенно сильно влияет на MFA-сайты и контент с низкой добавленной стоимостью.
Конкретные ниши или тематики: Ниши, где распространено создание низкокачественного контента под дорогие ключевые слова (например, финансы, здоровье, обзоры продуктов).

Когда применяется

Механизм 1: Активируется, когда Selection Data (CTR) для рекламы превышает определенный порог значимости (Threshold).
Механизм 2: Применяется при каждом запросе на показ контекстной рекламы.
Механизм 3: Анализ происходит постоянно. Идентификация manipulated article происходит, когда CTR рекламы превышает порог, указывающий на аномально высокое взаимодействие (попытки покинуть страницу).

Пошаговый алгоритм

Патент описывает три независимых процесса.

Процесс А: Генерация ключевых слов на основе пути навигации

Определение статьи и взаимодействия: Система идентифицирует статью и определяет Selection Data (CTR) для рекламных элементов на ней.
Проверка порога значимости: Система проверяет, превышают ли Selection Data установленный порог.
- Если НЕТ: Процесс останавливается.
- Если ДА: Переход к шагу 3.
Определение пути: Path Processor определяет путь навигации пользователя к этой статье (последовательность страниц, запросов, кликов).
Извлечение терминов: Term Processor анализирует путь и извлекает ассоциированные термины (поисковые запросы, текст ссылок/рекламы).
Установление ключевого слова: Извлеченные термины ассоциируются с рекламируемым продуктом/услугой и устанавливаются как новые ключевые слова.

Процесс Б: Географический таргетинг на основе поведения

Определение статьи: Идентифицируется статья, запросившая рекламу.
Определение географии статьи: Geographical Processor определяет географическую ассоциацию статьи на основе Selection Data (например, IP-адресов пользователей, посещающих статью).
Определение кандидатов и их географии: Matching Processor определяет потенциальные объявления. Для них определяется географическая ассоциация на основе Selection Data (IP-адресов пользователей, кликающих на объявление).
Выбор объявления: Система выбирает объявление для показа, основываясь на совпадении географической ассоциации статьи и объявления.

Процесс В: Обнаружение манипулятивных статей (MFA)

Определение статьи: Идентифицируется статья с рекламой.
Анализ взаимодействия: Определяются Selection Data (в частности, CTR) для рекламы на этой статье.
Оценка вероятности манипуляции: Система определяет вероятность того, что статья является manipulated article. Высокий CTR интерпретируется как признак низкого информационного содержания (пользователи кликают на рекламу, чтобы уйти).
Применение результатов: Информация о манипулятивной статье может быть использована для понижения ее рейтинга в поиске.

Какие данные и как использует

Данные на входе

Патент сосредоточен на использовании поведенческих данных.

Поведенческие факторы:
- Path Navigation Information: История просмотра страниц, последовательность кликов, введенные поисковые запросы.
- Selection Data / Click-through Data: Данные о кликах по рекламным объявлениям и ссылкам (CTR).
Географические факторы:
- IP-адреса пользователей, взаимодействующих со статьями и рекламой. Используются для определения Geographical Location.
Контентные факторы:
- Текст и ключевые слова, извлекаемые из пути навигации (текст ссылок, текст рекламы, поисковые запросы).

Какие метрики используются и как они считаются

Selection Data (CTR): Основная метрика. Отношение количества кликов на элемент (рекламу) к количеству показов.
Порог значимости (Threshold) для Механизма 1: Минимальный уровень CTR, при котором система активирует анализ пути навигации для генерации ключевых слов.
Порог для обнаружения MFA (Механизм 3): Уровень CTR, выше которого статья с высокой вероятностью классифицируется как manipulated article.
Geographical Association (Географическая ассоциация): Метрика, связывающая статью или рекламу с регионом на основе анализа географии IP-адресов пользователей, проявивших к ним интерес (Механизм 2).
Likelihood of Manipulated Article (Вероятность манипулятивной статьи): Оценка, вычисляемая на основе Selection Data.

Выводы

Аномальный CTR рекламы — сигнал низкого качества (MFA): Критически важный вывод для SEO. Патент явно описывает механизм, где высокий CTR контекстной рекламы интерпретируется как негативный сигнал. Логика в том, что пользователи покидают низкокачественные (MFA) страницы через рекламу в поисках лучшего контента, тогда как на качественных страницах они удовлетворены контентом и реже кликают на рекламу.
Контекст определяется путем пользователя: Google анализирует не только содержание целевой страницы, но и весь путь навигации пользователя (включая предыдущие запросы и клики), чтобы понять контекст и интент.
Поведенческие данные как основа для семантических связей: Система использует данные о совместном возникновении терминов в рамках одной сессии (пути) для установления семантических связей между ними (Механизм 1).
География определяется поведением: Географическая релевантность статьи или рекламы определяется на основе того, пользователи из каких регионов проявляют к ним интерес (анализ IP и Selection Data), а не только на основе контента (Механизм 2).
Интеграция AdTech и оценки качества: Патент демонстрирует, как данные, собранные для оптимизации рекламы, могут быть использованы для оценки качества контента в органическом поиске.

Практика

Best practices (это мы делаем)

Фокус на удовлетворении интента пользователя (User Satisfaction): Создавайте контент, который полностью отвечает на запрос пользователя и предоставляет высокую ценность. Это естественным образом снижает вероятность того, что пользователь немедленно покинет страницу через рекламный блок, что защищает сайт от классификации как manipulated article (Механизм 3).
Оптимизация пользовательского опыта (UX) и размещения рекламы: Рекламные блоки должны быть интегрированы аккуратно и не мешать потреблению основного контента. Агрессивное размещение рекламы может искусственно повысить CTR и сигнализировать о низком качестве страницы.
Построение тематического авторитета (Topical Authority): Поскольку система анализирует пути навигации (Механизм 1) для установления семантических связей, важно выстраивать четкую структуру сайта и внутреннюю перелинковку, которая поддерживает логичные пути перемещения пользователя внутри темы.
Локальная оптимизация (для релевантных бизнесов): Усиливайте локальные сигналы. Патент подтверждает (Механизм 2), что Google ассоциирует сайты с регионами на основе поведения пользователей. Привлечение целевого локального трафика укрепит эту географическую ассоциацию.

Worst practices (это делать не надо)

Создание MFA-сайтов (Made for Advertising): Создание сайтов с низкокачественным или автоматически сгенерированным контентом, оптимизированным под дорогие ключевые слова с целью максимизации дохода от рекламы. Патент напрямую описывает Механизм 3 для борьбы с такими сайтами через анализ Selection Data.
Агрессивная реклама и темные паттерны (Dark Patterns): Использование макетов, которые провоцируют случайные клики по рекламе или вынуждают пользователей кликать на рекламу для продолжения навигации. Это приводит к аномально высокому CTR, что является триггером для идентификации manipulated article.
Использование кликбейта: Привлечение нерелевантного трафика, который быстро покидает сайт (в том числе через рекламу), негативно влияет на поведенческие метрики и может быть интерпретировано как низкое качество контента.

Стратегическое значение

Этот патент подтверждает, что Google использует поведенческие сигналы не только для оптимизации рекламных продуктов, но и как важный компонент для оценки качества контента в органическом поиске. Он предоставляет конкретный механизм, как данные о взаимодействии с рекламой (Ad CTR) могут быть использованы для выявления низкокачественных, манипулятивных сайтов (MFA). Это подчеркивает важность стратегии, ориентированной на удовлетворение пользователя, а не на максимизацию кликов по рекламе любой ценой.

Практические примеры

Сценарий 1: Обнаружение MFA-сайта (Механизм 3)

Сайт: Блог о финансах, наполненный поверхностными статьями, сгенерированными ИИ, об оформлении кредитных карт.
Макет: Агрессивное размещение рекламных блоков, затрудняющее чтение.
Поведение пользователя: Пользователи приходят из поиска, быстро понимают, что контент бесполезен, и кликают на контекстную рекламу банков, чтобы найти реальные предложения.
Анализ Google: Document Engine фиксирует аномально высокий CTR рекламы (например, 25%).
Результат: Система классифицирует страницы как manipulated articles. Сайт теряет позиции в органической выдаче.

Сценарий 2: Генерация ключевых слов (Механизм 1)

Путь пользователя: Пользователь ищет в Google «как избавиться от сырости в подвале». Переходит на форум. С форума переходит на статью о методах гидроизоляции.
Целевая страница и реклама: На статье пользователь видит рекламу «Осушители воздуха для дома» и кликает на нее (CTR выше порога).
Анализ Google: Система анализирует путь и извлекает термин «избавиться от сырости в подвале» (исходный запрос).
Результат: Система ассоциирует этот термин с продуктом «Осушители воздуха» и предлагает его рекламодателям в качестве нового ключевого слова.

Вопросы и ответы

Означает ли этот патент, что высокий CTR рекламы на моем сайте приведет к его пессимизации?

Да, это весьма вероятно, согласно Механизму 3 данного патента. Система интерпретирует аномально высокий CTR контекстной рекламы как признак того, что страница имеет низкую информационную ценность (manipulated article или MFA). Логика в том, что пользователи кликают по рекламе, чтобы покинуть страницу, которая не удовлетворила их интент.

Как Google определяет, какой CTR считать «аномально высоким»?

Патент не указывает конкретных цифр, но упоминает сравнение с пороговым значением (threshold click-through rate). На практике это значение, вероятно, определяется динамически и зависит от тематики сайта, типа контента, макета страницы и среднего уровня CTR для похожих сайтов и рекламных форматов.

Что такое «Manipulated Article» в контексте этого патента?

Это веб-страница, созданная с целью манипулирования поисковой выдачей или исключительно для генерации дохода от рекламы, при этом не предоставляющая реальной ценности пользователю. В современном SEO это эквивалентно терминам MFA (Made for Advertising) или низкокачественный/спамный контент.

Какое отношение генерация рекламных ключевых слов (Механизм 1) имеет к органическому SEO?

Косвенное, но важное. Этот механизм показывает, что Google анализирует весь путь пользователя (Path Navigation Information), чтобы понять контекст и установить семантические связи между запросами и темами. Это подчеркивает важность понимания того, как пользователи приходят на ваш сайт и как они перемещаются по нему, для построения тематического авторитета.

Как работает механизм гео-таргетинга (Механизм 2) и влияет ли он на локальное SEO?

Механизм определяет географическую привязку сайта и рекламы на основе IP-адресов пользователей, которые с ними взаимодействуют. Это подтверждает, что для локального SEO важно не только наличие локальных ключевых слов на сайте, но и привлечение реального трафика из целевого региона, что усиливает географическую ассоциацию в системах Google.

Мой сайт не использует контекстную рекламу. Актуален ли этот патент для меня?

Механизмы 1 и 3 (генерация ключевых слов и обнаружение MFA) в описанном виде зависят от наличия рекламы и анализа ее CTR. Однако общие принципы — анализ пути навигации для понимания контекста и использование поведенческих сигналов для оценки качества — универсальны и могут применяться Google и без наличия рекламы (например, анализ кликов по исходящим ссылкам).

Стоит ли убирать рекламу с сайта, чтобы избежать рисков, связанных с Механизмом 3?

Дело не в наличии рекламы, а в качестве контента и способе интеграции рекламы. Если сайт предоставляет высокую ценность, а реклама не мешает пользователю, CTR будет в пределах нормы. Убирать рекламу не обязательно, но необходимо избегать стратегий MFA и агрессивного размещения блоков.

Что такое «Selection Data»?

Это общий термин для данных о взаимодействии пользователя с элементами на странице. Самый частый пример — Click-through Data (данные о кликах и CTR). Также может включать данные о конверсиях или других действиях после клика.

Патент подан в 2004 году. Насколько он актуален сейчас?

Несмотря на возраст, базовые принципы остаются актуальными. Анализ поведения пользователей для улучшения таргетинга и оценки качества — это фундаментальные задачи. Хотя техническая реализация, вероятно, усложнилась, логика обнаружения MFA через поведенческие аномалии по-прежнему используется Google.

Как защитить свой контентный проект от классификации как «Manipulated Article»?

Сосредоточьтесь на создании глубокого, экспертного контента (E-E-A-T), который полностью удовлетворяет интент пользователя. Обеспечьте отличный пользовательский опыт (UX) и интегрируйте рекламу так, чтобы она не доминировала над основным контентом и не провоцировала случайные клики.