Патент Google, описывающий систему для рекламных платформ (например, Google Ads). Система анализирует логи органического поиска, чтобы определить, какие запросы привели к кликам на конкретные сайты. На основе этой «народной популярности» (folksonomy) система рекомендует рекламодателям релевантные сайты для размещения их объявлений, улучшая контекстный таргетинг.
Описание
Какую задачу решает
Патент решает задачу помощи рекламодателям в поиске релевантных и популярных веб-сайтов (площадок) для размещения рекламы в контекстно-медийной сети (Display Network). Он улучшает таргетинг, используя данные о реальном поведении пользователей в органическом поиске для определения популярности сайта (folksonomy) и его фактической релевантности запросам пользователей, вместо того чтобы полагаться исключительно на анализ контента сайта.
Что запатентовано
Запатентована система рекомендации рекламных площадок (Suggestion System). Суть изобретения заключается в использовании логов органического поиска (Search Logs) для определения связи между запросами и сайтами через клики пользователей. Система анализирует, какие запросы чаще всего приводят к кликам на определенные сайты (пары Query/Domain), и ранжирует сайты на основе этой популярности. Затем она сопоставляет ключевые слова рекламодателя с этими данными, чтобы предложить наиболее подходящие площадки.
Как это работает
Система работает в двух основных режимах:
- Офлайн-анализ: Система обрабатывает Search Logs, чтобы определить, какие запросы привели к кликам на какие сайты. Из этих топовых запросов извлекаются ключевые термины (Content Vectors). Сайты ранжируются по частоте кликов, связанных с этими векторами.
- Онлайн-рекомендации: Рекламодатель вводит ключевые слова. Keyword Engine находит соответствующие Content Vectors. Suggestion Engine использует предварительно рассчитанные рейтинги и предлагает рекламодателю список наиболее популярных сайтов, связанных с этими векторами, при условии достижения пороговых значений популярности.
Актуальность для SEO
Средняя. Патент основан на концепциях, разработанных в 2007 году. Механизмы таргетинга в Google Ads значительно эволюционировали, сместив фокус на аудиторный и поведенческий таргетинг с использованием сложных ML-моделей. Однако базовый принцип использования популярности контента (folksonomy) и данных органического поиска для определения релевантности площадки (контекстуальный таргетинг) остается актуальным.
Важность для SEO
Патент имеет минимальное прямое влияние на SEO (2/10). Он не описывает алгоритмы органического ранжирования. Это инфраструктурный патент для рекламной системы Google (Google Ads). Его основная ценность для SEO-специалистов заключается в подтверждении того, что Google детально агрегирует данные о запросах и кликах (Search Logs) и связывает их с конкретными доменами для определения их тематики и популярности в контексте рекламы.
Детальный разбор
Термины и определения
- Content Source (Источник контента / Площадка)
- Веб-сайт или другой ресурс, на котором может быть размещена реклама.
- Content Vector (Вектор контента)
- Термин (слово или фраза, например, униграмма или биграмма), извлеченный из топовых запросов, которые привели к кликам на сайт. Служит для связи между запросами/ключевыми словами рекламодателей и сайтами-площадками.
- Folksonomy (Фолксономия)
- Использование популярности веб-сайтов, определяемой коллективным поведением пользователей (кликами), для классификации или рекомендации, вместо использования формальной таксономии или анализа контента.
- Keyword Engine (Механизм обработки ключевых слов)
- Компонент, который принимает ключевые слова от рекламодателей и определяет соответствующие Content Vectors.
- Query/Domain Pair (Пара Запрос/Домен)
- Связь между поисковым запросом и доменом веб-сайта, на который пользователь перешел из результатов этого запроса. Ключевая единица анализа в патенте.
- Ranking Engine (Механизм ранжирования)
- Компонент, который обрабатывает Search Logs и ранжирует сайты на основе частоты кликов по ассоциированным Content Vectors.
- Search Logs (Поисковые логи)
- Записи о запросах пользователей в органическом поиске и их взаимодействиях (кликах) с результатами поиска.
- Suggestion Engine (Система рекомендаций)
- Основной компонент, который генерирует и предлагает сайты рекламодателям на основе их ключевых слов и данных ранжирования.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод предложения рекламных площадок на основе анализа поведения пользователей в поиске.
- Идентификация источника контента (сайта), который был показан в результатах поиска по двум или более разным запросам, ранее полученным от пользователей.
- Определение для каждого запроса количества взаимодействий пользователей (кликов) с результатами поиска, которые ссылались на этот сайт.
- Ранжирование запросов на основе количества взаимодействий (кликов) с сайтом, когда он был представлен пользователю как результат поиска по этому запросу (определение Топ-запросов).
- Определение, что термин (ключевое слово), предоставленный рекламодателем, соответствует одному из этих запросов.
- Определение, что количество взаимодействий с сайтом по этому соответствующему запросу достигает порогового значения (threshold number of user interactions).
- Предоставление рекламодателю данных, идентифицирующих этот сайт как место для размещения контента (рекламы) рекламодателя.
Ядро изобретения — это использование фактической популярности сайта в органическом поиске (измеренной через клики по конкретным запросам) как основного фактора для рекомендации этого сайта рекламодателям, использующим схожие ключевые слова. Это механизм для рекламного таргетинга, использующий данные органического поиска.
Claim 5 (Зависимый от 1): Уточняет механизм сопоставления термина рекламодателя и запроса.
Система идентифицирует ключевое слово в рекламной кампании и находит соответствующий ему запрос среди ранжированных запросов (которые лежат в основе Content Vectors).
Claim 7 (Зависимый от 1): Описывает обработку ситуаций с несколькими подходящими сайтами.
Если пороговому значению популярности удовлетворяют несколько разных сайтов, система может предлагать разные наборы этих сайтов в ответ на разные запросы на рекомендации (обеспечение разнообразия, в описании патента упоминается метод round-robin).
Где и как применяется
ВАЖНО: Этот патент описывает инфраструктуру и алгоритмы рекламной системы (Google Ads / Adwords), а не системы органического поиска. Он не применяется напрямую на этапах CRAWLING, INDEXING или RANKING органической выдачи.
Однако он использует данные, генерируемые в результате работы поисковой системы.
Анализ данных (Офлайн-процессы):
Система анализирует Search Logs (результат взаимодействия пользователей с SERP). Это процесс обработки больших данных, выполняемый офлайн. В патенте упоминается использование параллельного анализа (например, с помощью Sawzall) для этой цели.
- Входные данные: Search Logs (пары запрос/домен и количество кликов).
- Выходные данные: Ранжированные списки сайтов, ассоциированных с Content Vectors.
Рекламная система (Интерфейс Google Ads):
Алгоритм применяется в реальном времени, когда рекламодатель использует инструмент подбора площадок для контекстно-медийной сети.
- Входные данные: Ключевые слова, введенные рекламодателем.
- Выходные данные: Список рекомендованных сайтов (Suggested Sites).
На что влияет
- Рекламный таргетинг: Влияет исключительно на подбор площадок и таргетинг рекламы в контекстно-медийной сети (Display Network).
- Органический поиск (SEO): Не влияет на ранжирование сайтов в органической выдаче.
- Издатели (AdSense): Влияет на то, как сайт классифицируется в рекламной системе. Сайты с большим количеством органических кликов по определенным темам будут чаще рекомендоваться релевантным рекламодателям.
Когда применяется
- Офлайн-обработка: Применяется периодически для обработки накопленных Search Logs и обновления базы данных Content Vectors и рейтингов сайтов. В патенте приведен пример методологии: обработка данных за 10 дней в каждом из 12 предшествующих месяцев для снижения временных эффектов и обеспечения стабильности данных.
- Онлайн-рекомендации: Применяется каждый раз, когда рекламодатель взаимодействует с инструментом подбора площадок и вводит ключевые слова для поиска релевантных сайтов.
- Пороговые значения: Алгоритм рекомендации срабатывает только если популярность сайта по запросу превышает threshold number of user interactions.
Пошаговый алгоритм
Процесс А: Офлайн-обработка данных (Ranking Engine)
- Сбор данных: Получение доступа к Search Logs.
- Агрегация кликов: Для каждой пары Query/Domain подсчитывается общее количество кликов (выборов сайта пользователем).
- Идентификация топовых запросов: Для каждого сайта определяется список наиболее частых запросов, которые привели к кликам на него (например, Топ-500 запросов).
- Генерация Content Vectors: Из топовых запросов извлекаются ключевые термины (например, 1-словные и 2-словные фразы – униграммы и биграммы). Могут удаляться стоп-слова.
- Ранжирование сайтов: Сайты ранжируются по частоте ассоциации с каждым Content Vector. Ранжирование основано на количестве кликов, связанных с этим вектором.
- Хранение: Сохранение рейтингов сайтов и связанных с ними Content Vectors.
Процесс Б: Генерация рекомендаций в реальном времени (Suggestion Engine)
- Получение ввода: Рекламодатель вводит ключевые слова.
- Определение Content Vectors (Keyword Engine): Система определяет Content Vectors, соответствующие ключевым словам рекламодателя. Может использоваться взвешивание терминов.
- Поиск сайтов: Система обращается к предварительно рассчитанным ранжированным спискам сайтов для этих Content Vectors.
- Агрегация и фильтрация: Собирается список топовых сайтов (например, Топ-K). Система может сначала использовать более точные 2-словные векторы. Если результатов недостаточно, используются 1-словные векторы. Применяются пороги популярности.
- Обеспечение разнообразия (Опционально): При использовании 1-словных векторов может применяться дополнительная обработка (например, метод round-robin) для повышения разнообразия рекомендаций.
- Выдача рекомендаций (Serving Engine): Представление финального списка рекомендованных сайтов рекламодателю.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Это основные данные для алгоритма. Используются Search Logs, содержащие информацию о запросах пользователей в органическом поиске и последующих кликах на результаты (пары Query/Domain). Это основа для определения folksonomy.
- Пользовательские данные (Рекламодателя): Ключевые слова, введенные рекламодателем в интерфейсе рекламной системы для поиска площадок.
Патент не упоминает использование контентных, технических, ссылочных или других SEO-факторов в этом механизме.
Какие метрики используются и как они считаются
- Частота кликов (Click Frequency / Number of user interactions): Основная метрика популярности. Количество кликов на конкретный сайт по конкретному запросу.
- Top Queries (Топ запросов): Список наиболее частых запросов, ведущих на сайт (например, 500 самых частых).
- Content Vector Frequency: Частота, с которой определенный Content Vector (термин) приводит к клику на сайт. Это агрегированная метрика на основе частоты кликов по запросам, содержащим этот вектор.
- Threshold number of user interactions (Порог взаимодействий): Минимальное количество кликов, необходимое для того, чтобы связь между запросом и сайтом считалась значимой для предложения рекламодателю.
- Веса (Weights): В описании патента упоминается возможность присвоения весов. Для запросов вес может учитывать количество кликов. Для ключевых слов рекламодателя вес может учитывать частоту их использования рекламодателем ранее.
Выводы
Патент описывает инфраструктуру рекламной платформы и не дает прямых практических выводов для SEO. Однако он предоставляет важное понимание методологии Google по анализу данных.
- Патент относится к рекламе (PPC), а не к органическому поиску (SEO): Описанные механизмы предназначены для подбора площадок в Display Network и не содержат рекомендаций для органического продвижения.
- Данные органического поиска используются для монетизации: Google активно использует логи запросов и кликов (Search Logs) из органического поиска как ключевой источник данных для улучшения рекламного таргетинга.
- Определение релевантности через «Folksonomy»: Система полагается на коллективное поведение пользователей для определения тематики и ценности сайта. Если пользователи массово переходят на сайт по определенным запросам, Google считает этот сайт релевантным этим запросам в контексте рекламы.
- Детальная агрегация данных на уровне «Запрос/Домен»: Патент демонстрирует инфраструктуру Google для детальной агрегации данных о поведении пользователей на уровне пар Query/Domain. Эта информация используется для создания Content Vectors, которые характеризуют сайт.
- Отсутствие анализа контента сайта: Этот конкретный механизм рекомендаций не анализирует контент самого сайта. Он полагается исключительно на то, как пользователи «голосуют» своими кликами из поиска.
- Фокус на агрегированных и стабильных данных: Система использует данные за длительные периоды (упоминается анализ за 12 месяцев) и применяет пороговые значения (Thresholds), что делает ее устойчивой к шуму и манипуляциям.
Практика
Патент является инфраструктурным и описывает механизмы рекламной платформы (PPC). Прямых практических выводов для SEO (органического продвижения) из него сделать нельзя.
Best practices (это мы делаем)
Хотя прямых рекомендаций для улучшения ранжирования в SEO нет, можно сделать косвенные выводы о том, как Google анализирует данные.
- Оптимизация под интент и максимизация релевантных кликов: Патент подтверждает, что Google точно агрегирует данные о том, по каким запросам пользователи кликают на ваш сайт. Необходимо фокусироваться на создании контента и оптимизации сниппетов (Title, Description), которые привлекают клики именно по целевым запросам. Это укрепляет связь вашего домена с нужными запросами в данных Google (Content Vectors).
- Построение четкой тематической релевантности (Topical Authority): Создание контента, который отвечает на широкий спектр запросов в рамках одной темы, увеличивает количество разнообразных Content Vectors, связанных с сайтом. Это помогает сформировать точный тематический профиль домена.
- Для издателей (AdSense): Для сайтов, участвующих в AdSense, получение значительного объема органического трафика по конкретной теме напрямую влияет на их привлекательность для рекламодателей через этот механизм таргетинга.
Worst practices (это делать не надо)
- Привлечение нерелевантных кликов (Кликбейт): Если сайт получает много кликов по запросам, не соответствующим его основному содержанию, это может сформировать «шумные» или нерелевантные Content Vectors. Это неэффективная стратегия для построения четкой тематической ассоциации домена и может ухудшить качество рекламы на сайте (для издателей).
- Накрутка кликов (Click Fraud): Попытки манипулировать этими данными неэффективны. Система использует агрегированные данные за длительные периоды и пороговые значения для нивелирования временных аномалий, шума и манипуляций.
Стратегическое значение
Стратегическое значение для SEO низкое. Патент подчеркивает важность данных о поведении пользователей (кликов из органического поиска) для экосистемы Google в целом. Он демонстрирует конкретный механизм, как Google интерпретирует связь между запросом и сайтом через действие пользователя (клик). Он подтверждает наличие у Google инфраструктуры для масштабного анализа поведенческих данных, но не доказывает их использование в органическом ранжировании.
Практические примеры
Практических примеров применения этого патента в работе по SEO продвижению сайтов нет, так как он описывает внутреннюю систему рекомендаций для рекламодателей (Google Ads).
Вопросы и ответы
Влияет ли этот патент на органическое ранжирование (SEO)?
Нет, напрямую не влияет. Патент описывает систему для рекламодателей (Google Ads), которая помогает им выбирать сайты (площадки) для размещения рекламы в контекстно-медийной сети. Он не описывает алгоритмы, по которым Google ранжирует сайты в органическом поиске.
Что такое «Folksonomy», упоминаемая в патенте?
Это способ классификации контента на основе коллективного поведения пользователей, а не формальной таксономии или анализа контента. В данном патенте это означает, что популярность и релевантность сайта определяются тем, как часто и по каким запросам пользователи на него кликают в органическом поиске.
Что такое «Content Vector» и как он формируется?
Это термин или фраза (обычно 1-2 слова), извлеченные из самых популярных запросов, которые привели к кликам на определенный сайт. Content Vector используется как связующее звено: он показывает, какие темы ассоциируются с сайтом на основе реального поведения пользователей.
Какую пользу этот патент несет SEO-специалисту?
Основная польза — подтверждение того, что Google детально агрегирует и использует данные о кликах из органического поиска (пары Query/Domain). Это показывает, что Google точно знает, какие запросы приводят трафик на ваш домен, и использует эту информацию для оценки релевантности сайта этим темам (как минимум, в своих рекламных системах).
Использует ли Google клики (CTR) как фактор ранжирования, судя по этому патенту?
Этот патент не подтверждает и не опровергает использование CTR как фактора органического ранжирования. Он лишь демонстрирует, что данные о кликах активно используются в рекламной системе для оценки популярности и тематики площадок.
Анализирует ли эта система контент на веб-сайте для определения его тематики?
Согласно патенту, этот конкретный механизм рекомендаций не анализирует контент на странице. Он полагается исключительно на анализ Search Logs и кликов пользователей. Тематика определяется на основе запросов, которые привели трафик на сайт из поиска.
Как система определяет топовые запросы для сайта?
Система анализирует Search Logs и подсчитывает общее количество кликов для каждой пары Query/Domain. Затем для каждого домена выбираются запросы с наибольшим количеством кликов (в патенте приводится пример выбора Топ-500 запросов).
Учитывает ли система время при анализе логов?
Да, в патенте упоминается метод для уменьшения временных эффектов и обеспечения стабильности данных. В качестве примера предлагается обрабатывать данные за 10 дней в каждом из 12 предшествующих месяцев, что позволяет получить более объективную оценку популярности и снизить влияние сезонности или аномалий.
Влияет ли эта система на то, какая реклама будет показана на моем сайте (если я использую AdSense)?
Да, косвенно. Если ваш сайт получает много органического трафика по определенной теме, эта система идентифицирует его как популярный ресурс по этой теме (через Content Vectors) и будет рекомендовать его рекламодателям, таргетирующимся на эту тему, что повышает релевантность рекламы.
Использует ли система какие-либо пороги при выборе сайтов?
Да. Патент явно указывает на использование threshold number of user interactions. Сайт будет рекомендован только в том случае, если количество кликов на него по соответствующему запросу превышает этот порог. Это гарантирует, что рекомендации основаны на статистически значимых данных о популярности.