Патент Google описывает методы определения «текущего контекста» динамического контента, например, поисковой выдачи (SERP), для подбора релевантной рекламы. Если контекст неясен или запрос слишком общий, система анализирует исторические запросы, которые приводили к похожим результатам, или анализирует контент страниц, на которые ссылается SERP, чтобы точнее таргетировать объявления.
Описание
Какую задачу решает
Патент решает проблему подбора релевантного «альтернативного контента» (Alternative Content, преимущественно рекламы), когда контекст основного запрошенного контента является новым, динамичным, неизвестным или неоднозначным. Это часто происходит на страницах поисковой выдачи (SERP) или новостных лентах. Цель — улучшить таргетинг рекламы путем определения Current Context (текущего контекста) в реальном времени, особенно для широких запросов, интент которых может меняться.
Что запатентовано
Запатентована система для определения текущего контекста запрошенного контента (например, SERP) путем анализа связанной информации, а не только самого контента. Эта связанная информация включает исторические поисковые запросы (Historic Queries), которые давали похожие результаты, а также контент, на который ссылается запрошенный контент (например, целевые страницы результатов поиска). Полученный контекст используется для выбора и показа релевантных рекламных объявлений.
Как это работает
Система предлагает несколько методов для определения контекста динамической страницы:
- Анализ исторических запросов (Ядро Claims): Система находит прошлые запросы, которые приводили к результатам, похожим на текущие. Ключевые слова из этих прошлых запросов используются для таргетинга рекламы для текущего запроса.
- Анализ связанных страниц (Описано в Description): Система определяет контекст страниц, на которые ведут ссылки из результатов поиска. Реклама, релевантная для этих связанных страниц, или ключевые слова, извлеченные из них, используются для выбора рекламы на SERP.
- Анализ заголовков и сниппетов (Описано в Description): Система извлекает ключевые слова из заголовков и сниппетов результатов поиска и использует их для подбора рекламы.
Актуальность для SEO
Высокая (для рекламных технологий). Точный контекстуальный таргетинг является основой Google Ads. Методы обработки динамического и нового контента для немедленного подбора релевантной рекламы остаются критически важными. Хотя конкретные реализации могли эволюционировать с развитием ML/NLP, базовые принципы использования исторических данных и связанных документов для вывода контекста актуальны.
Важность для SEO
Влияние на SEO минимальное (2/10). Патент полностью посвящен механизмам выбора контекстной рекламы (Google Ads/AdSense), а не органическому ранжированию. Он не содержит информации о факторах ранжирования или оценки качества сайтов для SEO. Однако он дает ценное представление о том, как Google интерпретирует контекст и устанавливает семантические связи между запросами на основе пересечения результатов.
Детальный разбор
Термины и определения
- Alternative Content (Альтернативный контент)
- Контент, подбираемый для показа вместе с основным запрошенным контентом. Преимущественно реклама (advertisements).
- Current Context (Текущий контекст)
- Актуальная тематика или интент контента на странице в момент запроса. Может меняться со временем.
- Historic Queries / Previous Search Queries (Исторические / Предыдущие запросы)
- Запросы, введенные пользователями ранее. Система анализирует их, чтобы найти связь с текущим запросом через общие результаты поиска.
- Requested Content (Запрошенный контент)
- Основной контент, запрошенный пользователем (например, SERP или веб-страница паблишера).
- Second Content / Referenced Content (Вторичный / Связанный контент)
- Контент, на который ссылается Requested Content. Например, целевые страницы (landing pages) результатов поиска.
- Advertisement Server (Рекламный сервер)
- Система (например, Google Ads), отвечающая за выбор Alternative Content.
- Content-based Index (Индекс на основе контента)
- База данных, содержащая предварительно рассчитанные связи между веб-страницами и релевантной рекламой.
- Keyword-based Index (Индекс на основе ключевых слов)
- База данных, содержащая ставки рекламодателей на ключевые слова и используемая для выбора рекламы.
Ключевые утверждения (Анализ Claims)
Важное замечание: Патент US9235852B2 является продолжением (continuation) заявки от 2010 года. Хотя общее описание (Description) патента обсуждает различные методы определения контекста (анализ сниппетов, анализ целевых страниц), Формула изобретения (Claims 1-21) этого конкретного патента узко сфокусирована исключительно на методе использования исторических запросов.
Claim 1 (Независимый пункт): Описывает метод предоставления контента на основе исторического поискового поведения.
- Система получает запрос на контент (рекламу). Этот запрос включает текущий поисковый запрос (search query) И результаты поиска (search results), релевантные этому запросу.
- Идентифицируются previous search queries (предыдущие поисковые запросы), чьи результаты включали один или несколько из текущих результатов поиска.
- Идентифицируются keywords (ключевые слова), которые (i) включены в эти предыдущие запросы И (ii) отличаются от терминов в текущем поисковом запросе.
- Выбирается контент (реклама) на основе этих идентифицированных ключевых слов.
- Выбранный контент предоставляется в ответ на запрос.
Ядро изобретения — использование сходства результатов поиска между текущим и прошлыми запросами для поиска дополнительных релевантных ключевых слов для таргетинга рекламы. Если текущий Запрос А (широкий) возвращает результаты R1, R2, R3, а прошлый Запрос Б (конкретный) также возвращал R1 и R2, система извлекает ключевые слова из Запроса Б, которых нет в Запросе А, и использует их для выбора рекламы для пользователя, который ввел Запрос А.
Claim 3, 5, 7 (Зависимые): Уточняют, что выбор контента может дополнительно основываться на рекламе, ранее связанной с историческими запросами (3), на заголовках и сниппетах текущих результатов (5), а также на данных о взаимодействии пользователей с рекламой (7).
Где и как применяется
Изобретение применяется в системах контекстной рекламы (Google Ads/AdSense) и взаимодействует с поисковой системой, но не является частью основного алгоритма органического ранжирования.
INDEXING / QUNDERSTANDING (Предварительная обработка)
Система должна предварительно обрабатывать и хранить исторические данные о запросах и соответствующих им результатах (historic information regarding previous search queries and search results), чтобы быстро находить связи между ними. Также требуется предварительный анализ веб-страниц для заполнения Content-based Index.
RANKING / METASEARCH (Выбор Рекламы)
Основное применение. Процесс происходит в реальном времени во время генерации SERP.
- Поисковая система (Search Engine) генерирует органические результаты.
- Поисковая система отправляет запрос на Рекламный сервер (Advertisement Server), включая запрос пользователя и список результатов (идентификаторы, ссылки, сниппеты).
- Рекламный сервер использует описанные механизмы (преимущественно анализ исторических запросов по Claim 1) для определения Current Context.
- Рекламный сервер выбирает объявления и возвращает их для отображения.
Входные данные:
- Текущий поисковый запрос.
- Список результатов поиска (URL, заголовки, сниппеты).
- Исторические данные о запросах и результатах.
- Индексы контекстной рекламы.
Выходные данные:
- Список выбранных рекламных объявлений.
На что влияет
- Специфические запросы: Наибольшее влияние на широкие (broad), общие или неоднозначные запросы, где контекст неясен из самого запроса (например, название компании). Система уточняет интент, опираясь на связанные данные.
- Типы контента: Влияет на подбор рекламы на страницах с динамическим контентом: SERP, новостные агрегаторы, ленты обновлений статусов (например, Twitter), блоги.
Когда применяется
Алгоритм применяется в реальном времени при каждом запросе страницы, содержащей слоты для контекстной рекламы. Он особенно полезен, когда:
- Контент страницы новый и еще не проанализирован.
- Контент часто меняется, и предыдущий анализ устарел.
- Запрос слишком широкий и требует уточнения контекста.
Пошаговый алгоритм
Патент описывает несколько вариантов реализации. Ниже представлены три основных метода, упомянутых в документе.
Метод 1: Использование исторических запросов (Соответствует Claim 1)
- Получение данных: Рекламный сервер получает текущий запрос и список его результатов.
- Идентификация исторических запросов: Система ищет historic queries, которые возвращали результаты, схожие с текущими (имеется пересечение результатов).
- Извлечение ключевых слов: Из этих исторических запросов извлекаются ключевые слова, отсутствующие в текущем запросе.
- Выбор рекламы: Система выбирает рекламу на основе этих извлеченных ключевых слов (используя Keyword-Based Index).
- Передача ответа: Выбранные объявления передаются для отображения.
Метод 2: Использование рекламы со связанных страниц (Описан в Description)
- Получение данных: Рекламный сервер получает список результатов поиска (ссылок).
- Идентификация целевых страниц: Определяются landing pages, на которые ведут эти ссылки.
- Получение связанной рекламы: Система обращается к Content-Based Index, чтобы получить рекламу, ранее определенную как релевантную для этих landing pages.
- Агрегация и выбор: Полученные объявления агрегируются (например, по частоте встречаемости или по рангу связанного результата). Выбирается лучший набор.
- Передача ответа: Выбранные объявления передаются для отображения.
Метод 3: Использование заголовков и сниппетов (Описан в Description)
- Получение данных: Рекламный сервер получает заголовки и сниппеты результатов поиска.
- Генерация ключевых слов: Система анализирует текст заголовков и сниппетов и генерирует ключевые слова или фразы.
- Выбор рекламы: Система выбирает рекламу на основе этих сгенерированных ключевых слов (используя Keyword-Based Index).
- Передача ответа: Выбранные объявления передаются для отображения.
Какие данные и как использует
Данные на входе
Патент фокусируется на данных, используемых для подбора рекламы.
- Контентные факторы: Текст заголовков (titles) и сниппетов (snippets) результатов поиска. Контент landing pages (используется для заполнения Content-Based Index или для извлечения ключевых слов).
- Технические факторы: URL-адреса (ссылки) результатов поиска, используемые для идентификации landing pages и сравнения с историческими результатами.
- Поведенческие/Исторические факторы: Журналы исторических поисковых запросов (historic queries) и соответствующих им результатов поиска. Данные о взаимодействии пользователей (user interaction) с рекламой (Claim 7).
- Рекламные данные: Ставки на ключевые слова (bids), показатели качества рекламы (advertisement quality).
Какие метрики используются и как они считаются
- Схожесть результатов поиска (Similarity of search results): Ключевая метрика для Методa 1. Определяет связь между текущим и историческим запросами на основе степени пересечения (overlap) результатов поиска.
- Контекстуальная релевантность (Contextual Relevance): Метрика в Content-Based Index, показывающая, насколько реклама соответствует контенту конкретной landing page (используется в Методе 2).
- Частота встречаемости (Frequency): При агрегации рекламы со связанных страниц может учитываться частота, с которой конкретное объявление появляется в списках (Метод 2).
- Bid Score (Оценка ставки): Стандартная метрика рекламных систем для выбора рекламы. Может учитывать сумму ставки (bid amount) и показатель качества объявления.
Выводы
- Патент описывает инфраструктуру контекстной рекламы, а не органический поиск. Он не содержит информации о факторах органического ранжирования. Прямое влияние на SEO минимально.
- Определение контекста через внешние сигналы. Для выбора рекламы Google не полагается только на текст запроса или контент страницы. Система активно использует внешние сигналы: контент связанных страниц и историю запросов для определения Current Context.
- Связь запросов через результаты (Ядро Claims). Ключевой защищенный механизм — установление семантической связи между разными запросами, если они приводят к похожим результатам поиска. Это позволяет уточнять контекст широких запросов, «заимствуя» его у более специфических исторических запросов.
- Динамическая адаптация. Система разработана для работы с новым или быстро меняющимся контентом, гарантируя показ релевантной рекламы даже в условиях неопределенности контекста.
- Важность связей «Запрос-Документ». Хотя патент сфокусирован на рекламе, он подтверждает, что Google глубоко анализирует и хранит данные о том, какие запросы приводят к каким документам, и использует эти данные для понимания семантики.
Практика
Практическое применение в SEO
ВАЖНО: Патент является инфраструктурным и описывает работу систем контекстной рекламы (Google Ads). Прямых практических выводов для SEO нет.
Best practices (Косвенные инсайты и стратегическое понимание)
Хотя патент не дает прямых SEO-рекомендаций, он демонстрирует возможности Google в области Information Retrieval, что полезно для формирования SEO-стратегии:
- Понимание семантической связи через SERP: Патент показывает, что Google считает запросы связанными, если они дают похожие результаты. Это подтверждает важность анализа состава SERP для понимания того, как Google интерпретирует контекст и интент запроса. Ваш контент должен соответствовать этому коллективному контексту.
- Укрепление Topical Authority: Создание контента, который является исчерпывающим ответом на кластер связанных запросов (как широких, так и узких), укрепляет связь документа с темой. Это соответствует логике патента, где один документ связан с множеством запросов.
- Четкость контекста и сниппетов: Убедитесь, что заголовки и мета-описания (формирующие сниппеты) точно отражают содержание страницы. Google использует их для быстрого определения контекста (в данном случае для рекламы, но это общая практика).
Worst practices (это делать не надо)
- Предполагать, что значение запроса статично: Патент подчеркивает концепцию Current Context. Нельзя полагаться на устаревший анализ интента. Контекст запросов, особенно широких, может меняться, и SEO-стратегия должна адаптироваться.
- Патент не выявляет конкретных негативных SEO-практик или манипуляций, так как не касается органического ранжирования.
Стратегическое значение
Стратегическое значение для SEO заключается в подтверждении того, что Google активно использует машинное обучение и анализ исторических данных для интерпретации контекста и интента. Он демонстрирует технический механизм кластеризации запросов на основе общих результатов. Это понимание лежит в основе современных подходов к семантическому SEO и построению Topical Authority.
Практические примеры
Практических примеров для применения в SEO нет. Ниже приведен пример работы системы для подбора рекламы.
Сценарий: Подбор рекламы для широкого запроса (Метод 1)
- Текущий запрос: Пользователь вводит широкий запрос «Ягуар».
- Текущие результаты (SERP): В данный момент выдача содержит ссылки на сайт автопроизводителя Jaguar и новости о новой модели F-Pace.
- Проблема: Контекст запроса «Ягуар» неоднозначен (животное или авто).
- Применение механизма: Система определяет, что текущие результаты сильно пересекаются с результатами недавних исторических запросов «Jaguar F-Pace цена» и «новый автомобиль Ягуар».
- Извлечение ключевых слов: Система извлекает ключевые слова, отсутствующие в текущем запросе: «F-Pace», «цена», «автомобиль», «новый».
- Результат: На SERP по запросу «Ягуар» показывается реклама автодилеров, а не зоопарков, так как контекст был уточнен до автомобильного.
Вопросы и ответы
Влияет ли этот патент на органическое ранжирование (SEO)?
Нет, прямого влияния нет. Патент US9235852B2 описывает исключительно методы выбора контекстной рекламы (Alternative Content). Он не затрагивает алгоритмы, используемые для индексации или ранжирования органических результатов поиска.
Какую основную проблему решает этот патент?
Он решает проблему подбора релевантной рекламы для страниц с динамическим, новым или неоднозначным контентом, например, для поисковой выдачи (SERP). В таких случаях стандартный анализ может быть неточен, и система использует связанные данные (ссылки, историю запросов) для определения Current Context.
В чем заключается основное изобретение, защищенное патентом (Claim 1)?
Основное изобретение (Claim 1) — это метод использования исторических запросов. Система находит прошлые запросы, которые давали результаты, похожие на текущие. Затем она извлекает дополнительные ключевые слова из этих прошлых запросов и использует их для выбора более релевантной рекламы, уточняя таким образом контекст текущего запроса.
В патенте также упоминается анализ сниппетов и landing pages. Почему это не главное?
Эти методы подробно описаны в Description как возможные варианты реализации. Однако Формула изобретения (Claims) данного конкретного патента (который является продолжением более ранней заявки) защищает только метод, основанный на исторических запросах. Другие методы могут быть защищены в связанных патентах.
Какую пользу этот патент несет SEO-специалисту?
Прямая польза минимальна. Косвенно он демонстрирует технические возможности Google по установлению семантических связей между запросами на основе пересечения результатов. Это подтверждает важность анализа состава SERP для понимания контекста и построения стратегии Topical Authority.
Как анализ связанных страниц (landing pages) помогает подобрать рекламу для SERP?
Этот метод (описанный в Description) предполагает, что контекст SERP является совокупностью контекстов страниц, на которые она ссылается. Если система уже знает, какая реклама релевантна для этих целевых страниц (из Content-Based Index), она агрегирует эту рекламу и показывает наиболее подходящую на самой SERP.
Актуален ли этот патент для владельцев сайтов, использующих AdSense?
Да, актуален. Этот механизм позволяет Google точнее подбирать рекламу на сайтах паблишеров, особенно если контент часто обновляется. Контекст для рекламы может определяться на основе статей, на которые ссылается паблишер, или на основе анализа заголовков и сниппетов на странице.
Что такое «Current Context» в патенте?
Это текущая тематика или интент, связанный с контентом в данный момент времени. Например, если сегодня вышла новость о новом продукте компании, то Current Context запроса по названию компании смещается в сторону этого продукта, даже если вчера контекст был другим.
Стоит ли мне оптимизировать страницы под контекст, который выгоден рекламодателям?
Ваша цель в SEO — максимально точно отвечать на интент пользователя. Однако, если на вашей странице показывается нерелевантная реклама (через AdSense), это может быть косвенным сигналом того, что контекст вашей страницы размыт или неверно интерпретируется системами Google.
Является ли этот патент актуальным в эпоху нейронных сетей (BERT, MUM)?
Концептуально да. Принцип использования исторических данных и анализа связей «запрос-документ» остается фундаментальным. Хотя конкретные технические методы идентификации контекста и схожести запросов эволюционировали (например, использование векторов вместо прямых текстовых совпадений), базовая идея остается жизнеспособной.