Google использует этот механизм для автоматического обогащения рекламных сайтлинков (Ad Sitelinks) текстами из существующих объявлений (Creatives). Система применяет агрессивную каноникализацию URL, включающую активное сканирование и сравнение страниц для удаления незначащих параметров. Это позволяет связать сайтлинки и креативы, ведущие на одну целевую страницу, и выбрать лучшее описание на основе текстовой схожести, в том числе при обработке голосовых запросов.
Описание
Какую задачу решает
Патент решает проблему повышения релевантности и CTR рекламных Sitelinks (дополнительных ссылок). Стандартные сайтлинки могут быть недостаточно информативными, а ручное создание описаний трудоемко. Система автоматизирует подбор релевантных текстов (Creatives). Технически, изобретение также направлено на повышение эффективности вычислений (improved processor efficiency via reductions in repeated calculations) за счет каноникализации URL.
Что запатентовано
Запатентована система в рамках Advertisement Management System (AMS) для автоматического сопоставления сайтлинков с существующими рекламными креативами. Ключевым механизмом является строгая Canonicalization URL как для креативов, так и для сайтлинков. Это позволяет системе идентифицировать, что разные URL (например, с разными трекинговыми параметрами) ведут на одну и ту же целевую страницу. Креативы кластеризуются по каноническим URL, и система выбирает наилучшее описание для сайтлинка из соответствующего кластера.
Как это работает
Система функционирует в несколько этапов:
- Каноникализация и Кластеризация (Офлайн): URL всех рекламных креативов приводятся к каноническому виду. Креативы группируются в Creative Clusters на основе совпадения канонических URL.
- Обработка запроса: Система получает запрос. В текущей версии патента (B2, Claims 1 и 10) особо выделяется получение голосового ввода (spoken information) через audio codec.
- Каноникализация Сайтлинков (Активная Верификация): URL выбранных сайтлинков канонизируются. Патент описывает метод активной проверки: сканирование (crawl) URL с параметром и без него, и сравнение целевых страниц. Если они совпадают, параметр удаляется.
- Сопоставление и Выбор: Канонический URL сайтлинка сопоставляется с кластерами. Из подходящего кластера выбирается лучший креатив на основе фильтров (например, географических) и текстовой схожести.
Актуальность для SEO
Высокая (для PPC). Технология динамического обогащения рекламных сайтлинков активно используется в Google Ads. Методы каноникализации URL остаются фундаментальными. Акцент на голосовом вводе в финальной версии патента (B2) отражает адаптацию рекламных технологий под голосовые интерфейсы и ассистентов.
Важность для SEO
Влияние на органическое SEO низкое (3/10). Патент напрямую описывает механизмы Google Ads (PPC), а не органического ранжирования. Однако он предоставляет критически важное подтверждение того, как Google технически реализует каноникализацию URL. Описание метода активного сканирования и сравнения контента страниц для определения значимости URL-параметров является ценным инсайтом для технического SEO.
Детальный разбор
Термины и определения
- Advertisement Management System (AMS)
- Система управления рекламой (например, Google Ads).
- Audio Codec (Аудиокодек)
- Технология для преобразования голосового ввода пользователя (spoken information) в цифровую информацию. Упоминается как триггер системы в Claims 1 и 10.
- Bipartite Graph Matching (Сопоставление двудольных графов)
- (Упоминается в описании). Алгоритм для поиска оптимального соответствия между наборами сайтлинков и креативов для максимизации общей оценки.
- Canonicalization (Каноникализация)
- Процесс приведения URL к стандартному виду путем удаления незначащих параметров (URL parameter, Campaign parameter). Используется для повышения эффективности и точного сопоставления.
- Creative (Креатив)
- Текст рекламного объявления. В патенте используется как описание, добавляемое к сайтлинку.
- Creative Clusters (Кластеры креативов)
- Группы креативов, объединенные на основе того, что они имеют один и тот же канонический URL.
- Landing Page (Целевая страница)
- Страница, на которую попадает пользователь. Ее контент используется для верификации каноникализации.
- Sitelink (Сайтлинк)
- Дополнительная ссылка, отображаемая под основным рекламным объявлением.
- Webmaster supplied rules (Правила, предоставленные вебмастером)
- Инструкции от владельца сайта (например, через GSC) о том, как обрабатывать определенные параметры URL.
Ключевые утверждения (Анализ Claims)
Анализ основан на независимых Claims 1 и 10 патента US10776435B2, которые описывают систему и метод генерации канонизированных сайтлинков.
Claim 1 и 10 (Независимые пункты):
- Триггер: Система получает цифровую информацию от аудиокодека, преобразующего голосовой ввод пользователя (spoken information).
- Обработка Креатива: Идентифицируется креатив (content item), связанный с первым URL, содержащим параметр кампании (campaign parameter). Генерируется канонический URL креатива путем удаления этого параметра. Креативы группируются.
- Обработка Сайтлинка: Получается sitelink, связанный со вторым URL, содержащим параметр URL (URL parameter).
- Метод Каноникализации (Ключевой): Система сканирует (crawl) второй URL с параметром и без параметра. Определяется, что оба варианта ведут на одну и ту же целевую страницу (landing page).
- Генерация Канонического URL Сайтлинка: Параметр удаляется. Указано, что это делается для сокращения повторных вычислений.
- Сопоставление (Matching): Канонический URL сайтлинка сопоставляется с креативом на основе схожести текста (similarity between text) креатива и сайтлинка.
- Фильтрация: Проверяется совместимость на основе фильтра (например, географической политики).
- Выбор: В ответ на голосовой ввод выбирается сопоставленный креатив.
Claim 6 (Зависимый): Уточняет методы каноникализации.
Канонизация может использовать правила, предоставленные вебмастером (webmaster supplied rules), указывающие на релевантность параметров URL.
Ядром изобретения является автоматизированное сопоставление креативов и сайтлинков через агрессивную, верифицируемую каноникализацию (сканирование и сравнение страниц) и применение этого механизма в ответ на голосовой запрос.
Где и как применяется
Патент описывает процессы в рамках Advertisement Management System (AMS). Однако используемые технологии пересекаются с этапами органического поиска.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит ключевая работа по каноникализации. Система должна активно сканировать (crawl) URL в разных вариантах (с параметрами и без), рендерить и сравнивать полученные целевые страницы. Если контент совпадает, система определяет каноническую версию. Также на этом этапе (офлайн) происходит кластеризация креативов.
QUNDERSTANDING – Понимание Запросов
Система обрабатывает ввод пользователя. Claims 1 и 10 специфицируют ввод через audio codec (голосовой запрос).
RANKING / RERANKING (в контексте Рекламного Аукциона)
Во время аукциона и формирования рекламного блока активируется механизм сопоставления. Система находит канонический URL для выбранных сайтлинков, сопоставляет его с кластерами и выбирает лучший креатив для формирования Enhanced Sitelink.
Входные данные:
- Голосовой запрос пользователя (spoken information).
- База данных креативов и сайтлинков с их URL и параметрами.
- Правила фильтрации (география, политика).
- Webmaster supplied rules (опционально).
Выходные данные:
- Объявление с обогащенными сайтлинками (комбинация сайтлинка и выбранного креатива).
На что влияет
- Конкретные типы контента: Влияет исключительно на рекламные объявления Google Ads, использующие расширения «Дополнительные ссылки» (Sitelink Extensions). Не влияет на органические результаты.
- Специфические запросы: Согласно Claims 1 и 10, влияет на обработку голосовых запросов, по которым показывается реклама с сайтлинками.
- Конкретные ниши или тематики: Актуально для рекламодателей, использующих сложные системы трекинга (много URL-параметров) и имеющих большой набор креативов.
Когда применяется
- Триггеры активации: Когда пользователь совершает голосовой запрос (согласно Claims 1 и 10), и система управления рекламой решает показать объявление с дополнительными ссылками.
- Условия работы: Применяется, если для сайтлинка существуют креативы, ведущие на ту же каноническую страницу, и они проходят правила фильтрации.
Пошаговый алгоритм
Часть А: Подготовка данных (Офлайн / INDEXING)
- Сбор креативов: Получение креативов и связанных с ними URL.
- Каноникализация URL креативов: Определение канонической версии для каждого URL путем удаления Campaign Parameters (возможно, с использованием webmaster supplied rules).
- Кластеризация креативов: Группировка креативов в creative clusters на основе совпадения их канонических URL.
Часть Б: Обработка запроса и генерация сайтлинков (Онлайн)
- Получение запроса: Система получает голосовой ввод пользователя.
- Выбор сайтлинков: В ходе рекламного аукциона выбираются релевантные сайтлинки.
- Каноникализация URL сайтлинков (Верификация): Для URL сайтлинка система выполняет сканирование с URL parameter и без него. Сравниваются целевые страницы.
- Генерация канонического URL: Если страницы совпадают, параметр удаляется.
- Сопоставление (Matching): Система использует канонический URL сайтлинка для поиска соответствующего кластера креативов.
- Оценка и Фильтрация: Креативы-кандидаты оцениваются на основе текстовой схожести с сайтлинком и проверяются на соответствие фильтрам (например, географическим). (В описании патента упоминается использование IDF Score и Impression Score для оценки).
- Выбор и Оптимизация: Выбирается лучший креатив. Для оптимизации набора может использоваться Bipartite Graph Matching.
- Формирование выдачи: Генерируются расширенные сайтлинки.
Какие данные и как использует
Данные на входе
- Контентные факторы: Текст креативов и текст сайтлинков (используются для оценки схожести). Содержимое целевых страниц (Landing pages content) (критически важно для верификации каноникализации).
- Технические факторы: URL креативов и сайтлинков. Параметры URL (URL Parameters, Campaign Parameters).
- Пользовательские факторы: Голосовой ввод пользователя (spoken information) как триггер. Географические данные (используются для фильтрации).
- Внешние данные: Правила, предоставленные вебмастером (Webmaster supplied rules) для обработки параметров.
Какие метрики используются и как они считаются
Claims 1 и 10 упоминают следующие метрики и методы:
- Canonicalization Verification (Верификация Каноникализации): Определяется путем сканирования URL с параметром и без него и сравнения полученных целевых страниц.
- Text Similarity (Текстовая схожесть): Метрика схожести между текстом сайтлинка и текстом креатива. (В описании патента это детализируется как IDF Score).
- Filter Compatibility (Соответствие фильтрам): Проверка креатива на соответствие политикам (например, географическим).
Примечание: В подробном описании патента (но не в Claims) также упоминаются Impression Score (популярность креатива) и Creative Score (комбинация Impression и IDF Score) как возможные метрики для оценки.
Выводы
- Патент относится к Google Ads, но дает ключевые инсайты по Каноникализации: Хотя основное применение — это обогащение рекламных сайтлинков (Ad Sitelinks), патент детально описывает технический процесс каноникализации, используемый Google.
- Подтвержденный метод Активной Каноникализации: Google активно верифицирует значимость URL-параметров. Система сканирует URL с параметром и без него, и сравнивает контент целевых страниц (Claims 1, 5, 10). Если контент совпадает, параметр игнорируется. Это критически важная информация для технического SEO.
- Использование правил Вебмастера: Система может учитывать webmaster supplied rules (Claim 6) при каноникализации, что соответствует функционалу обработки параметров URL в Google Search Console.
- Автоматизация через Сопоставление: Система автоматически связывает тексты (Creatives) и ссылки (Sitelinks), если их канонические URL совпадают. Для выбора лучшего описания используется оценка текстовой релевантности (similarity between text).
- Специфический фокус на Голосовом Поиске: Текущая версия патента (B2) явно указывает голосовой ввод (spoken information) как триггер системы (Claims 1, 10), подчеркивая адаптацию рекламных технологий под голосовые интерфейсы.
- Эффективность системы: Каноникализация используется не только для точности сопоставления, но и явно для повышения эффективности системы и сокращения повторных вычислений.
Практика
Best practices (это мы делаем)
Патент описывает систему Google Ads, но его технические детали о каноникализации критически важны для SEO.
- Активное управление URL-параметрами: Используйте инструмент обработки параметров в GSC (что соответствует Webmaster supplied rules из Claim 6), чтобы указать Google, как обрабатывать параметры отслеживания или сессий. Это поможет системе корректно канонизировать URL.
- Обеспечение консистентности контента: Убедитесь, что URL-параметры, используемые для аналитики (например, UTM-метки), НЕ изменяют основной контент страницы. Патент подтверждает, что Google сравнивает контент страниц (Claims 1, 10). Если контент идентичен, каноникализация пройдет корректно.
- Использование Четкого rel=»canonical»: Всегда используйте rel=»canonical» на страницах с параметрами, чтобы явно указать предпочтительную версию, снижая зависимость от автоматических механизмов Google.
- Мониторинг Каноникализации: Регулярно проверяйте в GSC (URL Inspection), какие страницы Google выбирает в качестве канонических. Если выбор Google отличается от вашего, необходимо скорректировать техническую реализацию, опираясь на принцип консистентности контента.
Worst practices (это делать не надо)
- Использование параметров для показа разного контента без управления индексацией: Если параметр значительно меняет контент (например, разные языковые версии), но при этом не настроен rel=»canonical» или индексация, это может привести к проблемам. Система может либо некорректно склеить страницы, либо создать дубли.
- Клоакинг на основе параметров: Попытки показывать разный контент в зависимости от наличия трекинговых параметров рискованны, так как механизм верификации (сканирование и сравнение) может это обнаружить.
- Блокировка ресурсов, влияющих на рендеринг: Поскольку каноникализация основана на сравнении целевых страниц, важно, чтобы Googlebot мог корректно отрендерить обе версии страницы (с параметром и без). Блокировка CSS/JS может помешать этому сравнению.
Стратегическое значение
Стратегическое значение для SEO заключается в глубоком понимании механизма каноникализации Google. Это не пассивный процесс, а активная верификация путем сканирования и сравнения контента. Техническое SEO должно быть безупречным в части управления URL и консистентности контента, чтобы избежать ошибок каноникализации. Также патент подчеркивает долгосрочную стратегию Google по адаптации всех систем (включая рекламу) к голосовому взаимодействию.
Практические примеры
Сценарий: Валидация обработки трекинговых параметров для Технического SEO
- Ситуация: Сайт использует параметр ?session_id=XXX для отслеживания сессий и ?utm_campaign=YYY для маркетинга.
- Проблема: Необходимо убедиться, что эти параметры не создают дубли и корректно канонизируются Google.
- Применение инсайта из патента: Мы знаем, что Google может сканировать URL с параметром и без него и сравнивать контент (Claims 1, 10).
- Действия SEO-специалиста:
- Убедиться, что наличие ?session_id или ?utm_campaign не меняет HTML-код или видимый контент страницы по сравнению с чистым URL.
- Настроить rel=»canonical» на всех страницах с параметрами, указывающий на чистый URL.
- Использовать GSC Parameter Handling Tool (Webmaster supplied rules, Claim 6), чтобы явно указать, что эти параметры не влияют на контент.
- Ожидаемый результат: Google корректно определяет канонический URL, консолидируя сигналы и избегая дублирования, что соответствует описанному в патенте механизму повышения эффективности.
Вопросы и ответы
Какую самую важную информацию для технического SEO можно извлечь из этого патента?
Самый важный инсайт — это детальное описание метода верификации каноникализации (Claims 1, 5, 10). Google активно определяет незначащие URL-параметры, сканируя URL как с параметром, так и без него, и сравнивая контент целевых страниц. Если контент совпадает, параметр игнорируется. Это подчеркивает необходимость обеспечения консистентности контента независимо от трекинговых меток.
Описывает ли этот патент работу органических сайтлинков (Organic Sitelinks)?
Нет. Патент описывает работу строго в рамках Advertisement Management System (Google Ads). Он касается автоматического добавления описаний (Creatives) к рекламным дополнительным ссылкам (Ad Sitelink Extensions). Механизмы органического поиска здесь не рассматриваются.
Что означает упоминание «audio codec» и «spoken information» в Claims 1 и 10?
Это означает, что в данной версии патента (B2) описанный механизм активируется в ответ на голосовой ввод пользователя. Система предназначена для работы с голосовым поиском или ассистентами, подбирая описания для рекламных сайтлинков, которые будут показаны или озвучены в ответ на устный запрос. Это подчеркивает адаптацию рекламных технологий под голосовые интерфейсы.
Как Google решает, какое описание добавить к рекламному сайтлинку?
Система сначала убеждается, что креатив и сайтлинк ведут на одну и ту же каноническую страницу. Затем, согласно Claims 1 и 10, она выбирает креатив на основе схожести текста (similarity between text) между креативом и сайтлинком, а также проверяет его на соответствие фильтрам (например, географическим политикам).
Упоминаются ли в патенте IDF Score и Impression Score?
Да, IDF Score (текстовая схожесть) и Impression Score (популярность креатива) упоминаются в подробном описании патента как часть возможной методологии скоринга (scoring methodology). Однако в финальных Claims 1 и 10 используется более общая формулировка «схожесть текста».
Может ли рекламодатель помочь системе в процессе каноникализации?
Да. В Claim 6 упоминается использование webmaster supplied rules (правил, предоставленных вебмастером) для определения релевантности параметров URL. Это соответствует использованию инструментов управления параметрами в Google Search Console, позволяя вебмастерам давать подсказки системе каноникализации.
Что делать, если трекинговые параметры на моем сайте меняют контент?
Если параметры легитимно меняют контент (например, фильтры, сортировка), они считаются значащими. Механизм из патента (сравнение страниц) определит, что страницы отличаются. В этом случае необходимо убедиться, что такие страницы корректно управляются с точки зрения SEO: либо каноникализированы на основную версию, либо закрыты от индексации, либо являются самостоятельными ценными страницами.
Что такое кластеры креативов (Creative Clusters)?
Это группы рекламных текстов, которые ведут на одну и ту же каноническую страницу. Они создаются системой офлайн путем анализа и каноникализации URL всех креативов в аккаунте. Это позволяет ускорить поиск релевантных описаний для сайтлинка в реальном времени.
Использует ли система сложные алгоритмы для подбора описаний?
Да. В описании патента упоминается использование Bipartite Graph Matching (сопоставление двудольных графов). Это сложный алгоритм, который используется, когда нужно подобрать описания сразу для нескольких сайтлинков, чтобы максимизировать общую релевантность всего набора и избежать дублирования текстов.
Зачем в патенте упоминается повышение эффективности и сокращение повторных вычислений?
Это одна из целей каноникализации. Вместо того чтобы обрабатывать и хранить данные для каждого уникального URL с разными параметрами отслеживания, система обрабатывает только каноническую версию. Это значительно экономит вычислительные ресурсы и ускоряет процесс сопоставления в масштабах Google.