Анализ патента Google, описывающего автоматическую генерацию критериев таргетинга для рекламных кампаний. Система анализирует целевую страницу рекламодателя и сравнивает сущности, найденные на ней, с сущностями из тематических коллекций, соответствующих заявленному типу бизнеса. Пересечение этих данных формирует точные критерии выбора, улучшая релевантность рекламы.
Описание
Какую задачу решает
Патент решает задачу автоматизации и повышения точности генерации критериев выбора (Selection Criteria), то есть параметров таргетинга, для рекламных кампаний (Content Items). Он направлен на устранение неоднозначности ключевых слов (например, отличить «Jaguar» автомобиль от животного) и снижение ручного труда рекламодателей путем автоматической идентификации ключевых сущностей (Entities), связанных с их бизнесом и целевой страницей.
Что запатентовано
Запатентована система автоматической генерации Selection Criteria для рекламной кампании. Механизм основан на сравнении двух наборов сущностей. Первый набор извлекается непосредственно из целевой страницы (Landing Page) рекламодателя. Второй набор берется из тематических коллекций (Collections), которые система ассоциирует с типом бизнеса (Business Type), указанным рекламодателем. Пересечение этих двух наборов формирует критерии таргетинга.
Как это работает
Система работает следующим образом:
- Ввод данных: Рекламодатель предоставляет URL лендинга и указывает свой Business Type.
- Анализ Бизнеса (Группа 1): Система идентифицирует релевантные Collections сущностей, основываясь на Business Type, и формирует первую группу сущностей.
- Анализ Лендинга (Группа 2): Компонент Annotator извлекает сущности из контента лендинга, рассчитывая метрики уверенности (Confidence Score) и тематичности (Topicality Score). Формируется вторая группа сущностей.
- Сравнение: Система сравнивает Группу 1 и Группу 2.
- Генерация Критериев: Совпадающие сущности (пересечение) используются для автоматической генерации Selection Criteria для кампании.
Актуальность для SEO
Высокая (для контекстной рекламы). Автоматизация настройки рекламных кампаний (например, Performance Max) активно развивается и полагается на автоматическое понимание бизнеса рекламодателя. Понимание сущностей является центральным элементом технологического стека Google, что делает описанные методы высокоактуальными для рекламной платформы.
Важность для SEO
Патент имеет косвенное значение для SEO (4/10). Он описывает механизмы внутри Content Management System (рекламной платформы), а не органического поиска (Search System). Однако он детально раскрывает, как Google технологически извлекает сущности со страниц и оценивает их с помощью Confidence Score и Topicality Score. Понимание этих базовых технологий анализа контента критически важно для Senior SEO-специалистов, разрабатывающих стратегии семантической оптимизации.
Детальный разбор
Термины и определения
- Annotator (Аннотатор)
- Компонент системы, который анализирует контент Landing Page, распознает термины, относящиеся к сущностям, и извлекает их. Использует парсинг и методы NLP.
- Business Type (Тип бизнеса)
- Категория, которую рекламодатель самостоятельно указывает для описания своего бизнеса (например, «мебельный магазин» или «автодилер»).
- Collection (Коллекция)
- Группа сущностей, объединенных общим признаком (например, коллекция «Лучшие фильмы 2000 года» или «Бренды автомобилей»). Используется как эталонный набор сущностей для Business Type.
- Confidence Score (Оценка уверенности)
- Метрика, определяющая вероятность того, что термин на лендинге действительно относится к идентифицированной сущности. Используется для разрешения неоднозначностей (например, «Ягуар» как автомобиль или животное).
- Content Management System (Система управления контентом)
- В контексте патента — рекламная платформа (например, Google Ads), управляющая кампаниями и показом рекламы.
- Entity (Сущность)
- Идентифицируемый объект: человек, место, продукт, услуга, организация, концепция или абстрактная идея.
- Landing Page (Целевая страница/Лендинг)
- Веб-страница, предоставленная рекламодателем, на которую ведет рекламное объявление.
- Quality Score (Оценка качества коллекции)
- Метрика, указывающая, насколько конкретная Collection релевантна определенному Business Type. Может быть предопределена в системе соответствий (mapping).
- Selection Criteria (Критерии выбора/Таргетинга)
- Параметры (ключевые слова, сущности), используемые для определения того, когда показывать элемент контента (рекламу) в ответ на запрос.
- Topicality Score (Оценка тематичности/Актуальности)
- Метрика, определяющая важность сущности для основной темы страницы. Зависит от расположения контента (например, сущность в заголовке важнее, чем в дисклеймере).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной процесс генерации критериев выбора.
- Система получает данные о Landing Page и данные об одном или нескольких Business Type.
- Идентифицируются одна или несколько Collections из множества коллекций, основываясь на Business Type.
- Из идентифицированных коллекций выбирается первая группа сущностей.
- Из Landing Page идентифицируется вторая группа сущностей.
- Первая группа сущностей сравнивается со второй группой.
- На основе сравнения генерируются Selection Criteria для элементов контента (рекламы).
Ядро изобретения — это валидация релевантности путем сравнения ожидаемых сущностей (из коллекций по типу бизнеса) и фактических сущностей (с лендинга).
Claim 3 и 4 (Зависимые): Детализируют процесс идентификации коллекций.
Система определяет Quality Score для коллекций на основе Business Type и выбирает коллекции с более высоким баллом. Этот Quality Score может быть взят из заранее определенного соответствия (predetermined mapping) между типами бизнеса и коллекциями.
Claim 5 (Зависимый): Детализирует выбор первой группы сущностей.
Если идентифицировано несколько коллекций, процесс может включать выполнение операций объединения (union) или пересечения (intersection) над ними для формирования первой группы.
Claim 6 (Зависимый): Детализирует идентификацию второй группы сущностей (с лендинга).
Сущности на лендинге идентифицируются Annotator вместе с Confidence Score и Topicality Score. Выбор сущностей для второй группы основывается на этих оценках (например, путем фильтрации по порогам).
Claim 7 и 8 (Зависимые): Детализируют сравнение и генерацию критериев.
Сравнение включает операцию пересечения (intersection) для определения сущностей, присутствующих в обеих группах. Selection Criteria генерируются на основе этого пересечения. Это может включать автоматическое создание кампании, использующей эти критерии.
Где и как применяется
Важно отметить, что этот патент НЕ применяется к стандартным фазам органического поиска (Ранжирование). Он относится исключительно к Content Management System (рекламной платформе).
Контекст применения: Система используется во время настройки или автоматического создания рекламной кампании рекламодателем.
INDEXING – Индексирование и извлечение признаков (Косвенно)
Описанная технология полагается на базовые системы Google, работающие на этапе индексирования. Для работы системы необходимы предварительно рассчитанные данные о сущностях (упоминается knowledge graph) и предопределенные Collections. Компонент Annotator использует технологии индексирования (NLP, Entity Extraction) для анализа контента Landing Page и расчета Confidence и Topicality Scores.
Входные данные:
- URL целевой страницы (Landing Page).
- Тип(ы) бизнеса (Business Type).
- Название бизнеса (Business Name) (опционально).
Выходные данные:
- Сгенерированные или предложенные критерии выбора (Selection Criteria), основанные на сущностях.
- Автоматически сгенерированная рекламная кампания.
На что влияет
- Рекламные кампании: Основное влияние — повышение точности таргетинга рекламных кампаний и автоматизация их настройки.
- Коммерческие ниши (E-commerce, Услуги): Наиболее применимо к бизнесам, где продукты и услуги четко определяются через сущности.
- Разрешение неоднозначности: Влияет на релевантность рекламы по запросам с неоднозначными терминами.
Когда применяется
- Создание кампании: Когда рекламодатель создает новую кампанию (особенно автоматизированную) и предоставляет базовую информацию (URL, тип бизнеса).
- Оптимизация кампании: Когда система предлагает рекомендации по улучшению таргетинга для существующей кампании.
Пошаговый алгоритм
Процесс генерации Selection Criteria:
- Получение Входных Данных: Система получает данные от рекламодателя: URL целевой страницы и информацию о типе бизнеса (Business Type Data).
- Идентификация Коллекций (Фаза 1: Анализ Бизнеса):
- Компонент Collection Identifier определяет релевантные коллекции сущностей на основе Business Type.
- Используется предопределенный маппинг и выбор коллекций с наивысшей оценкой качества (Quality Score) для данного типа бизнеса.
- Формирование Первой Группы Сущностей:
- Компонент Entity Selection Engine выбирает набор сущностей из идентифицированных коллекций. Могут использоваться операции объединения (union) или пересечения (intersection).
- Аннотирование Лендинга (Фаза 2: Анализ Страницы):
- Компонент Annotator анализирует контент целевой страницы.
- Идентифицируются сущности. Для каждой вычисляются Confidence Score (используя контекст) и Topicality Score (используя расположение на странице).
- Формирование Второй Группы Сущностей:
- Entity Selection Engine фильтрует сущности, найденные на лендинге, используя пороговые значения Confidence Score и Topicality Score.
- Сравнение Групп:
- Компонент Entity Comparison Engine сравнивает Первую группу (из коллекций) и Вторую группу (с лендинга).
- Выполняется операция пересечения (intersection) для поиска общих сущностей.
- Генерация Критериев Выбора: На основе совпадающих сущностей генерируются Selection Criteria. Они могут быть автоматически добавлены в кампанию.
Какие данные и как использует
Данные на входе
- Контентные факторы: Весь текст лендинга анализируется компонентом Annotator для извлечения сущностей.
- Структурные факторы: Расположение контента на странице (например, в заголовках, основном контенте, футере) используется для расчета Topicality Score.
- Бизнес-факторы (Внешние): Business Type и Business Name, предоставленные рекламодателем.
- Системные данные (Knowledge Graph): База данных сущностей, предопределенные Collections и их соответствия типам бизнеса.
Какие метрики используются и как они считаются
- Quality Score (для коллекций): Оценка релевантности предопределенной коллекции указанному типу бизнеса. Согласно патенту, часто является заранее определенной (predetermined) и хранится в mapping.
- Confidence Score (для сущностей): Оценка уверенности в том, что термин на странице действительно относится к конкретной сущности. Рассчитывается Annotator на основе контекста и окружающих терминов (например, «Jaguar» рядом с «дилер» повышает уверенность, что это автомобиль).
- Topicality Score (для сущностей): Оценка важности сущности для темы страницы. Рассчитывается Annotator на основе расположения термина на странице (структурная значимость).
- Методы анализа текста (NLP, entity extraction): Annotator использует парсинг текста и извлечение сущностей, опираясь на данные типа knowledge graph.
- Методы вычислений: Используются операции теории множеств (Union, Intersection) для агрегации коллекций и сравнения групп сущностей.
Выводы
- Патент относится к Рекламе, не к органическому SEO: Описанный механизм предназначен для автоматизации таргетинга в Google Ads (Content Management System), а не для ранжирования в органическом поиске. Прямых SEO-рекомендаций в нем нет.
- Валидация через сравнение Сущностей: Ключевой механизм — это проверка релевантности путем сравнения того, что система ожидает увидеть для данного типа бизнеса (сущности из Collections), с тем, что реально присутствует на лендинге (сущности, извлеченные Annotator).
- Детализация оценки сущностей на странице (Confidence и Topicality): Патент раскрывает использование двух ключевых метрик при анализе контента: Confidence Score (уверенность в идентификации/разрешение неоднозначности) и Topicality Score (важность для темы страницы/структурная значимость). Эти технологии анализа контента универсальны и, вероятно, используются в органическом поиске.
- Коллекции как Эталон Контекста: Collections служат эталонным набором данных для определения контекста и категоризации бизнеса. Соответствие контента этим эталонам критично для правильной интерпретации тематики сайта системой.
- Разрешение Неоднозначности: Механизм эффективно разрешает двусмысленность. Совпадение сущности на странице (например, «Ягуар») с сущностью в релевантной коллекции (например, «Автомобили») позволяет системе уверенно определить правильный контекст.
Практика
ВАЖНОЕ ПРИМЕЧАНИЕ: Патент относится к системе контекстной рекламы (PPC). Практические выводы для SEO основаны на понимании базовых технологий Google по извлечению и интерпретации сущностей (Annotator, Confidence Score, Topicality Score), которые описаны в патенте.
Best practices (это мы делаем)
- Четкое Представление Ключевых Сущностей (для Topicality Score): Патент подчеркивает важность Topicality Score, который зависит от расположения контента. SEO-специалисты должны убедиться, что основные сущности сайта (продукты, услуги, бренды) занимают центральное место в структуре документа (заголовки H1, основной контент), чтобы максимизировать их тематическую значимость.
- Использование Контекста для Уточнения Сущностей (для Confidence Score): Для терминов с несколькими значениями (омонимов) необходимо предоставлять достаточный контекст (связанные термины и сущности). Это помогает Annotator достичь высокого Confidence Score и правильно интерпретировать сущность, разрешая неоднозначность.
- Обеспечение Тематического Соответствия (Topical Alignment): Контент страницы должен семантически соответствовать общей тематике бизнеса. Механизм сравнения сущностей на лендинге с эталонными Collections показывает, что Google проверяет, соответствует ли содержимое страницы ожидаемому контенту для данной ниши.
- Использование структурированных данных (Schema.org): Хотя патент не упоминает микроразметку, ее использование помогает Annotator точнее идентифицировать сущности и их контекст, что потенциально повышает Confidence Score.
Worst practices (это делать не надо)
- Размытие Сущностей и Неоднозначность: Использование двусмысленных терминов без уточняющего контекста. Это снижает Confidence Score и затрудняет работу Annotator.
- Несоответствие Контента и Тематики Сайта: Создание страниц, чьи основные сущности не имеют отношения к общей тематике сайта. В контексте патента, система не нашла бы пересечений между сущностями на странице и в ожидаемых Collections.
- Скрытие Ключевых Сущностей: Размещение названий ключевых продуктов или услуг в неважных частях страницы (футер, дисклеймеры) приведет к низкому Topicality Score.
- Размытие тематики лендинга (Topic Dilution): Попытка охватить слишком много разных сущностей на одной странице без явного фокуса, что снижает Topicality Score для целевых сущностей.
Стратегическое значение
Патент подтверждает стратегический фокус Google на Entity-Oriented Search. Он демонстрирует конкретную реализацию использования сущностей и тематических коллекций (Knowledge Graph) для понимания и валидации коммерческого контента. Технологии глубокого анализа контента (Annotator, расчет Confidence и Topicality Scores) являются фундаментальными. Долгосрочная SEO-стратегия должна фокусироваться на построении четкой семантической структуры сайта, которая однозначно позиционирует его в рамках релевантных тематических коллекций.
Практические примеры
Сценарий: Оптимизация карточки товара для повышения Confidence и Topicality Scores
Задача: Оптимизировать страницу нового смартфона «Galaxy S30», чтобы Google четко идентифицировал его как основной объект.
- Повышение Topicality Score: Убедиться, что сущность «Galaxy S30» присутствует в Title, H1 и первом абзаце описания. Это сигнализирует, что данная сущность является центральной темой.
- Повышение Confidence Score:
- Добавить контекст: Упомянуть связанные сущности: бренд («Samsung»), тип устройства («Смартфон»), характеристики («AMOLED-экран», «Процессор Exynos»). Наличие этих связанных сущностей усиливает контекст и помогает отличить продукт от других возможных значений.
- Использовать структурированные данные: Внедрить разметку Schema.org/Product с указанием name, brand, model. Это напрямую помогает Annotator.
- Ожидаемый результат: Annotator с высокой уверенностью (Confidence Score) определяет «Galaxy S30» как продукт Samsung и присваивает ему высокий Topicality Score, улучшая понимание контента страницы.
Вопросы и ответы
Описывает ли этот патент алгоритмы органического ранжирования Google?
Нет. Патент описывает Content Management System, то есть систему управления рекламными объявлениями (Google Ads). Он посвящен автоматической генерации критериев таргетинга (Selection Criteria) для рекламодателей, а не тому, как ранжируются сайты в органической выдаче.
Какая польза от этого патента для SEO-специалиста, если он про рекламу?
Основная польза заключается в детальном описании технологий анализа контента, которые использует Google. В частности, он показывает, как работает Annotator для извлечения сущностей и как оценивает их с помощью Confidence Score (уверенность) и Topicality Score (тематичность). Понимание этих процессов помогает лучше оптимизировать контент для правильной интерпретации поисковой системой.
Что такое Confidence Score и как его можно повысить?
Confidence Score — это мера уверенности системы в том, что термин на странице относится к конкретной сущности. Он используется для разрешения неоднозначности (например, «Apple» компания или фрукт). Повысить его можно, предоставляя четкий контекст: используя связанные термины и сущности (например, «Apple» + «iPhone», «iOS»), а также внедряя структурированные данные (Schema.org).
Что такое Topicality Score и как его можно повысить?
Topicality Score — это оценка того, насколько центральной является сущность для темы документа. Повысить его можно, размещая ключевые сущности в структурно важных элементах страницы: заголовках (Title, H1), основном контенте и в начале документа. Сущности в футере или дисклеймерах, вероятно, получат низкий балл.
Что такое «Коллекция» (Collection) сущностей в контексте патента?
Collection — это предопределенная группа сущностей, объединенных общим признаком (например, «Производители автомобилей» или «Типы мебели»). Система использует эти коллекции, чтобы понять, какие сущности в целом релевантны для определенного типа бизнеса (Business Type), заявленного рекламодателем.
Как Google определяет, какие коллекции подходят моему бизнесу?
Согласно патенту, система использует предопределенные соответствия (predetermined mapping) между типом бизнеса и коллекциями. Эти соответствия могут иметь оценку качества (Quality Score), которая указывает на степень релевантности коллекции данному типу бизнеса. Система выбирает коллекции с наивысшим Quality Score.
Почему система сравнивает сущности из коллекций с сущностями на посадочной странице?
Это механизм валидации релевантности. Сущности из коллекций представляют общее понимание категории бизнеса (ожидание). Сущности с посадочной страницы представляют конкретное предложение (реальность). Система ищет пересечение, чтобы гарантировать, что сгенерированные критерии таргетинга точно соответствуют и категории, и конкретному контенту страницы.
Что произойдет, если сущности на моей странице не совпадают с теми, которые Google ожидает от моего типа бизнеса?
В контексте патента, если пересечение минимально, система не сможет сгенерировать надежные критерии таргетинга. В контексте SEO это может указывать на проблему с тематической релевантностью: Google может посчитать, что контент страницы не соответствует заявленной тематике сайта или нише, что негативно скажется на ранжировании.
Как этот патент связан с E-E-A-T?
Прямой связи нет, так как патент фокусируется на автоматизации таргетинга, а не оценке качества. Однако точное распознавание сущностей (с высоким Confidence и Topicality) является необходимым базовым условием для того, чтобы системы оценки качества могли корректно определить тематику контента и затем применить сигналы E-E-A-T.
Каков главный вывод для контент-стратегии из этого патента?
Главный вывод — необходимость фокуса на семантической ясности и структурной организации контента. Контент-стратегия должна гарантировать, что ключевые сущности представлены однозначно (для высокого Confidence Score) и занимают центральное место в структуре документа (для высокого Topicality Score), обеспечивая правильную интерпретацию контента системами Google.