Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует совместную встречаемость сущностей для автоматического расширения критериев таргетинга контента (например, рекламы)

    SYSTEMS AND METHODS OF SELECTING CONTENT BASED ON AGGREGATE ENTITY CO-OCCURRENCE (Системы и методы выбора контента на основе агрегированной совместной встречаемости сущностей)
    • US9311414B2
    • Google LLC
    • 2016-04-12
    • 2013-06-14
    2013 Knowledge Graph Патенты Google

    Механизм автоматического расширения критериев выбора контента (например, рекламного таргетинга в Google Ads). Система анализирует, какие сущности (entities) совместно используются другими поставщиками контента в аналогичных кампаниях. Если эти дополнительные сущности показывают высокую эффективность (CTR, конверсии) и используются достаточно часто, они предлагаются или добавляются к исходным критериям для увеличения охвата.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неполноты критериев выбора контента (Content Selection Criteria), используемых поставщиками контента (Content Providers, которые в контексте патента являются рекламодателями). Цель изобретения — помочь рекламодателям увеличить охват (coverage) их контента (рекламы) путем автоматического выявления дополнительных релевантных и эффективных критериев таргетинга (сущностей, Entities), которые они могли упустить при ручной настройке кампаний.

    Что запатентовано

    Запатентована система (Entity Refinement Tool) для автоматического уточнения и расширения критериев таргетинга. Система анализирует совместную встречаемость (co-occurrence) сущностей в группах контента (Content Groups, например, AdGroups) множества рекламодателей. На основе этого анализа, данных об эффективности (Performance Data) и частоте использования, система предлагает или автоматически добавляет высокоэффективные связанные сущности к критериям таргетинга.

    Как это работает

    Система работает следующим образом:

    • Идентификация исходной сущности: Определяется первая сущность (first entity), которую Рекламодатель А использует для таргетинга.
    • Анализ совместной встречаемости: Система находит других рекламодателей (B, C), которые также используют эту первую сущность в своих Content Groups.
    • Выявление дополнительных сущностей: Определяются дополнительные сущности (additional entity), которые Рекламодатели B и C используют совместно с первой сущностью.
    • Оценка эффективности и частоты: Для дополнительных сущностей определяется метрика эффективности (Performance Metric, например, CTR или Conversion Rate) и частота уникального использования.
    • Сравнение с порогами: Метрики сравниваются с пороговыми значениями (Performance Threshold и Frequency Threshold).
    • Ассоциация: Если пороги превышены, дополнительная сущность ассоциируется с контентом Рекламодателя А (предлагается ему или добавляется автоматически).

    Актуальность для SEO

    Высокая для Paid Search (Google Ads). Технологии автоматизации таргетинга и предложения ключевых слов/сущностей активно развиваются (например, Performance Max). Для органического SEO актуальность косвенная. Патент не описывает алгоритмы ранжирования, но демонстрирует методы Google для анализа связей между сущностями на основе их совместной встречаемости в заданном контексте (в данном случае — в рекламных кампаниях).

    Важность для SEO

    Влияние на органическое SEO минимальное (3/10). Патент описывает инфраструктуру и алгоритмы системы выбора платного контента (Google Ads), а не органического ранжирования. Он не дает прямых рекомендаций по оптимизации сайтов для SEO. Однако он представляет ценность для понимания того, как Google обрабатывает сущности (Entities), отличает их от ключевых слов и определяет их взаимосвязи через совместную встречаемость.

    Детальный разбор

    Термины и определения

    Entity (Сущность)
    Именованный объект физического мира (место, человек, медиаконтент и т.д.), обладающий уникальным идентификатором (Canonical Stable Identifier). Сущности отличаются от ключевых слов тем, что они недвусмысленны (например, сущность «Ягуар (автомобиль)» и «Ягуар (животное)»). Сущности имеют атрибуты и связи с другими сущностями.
    Content Provider (Поставщик контента)
    В контексте патента — рекламодатель или организация, предоставляющая контент для отображения на веб-страницах.
    Content Selection Criteria (Критерии выбора контента)
    Набор параметров (в данном патенте — сущностей), используемых сервером для таргетинга контента (рекламы).
    Content Group (Группа контента)
    Структура данных, объединяющая сам контент (например, объявления) и связанные с ним критерии выбора (например, AdGroup).
    Co-occurrence (Совместная встречаемость)
    Факт совместного использования двух или более сущностей в рамках одной Content Group разными поставщиками.
    Entity Refinement Tool (Инструмент уточнения сущностей)
    Описанная в патенте система, которая автоматически предлагает дополнительные критерии выбора контента.
    Performance Metric (Метрика эффективности)
    Показатель эффективности использования сущности для таргетинга. Примеры: Click Through Rate (CTR), Conversion Rate.
    Performance Threshold (Порог эффективности)
    Минимальное значение Performance Metric. Может быть статическим или динамическим (Dynamic Performance Threshold).
    Frequency Threshold (Порог частоты)
    Минимальное количество уникальных поставщиков контента, которые должны использовать дополнительную сущность, чтобы система предложила ее другим.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод уточнения критериев выбора контента.

    1. Система (Aggregator) идентифицирует критерии выбора, включающие первую сущность (first entity), используемую первым поставщиком контента. Подчеркивается, что сущность имеет канонический идентификатор, атрибуты и связи в базе данных.
    2. Система идентифицирует множество наборов сущностей (от других поставщиков), каждый из которых содержит первую сущность и дополнительную сущность (additional entity).
    3. Система (Entity Evaluator) определяет метрику эффективности (Performance Metric) для дополнительной сущности.
    4. Система (Selection Criteria Generator) сравнивает метрику с порогом эффективности (Performance Threshold).
    5. На основе сравнения дополнительная сущность ассоциируется с контентом первого поставщика.

    Claim 5 (Зависимый): Добавляет условие частоты использования (защита от копирования уникальных стратегий).

    1. Система определяет, что частота уникальных встречаемостей (frequency of unique occurrences) дополнительной сущности превышает порог частоты (Frequency Threshold).
    2. Только в этом случае система ассоциирует дополнительную сущность. Система не будет предлагать сущность, если ее использует слишком мало других поставщиков.

    Claim 3 и 4 (Зависимые): Уточняют природу порога эффективности.

    Порог эффективности может быть динамическим (dynamic performance threshold) и определяться на основе исторических данных обратной связи по эффективности (historical performance feedback). Это означает, что система самообучается для определения оптимального порога.

    Claim 2 (Зависимый): Уточняет взаимодействие с рекламодателем.

    Система может передать предложение (дополнительную сущность) рекламодателю и получить от него подтверждение (индикацию) для ассоциации этой сущности. Это описывает режим предложений, а не автоматического добавления.

    Claim 7 (Зависимый): Описывает оптимизацию производительности.

    Система переходит в офлайн-режим и сохраняет в базе данных таблицу ассоциаций между сущностями. Это позволяет ускорить процесс в реальном времени за счет предварительных вычислений.

    Где и как применяется

    ВАЖНО: Этот патент не описывает архитектуру органического поиска Google (Crawling, Indexing, Ranking и т.д.). Он описывает архитектуру системы выбора и таргетинга контента, например, рекламной системы Google Ads.

    Система управления контентом (Content Management System / Ad Server):

    • Создание и редактирование кампаний: Механизм применяется, когда Content Provider создает или изменяет Content Group. Система может предлагать дополнительные сущности в интерфейсе пользователя.
    • Автоматическое расширение таргетинга: Система может автоматически применять расширенные критерии, если поставщик выбрал соответствующие типы соответствия (в описании упоминаются «broad match» или «expanded match»).

    Компоненты системы:

    • Aggregator: Собирает данные о совместной встречаемости сущностей.
    • Entity Evaluator: Оценивает эффективность и частоту использования сущностей.
    • Selection Criteria Generator: Сравнивает метрики с порогами и принимает решение об ассоциации.

    Входные данные:

    • Исходная сущность, используемая поставщиком.
    • Данные о Content Groups и используемых сущностях от множества других поставщиков.
    • Исторические данные об эффективности (CTR, конверсии) сущностей.
    • База данных сущностей (Entity IDs) с идентификаторами и связями.

    Выходные данные:

    • Расширенный набор сущностей (критериев выбора) для исходного поставщика.
    • Рекомендации по добавлению сущностей в интерфейсе.

    На что влияет

    • Конкретные типы контента: Влияет на выбор дополнительного контента, такого как реклама, который отображается на веб-страницах.
    • Специфические запросы/Контекст: Влияет на то, какой контент будет показан в определенном контексте, за счет расширения критериев таргетинга.
    • Отраслевые вертикали (Industry Verticals): В патенте упоминается (Claim 9), что система может агрегировать данные в рамках одной отраслевой вертикали (например, сравнивать только поставщиков из сферы развлечений или технологий) для повышения релевантности.

    Когда применяется

    • Триггеры активации: Создание новой Content Group, добавление новой сущности в существующую группу, или автоматическая оптимизация существующих кампаний.
    • Условия работы: Наличие достаточного объема данных о совместной встречаемости сущностей у других поставщиков.
    • Пороговые значения: Применение зависит от выполнения двух ключевых условий:
      • Performance Threshold: Дополнительная сущность должна быть достаточно эффективной (например, высокий CTR).
      • Frequency Threshold: Дополнительная сущность должна использоваться достаточным количеством уникальных поставщиков.

    Пошаговый алгоритм

    Этап 1: Инициализация и сбор данных

    1. Идентификация исходной сущности: Aggregator идентифицирует первую сущность, используемую первым поставщиком контента.
    2. Поиск совместной встречаемости: Aggregator ищет в базе данных Content Groups других поставщиков, которые также используют эту первую сущность.
    3. Идентификация дополнительных сущностей: Aggregator идентифицирует все дополнительные сущности (кандидаты), которые встречаются совместно с первой сущностью в найденных группах.

    Этап 2: Оценка и фильтрация

    1. Фильтрация по частоте (Дедупликация): Entity Evaluator определяет частоту уникальных встречаемостей (сколько разных поставщиков используют кандидата). Если частота ниже Frequency Threshold, кандидат отклоняется (для сохранения стратегического преимущества конкурентов).
    2. Определение метрики эффективности: Entity Evaluator определяет Performance Metric (например, CTR, Conversion Rate) для оставшихся кандидатов на основе исторических данных (Performance Data).
    3. Определение порога: Selection Criteria Generator определяет Performance Threshold (статический или динамический).
    4. Сравнение: Selection Criteria Generator сравнивает Performance Metric каждого кандидата с Performance Threshold.

    Этап 3: Применение

    1. Ассоциация: Сущности, удовлетворяющие порогу, ассоциируются с контентом первого поставщика.
    2. Реализация ассоциации: Это может происходить одним из двух способов:
      • Автоматически: Дополнительная сущность добавляется к Content Selection Criteria (например, при использовании broad match).
      • Вручную (Предложение): Дополнительная сущность передается поставщику через интерфейс в виде предложения, и система получает от него подтверждение на добавление.

    Офлайн-процесс (Оптимизация):

    Система может периодически выполнять Этапы 1 и 2 в офлайн-режиме (используя, например, MapReduce или Hadoop, как упомянуто в описании) для наиболее популярных сущностей и сохранять результаты в таблице ассоциаций для быстрого доступа.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании данных о сущностях и их эффективности в контексте системы выбора контента (рекламы).

    • Структурные факторы (Entity Data): Сущности (Entities) с их уникальными идентификаторами (Canonical Stable Identifier), атрибутами и связями. Это основа для точного анализа.
    • Поведенческие факторы (Performance Data): Исторические данные об эффективности. Включает информацию о взаимодействии пользователей с контентом, который был выбран с использованием конкретной сущности (клики, конверсии).
    • Данные о конфигурации (Campaign Data): Данные о структуре Content Groups различных поставщиков, позволяющие определить совместную встречаемость (co-occurrence) сущностей.

    Какие метрики используются и как они считаются

    • Frequency of unique occurrences (Частота уникальных встречаемостей): Количество уникальных поставщиков контента, которые используют пару сущностей (исходную и дополнительную). Используется для сравнения с Frequency Threshold.
    • Performance Metric (Метрика эффективности): Агрегированный показатель успешности таргетинга. Конкретные примеры, указанные в патенте:
      • Click Through Rate (CTR).
      • Conversion Rate.
    • Performance Threshold (Порог эффективности): Пороговое значение для фильтрации сущностей. Может быть:
      • Статическим: Предопределенное значение (например, минимальный CTR 1%).
      • Динамическим (Dynamic Performance Threshold): Оптимизированное значение, определяемое системой на основе анализа обратной связи (performance feedback) для максимизации общей эффективности. Например, система может определить, что добавление Топ-5 сущностей дает лучший результат, чем добавление Топ-10.

    Выводы

    1. Ориентация на Paid Search (AdTech): Описанные механизмы напрямую относятся к системам платного контента (Google Ads) и не описывают алгоритмы органического ранжирования.
    2. Приоритет сущностей над ключевыми словами в таргетинге: Патент подчеркивает важность использования недвусмысленных сущностей (Entities) с уникальными идентификаторами для точного таргетинга, в отличие от многозначных ключевых слов.
    3. Совместная встречаемость как индикатор связи: Система использует совместное использование сущностей (co-occurrence) в рамках Content Groups как сильный сигнал их релевантности друг другу в контексте таргетинга контента.
    4. Использование агрегированных данных («Мудрость толпы»): Эффективность кампаний одного рекламодателя улучшается за счет анализа успешных стратегий (используемых комбинаций сущностей) других рекламодателей.
    5. Эффективность как ключевой фильтр: Сущность не добавляется только на основании связи. Она должна доказать свою эффективность (высокий CTR или Conversion Rate) и превысить Performance Threshold.
    6. Защита уникальных стратегий: Механизм Frequency Threshold гарантирует, что система не будет предлагать уникальные или нишевые сущности, используемые малым числом поставщиков, тем самым защищая их стратегическое преимущество.

    Практика

    Практическое применение в SEO

    ВАЖНО: Патент описывает инфраструктуру Paid Search (Google Ads). Прямых практических рекомендаций для органического SEO он не содержит. Однако он дает важные косвенные инсайты о работе Google с сущностями.

    Best practices (это мы делаем)

    • Фокус на сущностях (Entity-First SEO): Подтверждается стратегическая важность ориентации на сущности, а не только на ключевые слова. SEO-специалисты должны убедиться, что контент четко связан с целевыми сущностями (используя структурированные данные, четкие упоминания).
    • Использование совместной встречаемости для построения контекста: Хотя механизм в патенте использует совместную встречаемость в рекламных кампаниях, этот принцип применим и к контенту. Для раскрытия темы необходимо включать в текст связанные сущности (например, при описании фильма упоминать сущности режиссера, актеров, студии). Это помогает поисковым системам лучше понять контекст и построить Topical Authority.
    • Анализ тематического охвата: Изучение того, какие сущности совместно используют успешные конкуренты (и даже рекламодатели в этой нише) в рамках одной темы, может помочь выявить упущенные аспекты и расширить семантическое ядро на основе сущностей.

    Worst practices (это делать не надо)

    • Игнорирование сущностей: Разработка контент-стратегии исключительно на основе частотности ключевых слов без учета лежащих в их основе сущностей и их связей.
    • Поверхностное раскрытие темы: Упоминание основной сущности без включения связанных сущностей, которые естественно встречаются вместе в данном контексте.

    Стратегическое значение

    Патент демонстрирует, насколько глубоко Google интегрирует обработку сущностей в свои продукты, включая рекламу. Он показывает, что Google способен анализировать связи между сущностями не только на основе анализа текстов (Knowledge Graph), но и на основе паттернов их совместного использования в реальных данных (в данном случае — в настройках таргетинга). Это подтверждает общий тренд на семантическое понимание контента.

    Практические примеры

    Примеров для органического SEO нет. Примеры относятся к Paid Search (Google Ads), так как патент описывает именно эту систему.

    Сценарий: Расширение таргетинга для продавца билетов на фильм

    1. Исходная настройка: Онлайн-продавец билетов (Поставщик А) создает Content Group для рекламы нового фильма. В качестве критерия выбора он использует сущность «Название фильма X».
    2. Анализ системы: Entity Refinement Tool анализирует данные и видит, что многие другие поставщики (кинотеатры, фан-сайты) также используют сущность «Название фильма X».
    3. Выявление совместной встречаемости: Система обнаруживает, что 70% этих поставщиков также используют сущности «Актер Y» и «Режиссер Z» в тех же группах.
    4. Оценка эффективности: Система проверяет Performance Data. Сущность «Актер Y» имеет высокий CTR (5%), а «Режиссер Z» — низкий (0.5%).
    5. Применение порогов: Frequency Threshold пройден для обеих сущностей. Performance Threshold (например, 2%) пройден только для «Актер Y».
    6. Результат: Система предлагает Поставщику А добавить сущность «Актер Y» в его Content Group или добавляет ее автоматически (если включен expanded match).

    Вопросы и ответы

    Описывает ли этот патент алгоритмы органического ранжирования Google?

    Нет. Патент явно описывает системы и методы для выбора дополнительного контента (Content Selection), например, рекламы. Он описывает, как Google Ads помогает рекламодателям автоматически улучшать и расширять критерии таргетинга, а не то, как ранжируются сайты в органической выдаче.

    Чем отличаются сущности (Entities) от ключевых слов (Keywords) в контексте патента?

    Сущности — это объекты реального мира с уникальным идентификатором (Canonical Stable Identifier), атрибутами и связями. Они недвусмысленны. Ключевые слова — это термины или фразы, которые могут быть многозначными. Например, «ягуар» как ключевое слово неясно, а сущность четко определяет автомобиль или животное. Система использует точность сущностей для анализа.

    Как система определяет, что две сущности связаны?

    В данном патенте связь определяется через совместную встречаемость (co-occurrence). Если значительное количество разных поставщиков контента используют Сущность А и Сущность Б вместе в своих Content Groups (рекламных группах), система считает их связанными в контексте таргетинга.

    Что такое Performance Metric и почему это важно?

    Это показатель эффективности, например, CTR (Click Through Rate) или Conversion Rate. Это важно, потому что система не просто предлагает связанные сущности, а только те, которые исторически показывают высокую эффективность в таргетинге у других поставщиков.

    Может ли эта система скопировать и предложить мою уникальную стратегию таргетинга конкурентам?

    Патент предусматривает защиту от этого с помощью Frequency Threshold (порога частоты). Чтобы система предложила вашу сущность другим, необходимо, чтобы ее уже использовало определенное минимальное количество уникальных поставщиков. Уникальные стратегии, используемые малым числом участников рынка, не будут агрегированы и предложены.

    Что означает «динамический порог эффективности» (Dynamic Performance Threshold)?

    Это означает, что система не использует фиксированное значение (например, CTR > 1%) для всех случаев. Вместо этого она анализирует исторические данные (performance feedback) и оптимизирует порог для достижения наилучших результатов. Например, система может выбрать Топ-5 сущностей вместо Топ-10, если это дает оптимальный результат.

    Система автоматически добавляет новые сущности или только предлагает их?

    Патент описывает оба варианта. Система может автоматически ассоциировать дополнительную сущность с контентом (особенно если используются типы соответствия вроде broad match или expanded match). Также она может передать сущность поставщику через интерфейс и ждать его подтверждения (Claim 2).

    Какая польза от этого патента для SEO-специалиста, если он про рекламу?

    Польза косвенная, но важная. Патент подтверждает, что Google активно использует анализ сущностей и их совместной встречаемости для понимания контекста и связей. Это подчеркивает необходимость для SEO-специалистов применять подход Entity-First и обеспечивать совместную встречаемость связанных сущностей в контенте для построения Topical Authority.

    Что такое офлайн-режим, упоминаемый в патенте?

    Это процесс предварительных вычислений. Чтобы не проводить сложный анализ совместной встречаемости и эффективности в реальном времени, система заранее обрабатывает данные для популярных сущностей и сохраняет результаты в таблице ассоциаций. Это значительно ускоряет выдачу рекомендаций.

    Применяется ли анализ ко всем поставщикам контента или только к определенным группам?

    Система может ограничивать анализ поставщиками в рамках одной отраслевой вертикали (industry vertical). Это повышает релевантность предлагаемых сущностей, так как сравниваются стратегии компаний из одной сферы деятельности.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.