Google использует механизм для точной оценки релевантности спонсируемого контента (рекламы) при анализе ключевых слов из нескольких источников на странице (текст, URL, категории). Чтобы предотвратить завышение оценки из-за дублирования слов в разных источниках, система подсчитывает количество уникальных совпадений. Итоговая оценка корректируется: малое количество уникальных совпадений может быть оштрафовано, а большое — поощрено.
Описание
Какую задачу решает
Патент решает проблему неадекватно завышенных оценок релевантности (scores) при выборе спонсируемого контента (контекстной рекламы). Эта проблема возникает, когда система использует несколько наборов поисковых терминов (Multiple Sets of Query Terms) из разных источников (например, контент страницы и ее URL). Если один и тот же термин присутствует в нескольких наборах, он может учитываться несколько раз при расчете базовой оценки, что приводит к искажению. Цель — скорректировать оценку так, чтобы она точнее отражала количество уникальных совпадений.
Что запатентовано
Запатентована система выбора спонсируемого контента (Sponsored Content), которая корректирует оценку релевантности (Score Adjustment) на основе анализа совпадений между несколькими входными наборами данных (Sets of Query Terms) и терминами рекламного объявления (Item Terms). Ключевым элементом является подсчет количества уникальных совпадающих поисковых терминов (Unique Matching Query Terms) и корректировка итоговой оценки на основе этого числа.
Как это работает
Система работает в контексте выбора рекламы для показа на ресурсе:
- Сбор данных: Из ресурса извлекаются различные наборы поисковых терминов (например, из контента, URL, синонимов, категорий).
- Сопоставление: Matching Engine сопоставляет эти наборы с терминами рекламных объявлений (Item Terms).
- Базовая оценка: Рассчитывается начальная оценка релевантности.
- Анализ уникальности: Condition Detector анализирует совпадения и определяет количество уникальных поисковых терминов, которые совпали.
- Корректировка оценки: Score Calculator корректирует базовую оценку. Если уникальных совпадений мало (в описании патента упоминаются примеры: одно или два), может применяться штраф (Score Penalty). Если много (например, три или более), может применяться повышение (Score Increase).
Актуальность для SEO
Высокая для систем контекстной рекламы (например, Google AdSense/Ad Manager). Механизмы точного сопоставления контента страницы и рекламы, а также агрегация сигналов из разных источников, критически важны для рекламных технологий. Однако актуальность для органического поиска (SEO) низкая, так как патент описывает исключительно выбор Sponsored Content.
Важность для SEO
Патент имеет минимальное значение для стратегий органического SEO (1/10). Он описывает внутренние процессы системы выбора спонсируемого контента (рекламы), а не алгоритмы ранжирования органической выдачи. Патент полезен для понимания того, как Google анализирует контекст страницы для целей рекламы, но не дает прямых рекомендаций для улучшения органических позиций.
Детальный разбор
Термины и определения
- Sponsored Content (Спонсируемый контент)
- Контент, распространяемый через рекламную систему (например, рекламные объявления).
- Item Terms (Термины элемента)
- Слова и фразы, ассоциированные с элементом спонсируемого контента (рекламным объявлением). Используются для таргетинга.
- Sets of Query Terms (Наборы поисковых терминов)
- Множественные наборы слов и фраз, извлеченные из веб-страницы, для которой подбирается реклама. Могут включать термины из контента ресурса (Document Terms), URL (URL Terms), синонимы (Synonyms), историю запросов (Queries), категории (Category Terms).
- Matching Engine (Механизм сопоставления)
- Компонент, выполняющий операцию сопоставления между Sets of Query Terms и Item Terms.
- Condition Detector (Детектор условий)
- Компонент, который анализирует совпавшие термины (Matched Terms) для обнаружения специфических условий, например, наличия одного и того же термина в нескольких входных наборах. Определяет количество уникальных совпадений.
- Score Calculator (Калькулятор оценки)
- Компонент, который рассчитывает числовую оценку релевантности и корректирует ее на основе данных от Condition Detector.
- Unique Matching Query Terms (Уникальные совпадающие поисковые термины)
- Количество отдельных (уникальных) поисковых терминов, которые совпали с терминами элемента, независимо от того, в скольких входных наборах они присутствовали.
- Score Adjustment Information (Информация о корректировке оценки)
- Данные для изменения оценки. Включает Score Penalty (штраф) и Score Increase (повышение).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод оценки и выбора спонсируемого контента.
- Система получает несколько наборов поисковых терминов (plurality of sets of query terms).
- Для каждого элемента спонсируемого контента идентифицируется набор совпавших поисковых терминов (set of matched query terms).
- Формулируется оценка (score). Указано, что значение для каждого совпавшего термина определяется на основе количества наборов, в которых он находится, и взвешивается в зависимости от конкретного набора (weighted based on a set). Оценка элемента определяется путем комбинирования этих значений.
- Из совпавших терминов идентифицируются уникальные поисковые термины (unique query terms), которые присутствуют в (i) наборе совпавших терминов и (ii) более чем в одном наборе входных поисковых терминов.
- Определяется количество этих уникальных поисковых терминов по всем наборам.
- Оценка элемента корректируется как функция от определенного количества уникальных поисковых терминов.
- Скорректированная оценка присваивается элементу.
Claim 2 и 3 (Зависимые от 1): Детализируют характер корректировки.
- Корректировка может включать определение повышения оценки (score increase) (Claim 2) или штрафа (score penalty) (Claim 3) на основе количества уникальных поисковых терминов.
Где и как применяется
Важно отметить, что патент описывает работу Sponsored Content Engine (Рекламной системы, например, Google AdSense), а не системы органического поиска. Он не применяется на стандартных этапах CRAWLING, INDEXING или RANKING органического поиска.
Применение в Рекламной Системе:
Процесс происходит в момент запроса рекламы для показа на ресурсе.
- Извлечение терминов: Система анализирует ресурс и генерирует Sets of Query Terms (из контента, URL и т.д.).
- Сопоставление и Оценка: Matching Engine и Score Calculator выбирают релевантные объявления и рассчитывают базовую оценку.
- Корректировка: Condition Detector активируется для применения логики уникальных совпадений и корректировки оценок.
- Выбор: Итоговые скорректированные оценки используются для выбора наилучшего объявления.
Входные данные:
- Sets of Query Terms, извлеченные из ресурса.
- База данных спонсируемого контента с ассоциированными Item Terms.
Выходные данные:
- Скорректированная оценка (Adjusted Score) для каждого релевантного объявления.
На что влияет
- Типы контента: Влияет исключительно на выбор и ранжирование спонсируемого контента (контекстной рекламы). Не оказывает влияния на ранжирование органической выдачи.
Когда применяется
- Условия работы алгоритма: Алгоритм применяется, когда для выбора спонсируемого контента используется более одного набора поисковых терминов (Multiple Sets of Query Terms).
- Триггеры активации: Активируется, если обнаруживается, что поисковый термин, совпавший с терминами объявления, присутствует в нескольких входных наборах. Характер корректировки зависит от общего числа уникальных совпадений.
- Пороговые значения: В описании патента упоминаются примерные пороги: штраф (Score Penalty) может применяться, если количество уникальных совпадений низкое (например, 1 или 2); повышение (Score Increase) может применяться, если количество высокое (например, 3 и более).
Пошаговый алгоритм
Процесс выполняется для каждого кандидата спонсируемого контента.
- Получение входных данных: Система получает несколько наборов поисковых терминов, связанных с ресурсом.
- Сопоставление терминов: Matching Engine сопоставляет поисковые термины с Item Terms объявления для определения совпавших терминов (Matched Terms).
- Расчет начальной оценки: Score Calculator вычисляет начальную оценку релевантности. Эта оценка учитывает, в каких наборах находились совпавшие термины и вес этих наборов.
- Определение уникальных совпадений: Condition Detector анализирует совпавшие термины и определяет общее количество уникальных поисковых терминов, игнорируя дубликаты из разных наборов.
- Вычисление корректировки оценки: Рассчитывается корректировка оценки как функция от количества уникальных совпадений.
- Сценарий штрафа: Если количество уникальных совпадений низкое (например, одно или два), вычисляется Score Penalty.
- Сценарий повышения: Если количество уникальных совпадений высокое (например, три или более), вычисляется Score Increase.
- Применение корректировки: Начальная оценка обновляется с учетом вычисленной корректировки.
- Выбор контента: Скорректированные оценки используются для ранжирования и выбора элементов спонсируемого контента.
Какие данные и как использует
Данные на входе
Патент описывает использование различных данных, извлеченных из ресурса, для формирования Sets of Query Terms:
- Контентные факторы: Термины, извлеченные из содержания целевого ресурса (Document Terms). Также генерируются связанные слова, такие как синонимы (Synonyms).
- Технические факторы: Термины, извлеченные из URL ресурса (URL Terms).
- Структурные/Категориальные факторы: Термины, определяющие категорию (Category Terms), к которой принадлежит ресурс.
- Поведенческие/Исторические факторы: История запросов (Queries), которые использовались для доступа к ресурсу.
Какие метрики используются и как они считаются
- Initial Score (Начальная оценка): Рассчитывается путем комбинирования значений для всех совпавших терминов. Значение каждого термина зависит от количества наборов, в которых он присутствует, и веса (weighted based on the set) этих наборов (согласно Claim 1).
- Number of Unique Matching Query Terms (Количество уникальных совпадающих поисковых терминов): Ключевая метрика для корректировки. Подсчитывает уникальные термины, совпавшие с Item Terms.
- Score Adjustment (Корректировка оценки): Функция от количества уникальных совпадающих терминов. Включает Score Increase (положительная корректировка) и Score Penalty (отрицательная корректировка).
Выводы
- Патент относится к рекламе, а не к органическому поиску: Основной вывод заключается в том, что данный патент описывает исключительно механизмы выбора и оценки Sponsored Content (контекстной рекламы). Он не имеет прямого отношения к алгоритмам ранжирования органической выдачи.
- Использование множественных сигналов для контекстного анализа: Система контекстной рекламы использует разнообразные источники данных на странице (контент, URL, категории, связанные запросы) для понимания ее контекста.
- Фокус на уникальности совпадений (Дедупликация): Ключевой механизм — предотвращение искусственного завышения релевантности из-за дублирования ключевых слов в разных источниках. Система стремится оценить широту совпадения, а не интенсивность дублирования.
- Корректировка на основе широты охвата: Рекламные объявления, которые соответствуют большему количеству уникальных тем на странице, получают преимущество (Score Increase). Объявления, которые соответствуют только одной или двум темам (даже если эти темы упоминаются в разных источниках), могут быть пессимизированы (Score Penalty).
- Отсутствие практических выводов для SEO: Патент является инфраструктурным для рекламной системы и не дает практических выводов для специалистов по органическому продвижению сайтов.
Практика
ВАЖНО: Патент описывает внутренние процессы системы выбора спонсируемого контента (рекламы) и не дает практических выводов для органического SEO.
Следующие пункты применимы для специалистов, работающих с монетизацией контента через контекстную рекламу (например, Google AdSense).
Best practices (это мы делаем)
- Создание тематически целостного и разнообразного контента: Чтобы система точно определяла контекст и показывала релевантную рекламу, контент должен быть сфокусирован, но при этом использовать разнообразную лексику. Это увеличивает вероятность идентификации нескольких уникальных терминов.
- Обеспечение широты темы: Страницы, покрывающие несколько взаимосвязанных аспектов одной темы, могут привлекать более релевантную рекламу, так как механизм Score Increase поощряет рекламу, соответствующую нескольким уникальным терминам на странице.
- Оптимизация структуры и метаданных: Использование релевантных URL и четкой категоризации полезно, так как патент указывает, что URL Terms и Category Terms являются отдельными источниками для анализа контекста.
Worst practices (это делать не надо)
- Манипуляция контекстом (Keyword Stuffing): Попытки многократного повторения одного и того же ключевого слова в тексте, URL и заголовках для влияния на рекламу неэффективны. Система учитывает уникальные совпадения. Если уникальное совпадение только одно, может быть применен Score Penalty, что приведет к показу менее релевантной рекламы.
Стратегическое значение
Стратегическое значение для органического SEO отсутствует. Для рекламной экосистемы патент подчеркивает важность точности контекстуального таргетинга. Google стремится показывать рекламу, которая соответствует общему контексту страницы, а не цепляется за однократно упомянутое или избыточно повторяющееся слово.
Практические примеры
Практических примеров для органического SEO нет.
Пример в контексте AdSense:
Сценарий: Страница о путешествии на автомобиле.
- Исходные данные:
- Текст содержит: «путешествие», «автомобиль», «маршрут».
- URL содержит: «/travel-car-route».
- Наборы терминов (Sets of Query Terms):
- Набор 1 (Текст): [«путешествие», «автомобиль», «маршрут»]
- Набор 2 (URL): [«travel» (путешествие), «car» (автомобиль), «route» (маршрут)]
- Реклама А (Автомойка): Item Terms: [«автомобиль», «car»].
- Совпадения: «автомобиль» (Набор 1), «car» (Набор 2).
- Уникальные совпадения: 1 (автомобиль/car).
- Результат: Вероятен Score Penalty, так как реклама соответствует только одному аспекту страницы, несмотря на дублирование в разных источниках.
- Реклама Б (Аксессуары для автопутешествий): Item Terms: [«автомобиль», «путешествие», «маршрут», «аксессуары»].
- Совпадения: «автомобиль» (Набор 1, 2), «путешествие» (Набор 1, 2), «маршрут» (Набор 1, 2).
- Уникальные совпадения: 3.
- Результат: Вероятен Score Increase, так как реклама широко соответствует контексту страницы. Реклама Б получит приоритет над Рекламой А.
Вопросы и ответы
Этот патент описывает, как Google ранжирует сайты в органическом поиске?
Нет. Патент явно указывает, что он относится к выбору Sponsored Content (спонсируемого контента), то есть рекламных объявлений. Он описывает механизмы контекстной рекламы (например, Google AdSense), а не алгоритмы органического ранжирования.
Какую основную проблему решает этот патент?
Он решает проблему завышения оценок релевантности рекламы, когда одно и то же ключевое слово встречается в разных источниках на странице (например, и в тексте, и в URL). Система предотвращает многократный учет одного и того же слова, фокусируясь на количестве уникальных совпадений между страницей и рекламой.
Что такое «Наборы поисковых терминов» (Sets of Query Terms) в контексте патента?
Это различные группы ключевых слов, которые система извлекает из ресурса для подбора рекламы. Патент упоминает термины из контента документа, термины из URL, синонимы, категории, к которым относится ресурс, и историю запросов (queries), по которым приходили на этот ресурс.
Как работает механизм корректировки оценки?
Система подсчитывает количество уникальных терминов со страницы, которые совпали с терминами рекламного объявления. Если уникальных совпадений мало (например, 1 или 2), применяется штраф (Score Penalty). Если много (например, 3 и более), применяется повышение оценки (Score Increase). Это делается для поощрения рекламы, которая более широко соответствует контексту страницы.
Могу ли я использовать этот патент для улучшения SEO моего сайта?
Нет, этот патент не дает практических рекомендаций для органического SEO. Он описывает инфраструктуру рекламной системы. Понимание этого патента не поможет напрямую улучшить позиции сайта в результатах поиска Google.
Есть ли польза от этого патента для владельцев сайтов, использующих AdSense?
Да, для паблишеров AdSense патент дает понимание того, как оптимизировать контент для лучшего контекстуального таргетинга. Важно создавать контент, который покрывает несколько взаимосвязанных аспектов темы с разнообразной лексикой, чтобы система могла идентифицировать несколько уникальных терминов и показывать более релевантную рекламу.
Делает ли этот патент неэффективным повторение ключевых слов на странице (Keyword Stuffing)?
В контексте влияния на подбор контекстной рекламы — да. Многократное повторение одного и того же слова в тексте или его дублирование в URL не увеличит оценку релевантности для рекламы, так как система фокусируется на уникальных совпадениях. Это может даже привести к штрафу, если уникальное совпадение всего одно.
Что такое «Item Terms»?
Это ключевые слова или фразы, которые рекламодатель ассоциирует со своим рекламным объявлением (таргетинг). Система сопоставляет контент страницы (Query Terms) с этими Item Terms для определения релевантности объявления.
Учитывает ли система вес разных источников терминов (например, текст важнее URL)?
Да, в патенте (Claim 1) указано, что при расчете начальной оценки значение каждого совпавшего термина взвешивается в зависимости от набора (источника), в котором он находится (weighted based on a set). Это позволяет придавать разную важность терминам из разных источников.
Что произойдет, если объявление идеально соответствует только одной теме на странице, но эта тема повторяется во всех источниках?
Если объявление соответствует только одной уникальной концепции (1 уникальное совпадение), оно, скорее всего, получит Score Penalty, даже если этот термин присутствует и в тексте, и в URL, и в категориях. Система предпочтет другое объявление, которое соответствует нескольким разным концепциям страницы (например, 3 уникальных совпадения), так как оно получит Score Increase.