Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует концептуальное соответствие для разрешения неоднозначности и оценки семантической релевантности

    USING CONCEPTS FOR AD TARGETING (Использование концептов для таргетинга рекламы)
    • US20100287056A1
    • Google LLC
    • 2010-11-11
    • 2003-11-24
    2003 Knowledge Graph Патенты Google Семантика и интент

    Патент Google, раскрывающий механизмы перехода от ключевых слов к семантическим «концептам» для повышения точности таргетинга рекламы. Система сравнивает векторные или графовые представления концептов рекламы и запроса для разрешения лексической неоднозначности. Также используется обратная связь по эффективности (CTR/конверсии) для корректировки релевантности концептов, демонстрируя базовые принципы семантического анализа Google.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает фундаментальную проблему неоднозначности (ambiguity) при таргетинге рекламы, основанном на ключевых словах. Когда рекламодатели таргетируются на многозначные термины (например, «ford» или «jaguar»), их объявления часто показываются в нерелевантном контексте (реклама автомобиля Ford при поиске «Harrison Ford»). Изобретение направлено на автоматическое улучшение релевантности показов путем понимания семантического контекста и разрешения этой неоднозначности без необходимости ручного управления минус-словами.

    Что запатентовано

    Запатентована система, использующая сходство концептов (Concept Similarity) для определения релевантности и оценки рекламных объявлений. Система генерирует представление концептов как для рекламы (Ad Targeting Concept Representation), так и для контекста показа (запроса или документа — Request/Document Concept Representation). Решение о показе и ранжировании принимается на основе степени сходства между этими наборами концептов.

    Как это работает

    Система работает путем сравнения семантических профилей:

    • Извлечение концептов: Система анализирует рекламу (ключевые слова, текст, целевую страницу) и контекст (запрос пользователя, контент страницы, email) для определения связанных концептов.
    • Представление концептов: Концепты представляются в виде математических структур, таких как векторы (Concept Vectors) или узлы в графе.
    • Расчет сходства: Вычисляется Concept Similarity Score. Для этого могут использоваться методы векторного произведения (dot product) или расстояния обхода графа (traversal distance).
    • Обучение на эффективности: Система отслеживает эффективность рекламы (CTR, конверсии), связанной с конкретными концептами (Concept Performance Information), и корректирует их веса, чтобы отличать общую семантическую связь от коммерчески релевантной.
    • Ранжирование: Concept Similarity Score используется как ключевой фактор для расчета итогового Ad Score.

    Актуальность для SEO

    Высокая. Патент основан на заявке 2003 года и описывает фундаментальные принципы семантического анализа, которые лежат в основе современного поиска и рекламы. Переход от ключевых слов к концептам (сущностям, топикам) и использование векторных/графовых представлений для расчета релевантности являются основой для современных алгоритмов.

    Важность для SEO

    Стратегическое влияние на SEO значительное (7/10). Хотя патент напрямую описывает только систему таргетинга рекламы (Google Ads), базовые технологии, которые он раскрывает — извлечение концептов из документов и запросов, разрешение неоднозначности и расчет семантического сходства с использованием векторов и графов — являются центральными и для органического поиска. Понимание этих механизмов критически важно для разработки стратегий семантического SEO и построения Topical Authority.

    Детальный разбор

    Термины и определения

    Concept (Концепт)
    Представление значения (representation of meaning). Определяется из слов, анализа поисковых запросов или действий пользователя. Примеры включают категории таксономий (например, ODP), семантические кластеры (phil clusters) или векторы семантического контекста.
    Ad Targeting Concept Representation
    Представление концептов таргетинга рекламы. Структура данных (часто вектор), представляющая концепты, на которые нацелена реклама.
    Request/Document Concept Representation
    Представление концептов запроса или документа. Структура данных, представляющая концепты, извлеченные из контекста (поисковый запрос, веб-страница, email).
    Concept Similarity Score (Оценка сходства концептов)
    Числовая оценка (S), отражающая степень соответствия между концептами рекламы и концептами запроса/документа.
    Concept Vector (Вектор концептов, CTARGET, CREQUEST)
    Реализация представления концептов, где каждый элемент вектора идентифицирует концепт и его вес (score).
    Concept Performance Information
    Информация об эффективности концептов. Исторические данные (CTR, конверсии) рекламы, показанной на основе определенного концепта. Используется для корректировки весов концептов (Performance Factor).
    Ad Score (Оценка рекламы)
    Итоговая оценка, используемая для ранжирования рекламы. Зависит от Concept Similarity Score, ставки, качества рекламодателя и т.д.

    Ключевые утверждения (Анализ Claims)

    Патент содержит два ключевых независимых пункта (Claim 1 и Claim 14), описывающих разные методы определения концептов рекламы.

    Claim 1 (Независимый пункт): Описывает метод с использованием обратной связи от рекламодателя.

    1. Система определяет кандидатные концепты для объявления (с оценкой ad concept score).
    2. Кандидаты представляются рекламодателю.
    3. Система принимает обратную связь и корректирует ad concept score.
    4. При получении запроса определяются концепты запроса (request concept score).
    5. Вычисляется оценка сходства (similarity score) между скорректированными концептами объявления и концептами запроса.
    6. Показ объявления контролируется с использованием similarity score.

    Claim 14 (Независимый пункт): Описывает автономный метод (без участия рекламодателя).

    1. Система определяет таргетинговые концепты на основе критериев объявления (с оценкой targeting concept score).
    2. Оценка корректируется с использованием информации от других объявлений, использующих похожие критерии таргетинга (коллаборативная фильтрация).
    3. (Далее аналогично Claim 1): Определяются концепты запроса, вычисляется similarity score, который используется для контроля показа.

    Claim 5 (Зависимый от 1): Уточняет обработку концепций запроса с использованием исторических данных об эффективности.

    Оценка концепции запроса (request concept score) корректируется с использованием информации об эффективности (performance information) — например, CTR, конверсии — рекламных объявлений, которые ранее были показаны на основе этой концепции. Это критически важный механизм обучения на основе эффективности.

    Где и как применяется

    Хотя патент описывает рекламную систему (Ad Server), базовые технологии анализа контента применимы и взаимодействуют с основными этапами поиска.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе система анализирует документы (веб-страницы, а также целевые страницы рекламы) для определения связанных с ними концептов (Document Concept Determination Operations). Эти концептуальные представления сохраняются.

    QUNDERSTANDING – Понимание Запросов
    Система анализирует входящие поисковые запросы для определения их концептуального значения (Search Query Concept Determination Operations). Также офлайн происходит определение и уточнение концептов таргетинга рекламы (Ad Targeting Concept Determination Operations).

    RANKING – Ранжирование (В контексте рекламы — Ad Ranking)
    Основное применение патента.

    • Concept Similarity Determination Operations вычисляют сходство между концептами запроса/документа и концептами рекламы в реальном времени.
    • Ad Scoring Operations используют эту оценку сходства для расчета итогового Ad Score.

    Входные данные:

    • Информация о рекламе (ключевые слова, контент, URL).
    • Информация о запросе/документе.
    • Контекст пользователя (история поиска, язык).
    • Исторические данные об эффективности концептов (Concept Performance Information).

    Выходные данные:

    • Векторные/графовые представления концептов (Ad/Request Concept Representations).
    • Concept Similarity Score.
    • Итоговый Ad Score.

    На что влияет

    • Специфические запросы: Критически влияет на обработку неоднозначных запросов (полисемия), где одно слово имеет несколько значений (например, «Ягуар» — автомобиль, животное или команда).
    • Типы контента: Влияет на понимание и сопоставление любого текстового контента — веб-страниц, запросов, электронных писем, рекламных объявлений.

    Когда применяется

    Алгоритм применяется при каждом запросе на показ рекламы. Он используется для разрешения неоднозначности и определения семантической релевантности между контекстом и потенциальной рекламой, особенно при использовании широкого соответствия ключевых слов.

    Пошаговый алгоритм

    Процесс А: Обработка запроса и ранжирование (Real-time)

    1. Получение запроса (поисковый запрос или запрос документа).
    2. Определение концептов запроса: Генерация Request Concept Representation (например, вектор CREQUEST).
    3. Корректировка по эффективности (Claim 5): Корректировка весов в CREQUEST с использованием Concept Performance Information (исторических данных об эффективности концептов).
    4. Выбор кандидатов (рекламных объявлений).
    5. Получение концептов кандидатов: Извлечение заранее определенных Ad Targeting Concept Representations (например, вектор CTARGET).
    6. Расчет сходства концептов: Вычисление Concept Similarity Score (S) между CREQUEST и CTARGET.
    7. Ранжирование: Расчет итогового Ad Score с использованием S и других факторов (ставка, качество).
    8. Показ и сбор данных: Показ рекламы и отслеживание взаимодействий для обновления Concept Performance Information.

    Процесс Б: Определение концептов рекламы (Офлайн / Периодически)

    Метод 1 (С обратной связью, Claim 1):

    1. Генерация кандидатов в концепты.
    2. Представление рекламодателю и получение обратной связи (релевантно/нерелевантно).
    3. Корректировка оценок концептов на основе обратной связи.

    Метод 2 (Автономный, Claim 14):

    1. Анализ критериев таргетинга рекламы и контента целевой страницы.
    2. Определение и корректировка концептов с использованием информации от других похожих объявлений (коллаборативная фильтрация).

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Текст рекламного объявления, контент целевой страницы (landing page), текст поискового запроса, контент документа (веб-страницы), текст электронного письма.
    • Поведенческие факторы: Историческая эффективность рекламы (клики, конверсии), связанная с концептами (Concept Performance Information). История поиска пользователя (search history).
    • Структурные факторы (Внешние данные): Внешние источники для определения концептов, такие как таксономии (ODP), семантические кластеры (phil clusters), семантические векторы контекста.
    • Пользовательские и Контекстуальные факторы: Языковые предпочтения, происхождение запроса.

    Какие метрики используются и как они считаются

    • Concept Scores (Оценки концептов): Веса, связанные с элементами в векторах концептов.
    • Performance Factor (Фактор эффективности): Весовой коэффициент, корректируемый на основе исторических данных об эффективности концепта. Используется для масштабирования Concept Scores.
    • Concept Similarity Score (S): Вычисляемое сходство между векторами CTARGET и CREQUEST. Патент предлагает два метода расчета:

    1. Для независимых терминов (Векторное сходство):

    Используется формула на основе скалярного произведения (dot product):

    S = Limit-to-unity (K * (CTARGET · CREQUEST) / SQRT(CTARGET · CREQUEST))

    Где K — масштабирующий коэффициент.

    2. Для зависимых терминов (Графовое расстояние):

    Используется для иерархических или семантических графов. Сходство основано на расстоянии обхода (traversal distance) между концептами в графе:

    S = Limit-to-unity {K * traversal_distance}

    Расстояние вычисляется путем нахождения кратчайшего пути; веса вдоль последовательных участков пути перемножаются, а параллельные пути складываются.

    Выводы

    1. Фундамент семантического анализа: Патент демонстрирует ранний (2003 г.) переход Google от буквального сопоставления ключевых слов к пониманию базовых концептов (смыслов) для разрешения неоднозначности. Это фундаментальный принцип современного Information Retrieval.
    2. Математическое представление семантики: Концепты представляются в виде математических структур — векторов или узлов графа. Релевантность вычисляется алгоритмически как расстояние или сходство между этими структурами (dot product или traversal distance).
    3. Гибкость в расчете сходства: Система использует разные методы расчета сходства в зависимости от типа данных: векторный метод для независимых концептов и графовый метод для иерархически связанных концептов (таксономий).
    4. Обучение на основе эффективности (Performance Feedback Loop): Система использует машинное обучение (Claim 5) для корректировки значимости концептов на основе их реальной эффективности (CTR, конверсии). Это позволяет отличать общую семантическую связь от коммерческой релевантности.
    5. Стратегическое значение для SEO: Хотя патент о рекламе, он раскрывает базовые технологии Google для понимания контента. Это подтверждает критическую важность семантического SEO, построения Topical Authority и создания четкого контекста для разрешения неоднозначности.

    Практика

    Best practices (это мы делаем)

    Технологии семантического анализа, описанные в патенте, имеют прямое стратегическое значение для SEO.

    • Оптимизация под концепты и Topical Authority: Вместо фокусировки на отдельных ключевых словах, создавайте контент, который полностью охватывает тему (концепт). Убедитесь, что ваш контент генерирует сильный и когерентный вектор концептов, соответствующий семантическому значению целевых запросов.
    • Активное устранение неоднозначности: Если контент посвящен теме с многозначным названием (например, «Ягуар»), необходимо четко задать контекст (автомобиль или животное). Используйте связанные сущности и термины, чтобы помочь системе правильно сформировать Concept Vector страницы и избежать неверной классификации.
    • Использование графовых структур и таксономий: Понимание того, что Google может использовать расстояние обхода графа (traversal distance), подчеркивает важность четкой иерархии сайта, логичной перелинковки и использования микроразметки (например, Breadcrumbs, Schema.org). Это помогает системе понять отношения между концептами на вашем сайте.
    • Фокус на релевантном интенте и эффективности: Патент показывает, что Google корректирует релевантность концептов на основе их эффективности (Performance Factor). В SEO это аналогично: необходимо понимать и удовлетворять пользовательский интент, связанный с концептами, так как система предпочитает контент, ведущий к успешному взаимодействию.

    Worst practices (это делать не надо)

    • Keyword Stuffing и изолированная оптимизация: Фокусировка на плотности ключевых слов без учета базовых концептов неэффективна. Система ищет концептуальное сходство, а не простое совпадение терминов.
    • Создание двусмысленного или размытого контента: Контент, который не предоставляет достаточного контекста для интерпретации основных терминов или смешивает несколько несвязанных концептов, рискует быть неправильно классифицированным или признанным нерелевантным.
    • Игнорирование связей между сущностями: Неиспользование возможностей для связи контента с установленными сущностями и концептами усложняет системе построение точного представления концептов документа.

    Стратегическое значение

    Этот патент является ключевым свидетельством стратегии Google по построению семантического поиска. Он подтверждает, что релевантность рассчитывается на основе сходства базовых концептов, представленных математически. Для Senior SEO-специалистов это означает, что долгосрочная стратегия должна быть направлена на построение авторитетности в рамках определенного концептуального пространства (Topical Authority) и обеспечение максимальной семантической четкости контента.

    Практические примеры

    Сценарий: Оптимизация страницы о «Jaguar» для автомобильного сайта.

    1. Анализ концептов: Определить целевые концепты. Согласно патенту (FIG 11A, 12A), «Jaguar XJS» связан с концептами: Recreation, Autos, Makes and Models, Shopping, Vehicles, European, British.
    2. Действие (Контент): Убедиться, что страница содержит контент, раскрывающий эти концепты. Включить информацию о типе транспортного средства, производителе, стране происхождения, спецификациях и возможностях покупки. Это формирует сильный Concept Vector в автомобильной тематике.
    3. Действие (Структура и Разметка): Разместить страницу в логичной иерархии (например, /cars/british/jaguar/) и использовать микроразметку Vehicle или Product для укрепления связей в графе.
    4. Ожидаемый результат: Система правильно классифицирует вектор концептов страницы. Это повысит семантическое сходство (Concept Similarity Score) для автомобильных запросов о Jaguar и минимизирует риск ранжирования по нерелевантным запросам о животном или спортивной команде.

    Вопросы и ответы

    Что такое «Концепт» (Concept) согласно этому патенту?

    Концепт — это абстрактное представление значения (representation of meaning). Это не ключевое слово, а семантическая единица, например, категория в таксономии (как ODP), семантический кластер или вектор контекста. Это способ для системы понять, о чем идет речь, за пределами буквального текста, например, понять, что «Ягуар» может относиться к концепту «Автомобили» или «Животные».

    Как этот патент, ориентированный на рекламу, влияет на органическое SEO?

    Влияние стратегическое. Технологии, которые Google разрабатывает для понимания релевантности в Google Ads (извлечение концептов, расчет семантического сходства, разрешение неоднозначности), часто являются общими и для органического поиска. Понимание этих механизмов (векторы концептов, графы) критически важно для разработки эффективных стратегий семантического SEO и Topical Authority.

    Что такое вектор концептов (Concept Vector) и как он используется?

    Вектор концептов — это математическое представление семантики документа или запроса. Он состоит из списка концептов и их весов (значимости). Система вычисляет сходство между вектором документа (или рекламы) и вектором запроса, например, используя скалярное произведение (dot product), чтобы определить общую семантическую релевантность.

    Патент упоминает два метода расчета сходства: векторный и графовый. В чем разница?

    Векторный метод (скалярное произведение) используется, когда концепты считаются независимыми. Графовый метод (расстояние обхода) используется, когда концепты имеют зависимости, например, в иерархиях или таксономиях. В этом случае система оценивает семантическое расстояние между концептами, учитывая структуру связей в графе (например, Knowledge Graph).

    Что означает корректировка концептов на основе эффективности (Concept Performance Information)?

    Это механизм машинного обучения с обратной связью (Claim 5). Система отслеживает эффективность рекламы (CTR, конверсии), показанной на основе определенного концепта. Если эффективность высока, вес концепта увеличивается; если нет — уменьшается. Это позволяет Google динамически корректировать значимость концептов на основе их реальной (коммерческой) ценности.

    Как система определяет концепты для документа или запроса?

    Система анализирует контент документа, текст запроса, а также контекстуальные данные, такие как история поиска пользователя. Для рекламы также анализируются ключевые слова таргетинга, контент объявления и целевая страница. Система может использовать внешние источники (таксономии) или внутренние модели классификации для маппинга текста на концепты.

    Как SEO-специалист может использовать знание о графовом расстоянии (traversal distance) на практике?

    Это подчеркивает важность четкой таксономии и иерархии сайта. Если контент находится в структуре, которая логически отражает семантические отношения (например, /Животные/Млекопитающие/Кошачьи/Ягуар/), это помогает поисковой системе понять контекст и расстояние до смежных тем. Правильная перелинковка и микроразметка поддерживают эту структуру.

    Что делать, если мой контент посвящен теме с неоднозначным названием (например, «Меркурий» – планета или металл)?

    Необходимо максимально четко задать контекст. Используйте связанные концепты и сущности в заголовках, введении и основном тексте. Если речь о планете, используйте термины «космос», «Солнечная система», «орбита». Это поможет системе сформировать правильный вектор концептов для вашей страницы и избежать нерелевантного трафика.

    Может ли система определить концепты автоматически, без ручного ввода?

    Да. Патент описывает автономный метод (Claim 14), где система определяет и корректирует концепты, анализируя существующие критерии таргетинга и информацию от других похожих объявлений (коллаборативная фильтрация). Это позволяет масштабировать семантический анализ.

    Учитывает ли система случаи, когда концепт не определен («No Concept»)?

    Да, патент упоминает возможность отслеживания эффективности случаев, когда реклама была показана без использования сопоставления концептов. «No concept» может рассматриваться как специальный концепт, и его эффективность также отслеживается, что может влиять на будущие решения о показе.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.