Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google структурирует базу знаний (Онтологию): концепции, типы связей и направленная семантическая близость

    EDITING A NETWORK OF INTERCONNECTED CONCEPTS (Редактирование сети взаимосвязанных концепций)
    • US8051104B2
    • Google LLC
    • 2011-11-01
    • 2003-12-30
    2003 Knowledge Graph Патенты Google Семантика и интент

    Фундаментальный патент (Applied Semantics), описывающий структуру и методы создания Онтологии (Knowledge Graph). Система определяет концепции (сущности) через группы синонимов, устанавливает иерархические и латеральные связи между ними и присваивает этим связям количественную оценку силы (вес). Ключевая особенность — вес является направленным (асимметричным), что позволяет точно рассчитывать семантическое расстояние.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает ограничения традиционного поиска по ключевым словам и недостатки классических онтологий. Поиск по словам плохо справляется с синонимией и полисемией. Традиционные онтологии часто строго иерархичны, не учитывают вес (силу) ассоциаций и не могут смоделировать семантическую близость между концепциями из разных иерархий (например, «лыжник» и «лыжный спорт»). Цель — создать гибкую инфраструктуру для организации информации на основе значения (Meaning-Based Information Organization).

    Что запатентовано

    Запатентована система (Semantic Engine) и метод для создания и редактирования детализированной онтологии (сети взаимосвязанных концепций). Ядром изобретения является структура данных: концепции определяются группами терминов (Synsets), связаны типизированными отношениями (иерархическими и латеральными) и имеют назначенные, направленные значения силы связи (Strength Value). Сила связи от А к Б может отличаться от силы связи от Б к А (асимметрия).

    Как это работает

    Система предоставляет интерфейс для управления онтологией:

    • Определение концепции: Редактор вводит основной термин (Primary Term) и синонимы (Related Terms).
    • Установление связей: Определяются типы связей: иерархические (например, «kind of», «part of») и латеральные (Lateral Bond), соединяющие концепции из разных ветвей.
    • Назначение весов: Каждой связи присваивается направленное значение силы (Bond Strength). Например, вес от «K2 ski» к «ski» сильнее, чем наоборот.
    • Расчет расстояния: Эта структура позволяет системе вычислять Semantic Distance (семантическое расстояние) между любыми концепциями, учитывая веса и возможные штрафы за сложность пути.

    Актуальность для SEO

    Критически высокая. Патент подан Applied Semantics (приобретена Google в 2003) и описывает фундаментальную структуру, лежащую в основе Google Knowledge Graph. Концепции взвешенных, направленных связей и семантического расстояния являются центральными для современного семантического поиска и работы моделей ИИ (BERT, MUM).

    Важность для SEO

    Влияние на SEO фундаментальное (85/100). Хотя это патент на инфраструктуру, а не алгоритм ранжирования, он раскрывает, как именно Google моделирует знания о мире. Понимание этой структуры — концепций, типов связей, направленных весов и семантических расстояний — критически важно для стратегий Entity SEO, построения топикальной авторитетности (Topical Authority) и оптимизации контента под семантическое понимание поисковой системы.

    Детальный разбор

    Термины и определения

    Concept (Концепция / Сущность)
    Нормализованное семантическое представление идеи или объекта. Узел в онтологии.
    Directional Strength (Направленная сила связи)
    Принцип, согласно которому сила связи между А и Б может отличаться от силы связи между Б и А (асимметрия).
    Lateral Bond / Bind (Латеральная связь)
    Неиерархическая связь между концепциями, которые близки в обычном понимании, но находятся в разных иерархических ветвях (например, «skier» и «skiing»).
    Ontology (Онтология)
    Сеть взаимосвязанных концепций (network of interconnected concepts). База знаний или семантическое пространство.
    Primary Term (Основной термин)
    Главный термин, используемый для идентификации концепции.
    Refinition (Уточнение контекста)
    Контекстная информация, помогающая определить значение концепции.
    Semantic Distance (Семантическое расстояние)
    Мера близости между концепциями в онтологии. Рассчитывается на основе силы связей вдоль пути. Может включать штрафы (penalties) или масштабирующие коэффициенты (scaling factors) за сложность пути.
    Semantic Engine (Семантический движок)
    Система, которая управляет онтологией и предоставляет к ней доступ.
    Strength Value / Bond Strength (Значение силы связи / Вес)
    Числовое значение, присвоенное связи, которое определяет, насколько сильно одна концепция связана с другой. Является направленным.
    Synset / Related Terms (Синсет / Связанные термины)
    Группа синонимов и акронимов, которые определяют одну и ту же концепцию.

    Ключевые утверждения (Анализ Claims)

    Патент фокусируется на методах создания и редактирования онтологии и ее структуре данных.

    Claim 1 (Независимый пункт): Описывает метод добавления новой концепции (A) в существующую машиночитаемую сеть.

    1. Система получает пользовательские данные через интерфейс, включающие:
      • Основной термин и один или более синонимов.
      • Определение как минимум одной иерархической связи с существующей концепцией (B) и ее типа.
      • Определение силы связи в направлении от A к B.
      • Определение силы связи в направлении от B к A.
    2. Система добавляет новую концепцию и все данные в сеть.

    Ключевое утверждение: Сила связи в направлении от A к B отличается от силы связи в направлении от B к A. Это юридически закрепляет использование направленных и асимметричных весов в онтологии.

    Claim 10 (Независимый пункт): Описывает метод редактирования существующей концепции (A).

    1. Система получает запрос на редактирование и отображает текущие данные концепции.
    2. Система получает данные для создания новой иерархической связи с концепцией (B), включая ее тип и направленные силы связи (A->B и B->A).
    3. Система обновляет сеть.

    Здесь также ключевым является утверждение о том, что направленные силы связи различаются (асимметрия).

    Зависимые пункты (Claims 2-9 и др.): Уточняют типы отношений (например, «kind of», «part of», «member of») и другие атрибуты концепции, которые могут быть заданы: часть речи, частотность термина (frequency), вероятность (likelihood), широта (breadth), оскорбительность (offensive), контекст (refinition).

    Где и как применяется

    Патент описывает инфраструктуру (Базу Знаний/Knowledge Graph) и инструменты для ее наполнения. Эта инфраструктура поддерживает ключевые этапы поиска.

    INDEXING – Индексирование и извлечение признаков
    Онтология строится с использованием описанных методов. Во время индексирования контента система использует онтологию для распознавания сущностей (Entity Extraction) и разрешения неоднозначностей. Структура онтологии определяет семантический контекст контента.

    QUNDERSTANDING – Понимание Запросов
    Система сопоставляет термины запроса с концепциями в онтологии. Связи и их веса помогают определить интент пользователя, распознать сущности и понять семантический контекст запроса.

    RANKING – Ранжирование
    Понимание, полученное из онтологии, используется в моделях ранжирования. Semantic Distance между концепциями запроса и концепциями документа напрямую влияет на оценку семантической релевантности.

    Входные данные (для системы редактирования):

    • Лингвистические данные (термины, синонимы, определения).
    • Структурные данные (типы связей).
    • Числовые данные (веса связей, частотность терминов).

    Выходные данные:

    • Обновленная онтология (Knowledge Graph) с концепциями, типизированными связями и направленными весами.

    На что влияет

    • Все типы контента и запросов: Поскольку онтология моделирует реальный мир, она влияет на обработку всей информации.
    • Специфические запросы: Наибольшее влияние на информационные и неоднозначные запросы, где требуется точное понимание концепций и контекста.
    • YMYL тематики: Критически важно для точного понимания связей (например, между симптомом и заболеванием, что упоминается в патенте как возможный тип связи).

    Когда применяется

    • Поддержка онтологии: Инструменты редактирования используются непрерывно сотрудниками или автоматизированными системами для поддержания и расширения базы знаний (офлайн или периодически).
    • Использование онтологии: Сама онтология используется при каждом событии индексирования контента и при обработке каждого поискового запроса (в реальном времени).

    Пошаговый алгоритм

    Алгоритм описывает процесс создания новой концепции редактором онтологии.

    1. Инициализация: Пользователь инициирует создание новой концепции через интерфейс Semantic Engine.
    2. Определение терминологии: Ввод основного термина (Primary Term) и связанных терминов (синонимы, акронимы — Synset).
    3. Определение атрибутов: Указание метаданных: часть речи, контекстное определение (Refinition), частотность, вероятность, флаг оскорбительности и т.д.
    4. Идентификация и типизация связей: Определение связанных концепций и выбор типа связи (иерархическая: «kind of», «part of»; или латеральная: Lateral Bond).
    5. Назначение направленной силы связи (Взвешивание): Присвоение числового значения (Strength Value) для каждой связи. Веса назначаются для обоих направлений (от A к B и от B к A) и должны отличаться (асимметрия).
    6. Сохранение: Новая концепция со всеми атрибутами, связями и весами сохраняется в базе данных онтологии (Concept Database).

    Какие данные и как использует

    Данные на входе

    Система редактирования онтологии принимает следующие данные, вводимые пользователем:

    • Контентные/Лингвистические факторы:
      • Primary Term и Related Terms (Synset).
      • Part of Speech (Часть речи).
      • Refinition (Контекстное определение).
    • Структурные факторы (внутри онтологии):
      • Relationship Types (Типы связей: иерархические, латеральные, специализированные).
    • Атрибутивные факторы:
      • Frequency (Частотность термина).
      • Likelihood (Вероятность того, что термин подразумевает эту концепцию).
      • Breadth/Focus (Широта концепции).
      • Offensive nature flag (Флаг оскорбительного содержания).

    Какие метрики используются и как они считаются

    • Strength Value / Bond Strength (Сила связи): Основная метрика. Вводится пользователем для каждой связи и каждого направления. Определяет степень близости между двумя напрямую связанными концепциями.
    • Directionality (Направленность / Асимметрия): Учет того, что вес связи A->B не равен весу B->A.
    • Semantic Distance (Семантическое расстояние): Рассчитывается как путь между двумя концепциями в онтологии (сумма весов связей на этом пути).
    • Penalties (Штрафы при расчете расстояния): В описании патента (раздел, поясняющий FIG. 3) упоминается, что при расчете Semantic Distance могут накладываться штрафы (penalty) или масштабирующие коэффициенты (scaling factor), если путь сложный. Штрафы применяются за смену направления движения (например, вверх по иерархии, а затем вниз) или за пересечение латеральной связи (Lateral Bond). Это увеличивает расстояние и снижает предполагаемую релевантность.

    Выводы

    1. Концепции, а не ключевые слова: Система Google основана на концепциях (сущностях/Entities), которые объединяют все варианты написания и синонимы (Synset), а не на текстовых строках.
    2. Типизированные связи критически важны: Важен не только факт связи, но и ее тип. Lateral Bonds позволяют моделировать реальный мир, связывая концепции из разных иерархий (например, «Лыжник» и «Лыжный спорт»), что необходимо для полного понимания темы.
    3. Веса являются направленными (Directionality/Asymmetry): Это ключевое открытие патента. Ассоциация от А к Б может быть сильной, а от Б к А — слабой (например, «iPhone» -> «Apple» сильнее, чем «Apple» -> «iPhone»). Это фундаментально для расчета релевантности и передачи авторитета.
    4. Квантификация семантической близости: Релевантность рассчитывается как Semantic Distance на основе весов связей.
    5. Сложные пути штрафуются: Semantic Distance учитывает не только сумму весов, но и сложность пути. Штрафы (Penalties) за смену направления или использование латеральных связей делают отдаленные или сложно связанные концепции менее релевантными.

    Практика

    Best practices (это мы делаем)

    • Переход к Entity-Based SEO: Сместите фокус с ключевых слов на концепции/сущности. Определите ключевые сущности в вашей нише и их взаимосвязи. Оптимизируйте контент так, чтобы он четко соответствовал этим концепциям.
    • Четкое определение связей в контенте и структуре: Ясно определяйте отношения между концепциями. Используйте структуру сайта (иерархию категорий) для демонстрации иерархических связей и контекстную перелинковку для демонстрации латеральных связей. Используйте язык, который указывает на тип связи (например, «X — это тип Y»).
    • Использование структурированных данных (Schema.org): Активно используйте микроразметку для явного указания сущностей и их взаимосвязей (isPartOf, brand, mentions, about). Это напрямую соответствует структуре онтологии, описанной в патенте.
    • Построение тематического авторитета (Topical Authority): Создавайте контент, который покрывает кластер семантически связанных концепций (как иерархически, так и латерально). Это уменьшает Semantic Distance между вашим контентом и ядром темы.
    • Учет направленности связей в стратегии (Асимметрия): Работайте над усилением входящих связей от широких концепций к вашему бренду/продукту. Если связь от Категории к Бренду слабая (что типично), ее нужно усиливать через PR, экспертный контент и внешние сигналы (например, попадание в авторитетные рейтинги и обзоры).

    Worst practices (это делать не надо)

    • Keyword Stuffing и фокус на точных вхождениях: Игнорирование концепций и попытка ранжироваться за счет плотности ключевых слов. Система оперирует Synsets.
    • Создание изолированного контента (Content Silos): Публикация статей, которые семантически не связаны с другими материалами. Это увеличивает Semantic Distance от основного тематического ядра сайта.
    • Использование неоднозначной терминологии без контекста: Использование терминов без предоставления достаточного контекста (Refinition) для их разграничения, что затрудняет сопоставление с концепциями в онтологии.
    • Создание сложных и нелогичных связей на сайте: Запутанная навигация и нелогичная перелинковка могут сигнализировать о сложных семантических путях, которые могут быть «оштрафованы» (Penalties) при оценке релевантности.

    Стратегическое значение

    Патент подтверждает фундаментальный сдвиг к семантическому поиску, основанному на Knowledge Graph. Цель долгосрочной SEO-стратегии — максимально точно согласовать информационную архитектуру сайта и его контент с концептуальным пониманием мира Google. Чем сильнее, точнее и логичнее связи между концепциями вы строите на своем сайте, тем лучше поисковая система понимает вашу экспертизу и релевантность.

    Практические примеры

    Сценарий: Оптимизация страницы продукта в E-commerce (Лыжи K2) с учетом направленности связей.

    1. Анализ концепций: Концепции: Продукт («K2 Ski»), Категория («Ski»), Бренд («K2»).
    2. Анализ направленности (на основе патента FIG. 3):
      • От «K2 Ski» к «Ski» (Продукт -> Категория): Сильная связь (Strong relationship).
      • От «Ski» к «K2 Ski» (Категория -> Продукт): Слабая связь (Weak relationship).
    3. Действие (On-Page): Для ранжирования по запросу «K2 Ski» критически важно использовать сильную связь с категорией. Убедитесь, что категоризация безупречна (хлебные крошки, Schema isPartOf), чтобы Google четко связал продукт с концепцией «Ski».
    4. Действие (Стратегия): Для ранжирования по общему запросу «Ski» необходимо преодолеть слабую связь от категории к конкретному продукту. Это требует значительных усилий по построению авторитета бренда K2 на вашем сайте (обзоры, сравнения, экспертный контент о бренде) и во внешних источниках, чтобы усилить эту ассоциацию в онтологии Google.
    5. Ожидаемый результат: Google точно понимает семантический контекст, обеспечивая высокое ранжирование по продуктовым запросам и улучшая позиции по общим запросам по мере укрепления семантических связей.

    Вопросы и ответы

    Что важнее для современного SEO: ключевые слова или концепции (сущности)?

    Концепции (сущности) имеют первостепенное значение. Патент показывает, что Google хранит информацию в виде сети концепций (network of interconnected concepts), где одна концепция объединяет множество синонимов (Synset). SEO-стратегия должна фокусироваться на оптимизации под эти концепции, а не на конкретные формулировки ключевых слов.

    Что такое Направленная сила связи (Directional Strength) и почему она так важна?

    Это означает, что сила ассоциации от А к Б может отличаться от силы ассоциации от Б к А (асимметрия). Например, «iPhone» очень сильно ассоциируется с «Apple», но «Apple» слабее ассоциируется конкретно с «iPhone». Это критически важно для SEO, так как показывает, что релевантность и авторитет передаются неравномерно. Нужно выстраивать стратегию так, чтобы усилить нужные вам направления связей.

    Что такое латеральная связь (Lateral Bond) и зачем она нужна?

    Lateral Bond — это связь между концепциями, которые находятся в разных иерархиях, но тесно связаны в реальном мире (например, «Лыжник» и «Лыжный спорт»). Для SEO это означает, что для построения Topical Authority необходимо покрывать не только иерархию темы, но и эти латерально связанные концепции, демонстрируя полное понимание предметной области.

    Как рассчитывается семантическое расстояние (Semantic Distance)?

    Semantic Distance — это мера удаленности между концепциями. Оно рассчитывается как сумма весов (Strength Values) связей на пути между ними. Чем меньше расстояние, тем выше семантическая близость и релевантность. Важно, что сложные пути могут получать штрафы (Penalties), увеличивая расстояние.

    Что такое «штраф» (Penalty) при расчете семантического расстояния?

    Патент предполагает, что если путь между концепциями сложный (например, требует смены направления движения по графу или пересечения латеральных связей), система может наложить «штраф», увеличивая итоговое семантическое расстояние. Это делает концепции менее релевантными друг другу. Для SEO это подчеркивает важность прямых и логичных связей в контенте и структуре сайта.

    Описывает ли этот патент Google Knowledge Graph?

    Да, этот патент (от Applied Semantics, приобретенной Google) описывает фундаментальную структуру данных и методы управления онтологией, которые легли в основу Google Knowledge Graph. Он детально описывает, как хранятся сущности, типы связей и направленные веса этих связей.

    Как SEO-специалист может повлиять на связи в онтологии Google?

    Напрямую редактировать онтологию нельзя. Однако можно повлиять косвенно: используя точную терминологию, четко определяя связи в тексте, применяя микроразметку Schema.org и получая подтверждение этих связей из авторитетных внешних источников (Википедия, СМИ). Это помогает Google уточнить или укрепить связи в их базе знаний.

    Влияет ли структура моего сайта на то, как Google понимает концепции?

    Да, абсолютно. Четкая информационная архитектура и логичная иерархия категорий помогают Google понять иерархические связи («kind of», «part of»). Продуманная внутренняя перелинковка помогает понять латеральные связи. Структура сайта должна отражать реальную онтологию вашей тематики.

    Как использовать эти знания при создании контент-плана?

    Необходимо проводить исследование сущностей (Entity Research), а не только ключевых слов. Определите основные концепции, выявите иерархические и латеральные связи между ними и оцените силу этих связей. Контент-план должен обеспечивать полное покрытие этого семантического кластера, чтобы минимизировать Semantic Distance до ядра темы.

    Какова связь этого патента с E-E-A-T?

    Онтология является инструментом для оценки E-E-A-T на уровне сущностей (Автора, Организации). Если ваш бренд (как сущность) прочно связан в онтологии (имеет сильные Bond Strengths) с ключевыми концепциями вашей ниши и имеет связи с другими авторитетными сущностями, это служит сильным сигналом E-E-A-T.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.