
Google использует систему для автоматического создания и категоризации групп сущностей ("Коллекций") в Knowledge Graph на основе общих признаков. Патент описывает язык правил для определения принадлежности к коллекции и высокоэффективный механизм, который проверяет сущность на соответствие всем коллекциям за один проход, обеспечивая масштабируемость и актуальность данных.
Патент решает проблему масштабируемой классификации сущностей в больших графах знаний (например, Knowledge Graph). Графы содержат мелкозернистые факты (триплеты), но для поиска, анализа данных и таргетинга рекламы часто полезнее понимать сущности на более высоком уровне (например, знать, что кто-то "Отец" или "Гитарист", а не конкретные имена детей или альбомы). Ручное создание таких групп (Collections) не масштабируется. Изобретение автоматизирует обнаружение полезных коллекций и обеспечивает высокоэффективный механизм определения принадлежности сущностей к ним.
Запатентована система и метод для эффективного определения принадлежности узла (сущности) к коллекциям в графе данных. Изобретение включает формальный язык для определения правил коллекций (Collection Definitions) и механизм индексации этих правил (Collection Index). Ключевая особенность — способность системы определить принадлежность сущности ко всем существующим коллекциям за один проход по ее окрестностям (связям) в графе.
Система работает в нескольких режимах:
property-value pairs). Для выбора лучших определений используется метрика Information Gain.Collection Index, разделенный по типам ограничений (Constraint Types).Collection Index. Система отслеживает выполнение условий для всех коллекций одновременно. Если все условия коллекции выполнены, система генерирует в графе связь между сущностью и коллекцией.Высокая. Автоматическая и масштабируемая классификация сущностей является фундаментом для работы Knowledge Graph. Этот механизм напрямую влияет на то, как Google понимает сущности, формирует Knowledge Panels и отвечает на запросы о категориях объектов. Технология остается критически важной для развития семантического поиска.
Патент имеет высокое стратегическое значение для Entity SEO и оптимизации под Knowledge Graph. Он описывает механизм, с помощью которого Google классифицирует сущности. Понимание этого механизма позволяет SEO-специалистам понять, какие именно данные и связи необходимы для того, чтобы ключевые сущности (компании, продукты, авторы) были корректно отнесены к важным коллекциям (например, "Award-Winning Authors" или "San Francisco-based Startups"), что напрямую влияет на видимость и понимание E-E-A-T.
Conditions).Constraints). Если в условии несколько ограничений, они связаны логическим ИЛИ (дизъюнкция).Conditions) коллекции должны быть выполнены (логическое И) для членства. Каждое условие является дизъюнкцией (логическое ИЛИ) ограничений.Constraint Type) и выражение (Constraint Expression).Exists (путь существует), Not Exists (путь не существует), Equals (путь ведет к конкретному значению/сущности), Not Equals (путь не ведет к значению), Template (динамическое создание коллекций на основе значения).Knowledge Graph), где сущности представлены узлами (Nodes/Entities), а отношения между ними — ребрами (Edges/Relationships).Template, которая позволяет значению целевого узла определять, к какой именно коллекции принадлежит сущность (например, [CTRY] в "Presidents of [CTRY]").Патент фокусируется на механизме индексации правил и эффективном вычислении принадлежности к коллекциям.
Claim 1 (Независимый пункт): Описывает систему для эффективной оценки принадлежности.
index of constraints) из определений коллекций.conjunctive).Claim 16 (Независимый пункт): Описывает пошаговый метод оценки принадлежности с использованием структур данных для отслеживания выполнения условий и нарушений.
condition met/not met) для узла.violation found/not found).condition met в первой структуре.violation found во второй структуре.violation not found, установка флага condition met в первой структуре.condition met, генерация связи в графе, указывающей на членство узла в коллекции.Claim 21 (Независимый пункт): Описывает систему, которая генерирует индекс коллекций.
Изобретение является инфраструктурной технологией для управления и использования Графа Знаний (Knowledge Graph).
INDEXING – Индексирование и извлечение признаков
Основное применение. На этом этапе происходит построение самого графа данных. Описанный механизм используется для анализа существующих связей и генерации новых связей, классифицирующих сущности.
E-E-A-T) для дальнейшего ранжирования.QUNDERSTANDING – Понимание Запросов
Коллекции используются для интерпретации запросов о группах объектов. Если пользователь ищет "19th Century Leaders", система может использовать соответствующую коллекцию для быстрого поиска членов (Claim 9).
RANKING – Ранжирование
Принадлежность к коллекциям может использоваться как сигнал ранжирования. Сущности, принадлежащие к высококачественным или релевантным запросу коллекциям, могут получать преимущество.
Входные данные:
Published Collections).Collection Index).Выходные данные:
Collection Entities).Knowledge Graph (статьи об организациях, биографии, описания продуктов).YMYL-тематиках, где классификация экспертов и организаций имеет решающее значение для оценки E-E-A-T.Процесс А: Генерация Индекса Коллекций (Офлайн)
Equals, Exists, Template и т.д.) и выражения.Collection Index, который может состоять из нескольких субиндексов (по одному для каждого типа ограничения). Каждая запись в индексе связывает выражение ограничения с парой (Идентификатор Коллекции, Идентификатор Условия).Процесс Б: Оценка Принадлежности Сущности (Пакетно или Онлайн)
Not Exists/Not Equals), инициализируется значением "нарушение не найдено".Member/Not Member).Template система использует сохраненные значения переменных для генерации связей с конкретными динамическими коллекциями.Патент фокусируется исключительно на данных, хранящихся в графе знаний.
property-value pairs (пары свойство-значение) для каждой сущности. Это включает прямые связи и пути длиной более одного.Collection Definitions) и сгенерированный индекс ограничений (Collection Index).Search Records) для идентификации популярных запросов и оценки популярности коллекций.Метрики делятся на два этапа: Обнаружение коллекций и Оценка принадлежности.
Этап Обнаружения (Discovery):
property-value pairs. Может использовать Information Gain, TF-IDF и учитывать популярность сущностей.Этап Оценки Принадлежности (Membership Evaluation):
Not Exists/Not Equals).Knowledge Graph без ручного вмешательства. Это основа семантического поиска.Conjunctive Normal Form (И условий, состоящих из ИЛИ ограничений) и различных типов ограничений (Exists, Equals, Not) обеспечивает высокую гибкость в определении сложных коллекций.Template крайне важны. Они позволяют динамически генерировать тысячи гранулярных коллекций (например, "Актеры из [Город]", "Выпускники [Университет]") на основе значений атрибутов сущности.sameAs, указывая на Wikidata ID). Это гарантирует, что Google корректно распознает целевой узел (target node) при оценке ограничений типа Equals и Template.Knowledge Panel). Если классификация неверна, это сигнал о том, что Google не видит необходимых связей для включения в правильную коллекцию.Knowledge Graph. В современном поиске видимость часто зависит от того, как классифицирована ваша сущность.Патент подтверждает фундаментальную роль Knowledge Graph в поиске Google. Он демонстрирует, что классификация сущностей — это не ручной процесс, а высоко автоматизированная и масштабируемая система. Для SEO это означает, что управление репутацией и данными о сущностях (Entity Management) является критически важной частью стратегии. Долгосрочный успех зависит от способности предоставить Google четкие, непротиворечивые и полные данные, которые позволят системе корректно классифицировать ваши сущности и оценить их авторитетность (E-E-A-T).
Сценарий: Оптимизация профиля автора для улучшения E-E-A-T
Задача: Улучшить восприятие авторитетности автора медицинских статей.
Equals profession=CardiologistExists medical_licensePerson. Четко указываем jobTitle ("Cardiologist"). Указываем alumniOf (ВУЗ) и worksFor (Клиника), ссылаясь на их сущности (если есть).E-E-A-T автора и контента, который он создает.Что такое "Коллекция" в контексте этого патента и чем она отличается от типа сущности?
Тип сущности (например, "Person", "Organization") — это базовая классификация. Коллекция — это более гранулярная и динамическая группировка, основанная на выполнении определенных правил и наличии атрибутов. Например, сущность с типом "Person" может одновременно принадлежать к коллекциям "19th Century Leaders", "Lawyers" и "Only Children". Коллекции описывают роли и характеристики сущности более детально, чем типы.
Как этот патент влияет на E-E-A-T?
Он напрямую влияет на автоматическую оценку Авторитетности (Authority) и Экспертности (Expertise). Если система Google может автоматически включить автора в коллекции типа "Award-Winning Journalists" или "Certified Doctors" на основе его атрибутов и связей, это служит сильным сигналом E-E-A-T. Этот механизм позволяет Google масштабировать оценку авторитетности без ручной проверки.
Что означает "оценка принадлежности за один проход" и почему это важно?
Это означает, что система проверяет каждую связь (ребро) сущности только один раз, одновременно сопоставляя ее с правилами всех существующих коллекций. Это критически важно для производительности. Вместо того чтобы многократно обходить граф для каждой коллекции, система делает это один раз, что позволяет обрабатывать миллиарды сущностей и поддерживать актуальность Knowledge Graph.
Что такое тип ограничения "Template" и как он используется в SEO?
Тип Template позволяет динамически создавать коллекции на основе значения атрибута. Например, правило "Гражданство=[Страна]" создаст коллекции "Граждане Франции", "Граждане США" и т.д. Для SEO это подчеркивает важность точного указания ключевых атрибутов (местоположение, профессия, университет), так как они напрямую определяют, в какие гранулярные коллекции попадет ваша сущность.
Как Google автоматически находит новые коллекции?
Патент описывает процесс обнаружения (Discovery). Система анализирует группы сущностей, которые часто появляются вместе в поисковых запросах или категориях Википедии. Затем она ищет общие для них свойства в графе и использует метрику Information Gain, чтобы определить, какие свойства лучше всего определяют эту группу. Так формируются кандидаты в коллекции.
Какие источники данных использует Google для этого механизма?
Механизм оценки принадлежности использует исключительно данные из Knowledge Graph (узлы и связи). Сам Knowledge Graph наполняется из различных источников, включая структурированные данные (Schema.org), Wikidata, Wikipedia, официальные сайты и данные, извлеченные из веб-страниц. Ваша задача — обеспечить наличие корректных данных в этих источниках.
Что делать, если моя сущность (например, компания) неправильно классифицирована Google?
Неправильная классификация означает, что система видит связи, которые соответствуют правилам неверной коллекции, или не видит связей, необходимых для правильной. Необходимо провести аудит данных о сущности во всех источниках (ваш сайт, разметка, Wikidata, профили), найти противоречия или отсутствующие факты и исправить их, обеспечив консистентность данных.
Влияет ли этот механизм на локальный поиск?
Да. Локальные бизнесы являются сущностями в графе. Механизм позволяет создавать коллекции типа "Рестораны в [Город]", "Круглосуточные магазины" или "Бизнесы, принимающие [Тип оплаты]". Корректное заполнение данных в Google Business Profile и микроразметке гарантирует попадание в релевантные локальные коллекции.
Что такое Conjunctive Normal Form (CNF) в определении коллекций?
Это означает, что определение состоит из нескольких условий, и все они должны быть выполнены (логическое И). При этом каждое условие может состоять из нескольких ограничений, из которых достаточно выполнить хотя бы одно (логическое ИЛИ). Пример: (Условие 1: Профессия=Президент ИЛИ Профессия=Монарх) И (Условие 2: Год рождения > 1800).
Может ли сущность быть исключена из коллекции, даже если она соответствует правилам?
Да. Патент упоминает возможность использования "черных списков" (blacklist) в определении коллекции. Сущности в черном списке исключаются из коллекции независимо от выполнения условий. Также существуют "белые списки" (whitelist) для принудительного включения сущностей.

Knowledge Graph
Семантика и интент

Knowledge Graph
Семантика и интент

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
Семантика и интент

SERP
Поведенческие сигналы

Семантика и интент
Структура сайта
Ссылки

Антиспам
SERP
Поведенческие сигналы

Индексация
Поведенческие сигналы
Семантика и интент

Мультимедиа
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
SERP

Персонализация
Индексация
Поведенческие сигналы

Ссылки
Антиспам
Краулинг

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP
