
Google использует системы для преобразования неструктурированных табличных данных (например, из spreadsheets, HTML-таблиц или продуктовых фидов) в структурированный граф знаний. Патент описывает механизмы импорта таблиц, автоматического создания сущностей и связей, а также процесс сверки (reconciliation) для связи данных с существующими сущностями во внешних графах (Knowledge Graph).
Патент решает проблему сложности преобразования данных из распространенных табличных форматов (электронные таблицы, базы данных, фиды, HTML-таблицы) в формат графа данных (Data Graph). Табличные данные часто не имеют явной семантической структуры, понятной машинам. Традиционно перевод этих данных в формат сущностей и связей требовал значительной технической экспертизы. Изобретение автоматизирует и упрощает этот процесс, делая его доступным для нетехнических пользователей.
Запатентована система и пользовательский интерфейс (UI) для импорта табличных данных и их преобразования в структурированный граф данных, называемый Knowledge Document. Ключевым элементом является механизм, позволяющий через привычный табличный интерфейс определять семантику данных: преобразовывать простые текстовые свойства в типизированные сущности и устанавливать связи между ними, включая связи с внешними графами (Public Graphs).
Система работает в несколько этапов:
Document Entities), а столбцы — их простыми свойствами (Property Entities – текстовыми или числовыми значениями).Высокая. Преобразование полуструктурированных данных (таблиц, фидов, списков) в структурированные графы знаний является фундаментальной задачей для Google (переход "от строк к вещам"). Хотя конкретный UI может эволюционировать, а упоминание Freebase устарело, базовые принципы извлечения, структурирования и сверки данных (Reconciliation) остаются крайне актуальными для построения Knowledge Graph и обработки фидов (например, в Merchant Center).
Высокое стратегическое значение (6.5/10). Хотя патент не описывает алгоритмы ранжирования, он раскрывает инфраструктурные механизмы, которые Google использует для приема, структурирования и сверки данных. Понимание этих процессов критически важно для Entity SEO, оптимизации фидов данных (например, Merchant Center) и обеспечения того, чтобы контент сайта (особенно таблицы и списки) был корректно интерпретирован и включен в Knowledge Graph.
Entity Type) и может быть связан с любым количеством других узлов.Document Entity.Freebase (упомянутый в патенте) или современный Google Knowledge Graph.Document Entity (внутренней или внешней) для установления связи.Claim 1 (Независимый пункт): Описывает основной механизм преобразования столбца свойств в НОВЫЙ тип сущности через табличный интерфейс.
labeled relationship) между исходными сущностями (Тип 1) и новыми сущностями (Тип 2). Метка основана на заголовке столбца.Это механизм структурирования: преобразование плоских атрибутов (например, текстовых названий цветов в фиде) в связанные узлы графа (сущности Цвета). Он трансформирует плоские данные (Продукт -> текст "Красный") в связанные данные (Сущность Продукт -> Сущность Цвет Красный).
Claim 6 (Зависимый от 1, описан в патенте): Описывает механизм связывания с СУЩЕСТВУЮЩИМ типом сущности (Сверка/Reconciliation).
Это механизм сверки (Reconciliation). Он позволяет связывать данные внутри графа, сопоставляя текстовые строки с известными узлами.
Claim 21 (Независимый пункт): Описывает механизм связывания с ВНЕШНИМ графом данных (аналогично Claim 10).
matching/Reconciliation) с сущностью во внешнем графе.Это ключевой механизм для интеграции локальных данных (например, продуктового фида) с глобальным Knowledge Graph (например, сверка бренда или категории продукта).
Изобретение затрагивает этапы приема и структурирования данных.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения. Описанные механизмы используются для обработки структурированных и полуструктурированных данных:
Knowledge Graph (внешний граф, как описано в патенте).Взаимодействие с компонентами:
Graph Building Engine для выполнения трансформаций.Tabular Data (вход) и управляет Knowledge Document (выход).Public Graphs (Knowledge Graph) для сверки.Входные данные: Tabular Data (Фиды, CSV, HTML-таблицы, Spreadsheets), существующие графы данных.
Выходные данные: Обогащенный граф данных (Knowledge Document) с типизированными сущностями, семантическими связями и ссылками на внешние графы.
Патент не содержит информации о влиянии на специфические запросы, форматы контента, ниши (YMYL), языковые или географические ограничения в контексте ранжирования.
Reconciliation) текстовых строк с известными сущностями в Knowledge Graph.Патент описывает несколько ключевых процессов трансформации данных.
Процесс А: Начальный импорт и генерация графа
Tabular Data (например, фида).Document Entity для каждой строки.Property Entities (текстовые/числовые значения) для остальных ячеек и связывание их с базовой сущностью. Заголовки столбцов используются как названия связей.Fact Templates на основе семантического анализа заголовков.Процесс Б: Преобразование свойства в НОВЫЙ тип сущности (Claim 1)
Document Entity для каждого уникального значения.Document Entity.Property Entities.Процесс В: Сверка с СУЩЕСТВУЮЩИМ/ВНЕШНИМ типом сущности (Reconciliation, Claim 21)
Knowledge Graph).Патент фокусируется на структурных факторах, используемых для построения графа.
Fact Templates. Имена таблиц/листов используются для начальных типов сущностей.Public Graphs, Knowledge Graph), используемые в процессе сверки (Reconciliation).natural language computation), используемые для определения вычислений и подтипов (если используется интерактивный UI).Патент не описывает метрики ранжирования. Он описывает детерминированные методы структурирования данных:
Fact Templates из заголовков.Knowledge Graph). Это подчеркивает стратегическую важность консистентности данных и использования стандартных идентификаторов.Понимание этого патента критически важно для стратегий, включающих работу со структурированными данными, Entity SEO и оптимизацию фидов данных.
Knowledge Graph.<table>, <th>). Используйте четкие и однозначные заголовки столбцов, так как они используются для определения названий отношений (Relationships) и генерации Fact Templates.@id для четкой идентификации сущностей, облегчая процесс сверки.sameAs для связи ваших локальных сущностей с устоявшимися сущностями во внешних графах (например, Wikidata), что соответствует механизму Claim 21 (связывание с внешним графом).<div> или изображений мешает системам корректно извлекать и структурировать информацию согласно описанным механизмам.Fact Templates.Патент подтверждает стратегический переход Google от анализа ключевых слов к пониманию сущностей и их взаимосвязей ("strings to things"). Он детализирует инфраструктуру, используемую для приема и трансформации сырых данных в Knowledge Graph. Для SEO это означает, что успех все больше зависит от способности предоставить данные в форме, которая легко извлекается, интерпретируется и сверяется (Reconciliation) с глобальным графом знаний. Стратегия должна фокусироваться на точности и полноте представления сущностей.
Сценарий: Оптимизация продуктового фида для корректной сверки брендов
Tabular Data) со столбцом Brand Name. В этом столбце встречаются значения "Nike", "Nikey" и "Найк".Document Entities, а название бренда — текстовым свойством (Property Entity).Knowledge Graph.Описывает ли этот патент алгоритмы ранжирования Google?
Нет. Патент не описывает, как Google ранжирует результаты поиска. Он описывает инфраструктуру и методы для приема табличных данных (фидов, spreadsheets, HTML-таблиц) и их преобразования в структурированный формат графа знаний. Это относится к этапу индексирования и структурирования данных.
Что такое Сверка (Reconciliation) и почему она важна для SEO?
Сверка (Reconciliation, описанная в Процессе В) — это процесс сопоставления текстовой строки (например, названия компании на вашем сайте или в фиде) с конкретной сущностью в Knowledge Graph. Это критически важно для Entity SEO. Если сверка проходит успешно, Google точно знает, о ком или о чем идет речь, что позволяет корректно агрегировать информацию о сущности из разных источников.
Как я могу помочь процессу сверки моих данных?
Используйте максимально чистые, консистентные и однозначные данные. В фидах используйте стандартные идентификаторы (GTIN) и общепринятые названия брендов/атрибутов. На сайте используйте микроразметку Schema.org с указанием @id и ссылками sameAs на внешние авторитетные источники (например, Wikidata).
Что означает преобразование свойства в новый тип сущности (Процесс Б)?
Это процесс структурирования. Например, если в фиде есть столбец "Цвет" с текстовыми значениями, система может идентифицировать все уникальные цвета ("Красный", "Синий"), создать для них отдельные сущности и связать продукты с этими сущностями Цвета, а не просто с текстом. Это делает данные более связанными и понятными для машины.
Актуален ли этот патент для Google Merchant Center и продуктовых фидов?
Да, очень актуален. Механизмы, описанные в патенте (импорт табличных данных, идентификация сущностей, сверка атрибутов), вероятно, лежат в основе того, как Merchant Center и другие системы Google обрабатывают фиды данных и преобразуют их в структурированные сущности продуктов.
Может ли Google использовать эту технологию для анализа HTML-таблиц на моем сайте?
Да, это весьма вероятно. Описанная технология идеально подходит для извлечения сущностей и связей из табличного контента на веб-страницах и его быстрого преобразования в структурированный граф для использования в Knowledge Graph или для формирования расширенных сниппетов (например, табличных featured snippets).
Патент упоминает Freebase. Значит ли это, что технология устарела?
Упоминание Freebase датирует конкретную реализацию, но базовые принципы сверки и подключения к внешним графам знаний остаются актуальными. Сегодня эти механизмы применяются для интеграции с текущим Google Knowledge Graph и Wikidata.
Что такое "Fact Template" и как он влияет на SEO?
Fact Template — это шаблон на естественном языке для описания связи (например, "[А] работает в [Б]"). Он генерируется автоматически на основе заголовков столбцов. Для SEO это означает, что использование четких и описательных заголовков в HTML-таблицах помогает Google правильно интерпретировать семантику ваших данных.
Что такое "Document Entity" и "Property Entity"?
Document Entity — это полноценная сущность (узел) в графе, представляющая объект реального мира (например, Продукт). Property Entity — это простое текстовое или числовое значение (атрибут), привязанное к сущности (например, цена Продукта). Патент описывает, как преобразовывать атрибуты в полноценные сущности.
Каков главный вывод для старшего SEO-стратега из этого патента?
Главный вывод — подтверждение того, что инфраструктура Google настроена на прием и автоматическое структурирование данных для построения Knowledge Graph. Стратегия должна быть сосредоточена на облегчении процессов сверки (Reconciliation) и извлечения данных через предоставление чистой, консистентной и хорошо структурированной информации в фидах и на сайте.

Семантика и интент
Индексация
Техническое SEO


Knowledge Graph
Семантика и интент
Индексация

Семантика и интент

Knowledge Graph
Local SEO

Knowledge Graph
SERP
Семантика и интент

Семантика и интент
Ссылки

Ссылки
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Семантика и интент

Local SEO
Поведенческие сигналы
Свежесть контента

Индексация
SERP
Персонализация

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
SERP
Мультимедиа
