
Google использует специализированную архитектуру индекса для Knowledge Graph, отличную от веб-индекса. Патент описывает двумерную структуру индекса, которая позволяет обрабатывать сложные запросы к графу (связи сущностей, диапазоны, геолокация) с очень низкой задержкой. Система интегрирует текстовый поиск с графом, предварительно вычисляет сложные пути и использует специальные структуры для оптимизации локального и диапазонного поиска.
Патент решает проблему неэффективности традиционных поисковых индексов (оптимизированных для поиска ключевых слов в документах) при работе с огромными графовыми базами данных, такими как Knowledge Graph. Традиционный одномерный индекс не позволяет эффективно и с низкой задержкой (low latency) выполнять сложные операции, необходимые для графов: обход связей (graph traversal), соединение данных (joins), а также обработку запросов с числовыми диапазонами и условиями близости (proximity queries).
Запатентована система индексирования и обслуживания запросов, специально разработанная для больших графов. Ядром изобретения является двухмерная структура индекса (two dimensional index). В отличие от традиционного индекса (Ключевое слово → Список Документов), этот индекс имеет структуру: Posting List Value → [Intersection Identifiers (1-е измерение)] → [Result Identifiers (2-е измерение)]. Эта структура оптимизирована для хранения триплетов (Субъект-Предикат-Объект) и быстрого выполнения сложных графовых операций.
Система обрабатывает данные графа в виде триплетов. Ключевые механизмы работы:
искусственные триплеты (artificial triples), связывающие сущности с текстовыми токенами из их описаний, что позволяет находить сущности через обычный текстовый поиск.Chain Paths и Converge Paths) вычисляются заранее и сохраняются в индексе, если результат пересечения мал, а исходные данные велики.Bucket Posting Lists для ускорения запросов по числам/датам и Proximity Posting Lists с иерархией местоположений для ускорения гео-запросов.forward path) и обратного (reverse path) прохода для эффективной фильтрации (pruning).Критически высокая. Описанная архитектура является фундаментальной для работы Knowledge Graph и всех связанных с ним функций в поиске Google (Knowledge Panels, Featured Snippets, entity-based search). Механизмы обработки сложных запросов, интеграции текста и графа, а также оптимизации гео-поиска являются основой современного семантического и локального поиска.
Влияние на SEO — значительное (85/100). Хотя патент описывает внутреннюю инфраструктуру и не содержит алгоритмов ранжирования, он имеет критическое значение для понимания того, как Google хранит, структурирует и извлекает информацию о сущностях. Понимание этой архитектуры необходимо для эффективной оптимизации под Knowledge Graph (Entity SEO), локальный поиск и семантическое SEO. Патент объясняет техническую основу, почему структурированные данные и четкое определение связей являются ключевыми.
Text Search Aid) или для оптимизации запросов (например, Proximity Triples).ancestors) в иерархии местоположений (прямой список) или связывает предков с сущностями внутри них (обратный список). Используется для обработки запросов на близость.Intersection ID → Result ID, но индексируется по Result ID. Используется в обратном проходе для эффективного сопоставления отфильтрованных результатов с исходными идентификаторами.intersections) между списками.Proximity Queries.rank) в отсортированном списке всех значений для данного предиката.Location Hierarchy, находящимися в пределах заданного радиуса.Intersection Identifier. Могут содержать контекст (context), например, ранг или точное местоположение.Патент содержит несколько ключевых групп независимых пунктов, защищающих разные аспекты системы.
Группа 1: Структура индекса и Пре-компьютинг (Claims 21-26)
Claim 21 (Независимый): Определяет базовую архитектуру индекса и оптимизацию.
Posting List Value → множество Intersection Identifiers → (для каждого) один или более Result Identifiers.pre-compute) записи, представляющие пересечение между двумя значениями списков публикаций, и сохраняет их в индексе.Это фундаментальное утверждение, защищающее двумерный индекс и стратегию оптимизации через офлайн-вычисления (Chain/Converge Paths).
Claim 24 (Зависимый от 21): Определяет условие для пре-компьютинга.
Предварительное вычисление выполняется, когда количество триплетов для первого и второго значения списка велико (large), а результат их пересечения имеет значительно меньше (significantly fewer) членов. (Дорого вычислять, дешево хранить).
Группа 2: Индекс Близости (Claims 9-16)
Claim 9 (Независимый): Описывает механизм обработки Proximity Queries.
proximity ranges) в пространстве (например, географическом), используя иерархию местоположений (location hierarchy).distance-predicate posting list, связывающий узлы иерархии с сущностями внутри них.Это защищает механизм ускорения локального поиска за счет использования иерархических структур и предварительно рассчитанных областей.
Группа 3: Индекс Диапазонов (Claims 17-20)
Claim 17 (Независимый): Описывает механизм обработки числовых диапазонных запросов.
Bucket Posting Lists, представляющие диапазоны значений объектов.Object-Rank Posting Lists, где объекты ассоциированы с рангом (rank).Это защищает механизм сегментации (bucketing) числовых данных для ускорения фильтрации по диапазонам.
Группа 4: Выполнение Запросов (Claims 1-8)
Claim 1 (Независимый): Описывает механизм выполнения многоэтапных запросов.
forward query path). На первом этапе применяется оператор expand, генерируются пары ID, и результаты передаются следующему этапу как входящие идентификаторы (incident identifiers).reverse query path) для генерации финальных результатов, отличных от результатов прямого пути.Это защищает двухэтапный механизм выполнения запросов (вперед и назад) для эффективного обхода графа и применения ограничений.
Изобретение описывает фундаментальную архитектуру индекса и механизма запросов для Knowledge Graph.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Вся система индексирования работает здесь.
Index 155).Chain Paths и Converge Paths.Bucket Posting Lists (для чисел/дат) и Proximity Posting Lists (для геолокации).Updated Entities) для коррекции Pre-computed Paths.RANKING (Этап Retrieval) / QUNDERSTANDING
На этих этапах система использует созданный индекс для быстрого извлечения данных и сопоставления запросов с сущностями.
Query Resolver использует индекс для выполнения графовых операций (обход, пересечение) с низкой задержкой.Forward/Reverse Path, Retrieval/Filling phase).Query Understanding связывать текст запроса с сущностями графа.Входные данные (Индексирование):
Knowledge Graph.Выходные данные (Индексирование):
Index 155), включающий все типы списков публикаций.Входные данные (Запрос):
Выходные данные (Запрос):
Pre-computed Paths.Bucket Lists.Proximity Lists.Knowledge Graph (как в пакетном режиме, так и в реальном времени).Knowledge Graph.Bucket/Proximity Lists активируются онлайн при наличии в запросе соответствующих условий (диапазон или близость).Процесс А: Построение Индекса (Обобщение FIG. 5, 9, 11)
Ranks). Создание Object Map и Object-Rank Entries.Bucket Entries разной гранулярности.Location Hierarchy).Proximity Entries (связь сущности с областями в заданном радиусе) и Distance Predicate Entries.Chain-Path Entries и Converge-Path Entries.Процесс Б: Выполнение Запроса (Обобщение FIGS. 13A, 13B, 14)
Incident Identifiers) передается следующей стадии.Entity Map.Entity Map для преобразования отфильтрованных Result IDs обратно в Intersection IDs.Pre-computed Path, система проверяет измененные сущности (delta identifiers), пересчитывает путь только для них и объединяет с сохраненными данными.Патент фокусируется на инфраструктуре индексирования графовых данных.
Text Search Aids), обеспечивая текстовый поиск по графу.Location Hierarchy и генерации Proximity Posting Lists.Filterable Predicates и генерации Bucket Posting Lists и Object-Rank Entries.Bucket Posting Lists.Result Identifier. Может содержать ранг (для диапазонных запросов), точное местоположение (для запросов близости) или оценочные сигналы (scoring signals).basic units) и предки (ancestors) используются для определения покрытия территории или времени при обработке запросов близости.Chain Paths и Converge Paths) и специализированных структур для диапазонных (Bucket Lists) и локальных (Proximity Lists) запросов.искусственных триплетов (Artificial Triples) является ключом к тому, как Google связывает текстовые запросы с сущностями в графе. Система индексирует текстовые токены из описаний сущностей для обеспечения текстового поиска по графу.Forward/Reverse Path) и фаз Retrieval/Filling позволяет эффективно обрабатывать сложные запросы с множеством ограничений, минимизируя объем обрабатываемых данных на каждом этапе.worksFor, author, location, offers). Это напрямую соответствует формату триплетов, который индексируется в этой двумерной структуре.Location Hierarchy и эффективно использовать Proximity Posting Lists для быстрого локального поиска.Filterable Predicates, которые индексируются в Bucket Posting Lists, ускоряя поиск с диапазонами и фильтрами.искусственные триплеты (Text Search Aids). Используйте естественный язык и релевантные термины для максимизации точек входа в граф через текстовый поиск.Chain/Converge Paths) и будут чаще извлекаться.Proximity Lists, что негативно скажется на видимости в локальном поиске.Патент подтверждает, что Knowledge Graph — это не просто база данных, а высокопроизводительная поисковая система со специализированной архитектурой. Стратегическое значение для SEO заключается в необходимости перехода от оптимизации страниц к оптимизации сущностей и их связей (Entity SEO). Долгосрочная стратегия должна быть направлена на то, чтобы стать авторитетным источником фактов о сущностях в вашей нише. Чем полнее, точнее и лучше связаны данные, тем эффективнее они будут обрабатываться этой системой.
Сценарий 1: Оптимизация локального бизнеса (Proximity Query)
LocalBusiness на сайте.Location Hierarchy и генерирует Proximity Entries, связывая ресторан с географическими областями (ancestors) для разных радиусов (например, 1 миля, 5 миль).Сценарий 2: Оптимизация интернет-магазина (Range Query)
Product и Offer с указанием цены.Filterable Predicate. Система присваивает ценам ранги и создает Bucket Posting Lists (например, бакет $500-$1000). Товары попадают в соответствующие бакеты.Что такое двумерный индекс и чем он отличается от обычного веб-индекса?
Обычный веб-индекс одномерный: Ключевое слово → Список Документов. Двумерный индекс, описанный в патенте, имеет структуру: Значение Списка → [Идентификаторы Пересечения → [Идентификаторы Результатов]]. Эта структура специально разработана для эффективного хранения триплетов (связей в графе) и позволяет выполнять сложные операции соединения (joins) и обхода графа прямо в индексе, что критически важно для работы Knowledge Graph.
Как Google связывает обычный текстовый поиск с сущностями в Knowledge Graph, согласно этому патенту?
Система использует механизм искусственных триплетов (Artificial Triples) или Text Search Aids. При индексировании текстовые описания и названия сущностей токенизируются. Создаются новые триплеты вида: (Сущность, специальный_предикат, Текстовый Токен). Это позволяет находить сущности при поиске по связанным с ними текстовым терминам, интегрируя текст и граф.
Что такое Chain Path и Converge Path и зачем они нужны?
Это предварительно вычисленные (pre-computed) пути для оптимизации сложных запросов. Chain Path ускоряет многошаговые запросы (например, Актер → Фильм → Режиссер). Converge Path ускоряет запросы с несколькими условиями (например, Актер И Певец). Они позволяют избежать дорогостоящих вычислений во время запроса, если результат пересечения компактен для хранения.
Как этот патент влияет на локальное SEO (Local SEO)?
Патент напрямую описывает механизм Proximity Posting Lists, критически важный для локального поиска. Система использует иерархию местоположений (Location Hierarchy) и предварительно вычисляет, какие объекты находятся в заданном радиусе друг от друга. Это обеспечивает быструю работу запросов типа "рядом со мной". Точность геоданных в GBP и на сайте является ключевым фактором для попадания в эти списки.
Что такое Bucket Posting Lists и как они влияют на поиск?
Bucket Posting Lists оптимизируют запросы по числовым диапазонам (даты, цены, рейтинги). Система заранее группирует сущности по диапазонам значений их атрибутов (бакетам). Это позволяет очень быстро отвечать на запросы с фильтрами (например, "отели с рейтингом выше 4 звезд"), не сканируя весь индекс, а только релевантные бакеты.
Что означает выполнение запроса в прямом (Forward) и обратном (Reverse) проходе?
Это метод эффективной обработки многоэтапных запросов. Прямой проход используется для последовательного применения ограничений запроса и генерации кандидатов на каждой стадии. Обратный проход используется для финальной фильтрации (pruning) результатов на основе всех ограничений запроса и для сбора итоговых данных (Filling Phase). Это обеспечивает точность и полноту ответа.
Какое значение этот патент имеет для сайтов, использующих структурированные данные (Schema.org)?
Значение фундаментальное. Структурированные данные являются основным источником для формирования триплетов, которые затем попадают в этот двумерный индекс. Патент показывает, насколько важны не только сами сущности, но и точность их атрибутов (для Buckets/Proximity) и связи (предикаты) между ними.
Как система обрабатывает обновления данных в реальном времени для пре-вычисленных путей?
Вместо полного пересчета пути при каждом обновлении, система отслеживает изменения (delta identifiers) для затронутых сущностей. Во время запроса система объединяет старые данные из индекса с пересчитанными данными только для этих измененных сущностей. Это позволяет поддерживать актуальность данных без значительной потери производительности.
Что важнее для SEO в контексте этого патента: ключевые слова или сущности?
Сущности и их связи. Патент описывает инфраструктуру, полностью ориентированную на обработку графовых данных (сущностей). Хотя текстовый поиск интегрирован (через Artificial Triples), основа системы — это понимание фактов и отношений. SEO-стратегия должна фокусироваться на четком определении сущностей и связей (Entity SEO).
Описывает ли этот патент алгоритмы ранжирования сущностей?
Нет, патент не описывает алгоритмы ранжирования или факторы авторитетности (E-E-A-T). Он описывает исключительно инфраструктуру для максимально быстрого и эффективного хранения и извлечения (retrieval) данных из графа. Ранжирование происходит на последующих этапах, используя данные, извлеченные этой системой.

Knowledge Graph
Семантика и интент
Local SEO

Knowledge Graph
Семантика и интент
Индексация

Knowledge Graph
Свежесть контента
Семантика и интент

Knowledge Graph
Семантика и интент
SERP

Ссылки

Семантика и интент
Поведенческие сигналы

Антиспам
SERP
Ссылки

EEAT и качество
Антиспам
Ссылки

Семантика и интент
Поведенческие сигналы
Персонализация

Персонализация
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Поведенческие сигналы
SERP
Антиспам

Ссылки
SERP
Техническое SEO

Поведенческие сигналы
Персонализация
Семантика и интент

Ссылки
Поведенческие сигналы
SERP
