Как Google использует Knowledge Graph для генерации коллекций связанных сущностей и облегчения навигации в поиске

Google использует этот механизм для помощи пользователям в изучении тем, связанных с их исходным запросом. Когда пользователь ищет коллекцию сущностей (например, «Романтические фильмы»), система анализирует связи этих сущностей в Knowledge Graph (например, кто режиссер, кто актер). На основе этих связей (триплетов) система генерирует и предлагает пользователю новые коллекции для изучения (например, «Актеры романтических фильмов»).

Описание

Какую задачу решает

Патент решает проблему навигации и исследования темы (exploration) за пределами первоначального запроса. Он направлен на то, чтобы помочь пользователям обнаружить связанные коллекции сущностей, о которых они могут не знать или не знать, как сформулировать запрос для их поиска. Например, пользователь, ищущий фильмы определенного жанра, может не сразу подумать о поиске актеров или режиссеров, связанных с этим жанром. Система облегчает этот процесс, автоматически предлагая релевантные связанные коллекции.

Что запатентовано

Запатентована система и метод для поиска связанных сущностей (Related Entity Search) с использованием Knowledge Graph. Суть изобретения заключается в анализе структуры графа для динамической генерации коллекций связанных результатов. Когда поиск возвращает набор сущностей, система анализирует связи (edges) между этими исходными сущностями и другими сущностями в графе. Анализируя эти связи (структурированные как триплеты), система определяет и предоставляет доступ к новым коллекциям связанных сущностей.

Как это работает

Механизм функционирует на основе анализа связей в Knowledge Graph:

Получение результатов: Система получает набор результатов поиска (сущностей) из Knowledge Graph в ответ на запрос.
Идентификация связей: Для этих сущностей система идентифицирует связанные сущности и определяет ребра графа (graph edges), которые их соединяют.
Анализ триплетов: Система генерирует и анализирует триплеты (сущность 1 — связь — сущность 2), чтобы найти общие закономерности и идентифицировать дополнительные сущности.
Генерация коллекций: На основе анализа формируются связанные коллекции. Например, если найдено много фильмов, связанных отношением «Режиссер» с конкретными людьми, система создаст коллекцию «Режиссеры».
Предоставление доступа: Доступ к этим коллекциям предоставляется пользователю через интерфейс (например, выпадающее меню «Explore», карусели или боковую панель «Related Collections»).

Актуальность для SEO

Высокая. Патент подан в 2012 году, одновременно с запуском Google Knowledge Graph. Описанные механизмы лежат в основе семантического поиска и функций исследования сущностей, которые активно используются и развиваются Google. Представление информации в виде связанных коллекций является центральным элементом современного пользовательского опыта в поиске.

Важность для SEO

Патент имеет высокое значение для SEO (8.5/10), особенно в области оптимизации сущностей (Entity SEO). Он описывает не ранжирование веб-страниц, а то, как Google организует и связывает структурированную информацию. Понимание этого механизма критически важно для обеспечения видимости бренда, продукта или персоны в связанных коллекциях и функциях исследования. Это напрямую влияет на то, как сущность представлена и связана с другими темами в Knowledge Graph.

Детальный разбор

Термины и определения

Entity (Сущность): Вещь или концепция, которая является единичной, уникальной, четко определенной и различимой (например, человек, место, предмет, идея). В графе представлена узлом (node). В патенте используется взаимозаменяемо с Entity Reference.
Knowledge Graph (Граф знаний): Структура данных, состоящая из узлов (nodes) и ребер (edges). Хранит информацию о сущностях и отношениях между ними.
Node (Узел): Элемент Knowledge Graph. Узлы могут представлять сущности, типы сущностей, свойства или литеральные значения.
Edge (Ребро): Семантическая связь, определяющая отношение между двумя узлами в Knowledge Graph (например, «Is A», «Has A»).
Triple / 3-tuple (Триплет): Группа из двух узлов и соединяющего их ребра (Узел 1 — Ребро — Узел 2). Представляет собой факт или утверждение о взаимосвязи (например, «George Washington» — «Is A» — «U.S. President»).
Entity Type (Тип сущности): Определяющая характеристика сущности (например, «Person», «Movie»). В графе представлен узлом типа сущности (Entity type node).
Related Collection (Связанная коллекция): Набор связанных результатов поиска (сущностей), сгенерированный системой на основе анализа отношений в Knowledge Graph.
Differentiation (Дифференциация): Ситуация «многие-к-одному», когда несколько имен (алиасов) связаны с одной сущностью.
Disambiguation (Устранение неоднозначности): Ситуация «один-ко-многим», когда одно и то же имя связано с несколькими сущностями.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод поиска связанных сущностей с использованием Knowledge Graph.

Система получает множество результатов поиска, идентифицирующих сущности из Knowledge Graph.
Система идентифицирует одну или более связанных сущностей (related entities) в Knowledge Graph.
Определяются ребра графа (graph edges), которые связывают узлы исходных сущностей с узлами связанных сущностей.
Для каждого определенного ребра генерируется триплет (triple).
Каждый сгенерированный триплет анализируется для идентификации дополнительных сущностей в Knowledge Graph и связанного множества результатов (related plurality of results).
Система предоставляет доступ к этому связанному множеству результатов.

Ядром изобретения является использование структурного анализа Knowledge Graph (в частности, генерация и анализ триплетов) для определения и представления пользователю новых коллекций связанных сущностей. Это не поиск по ключевым словам, а навигация по семантическим связям.

Claim 2 (Зависимый от 1): Уточняет, что предоставление доступа включает предоставление доступа к коллекции результатов, идентифицирующих сущности, которые все относятся к одному и тому же типу (same type).

Это означает, что система стремится создавать однородные коллекции (например, коллекция только актеров или только фильмов).

Claim 3 (Зависимый от 1): Уточняет, что предоставление доступа включает предоставление ссылок на основе релевантности (relevance).

Claim 31 (Зависимый от 1): Описывает расширение метода для генерации текстовых запросов.

На основе как минимум одного сгенерированного триплета идентифицируются один или несколько альтернативных текстовых запросов (alternative text queries).
Определяются дополнительные результаты на основе этих альтернативных текстовых запросов.
Предоставляется доступ к этим дополнительным результатам.

Это важный пункт, который связывает исследование сущностей обратно с традиционным поиском. Система может использовать информацию из триплета для формулирования нового текстового запроса.

Где и как применяется

Изобретение применяется на нескольких этапах поиска, интегрируя данные из Knowledge Graph в процесс генерации SERP.

INDEXING – Индексирование и извлечение признаков
На этом этапе формируется и обновляется Knowledge Graph. Система извлекает сущности, определяет их типы и устанавливает связи (edges) между ними, формируя триплеты. Эти данные являются основой для работы механизма.

QUNDERSTANDING – Понимание Запросов
Система интерпретирует запрос пользователя и идентифицирует связанные с ним сущности или коллекции сущностей в Knowledge Graph.

RANKING – Ранжирование
Основная система ранжирования генерирует первичный набор результатов, которые могут включать сущности, идентифицированные из Knowledge Graph.

METASEARCH – Метапоиск и Смешивание
Основное применение патента. После того как исходные результаты получены, система активирует механизм Related Entity Search:

Анализируются сущности, присутствующие в результатах.
Система обращается к Knowledge Graph для поиска связанных сущностей и анализа триплетов.
Генерируются связанные коллекции (Related Collections).
Алгоритмы смешивания интегрируют эти коллекции в SERP в виде специальных блоков (карусели, меню «Explore», панели).

Входные данные:

Поисковый запрос пользователя.
Исходный набор результатов поиска (идентифицирующих сущности).
Данные из Knowledge Graph (узлы, ребра, типы сущностей).

Выходные данные:

Доступ к связанным коллекциям сущностей.
Альтернативные текстовые запросы (согласно Claim 31).
Элементы пользовательского интерфейса (UI), представляющие эти коллекции.

На что влияет

Конкретные типы контента и ниши: Наибольшее влияние оказывается на тематики, которые хорошо структурированы в Knowledge Graph: развлечения (фильмы, музыка, книги), биографии, наука, история, география, e-commerce.
Специфические запросы: Влияет на запросы, которые явно или неявно относятся к коллекциям сущностей (например, «романтические фильмы», «книги Шекспира») или к отдельным сущностям, имеющим богатые связи в Knowledge Graph.
Форматы контента: Способствует отображению структурированных данных в SERP, таких как карусели, списки сущностей и панели знаний.

Когда применяется

Алгоритм применяется при следующих условиях:

Триггеры активации: Когда исходный поисковый запрос приводит к результатам, которые могут быть идентифицированы как набор сущностей в Knowledge Graph.
Наличие данных: Когда для этих исходных сущностей существуют значимые связи (edges) с другими сущностями в Knowledge Graph, позволяющие сформировать релевантные и однородные (Claim 2) связанные коллекции.

Пошаговый алгоритм

Процесс генерации связанных коллекций сущностей:

Получение исходных сущностей: Система получает запрос и извлекает из Knowledge Graph множество результатов, идентифицирующих исходные сущности (например, список фильмов по запросу «Романтические фильмы»).
Идентификация связанных сущностей: Система обходит Knowledge Graph для идентификации сущностей, связанных с исходным набором (например, актеров, режиссеров этих фильмов).
Определение отношений (Ребер): Система определяет конкретные ребра графа (graph edges), которые соединяют узлы исходных сущностей с узлами связанных сущностей.
Генерация триплетов: Для каждой найденной связи формируется триплет, состоящий из исходного узла, ребра и связанного узла (например, Фильм А — [Актер] -> Персона X).
Анализ и кластеризация триплетов: Система анализирует сгенерированные триплеты для выявления общих паттернов. Триплеты кластеризуются на основе типа связанной сущности или типа отношения (ребра).
Формирование связанных коллекций: На основе анализа триплетов система формирует связанные коллекции. Система отдает предпочтение коллекциям, где все сущности одного типа (Claim 2).
Ранжирование коллекций: Сформированные коллекции могут ранжироваться на основе релевантности (Claim 3).
(Опционально) Генерация альтернативных запросов: Система может идентифицировать альтернативные текстовые запросы на основе триплетов (Claim 31).
Предоставление доступа (UI): Система предоставляет доступ к выбранным коллекциям через пользовательский интерфейс (например, меню, панель или горизонтально прокручиваемый дисплей).

Какие данные и как использует

Данные на входе

Патент сосредоточен исключительно на использовании структурированных данных из Knowledge Graph. Он не упоминает традиционные факторы ранжирования веб-страниц (контентные, ссылочные, поведенческие и т.д.) для этого механизма.

Структурные факторы (Knowledge Graph Data):
- Entities (Сущности): Исходные и связанные сущности, представленные как узлы (nodes).
- Entity Types (Типы сущностей): Классификация сущностей. Используется для формирования однородных коллекций.
- Relationships (Отношения): Связи между сущностями, представленные как ребра (edges).
- Properties/Values (Свойства/Значения): Литеральные значения, связанные с сущностями.

Какие метрики используются и как они считаются

Патент не детализирует конкретные формулы для расчета метрик, но упоминает следующие концепции, используемые в процессе:

Анализ триплетов (Triple Analysis): Основной метод вычисления. Система анализирует структуру triples для идентификации паттернов связей.
Однородность типа (Type Homogeneity): Используется для обеспечения однородности коллекций (Claim 2). Система проверяет, принадлежат ли сущности в коллекции к одному типу.
Relevance (Релевантность): Упоминается в Claim 3. Конкретный метод расчета релевантности не указан, но он используется для выбора и упорядочивания предлагаемых коллекций.

Выводы

Knowledge Graph как навигационная структура: Патент подтверждает роль Knowledge Graph не просто как источника фактов, а как инструмента для исследования темы (Topic Exploration). Google использует связи между сущностями для проактивного предложения пользователю путей дальнейшего исследования.
Структурный анализ связей (Триплеты): Ключевым механизмом является генерация и анализ триплетов. Понимание того, как сущности связаны (предикат в триплете), позволяет Google создавать осмысленные и релевантные связанные коллекции.
Приоритет однородных коллекций: Система предпочитает генерировать коллекции, состоящие из сущностей одного типа (например, список Актеров). Это улучшает пользовательский опыт и структурирует выдачу.
От сущностей к текстовым запросам: Механизм (Claim 31) позволяет системе преобразовывать семантические связи обратно в альтернативные текстовые запросы. Это демонстрирует глубокую интеграцию между Knowledge Graph и традиционной системой поиска.
Критичность Entity SEO: Для SEO это подтверждает необходимость оптимизации под сущности и их взаимосвязи. Видимость контента зависит от того, насколько хорошо он связан с сущностями, которые Google использует для генерации этих коллекций.

Практика

Best practices (это мы делаем)

Оптимизация присутствия в Knowledge Graph (Entity SEO): Ключевая задача — обеспечить, чтобы ваши основные сущности (бренд, продукты, авторы, ключевые лица) были точно представлены и хорошо связаны в Knowledge Graph. Используйте согласованные данные (NAP) и поддерживайте актуальность официальных профилей.
Использование полной и точной разметки Schema.org: Внедряйте структурированные данные для определения сущностей и, что критически важно, для определения связей между ними. Используйте свойства, которые явно указывают на отношения (например, brand, author, director, actor, isPartOf). Это помогает Google формировать точные триплеты.
Построение Topical Authority через кластеры сущностей: Организуйте контент вокруг ключевых сущностей и тем. Создавайте контент, который покрывает связанные сущности и явно описывает отношения между ними (в тексте и через внутреннюю перелинковку).
Устранение неоднозначности (Disambiguation): Активно работайте над тем, чтобы ваши сущности были отличимы от других сущностей с похожими названиями. Используйте точные идентификаторы (например, через sameAs в Schema.org) и контекст.

Worst practices (это делать не надо)

Фокус только на ключевых словах (Strings, not Things): Игнорирование сущностной оптимизации. Если ваш контент не связан с четко определенными сущностями, он не будет участвовать в механизмах исследования, описанных в патенте.
Неполная или противоречивая разметка Schema.org: Внедрение разметки без учета семантической точности связей. Противоречивые данные могут помешать формированию корректных триплетов.
Создание изолированного контента: Публикация статей, которые не связаны семантически с другими материалами на сайте или с общепринятыми сущностями в нише. Изолированные сущности сложнее включить в коллекции.

Стратегическое значение

Этот патент подтверждает стратегию Google по превращению поисковой системы в систему исследования и открытий, основанную на индексе сущностей (Knowledge Graph). Для долгосрочной SEO-стратегии это означает, что инвестиции в Entity SEO и структурированные данные становятся критически важными. Способность Google генерировать связанные коллекции напрямую влияет на то, как пользователи перемещаются по контенту и открывают для себя новые бренды или продукты.

Практические примеры

Сценарий 1: Оптимизация сайта с обзорами книг

Задача: Повысить видимость сайта по запросам, связанным с авторами и жанрами.
Применение патента: Необходимо помочь Google связать сущности «Книга», «Автор» и «Жанр», чтобы контент сайта попадал в связанные коллекции.
Действия:
- На странице обзора книги (например, «Ромео и Джульетта») внедрить микроразметку Book.
- Четко указать свойство author, ссылающееся на сущность «William Shakespeare» (используя Person разметку и sameAs ссылку на его идентификатор в KG/Wikipedia).
- Указать свойство genre.
Ожидаемый результат: Google распознает отношения (триплеты): (Romeo and Juliet) -[Has Author]-> (Shakespeare). Когда пользователь ищет «Romeo and Juliet», система может сгенерировать связанные коллекции «Shakespeare Plays». Сайт, как авторитетный источник для этих сущностей, имеет больше шансов ранжироваться в этих коллекциях.

Сценарий 2: Оптимизация E-commerce сайта

Задача: Увеличить видимость аксессуаров при поиске основного продукта.
Действия: На странице смартфона (Основной продукт) внедрить разметку Product. Использовать свойство isAccessoryOrSparePartFor или isRelatedTo для связи с чехлами и зарядками (Аксессуары).
Ожидаемый результат: При поиске смартфона Google может идентифицировать связь «имеет аксессуар» и сгенерировать Related Collection: «Аксессуары для этого смартфона», увеличивая видимость ваших товаров в этой коллекции.

Вопросы и ответы

Что такое «триплет» (triple) в контексте этого патента и почему он важен?

Триплет — это базовая структура данных в Knowledge Graph, состоящая из двух узлов (сущностей) и соединяющего их ребра (отношения), например: [Фильм А]-(Режиссер)-[Человек Б]. В этом патенте анализ триплетов является центральным механизмом. Система анализирует эти структуры, чтобы понять, как исходные результаты поиска связаны с другими сущностями, и использует это понимание для динамической генерации релевантных связанных коллекций.

Как система определяет, какие именно связанные коллекции показать пользователю?

Патент указывает на несколько факторов. Во-первых, система предпочитает коллекции, состоящие из сущностей одного типа (Claim 2), например, только Актеры или только Фильмы. Во-вторых, коллекции выбираются на основе релевантности (Claim 3). На практике это, вероятно, определяется силой и частотой связи в Knowledge Graph и популярностью связанных коллекций.

Влияет ли этот патент на ранжирование обычных «синих ссылок»?

Напрямую нет. Патент описывает механизм генерации дополнительных элементов SERP — связанных коллекций сущностей (часто в виде каруселей, панелей знаний или меню «Explore»). Однако он влияет на общую видимость в SERP. Если ваш сайт является источником данных для этих коллекций, это увеличивает его видимость, но сами коллекции могут перехватывать трафик у стандартных результатов.

Как я могу повлиять на то, чтобы мои сущности (продукты, бренд) появлялись в этих связанных коллекциях?

Ключ к влиянию — это обеспечение того, чтобы ваши сущности были точно представлены и хорошо связаны в Knowledge Graph. Это достигается за счет последовательного использования полной и точной разметки Schema.org, управления официальными профилями, а также создания качественного контента, который явно описывает отношения между вашими сущностями и другими известными сущностями в вашей нише.

Что означает Claim 31 о генерации альтернативных текстовых запросов?

Claim 31 описывает, как система может использовать информацию из триплета для формулирования нового текстового запроса. Например, если система анализирует триплет [Романтические Фильмы]-(Имеет Актера)-[Актер X], она может сгенерировать и предложить пользователю текстовый запрос вроде «Актер X в романтических фильмах». Это показывает тесную связь между семантическим пониманием связей и традиционным поиском.

Применяется ли этот механизм только к известным сущностям (знаменитости, крупные бренды)?

Хотя известные сущности имеют более богатые связи в Knowledge Graph, механизм применяется к любым сущностям, которые система может идентифицировать и связать. С развитием Knowledge Graph и улучшением извлечения данных (в том числе с помощью разметки Schema.org), этот механизм все чаще применяется к менее известным или более нишевым сущностям.

Какова роль разметки Schema.org в контексте этого патента?

Разметка Schema.org критически важна. Она является основным способом для SEO-специалистов явно указать Google на сущности, присутствующие на странице, и определить отношения между ними. Предоставляя эти данные в структурированном виде, вы напрямую помогаете Google формировать триплеты, которые затем используются для генерации связанных коллекций, описанных в патенте.

Как этот патент связан с концепцией Topical Authority?

Он напрямую связан. Построение Topical Authority подразумевает создание контента, который покрывает множество взаимосвязанных сущностей в рамках одной темы. Это приводит к формированию плотной сети связей в Knowledge Graph. Такая плотная сеть увеличивает количество потенциальных паттернов, которые система может использовать для генерации связанных коллекций, тем самым повышая видимость авторитетного ресурса.

Где в интерфейсе поиска можно увидеть работу этого патента?

Работу этого патента можно увидеть в различных элементах SERP. Это могут быть карусели связанных сущностей (например, «Актерский состав» под фильмом), блоки «Люди также ищут», фильтры в поиске (например, по брендам или характеристикам), а также любые меню (например, «Explore»), предлагающие перейти к связанным категориям или коллекциям.

Что делать, если Google показывает нерелевантную связанную коллекцию при поиске моего бренда?

Это может указывать на проблемы с тем, как Google интерпретирует вашу сущность или ее связи в Knowledge Graph (проблема Disambiguation или неверные связи). Необходимо провести аудит присутствия вашей сущности в поиске, проверить корректность данных в авторитетных источниках (Википедия, Wikidata) и убедиться, что ваша собственная разметка Schema.org точна и недвусмысленна.