
Google использует этот механизм для структурирования поисковой выдачи по широким запросам. Система группирует результаты в кластеры на основе их связи с сущностями из Базы Знаний. Для объединения кластеров используются онтологические связи (иерархия, синонимы) и векторная близость (embedding similarity). Система параллельно тестирует несколько алгоритмов и выбирает наилучшую структуру SERP на основе метрик качества (покрытие, баланс, пересечение, силуэт).
Патент решает проблему неструктурированной и недостаточно разнообразной поисковой выдачи по общим (generic) запросам (например, "игры", "инструменты"). В традиционных ранжированных списках по таким запросам часто доминирует небольшое количество популярных элементов, что затрудняет пользователю навигацию и изучение всего спектра релевантных результатов. Изобретение призвано обеспечить логическую структуру и разнообразие (diversity) в выдаче.
Запатентована система кластеризации результатов поиска, основанная на ассоциациях с сущностями (entities) из Базы Знаний. Система группирует результаты, связанные с одной сущностью, а затем объединяет эти группы, используя онтологию сущностей (Entity Ontology – иерархические связи и синонимы) и метрики схожести, рассчитанные в векторном пространстве (Embedding Space). Ключевой особенностью является оптимизационный фреймворк, который параллельно оценивает несколько алгоритмов кластеризации для выбора наилучшей структуры выдачи.
Система работает следующим образом:
first-level clusters). Каждый кластер соответствует одной сущности.embedding similarity) и иерархические методы с онтологическим усилением.Cluster Score), которая агрегирует пять показателей: охват популярных результатов (Coverage), равномерность размеров (Balance), пересечение (Overlap), тематическую однородность и разделение (Silhouette Score и Silhouette Ratio).Высокая. Структурирование поисковой выдачи, использование сущностей и векторных представлений (embeddings) являются центральными элементами современного поиска. Этот патент напрямую описывает механизмы, которые могут использоваться в Google Поиске, Google Shopping, Play Store и других сервисах для улучшения разнообразия и организации результатов по широким запросам.
Патент имеет высокое значение (8/10), особенно для E-commerce, агрегаторов, контентных проектов с большим количеством однотипных страниц и App Store Optimization (ASO). Он показывает, что для видимости по общим запросам критически важна не только релевантность элемента, но и его четкая ассоциация с сущностями и место этих сущностей в онтологии Google. Если контент не может быть качественно кластеризован, он может потерять видимость в структурированной выдаче.
Embedding Space, часто рассчитываемая как косинусное сходство (cosine similarity).Knowledge Base), представляющий человека, место, предмет, идею, тему и т.д.synonyms) или как родитель-потомок (parent-child/hypernyms). Также включает отношения братьев/сестер (co-hypernyms).distance-based).Silhouette Score выше определенного порога.coherence) и разделенность (separation) отдельного кластера. Учитывает сходство внутри кластера и несходство с ближайшим соседним кластером.Embedding Space на основе привязок результатов поиска к сущностям.Claim 1 (Независимый пункт): Описывает основной метод кластеризации с оптимизацией на основе оценок качества.
first-level clusters) на основе привязки результатов к сущностям.Cluster Score для каждого первичного кластера. Ключевое требование: эта оценка основана на Silhouette Score и Silhouette Ratio.Entity Ontology И рассчитанных оценок. Условие объединения: оценка объединенного кластера должна быть лучше, чем оценки исходных кластеров.hierarchical clustering) к объединенным кластерам для получения финальных кластеров, максимизируя их оценки качества.Claim 2 и 3 (Зависимые от 1): Детализируют стратегию объединения на основе схожести.
Система предпочитает объединять онтологически связанные кластеры, которые имеют наивысшую схожесть (определяемую через Embedding Similarity – Claim 3), при условии, что качество (Cluster Score) улучшается.
Claim 4 (Зависимый от 1): Детализирует альтернативную стратегию объединения на основе размера.
Система предпочитает объединять онтологически связанные кластеры, начиная с самых маленьких, при условии, что качество (Cluster Score) улучшается.
Claim 6 (Зависимый от 1): Определяет состав Cluster Score.
Оценка кластера рассчитывается как регрессия пяти метрик: Silhouette Score, Silhouette Ratio, Coverage Score, Balance Score и Overlap Score.
Claim 9 (Независимый пункт): Фокусируется на деталях механизма оценки качества кластеров.
Этот пункт защищает сам метод расчета Cluster Score как регрессии пяти метрик. Он определяет Silhouette Ratio как долю кластеров с Silhouette Score выше порога. Далее этот скоринг используется для итеративного улучшения кластеров, гарантируя, что новые кластеры имеют лучшую оценку.
Claim 14 (Независимый пункт): Описывает метод, комбинирующий онтологию и векторные представления для кластеризации.
Этот пункт акцентирует внимание на использовании как Entity Ontology, так и Embedding Space (сгенерированного из Embedding Model) для объединения кластеров, при этом также требуя использования Silhouette Score и Silhouette Ratio для валидации качества объединения.
Изобретение затрагивает несколько этапов поисковой архитектуры, используя данные, рассчитанные на этапе индексирования, для формирования финальной выдачи.
INDEXING – Индексирование и извлечение признаков
search items) к сущностям в Knowledge Base на основе анализа контента или метаданных.Entity Ontology Engine) генерирует или обновляет Entity Ontology (офлайн-процесс).Trained Embedding Model (например, WALS), создавая Embedding Space для сущностей и результатов поиска.RANKING – Ранжирование
Coverage).METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента происходит на этапе формирования SERP.
Clustering Engine получает набор результатов и применяет фреймворк оптимизации: генерирует первичные кластеры, запускает параллельные алгоритмы кластеризации и оценивает их качество с помощью Cluster Score.Result Engine выбирает наилучший вариант кластеризации и организует финальную выдачу в виде сгруппированных блоков (например, каруселей).Входные данные:
Entity Ontology.Trained Embedding Model.Выходные данные:
insufficiently diverse) или когда требуется предоставить логическую структуру для большого пространства результатов.Описание процесса оптимизации кластеризации (Optimization-based framework).
first-level clusters на основе сущностей. Для них рассчитывается Cluster Score (см. Процесс Оценки).Embedding Similarity).Embedding Similarity усиливается (boost) для онтологически связанных пар.Embedding Similarity.Cluster Score улучшается.Cluster Score или Silhouette Ratio) для всех методов.Процесс Оценки (Cluster Scoring):
Embedding Similarity).Silhouette Score выше порога.Entities) в Knowledge Base. Основаны на анализе текста, метаданных или аннотаций.Entity Ontology, определяющая отношения между сущностями (синонимы, иерархии).Trained Embedding Model, позволяющий проецировать сущности и результаты поиска в единое Embedding Space.Coverage.Система использует пять ключевых метрик для оценки качества кластеров:
Embedding Similarity.Silhouette Score выше порога.Итоговая метрика:
Embedding Similarity). Это позволяет объединять семантически связанные темы.Coverage), равномерному распределению (Balance), минимальному пересечению (Overlap) и четкой семантической обособленности кластеров (Silhouette Score/Ratio).first-level clusters.merged clusters).embedding similarity с другими релевантными элементами, что положительно скажется на Silhouette Score кластера, в который попадет ваш контент.Coverage напрямую зависит от популярности элементов. Работа над поведенческими факторами и конверсиями остается критически важной для того, чтобы ваши элементы считались «топовыми» и учитывались при оценке качества кластеров.embedding similarity с целевыми кластерами, ухудшая Silhouette Score.Embedding Model для оценки фактической семантической близости, поэтому поверхностные манипуляции будут неэффективны.Этот патент демонстрирует переход от ранжирования документов к организации информации на основе семантической структуры знаний. Стратегическое значение для SEO заключается в необходимости мыслить категориями сущностей и их взаимосвязей, а не только запросами и страницами. Построение авторитетности в рамках определенной темы (которая представляет собой кластер сущностей) становится ключом к видимости по широким запросам. Система предпочитает источники, которые помогают ей формировать когерентные и разнообразные кластеры.
Сценарий: Оптимизация интернет-магазина кроссовок по запросу "Баскетбольная обувь"
embedding similarity товаров с целевыми кластерами.Что такое Entity Ontology и почему это важно для SEO?
Entity Ontology – это структура, описывающая отношения между сущностями в базе знаний Google. Она определяет, является ли одна сущность синонимом, родителем, потомком или "братом/сестрой" другой сущности (например, "iPhone" – потомок "Смартфон"). В контексте этого патента, онтология используется для объединения первичных кластеров. Понимание этой структуры позволяет SEO-специалистам строить контентную стратегию так, чтобы охватывать связанные сущности и участвовать в более крупных и значимых кластерах в выдаче.
Как система определяет схожесть между кластерами?
Схожесть (similarity) определяется преимущественно с помощью моделей векторных представлений (Embedding Models). И элементы поиска, и сами сущности отображаются в единое многомерное пространство (Embedding Space). Схожесть рассчитывается как близость между векторами (например, косинусное сходство). Чем ближе векторы двух кластеров (или сущностей, их представляющих), тем они более похожи семантически.
Что такое двухэтапная кластеризация (Two-step Clustering), описанная в патенте?
Это один из методов, который система использует для повышения качества группировки. На первом этапе система объединяет только те кластеры, которые связаны онтологически (например, синонимы или родитель-потомок). Это гарантирует семантическую логичность объединения. На втором этапе к этим укрупненным кластерам применяется стандартная иерархическая кластеризация на основе векторной близости для дальнейшего структурирования выдачи.
Патент упоминает параллельное выполнение нескольких алгоритмов кластеризации. Зачем это нужно?
Это называется оптимизационным фреймворком. Разные наборы результатов могут требовать разных подходов к группировке. Например, для очень фрагментированных результатов может лучше сработать агрессивное объединение маленьких кластеров, а для результатов с четкой иерархией – другой подход. Запуская несколько методов одновременно и оценивая их по единым метрикам качества (Cluster Score), система может динамически выбрать наилучшую структуру SERP для каждого конкретного запроса.
Что такое Silhouette Score и Silhouette Ratio, и почему они так важны?
Silhouette Score измеряет качество отдельного кластера: насколько элементы внутри него похожи друг на друга (когерентность) и насколько он отличается от соседних кластеров (разделение). Silhouette Ratio показывает процент "хороших" кластеров во всей выдаче. Они критически важны, так как гарантируют, что созданные группы тематически однородны и четко разделены. Для SEO это означает, что контент должен быть максимально сфокусированным и семантически когерентным.
Как метрики Coverage и Balance влияют на формирование выдачи?
Coverage (Покрытие) гарантирует, что кластеры содержат наиболее популярные или топовые результаты. Система стремится включить в кластеры то, что пользователи чаще всего ищут. Balance (Баланс) гарантирует, что кластеры имеют примерно одинаковую значимость, предотвращая доминирование одного огромного кластера. Вместе они обеспечивают разнообразие выдачи, включающей популярный контент.
Как я могу улучшить ассоциацию моего контента или товаров с нужными сущностями?
Ключевыми инструментами являются использование структурированных данных (Schema.org) для явного указания сущностей (например, Product, Recipe, Organization), а также качественный копирайтинг, который естественно интегрирует сущности и связанные с ними термины в заголовки и основной текст. Также важно убедиться, что ваш контент семантически соответствует целевой сущности, так как это влияет на его позицию в Embedding Space.
Применяется ли этот патент только к App Store или E-commerce?
Нет. Хотя примеры в патенте часто ссылаются на мобильные приложения ("apps") и веб-магазины, в тексте явно указано, что технология применима к любым коллекциям элементов. Это включает веб-документы (стандартный поиск Google), песни, изображения, видео, товары в маркетплейсах и т.д. Механизмы кластеризации на основе сущностей универсальны.
Что произойдет, если система попытается объединить два кластера, но качество ухудшится?
Патент явно указывает, что в каждом раунде кластеризации система пересчитывает Cluster Score. Если оценка объединенного кластера оказывается хуже (ниже), чем оценки исходных кластеров, система отменяет это объединение. Это защитный механизм, который предотвращает создание некачественных или нелогичных групп.
Как Google создает Entity Ontology? Могу ли я на это повлиять?
Патент описывает, что онтология может создаваться путем анализа совместной встречаемости сущностей в контенте, анализа названий (является ли одно подмножеством другого), близости в Embedding Space, а также с помощью краудсорсинга для верификации связей. Напрямую повлиять сложно, но создание авторитетного контента, который четко описывает связи между сущностями в вашей нише, может помочь Google лучше понять эту область.

Персонализация
Семантика и интент
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
SERP

Мультимедиа
SERP
Семантика и интент

Свежесть контента
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
EEAT и качество
Индексация

EEAT и качество
Свежесть контента
Семантика и интент

Семантика и интент
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
SERP
Семантика и интент

Knowledge Graph
EEAT и качество
Семантика и интент

Local SEO
Антиспам
Поведенческие сигналы

Индексация
Краулинг
Ссылки
