
Google использует масштабируемую систему для организации результатов поиска (таких как приложения или товары) в логические группы (кластеры). Система генерирует множество вариантов кластеризации для запроса, а затем использует краудсорсинговых работников для оценки и выбора наилучшего варианта. Лучший вариант дополнительно уточняется на основе консенсуса работников и сохраняется для использования при будущих запросах.
Патент решает проблему качества и масштабируемости при организации поисковой выдачи в виде кластеров (групп). Автоматические алгоритмы кластеризации не всегда создают логичные или высококачественные группы. Ручная оценка экспертами дает высокое качество, но она медленная и не масштабируется. Изобретение предлагает масштабируемый метод использования краудсорсинга для достижения качества, близкого к экспертному.
Запатентована система для выбора и улучшения способа группировки результатов поиска (Search Items), таких как приложения или товары. Система генерирует несколько наборов кластеров (Cluster Sets) для одного запроса, используя разные алгоритмы. Затем она использует краудсорсинговых работников (Crowdsource Workers) для оценки этих наборов и выбора лучшего. Лучший набор проходит этап уточнения (Refinement) также с помощью краудсорсинга.
Система работает в три основных этапа:
Cluster Sets с использованием разных алгоритмов кластеризации, часто основанных на связях с сущностями (Entity Associations) и онтологии.Cluster Set представляется работникам в случайном порядке для независимой оценки. Система рассчитывает оценки (Cluster Set Score), учитывая затраченное время и экспертизу работников, и выбирает лучший набор.Agreement Threshold), система автоматически обновляет определение кластера или отправляет отчет эксперту.Высокая для поиска в маркетплейсах (Google Play, Google Shopping) и магазинах приложений (ASO). Организация больших объемов товаров или приложений в логические группы критична для пользовательского опыта. Использование краудсорсинга (аналогично асессорам или Google Raters) для оценки и улучшения алгоритмов является стандартной практикой Google. Акцент на кластеризации, основанной на сущностях, также актуален.
Влияние на традиционное SEO (веб-поиск) минимальное (2/10). Однако для App Store Optimization (ASO) и Product Search влияние значительное (8/10). Патент показывает, что группировка результатов для конкретных запросов в этих вертикалях определяется не одним алгоритмом, а тщательно отбирается и курируется с помощью человеческой оценки. Ключевым фактором для попадания в правильный кластер является точная ассоциация продукта/приложения с релевантными сущностями (Entities).
Embedding Similarity).Claim 1 (Независимый пункт): Описывает основной метод использования краудсорсинговой оценки для выбора лучшего способа кластеризации.
Cluster Set).Cluster Ratings) от работника.Cluster Set Score для каждого набора на основе полученных рейтингов.Cluster Set Definition) для набора с наивысшей оценкой и ассоциация его с запросом.Ядром изобретения является процесс выбора наилучшего алгоритма кластеризации для конкретного запроса путем краудсорсинговой оценки результатов работы разных алгоритмов. Случайный порядок представления критичен для минимизации предвзятости оценки.
Claim 2 (Зависимый от 1): Уточняет, что система отслеживает время, затраченное работником на оценку, и Cluster Set Score взвешивается на основе этого времени. Это механизм контроля качества краудсорсинга.
Claim 18 (Независимый пункт): Описывает полный процесс, включающий генерацию, оценку и уточнение.
Cluster Sets разными методами.weighted cluster set score) для каждого набора, используя вес на основе экспертизы.Refinement).Изобретение описывает офлайн-процесс оптимизации представления поисковой выдачи для конкретных запросов в специализированных поисковых системах (магазины приложений, маркетплейсы).
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных. Search Items (приложения/товары) ассоциируются с Entities из Knowledge Base. Также устанавливается Entity Ontology и генерируются Embeddings.
RANKING / METASEARCH (Офлайн-оптимизация)
Основное применение патента происходит здесь, как процесс подготовки данных, а не в реальном времени.
Clustering Engine применяет несколько разных алгоритмов для генерации множества Cluster Sets для выбранного запроса.Crowdsource Engine координирует задачи по оценке и уточнению сгенерированных наборов с помощью работников.Cluster Set Definition и сохраняется.METASEARCH – Метапоиск и Смешивание (Онлайн)
Когда пользователь вводит запрос, Result Engine использует сохраненный Cluster Set Definition для организации и отображения результатов поиска в виде кластеров.
Входные данные (для офлайн-процесса):
Search Items.Search Items и Entities.Entity Ontology и Embeddings.Выходные данные (для офлайн-процесса):
Cluster Set Definition для данного запроса.Этап 1: Генерация наборов кластеров (Офлайн)
Search Items, релевантные запросу.Cluster Sets. Примеры алгоритмов из патента: Этап 2: Краудсорсинговая оценка (Офлайн)
Cluster Sets передается пулу работников.Cluster Set. Запускается таймер.Cluster Rating) и набор в целом (Cluster Set Rating), предоставляет текстовое обоснование. Система отслеживает взаимодействие с элементами (просмотр деталей) и фиксирует время.Cluster Sets в случайном порядке.Cluster Set Score для каждого набора путем агрегации рейтингов. Рейтинги взвешиваются на основе затраченного времени, качества обоснования и экспертизы работника.Cluster Set с наивысшей средней взвешенной оценкой.Этап 3: Краудсорсинговое уточнение (Офлайн)
Cluster Set передается пулу работников.Agreement Threshold) для каждого предложения (например, 20% работников предложили слияние).Cluster Set Definition И/ИЛИ генерирует отчет для экспертного анализа (например, если предложено удаление элемента, это может сигнализировать о неверной ассоциации с сущностью).Search Items, метаданные. Ассоциации элементов с Entities (критичны для генерации кластеров).Entity Ontology (связи синонимии и иерархии между сущностями). Embeddings (векторные представления элементов и сущностей).Cluster Ratings, Cluster Set Ratings, текстовые обоснования оценок, время, затраченное на задачу, самооценка экспертизы/осведомленности работника о запросе.Cluster Set Score. Вес увеличивается при высокой экспертизе и достаточном времени. Вес уменьшается (или оценка игнорируется) при недостаточном времени, отсутствии взаимодействия с деталями элементов или низком качестве обоснования.Entities они ассоциированы и как эти сущности связаны в онтологии (Entity Ontology).Agreement Threshold).Refinement) также служит механизмом обратной связи. Если работники предлагают удалить элемент из кластера, это может сигнализировать экспертам о неправильной ассоциации элемента с сущностью в базе данных.Рекомендации применимы в первую очередь для App Store Optimization (ASO) и оптимизации товаров в маркетплейсах (например, Google Shopping).
Entities (темами, категориями, брендами). Поскольку кластеризация строится на этих ассоциациях, ошибки приведут к попаданию в нерелевантные группы.Refinement) позволяет работникам предлагать удаление нерелевантных элементов из кластера, что может привести к ручной проверке экспертами и исправлению некорректных ассоциаций.Entity Ontology).Патент подтверждает стратегию Google по использованию комбинации машинного обучения (генерация кластеров, эмбеддинги) и человеческой оценки (краудсорсинг) для улучшения качества поиска в специализированных вертикалях. Для ASO и Product Search это означает, что структура выдачи не является чисто алгоритмической, а проходит этап валидации и курирования людьми. Стратегия оптимизации должна фокусироваться на четком представлении продукта и его связи с релевантными сущностями.
Сценарий: Оптимизация приложения для изучения гитары (ASO)
Search Item Delete Refinement). Это может привести к проверке экспертом.Применяется ли этот патент к основному веб-поиску Google (SEO)?
Напрямую нет. Примеры и описание в патенте четко указывают на Search Items, такие как приложения в веб-магазине или товары в маркетплейсе. Патент описывает, как организовать выдачу в этих специализированных поисковых системах (ASO, Product Search), а не как ранжировать или кластеризовать веб-страницы в органическом поиске.
Что такое "Cluster Set" и почему их несколько?
Cluster Set — это один из вариантов группировки результатов для запроса. Поскольку не существует единого идеального алгоритма кластеризации, система генерирует несколько наборов, используя разные подходы (например, один фокусируется на схожести эмбеддингов, другой — на онтологических связях). Это позволяет выбрать наилучший способ организации выдачи для каждого конкретного запроса.
Как система определяет, в какой кластер попадет мой товар или приложение?
Согласно патенту, кластеризация в значительной степени основана на Entity Associations. Если ваш товар ассоциирован с сущностью А, и система решает создать кластер вокруг сущности А, ваш товар попадет в этот кластер. Точность ваших метаданных и описаний, позволяющих системе установить эти ассоциации, критически важна.
Кто эти краудсорсинговые работники и как контролируется качество их работы?
Это люди, выполняющие задачи за вознаграждение (аналог асессоров). Патент предусматривает строгие меры контроля качества: рандомизация порядка задач для избежания предвзятости, отслеживание затраченного времени, учет экспертизы работника и требование текстовых обоснований. Оценки от недобросовестных работников отбрасываются или имеют низкий вес.
Что происходит на этапе уточнения (Refinement)?
На этом этапе работникам показывают лучший набор кластеров и просят предложить улучшения: объединить слишком похожие кластеры, удалить плохие кластеры, переместить элементы или темы между кластерами или предложить лучшие заголовки. Это позволяет тонко настроить структуру выдачи.
Что такое "Agreement Threshold" и как он работает?
Это минимальный процент работников, которые должны согласиться с предложенным изменением (например, слиянием двух кластеров), чтобы оно было принято. Если 20% работников предлагают одно и то же изменение, система может автоматически обновить определение кластера или отправить отчет эксперту для анализа.
Могу ли я повлиять на то, как Google кластеризует результаты по моему запросу?
Напрямую повлиять на выбор алгоритма или оценки работников нельзя. Однако вы можете повлиять на то, как ваш собственный продукт или приложение будет представлено в этих кластерах, обеспечив максимально точные и полные ассоциации с релевантными сущностями (Entities) через метаданные и описания.
Что произойдет, если я попытаюсь манипулировать сущностями, чтобы попасть в нерелевантный кластер?
Если ваш продукт не соответствует тематике кластера, краудсорсинговые работники на этапе уточнения могут предложить удалить его (Search Item Delete Refinement). Если достаточное количество работников это предложит, это может привести к проверке экспертом и исправлению ассоциаций вашего продукта с сущностями, что негативно скажется на видимости.
Происходит ли этот процесс в реальном времени при каждом запросе?
Нет. Генерация, оценка и уточнение кластеров — это офлайн-процесс. Система заранее подготавливает оптимальную структуру выдачи (Cluster Set Definition) для запроса и сохраняет ее. Когда пользователь вводит этот запрос, система просто использует заранее подготовленное определение для отображения результатов.
Какова роль "Entity Ontology" в этом процессе?
Entity Ontology определяет связи между сущностями (синонимы, иерархия). Некоторые алгоритмы кластеризации используют эти связи для объединения кластеров. Например, кластеры "Обучение" и "Уроки" могут быть объединены, если система знает, что эти сущности тесно связаны в онтологии.

EEAT и качество
Свежесть контента
Семантика и интент

SERP
Семантика и интент
Knowledge Graph

Knowledge Graph
Семантика и интент
SERP

Google Shopping
SERP
Индексация

Семантика и интент
SERP
Поведенческие сигналы

SERP
Поведенческие сигналы
Семантика и интент

Семантика и интент
SERP
Ссылки

Семантика и интент
Мультимедиа
Персонализация

Поведенческие сигналы
Мультимедиа
Семантика и интент

SERP
EEAT и качество
Поведенческие сигналы

Ссылки
SERP
Структура сайта

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

EEAT и качество
Семантика и интент

Поведенческие сигналы
