
Google использует этот механизм для автоматической идентификации и группировки вариантов одного продукта (например, разных цветов или размеров), предлагаемых разными продавцами. Система анализирует заголовки товаров в фидах, выявляет закономерности и создает глобальный каталог вариантов. Для разрешения конфликтов в названиях система выбирает терминологию того продавца, который наиболее полно и последовательно описал все варианты.
Патент решает проблему дезорганизации данных в электронных каталогах (например, Google Shopping), когда один и тот же продукт и его варианты (цвет, размер, объем памяти) предлагаются множеством продавцов с использованием разных структур данных и названий (например, "Красный" vs "Red" vs "Rd"). Это затрудняет сравнение предложений и создает высокую когнитивную нагрузку на пользователя. Система стремится автоматически определить, какие товары являются вариантами друг друга, и нормализовать их представление.
Запатентована система для автоматической идентификации вариантов продукта (Product Variants) в большом каталоге, получающем данные от множества продавцов. Изобретение описывает двухэтапный процесс: сначала варианты идентифицируются на уровне отдельного продавца путем анализа заголовков товаров (Product Titles), а затем эти данные агрегируются для построения глобального представления вариантов и разрешения конфликтов в наименованиях и структуре.
Механизм работает следующим образом:
Variant Key (например, "Плеер - Цвет"). Если несколько товаров имеют одинаковый Variant Key, но уникальные значения атрибутов, они группируются в Merchant Cluster.Product Catalog Entries (одна запись на уникальный вариант товара).Product Catalog Entry аннотируется идентификаторами Merchant Cluster, к которым принадлежат её предложения. Строится граф, связывающий Product Catalog Entries, которые имеют общие Merchant Cluster IDs.Graph Component) система определяет, какой Merchant Cluster охватывает наибольшее количество Product Catalog Entries. Этот доминирующий кластер используется как канонический источник для определения структуры вариантов и их названий.Высокая. Организация и структурирование товарных данных является фундаментальной задачей для Google Shopping, Rich Results и общего поиска по товарам. По мере роста электронной коммерции точность идентификации и группировки вариантов остается критически важной для обеспечения качественного пользовательского опыта и эффективного сравнения предложений.
Патент имеет критическое значение для SEO в E-commerce (85/100). Он описывает базовый механизм, с помощью которого Google структурирует товарные предложения в Google Shopping и товарных блоках поиска. Если система не сможет корректно идентифицировать и сгруппировать варианты товаров сайта, это приведет к фрагментированному представлению ассортимента, ухудшению видимости и снижению качества пользовательского опыта при взаимодействии с SERP.
Product Catalog Entries (вершины) связаны, потому что они имеют общие Merchant Cluster IDs (ребра). Представляет собой группу глобально идентифицированных вариантов продукта.Product Offers) от одного конкретного продавца, которые система идентифицировала как варианты одного и того же базового продукта.Merchant Cluster.Claim 1 (Независимый пункт): Описывает основной процесс идентификации и представления вариантов продукта.
Product Offers) от множества продавцов, содержащие заголовки и значения атрибутов вариантов.Merchant Cluster Identifier.Product Catalog Entries, где каждая запись соответствует конкретному варианту продукта.Merchant Cluster Identifier из предложения с Product Catalog Entry, к которой оно принадлежит.Product Catalog Entries, которые имеют пересекающиеся (общие) Merchant Cluster Identifiers.Merchant Cluster Identifier ассоциирован с наибольшим количеством Product Catalog Entries.Ядро изобретения (пункты 6 и 7) — это механизм разрешения конфликтов. Если Продавец А считает, что у товара есть варианты Красный и Синий, а Продавец Б считает, что есть варианты Алый и Лазурный, система смотрит, чей кластер (А или Б) охватывает большее количество уникальных продуктов (Product Catalog Entries). Кластер с наибольшим охватом "побеждает" и определяет канонические варианты и их названия.
Claim 3 (Зависимый от 1): Детализирует, как происходит идентификация вариантов на уровне продавца (Шаг 2 в Claim 1).
Variant Key).Это подтверждает, что система полагается на выявление шаблонов в заголовках, где изменяются только определенные атрибуты.
Изобретение в основном применяется на этапе индексирования и обработки данных, критически важных для E-commerce поиска (например, Google Shopping).
CRAWLING – Сканирование и Сбор данных
Система получает данные о товарах (Product Offers). Это происходит преимущественно через загрузку продуктовых фидов (например, Google Merchant Center).
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Происходит обработка сырых товарных данных для создания структурированного каталога.
Product Titles), извлечение атрибутов, генерация Variant Keys.Merchant Clusters и присвоение им ID.Product Offers в Product Catalog Entries (дедупликация и группировка на основе идентификаторов GTIN/MPN и других данных).Connected Components, определение канонических групп вариантов и нормализация значений атрибутов.RANKING / METASEARCH
Патент не описывает процесс ранжирования, но структурированные данные о вариантах, полученные на выходе этого процесса, напрямую влияют на то, как продукты отображаются в ответ на запрос (например, объединение вариантов в один сниппет с возможностью выбора цвета).
Входные данные:
Product Offers (Заголовки, Идентификаторы, Описания).Выходные данные:
Product Catalog Entries, аннотированные канонической информацией о вариантах (к какой группе они принадлежат и каково их нормализованное значение атрибута).Алгоритм применяется в процессе обработки и индексации товарных фидов или при обновлении продуктового каталога. Он активируется, когда система обнаруживает множественные предложения от одного или нескольких продавцов, которые потенциально относятся к вариантам одного и того же продукта.
Алгоритм состоит из двух основных фаз: группировка на уровне продавца и глобальная группировка.
Фаза А: Группировка вариантов на уровне продавца
Variant Attribute Values (например, "Красный").Variant Attribute Type (например, "Цвет"). Полученный нормализованный заголовок становится Variant Key (например, "Музыкальный Плеер - Цвет").Variant Key.Merchant Cluster) присваивается уникальный Merchant Cluster Identifier.Фаза Б: Глобальная группировка вариантов и нормализация
Product Catalog Entries. Каждая запись представляет один уникальный вариант продукта (используя GTIN, MPN и т.д. для идентификации).Product Catalog Entry определяются все Merchant Cluster Identifiers, связанные с предложениями, которые она содержит. Создаются пары (Merchant Cluster ID, Catalog Entry ID).Product Catalog Entries, которые имеют хотя бы один общий Merchant Cluster Identifier.Graph Components (групп записей, связанных прямо или косвенно). Каждый компонент представляет собой набор связанных вариантов продукта.Graph Component подсчитывается, сколько Product Catalog Entries связано с каждым присутствующим в компоненте Merchant Cluster Identifier.Merchant Cluster Identifier, связанный с наибольшим количеством записей. Это "доминирующий кластер".Product Title (Заголовок товара) является основным источником данных, используемым для идентификации вариантов в этом патенте.Product Catalog Entries.Variant Key.Product Catalog Entries, определяет каноническую структуру и наименования.Product Titles играют ключевую роль в идентификации вариантов, даже при наличии структурированных данных. Система активно анализирует текст заголовков для понимания структуры ассортимента.Merchant Clusters. Неконсистентные данные затрудняют этот процесс.Product Catalog Entries, которые являются основой для глобальной группировки.Рекомендации сфокусированы на оптимизации товарных фидов (например, Google Merchant Center) и структуры данных на сайте E-commerce.
Variant Keys.Merchant Cluster. Это повышает вероятность его выбора в качестве доминирующего/канонического источника данных.Product Catalog Entries.Merchant Cluster.Product Title. Патент показывает, что заголовки активно анализируются.Product Catalog Entries и разрушает группировку вариантов.Патент подтверждает, что качество, консистентность и полнота данных в электронной коммерции являются прямыми факторами успеха. Он демонстрирует, как Google пытается нормализовать хаотичные данные продавцов, находя консенсус. Продавцы с высококачественными, последовательными и полными данными получают преимущество, поскольку они фактически "обучают" систему тому, как должны быть структурированы и представлены их продукты в экосистеме Google. Это напрямую влияет на пользовательский опыт и видимость в товарных вертикалях поиска.
Сценарий: Оптимизация фида для группировки вариантов футболок
Ситуация ДО оптимизации (Плохо):
Продавец предоставляет фид с неконсистентными заголовками.
Результат: Система не может надежно сгенерировать Variant Key из-за разных структур. Товары отображаются в поиске как отдельные продукты, не связанные друг с другом.
Ситуация ПОСЛЕ оптимизации (Хорошо):
Продавец стандартизирует заголовки по шаблону: Продукт + Бренд + Цвет + Размер.
Процесс системы:
Merchant Cluster.Являются ли заголовки (Titles) товаров действительно важными, если я уже предоставляю все атрибуты вариантов через структурированные данные (Schema.org или атрибуты фида)?
Да, заголовки критически важны в контексте этого патента. Он демонстрирует, что Google активно использует анализ Product Titles как основной механизм для идентификации и группировки вариантов на уровне продавца (формирование Merchant Cluster). Хотя структурированные данные также важны, консистентность и информативность заголовков необходимы для обеспечения корректной работы описанного алгоритма.
Как Google решает, какие названия цветов использовать, если я называю цвет "Лазурный", а мой конкурент "Синий"?
Google использует механизм "доминирующего кластера". Система определяет, какой Merchant Cluster (набор вариантов от одного продавца или группы продавцов с одинаковой структурой) охватывает наибольшее количество уникальных вариантов продукта (Product Catalog Entries). Терминология этого доминирующего кластера принимается как каноническая. Если большинство продавцов используют "Синий", Google, вероятно, выберет его.
Что такое Variant Key и почему он важен для SEO?
Variant Key — это нормализованная версия заголовка вашего продукта, где конкретные значения атрибутов заменены их типами (например, "Рубашка - [Цвет]"). Это внутренний механизм Google для идентификации товаров, которые отличаются только вариантами. Для SEO это означает, что структура ваших заголовков должна быть максимально последовательной для всех вариантов, чтобы система могла легко сгенерировать этот ключ и сгруппировать товары.
Что произойдет, если я использую один и тот же GTIN для всех вариантов продукта?
Это серьезная ошибка. На этапе глобальной группировки (Фаза Б) система использует идентификаторы (такие как GTIN) для создания Product Catalog Entries, каждая из которых должна представлять уникальный вариант. Если все варианты имеют один GTIN, система может ошибочно объединить их в одну запись каталога, что приведет к путанице в данных, некорректному отображению и проблемам с отслеживанием.
Как я могу повысить вероятность того, что Google будет использовать именно мою структуру и названия вариантов как канонические?
Чтобы стать "доминирующим кластером", необходимо обеспечить три вещи: 1) Полноту ассортимента (предлагать как можно больше вариантов продукта); 2) Абсолютную консистентность в структуре данных и заголовков для всех этих вариантов; 3) Использование четкой, общепринятой терминологии для названий атрибутов. Чем больше и чище ваш Merchant Cluster, тем выше его авторитет для системы.
Влияет ли этот патент на обычный веб-поиск или только на Google Shopping?
Он в первую очередь влияет на Google Shopping и любые функции поиска, которые отображают структурированные данные о товарах, такие как Rich Results, товарные карусели и панели знаний о продуктах. Корректная группировка вариантов улучшает представление вашего ассортимента в этих блоках, что косвенно влияет на общий трафик и конверсии из органического поиска.
Что такое Merchant Cluster?
Merchant Cluster — это группа товаров от одного продавца, которые система идентифицировала как варианты одного базового продукта. Например, если вы продаете одну модель футболки в трех цветах и последовательно их называете, эти три товара сформируют Merchant Cluster. Эти кластеры затем используются для глобальной группировки вариантов между разными продавцами.
Как система извлекает атрибуты из заголовков?
Патент упоминает использование словарей и сопоставление с шаблонами. Это может включать поиск известных названий цветов, использование регулярных выражений для идентификации размеров или объемов (например, "8GB", "12x24"), и даже рекурсивные определения (например, распознавание "Светло-зеленый", если известны "Светлый" и "Зеленый").
Что произойдет, если мои данные о вариантах противоречат данным производителя?
Система ищет консенсус на основе всех полученных данных. Если данные производителя предоставлены (напрямую или через других продавцов) и они формируют более крупный и последовательный Merchant Cluster, чем ваш, то данные производителя, вероятно, будут выбраны как канонические. Рекомендуется придерживаться терминологии и структуры данных производителя.
Насколько быстро система реагирует на изменения в моем товарном фиде?
Описанный процесс происходит на этапе индексирования и обработки данных каталога. Изменения будут отражены после того, как Google обработает обновленный фид и проведет повторную кластеризацию и анализ графа. Это не происходит в реальном времени и зависит от частоты обновления данных в Google Merchant Center и скорости индексации продуктового каталога.

Google Shopping
SERP
Индексация

Google Shopping
Семантика и интент

Индексация
Краулинг
Семантика и интент

Семантика и интент
Структура сайта
Поведенческие сигналы

Мультимедиа
Индексация
Google Shopping

Local SEO
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Мультимедиа
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Поведенческие сигналы
Персонализация

Knowledge Graph
EEAT и качество
Семантика и интент

Семантика и интент
Ссылки
Knowledge Graph

Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
SERP

Поведенческие сигналы
Антиспам
SERP
