
Google использует систему для автоматического извлечения и проверки «Структурных параметров» (бренды, атрибуты, категории, линейки продуктов) из неструктурированного веб-контента и логов запросов. Система валидирует классификацию с помощью анализа контекстуального сходства, целевого краулинга (поиск фраз типа «X является Y») и анализа распределения кликов. Это позволяет стандартизировать данные о товарах от разных продавцов и формировать структурированную E-commerce выдачу.
Патент решает проблему противоречивой и нестандартизированной классификации товаров разными продавцами в интернете. Когда разные магазины используют разные описания и категории для одних и тех же товаров, поисковым системам сложно агрегировать эту информацию, что приводит к ошибкам (например, путанице между атрибутом и брендом) и ухудшению качества поиска товаров. Изобретение направлено на автоматическое обнаружение, валидацию и стандартизацию структур классификации продуктов.
Запатентована система для автоматического майнинга (извлечения) и валидации Структурных параметров (Structural Parameters) продуктов (например, бренд, атрибут, тип, линейка продуктов) из различных источников. Ключевым элементом является многоступенчатый процесс валидации, который проверяет классификации с помощью анализа Контекстуального сходства (Contextual Similarity), анализа распределения кликов (Click Distribution) и целевого краулинга специфических фраз.
Система работает в двух основных режимах: Индексирование (Майнинг) и Обработка запросов.
Web crawlers собирают контент с сайтов продавцов, производителей, блогов и т.д. Система анализирует этот контент и логи запросов для идентификации потенциальных Структурных параметров. Валидация происходит путем проверки согласованности между источниками, анализа структуры URL, анализа кликов пользователей и целевого поиска подтверждающих фраз (например, «[Термин] это [Параметр]»). Если структура подтверждена, она сохраняется в Product Database.Структурные параметры. Затем генерируется страница результатов, где продукты и/или связанные поисковые подсказки (фасеты) группируются по этим проверенным параметрам.Высокая. Структурирование данных о товарах и точное понимание атрибутов являются критически важными для Google Shopping, Product Knowledge Graph и основного поиска в сегменте E-commerce. Описанные методы автоматического извлечения и валидации атрибутов с использованием машинного обучения и поведенческих сигналов остаются фундаментом современных систем поиска товаров.
Патент имеет высокое значение для E-commerce SEO (85/100). Он раскрывает конкретные механизмы, которые Google использует для понимания структуры продукта (бренд, атрибуты, линейки) независимо от разметки конкретного продавца. Это подчеркивает важность консистентности информации о продукте как на сайте, так и во внешних источниках (обзоры, блоги), которые Google использует для валидации классификации, а также важность поведенческих сигналов (кликов).
granulizing) текстового контента или поисковых запросов.product line), скидка.Structural Parameter. Измеряется методами вроде Евклидова расстояния или косинусного угла.skewness) кликов.Structural Parameters, а также с другой информацией о продукте (URL, изображения, описания).Components, хранящиеся в Product Database.Structural Parameters, если компонент не соответствует существующим, но постоянно появляется в определенном контексте.Claim 20 (Независимый пункт): Описывает процесс майнинга (индексирования) классификационных структур из текстового контента.
Structural Parameter.Contextual Similarity между совпадением и структурным параметром. Ключевой механизм: Эта проверка включает парсинг веб-контента с использованием контекстуальной фразы (contextual phrase), которая содержит этот структурный параметр.Product Database.Ядро изобретения в процессе индексации — это активная валидация. Система не просто принимает классификацию от источника, а проверяет ее, анализируя, как этот термин используется в вебе в связке со структурным параметром. Например, чтобы проверить, является ли «Nikon» производителем, система ищет в вебе фразы, содержащие и «Nikon», и контекст «производителя».
Claim 1 (Независимый пункт): Описывает процесс обработки поискового запроса.
Product Database.Structural Parameter ключевого слова ассоциируется с частью запроса.Contextual Similarity между частью запроса и структурным параметром (используя тот же механизм парсинга веб-контента с предопределенной контекстуальной фразой).Structural Parameters.Claim 5 (Независимый пункт): Аналогичен Claim 1, но фокусируется на генерации поисковых подсказок/связанных запросов.
Процесс идентичен Claim 1, включая проверку Contextual Similarity. Результатом является генерация страницы результатов, содержащей поисковые подсказки (search suggestions), сгруппированные по этим Structural Parameters. (Это описывает блок «Related searches», сгруппированный по Брендам, Типам и т.д.).
Изобретение охватывает несколько этапов поисковой архитектуры, связанных с вертикалью поиска товаров (Product Search/Google Shopping).
CRAWLING – Сканирование и Сбор данных
Система использует как общий, так и целевой (targeted) краулинг. Общий краулинг собирает данные о продуктах. Целевой краулинг используется для валидации: система специально ищет контекстуальные фразы (например, «[X] это [Y]»), чтобы подтвердить классификацию.
INDEXING – Индексирование и извлечение признаков
Основной этап майнинга структур. Здесь происходит:
Structural Parameters.Contextual Similarity, анализа кликов (Click Distribution) и целевого краулинга.Product Database.QUNDERSTANDING – Понимание Запросов
Запрос разбивается на компоненты, которые сопоставляются с Product Database для понимания его структуры (например, Бренд + Атрибут + Тип продукта).
RANKING / METASEARCH (В рамках вертикали товаров)
Система использует извлеченные структурированные данные для формирования выдачи. Результаты (списки товаров) и поисковые подсказки (фасеты/связанные запросы) организуются и группируются на основе идентифицированных Structural Parameters.
Алгоритмы майнинга работают постоянно в офлайн-режиме для обновления Product Database. Алгоритмы обработки запросов применяются в реальном времени при получении продуктового запроса.
Триггеры активации (Валидация):
Процесс А: Майнинг и Индексирование структур (Офлайн/Периодический)
Structural Parameters.Product Database обновляется.Smart Learning), инициируется создание нового Structural Parameter.Product Database.Процесс Б: Обработка поискового запроса (Реальное время)
Key Words в Product Database.Structural Parameters и данные о продуктах (URL, изображения).Structural Parameters.product logs), данные о кликах (web clicks), распределение кликов (click distribution), впечатления (impressions).product search feeds).Euclidean distance, vector modeling, cosine angle distance. Также упоминаются методы подгонки (fitting methods) вроде Least Square Fitting (LSF) для определения значимости связи.not skewed) в сторону одного бренда.skewed) в сторону одного слова/фразы (которое является Брендом).Structural Parameters (бренды, атрибуты, линейки) из неструктурированного контента и поведения пользователей.Contextual Similarity, которая проверяется несколькими методами: консенсус источников, целевой краулинг и анализ поведения пользователей.skewed click distribution).Product Database Google.Contextual Similarity.Click Distribution по всему интернету может выявить такие несоответствия, что приведет к неудачной валидации.Contextual Similarity и валидацию.Патент подтверждает стратегию Google по созданию стандартизированного индекса товаров. Для E-commerce проектов это означает, что контроль над интерпретацией их товаров смещается от данных продавца к общему консенсусу в интернете и поведению пользователей. Долгосрочная стратегия должна включать построение сильного бренда и обеспечение широкого, последовательного и авторитетного освещения продуктов во всей экосистеме (PR, обзоры, контент-маркетинг), а не только оптимизацию собственного сайта.
Сценарий 1: Валидация новой линейки продуктов (использование Click Distribution и Контента)
Компания «BrandA» запускает новую линейку курток «AquaBlock».
Click Distribution. Если пользователи, ищущие «AquaBlock куртки», преимущественно кликают на результаты, связанные с «BrandA» (перекос распределения).Structural Parameter: Product Line для бренда «BrandA», улучшая релевантность выдачи по запросам линейки.Сценарий 2: Валидация нового Атрибута
Появился новый материал «DynaWeave» для ботинок.
Structural Parameter: Attribute.Что такое «Структурные параметры» (Structural Parameters) в контексте этого патента?
Это система классификации, которую Google автоматически присваивает терминам, связанным с продуктами. Примеры включают бренд, производителя, тип продукта, атрибут (например, цвет, материал), продавца, линейку продуктов. Они используются для понимания запросов и организации результатов поиска, например, для создания фильтров или группировки связанных запросов.
Как Google определяет, является ли термин атрибутом (например, «флисовый») или линейкой продуктов (например, «Momentum»)?
Патент описывает правила валидации на основе распределения кликов (Click Distribution). Атрибут считается действительным, если он ассоциируется со многими брендами и клики НЕ перекошены в сторону одного бренда. Линейка продуктов считается действительной, если она почти исключительно ассоциируется с одним конкретным брендом (клики сильно перекошены в сторону этого бренда).
Что такое метод валидации с помощью «контекстуальной фразы» или паттерна «is a»?
Это метод целевого краулинга (targeted web-crawling). Если система не уверена в классификации термина, она активно ищет в интернете фразы вида «[Термин] это [Классификация]». Например, для валидации «Nikon» система может искать фразы типа «Nikon это производитель». Наличие таких фраз в авторитетных источниках подтверждает классификацию.
Как SEO-специалист может использовать знание о валидации через «контекстные фразы»?
Необходимо активно использовать такие конструкции в контенте (описания продуктов, блог, PR-материалы). Если вы хотите, чтобы Google четко понимал вашу классификацию, заявите о ней прямо. Например: «[Название модели] является [Тип продукта] от бренда [Бренд]». Это дает системе явные сигналы для валидации, которые она ищет во время целевого краулинга.
Насколько важна структура URL моего сайта согласно этому патенту?
Она очень важна. Патент прямо указывает, что система извлекает информацию о классификации из структуры URL. Например, URL вида «/apparel/jackets/fleece.html» сообщает системе о категории «apparel», типе «jacket» и атрибуте «fleece». Логичная иерархия URL помогает Google правильно определить Structural Parameters.
Что произойдет, если разные продавцы классифицируют мой товар по-разному?
Система Google собирает данные из множества источников (включая сайты производителей, блоги, обзоры) и использует процессы валидации (консенсус, Contextual Similarity, анализ кликов), чтобы определить наиболее достоверную и стандартизированную классификацию, игнорируя противоречивые данные от отдельных продавцов.
Может ли система изучать совершенно новые атрибуты или категории товаров?
Да. В патенте описано «ПО для умного обучения» (Smart Learning Software). Если новый термин постоянно появляется в определенном контексте (например, новый материал постоянно упоминается рядом с категорией «куртки») и не соответствует существующим структурам, система может научиться распознавать его как новый Structural Parameter после успешной валидации.
Что такое «Contextual Similarity» и как она измеряется?
Это мера того, насколько хорошо термин вписывается в контекст определенной классификации. Технически она измеряется как близость между компонентами в многомерном векторном пространстве, используя методы машинного обучения вроде Евклидова расстояния или косинусного угла. Она учитывает как семантические, так и несемантические связи между словами.
Как этот патент влияет на Off-Site SEO для E-commerce?
Он значительно повышает важность Off-Site сигналов. Поскольку Google использует внешний веб-контент (блоги, обзоры, новости) для валидации брендов, атрибутов и линеек продуктов (например, через целевой краулинг фраз «is a»), крайне важно обеспечить последовательное и правильное описание ваших товаров на сторонних авторитетных ресурсах.
Где в выдаче можно увидеть результат работы этой системы?
Наиболее очевидные примеры — это фильтры в Google Shopping, а также блок «Related Searches» (Связанные запросы) в основной выдаче. В патенте показан пример, где связанные запросы сгруппированы по категориям: «Brands», «Stores», «Types», «Products». Эта группировка является прямым применением извлеченных Structural Parameters.

Семантика и интент
Структура сайта
Поведенческие сигналы

Google Shopping
SERP
Индексация

Семантика и интент
SERP

Краулинг

SERP

Структура сайта
SERP
Ссылки

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Мультимедиа
Семантика и интент

Local SEO
Поведенческие сигналы

Поведенческие сигналы
Персонализация
SERP

Поведенческие сигналы
Антиспам
SERP

Ссылки
Индексация
Поведенческие сигналы

Ссылки
Мультимедиа
Поведенческие сигналы

Поведенческие сигналы
SERP

Мультиязычность
Поведенческие сигналы
Персонализация
