
Патент описывает систему (исторически Google Base), позволяющую владельцам загружать структурированные данные и определять собственные атрибуты (пары имя/значение) и метки. Google индексирует эту информацию и использует наиболее популярные атрибуты для создания динамических фильтров в результатах поиска, позволяя пользователям уточнять запросы. Система также автоматически определяет и продвигает популярные пользовательские атрибуты в статус "основных" для улучшения структуры данных.
Патент решает проблему поиска и организации разнородных коллекций данных, которые могут не иметь заранее определенной или единой структуры. Традиционным поисковым системам сложно эффективно сужать большие наборы результатов на основе специфических характеристик элементов (например, цены, цвета, локации). Изобретение создает платформу (Google Base), позволяющую поставщикам контента (Providers) самостоятельно структурировать свои данные с помощью атрибутов и меток, делая их доступными для детального поиска и фасетной фильтрации.
Запатентована система для приема, структурирования и поиска данных, загружаемых пользователями. Ключевой особенностью является возможность для Providers определять собственные Attributes (пары имя/значение) и Labels (теги без значения) для своих элементов данных (data items). Система динамически использует эти атрибуты для уточнения поиска, предлагая пользователям фильтры на основе наиболее популярных атрибутов в результатах. Кроме того, запатентован механизм автоматической эволюции схемы данных, при котором часто используемые пользовательские атрибуты продвигаются в статус основных (Core Attributes).
Система работает в нескольких режимах:
Bulk Upload, FTP, RSS), определяя тип информации (Information Type) и назначая атрибуты и метки.Item Rank) на основе полноты и качества данных.Popularity Rank, учитывающий частоту и CTR) и отображает их как динамические фильтры.Core Attributes.Высокая. Хотя платформа Google Base, описанная в патенте (оригинальная заявка подана в 2005 году), устарела, описанные механизмы лежат в основе критически важных современных систем Google. Принципы загрузки структурированных данных через фиды, использования атрибутов для ранжирования (Item Rank) и динамической фильтрации являются ядром Google Shopping (Merchant Center), а также вертикалей Поиска Работы, Рецептов, Недвижимости и обработки структурированных данных (Schema.org) в целом.
Патент имеет критическое значение (85/100) для SEO в e-commerce и для любых вертикалей, зависящих от фидов данных. Он описывает фундаментальные механизмы того, как Google обрабатывает и ранжирует структурированные элементы. Полнота и качество предоставляемых атрибутов напрямую влияют на Item Rank (независимый от запроса ранг) и определяют, по каким фильтрам элемент будет доступен пользователям. Понимание этого патента необходимо для эффективной оптимизации товарных фидов и структурированных данных.
Core Attributes.Information Type. Этот набор может эволюционировать автоматически.Core Attributes.ВАЖНО: В предоставленном тексте патента (US20130339338A1), который является патентом-продолжением, Claim 1 отменен (canceled). Claims 2-21 фокусируются исключительно на механизме автоматического продвижения атрибутов в статус основных (Core Attributes).
Claim 2 (Независимый пункт): Описывает основной процесс эволюции схемы данных.
Core Attributes для элементов определенного Information Type.Core Attribute: атрибут, который идентифицируется поставщику при добавлении нового элемента этого типа, и для которого запрашивается значение).Core Attributes.Это описывает автоматизированный процесс обновления схемы данных (предлагаемых атрибутов) на основе анализа паттернов использования кастомных атрибутов. Если многие поставщики начинают использовать новый атрибут, система автоматически делает его стандартом для этой ниши (краудсорсинг схемы).
Claim 3 (Зависимый от 2): Описывает применение обновленного набора Core Attributes.
Как только атрибут продвигается, он становится частью стандартной формы ввода. Система отправляет ответ поставщику (например, форму), который запрашивает значение для этого нового основного атрибута.
Claims 4, 5, 6 (Зависимые от 2): Определяют критерии (метрики популярности) для продвижения атрибута.
Google определяет "популярность" для эволюции схемы, используя комбинацию метрик: взаимодействие пользователей, видимость в SERP и скорость принятия индустрией.
Изобретение охватывает инфраструктуру для работы со структурированными данными (Google Base и его наследники, например, Merchant Center).
CRAWLING – Сканирование и Сбор данных (Data Acquisition)
Система принимает данные через прямую загрузку от поставщиков (UI, Bulk Upload, FTP, RSS), что является альтернативой традиционному краулингу веб-страниц.
INDEXING – Индексирование и извлечение признаков
Attributes и Labels извлекаются, нормализуются (Normalization) и сохраняются.Item Rank (независимая от запроса оценка) на основе полноты предоставленных данных (количество атрибутов, изображений, длина описания и т.д.).Attribute Promotion работает в офлайн-режиме, анализируя статистику использования атрибутов для эволюции схемы данных (обновления Core Attributes).RANKING – Ранжирование
Search and Query Engine извлекает элементы, соответствующие запросу. Ранжирование использует как зависимую от запроса оценку (IR score), так и независимую (Item Rank). Формула ранжирования (упомянутая в Description): FinalScore=QueryDependentRank∗ItemRank.
RERANKING – Переранжирование (Динамическая фильтрация)
Основное применение во время поисковой сессии. Система анализирует атрибуты в наборе результатов ранжирования для определения наиболее популярных (используя Popularity Rank) и представляет их как динамические фильтры (Twiddlers для уточнения). Когда пользователь применяет фильтр, результаты переранжируются (фильтруются).
Google Shopping, Google Jobs и т.д.Процесс А: Обработка запроса и динамическая фильтрация (На основе Description)
Item Rank и IR score.Popularity Rank) учитывает частоту в результатах и историю кликов пользователей (CTR) по этим атрибутам в качестве фильтров.Процесс Б: Эволюция схемы данных (Promoting Attributes to Core) (На основе Claims)
Information Type.Core Attributes для данного Information Type.Система использует данные, предоставленные поставщиками, а также данные о поведении пользователей.
Attributes (пары имя/значение), Labels (метки), Information Type (тип информации). Указаны типы данных атрибутов: BOOLEAN, INT, FLOAT, URL, STRING, LOCATION, DATE, DATE RANGE.Item Rank.Popularity Rank) при выборе фильтров для отображения.Recency (свежесть) элемента упоминается как фактор ранжирования.Item Rank. Также упоминается возможность использования PageRank веб-сайта поставщика.Item Rank (Query Independent Rank): Независимая от запроса оценка элемента. Рассчитывается на основе агрегации: Query Dependent Rank: Стандартная оценка релевантности (IR score).Final Score (Итоговая оценка ранжирования): QueryDependentRank∗QueryIndependentRank (включая Item Rank).Labels) имеют больший вес, чем заголовки (Titles), которые имеют больший вес, чем описания (Descriptions). Значения атрибутов (Attribute values) имеют тот же вес, что и метки.Popularity Rank (PR) (для атрибутов): Используется для выбора фильтров. PR=Популярностьврезультатахзапроса∗CTR дляэтогозапроса.Shopping, Jobs и т.д.).Item Rank): В отличие от традиционного SEO, здесь критична структурированная полнота. Элементы с большим количеством атрибутов, меток, изображений и длинным описанием получают более высокий Item Rank, что повышает итоговый Final Score.Core Attributes).Рекомендации критически важны для E-commerce (Google Shopping) и других вертикалей, использующих фиды данных.
Core Attributes, предоставляемые Google для вашего Information Type.Item Rank за счет полноты данных и увеличивает шансы на попадание под специфические фильтры пользователей.Query Dependent Rank (IR score), но помните, что значения атрибутов и метки имеют больший вес.Item Rank: Предоставляйте высококачественные изображения (Image URL), полные описания и максимально возможное количество меток (Labels). Все это учитывается в расчете Item Rank.Item Rank. Патент указывает на необходимость обновления фида как минимум раз в 30 дней.Item Rank и ограничивает видимость элемента при использовании фильтров.Item Rank.Патент подтверждает стратегический переход Google к поиску на основе сущностей (entity-based search) и критическую роль фидов данных. Успех в таких вертикалях, как Google Shopping, полностью зависит от освоения этой системы, основанной на атрибутах. Он объясняет, как Google структурирует информацию за пределами традиционных веб-страниц и как адаптирует свое понимание различных рынков на основе данных, предоставляемых самими участниками рынка (эволюция Core Attributes).
Сценарий: Оптимизация товарного фида для интернет-магазина электроники
Core Attributes: Убедиться, что все основные атрибуты для типа "Products" заполнены: Brand, UPC (GTIN), Manufacturer ID (MPN), Price, Condition, Image URL, Title, Description.Item Rank: product_detail в GMC). Это улучшит полноту данных и позволит фильтровать по ним.Item Rank, что улучшает его общие позиции в выдаче. Он также становится видимым, когда пользователи применяют динамические фильтры по специфическим характеристикам (RAM, Processor, Refresh Rate).Какое отношение этот патент имеет к современному Google Shopping?
Этот патент описывает Google Base, который является прямым предшественником Google Shopping и Google Merchant Center. Все описанные механизмы — загрузка фидов (Bulk Upload), использование атрибутов для описания товаров, расчет Item Rank на основе полноты данных и динамическая фильтрация результатов — являются фундаментом работы современного Google Shopping. По сути, это инструкция по оптимизации товарных фидов.
Что такое Item Rank и как его повысить?
Item Rank — это независимая от запроса оценка качества и полноты элемента данных. Патент указывает, что он рассчитывается на основе рейтинга поставщика и сигналов элемента: длины описания, количества атрибутов, меток, наличия изображений, свежести данных и отсутствия жалоб на спам. Для его повышения необходимо максимально полно и точно заполнять все поля в фиде данных.
Как Google решает, какие фильтры (атрибуты) показать пользователю для конкретного запроса?
Система анализирует топовые результаты поиска и определяет наиболее популярные атрибуты среди них. Популярность (Popularity Rank) рассчитывается не только по частоте встречаемости атрибута в результатах, но и по тому, как часто пользователи кликают на этот атрибут в качестве фильтра (CTR) для данного запроса. Это динамическая система, адаптирующаяся к поведению пользователей.
Стоит ли использовать кастомные (пользовательские) атрибуты в фидах?
Да, это рекомендуется. Во-первых, это увеличивает полноту данных, что положительно влияет на Item Rank. Во-вторых, это позволяет вашим элементам появляться при использовании специфических фильтров. В-третьих, если ваш кастомный атрибут станет популярным в нише, Google может автоматически продвинуть его в статус Core Attribute (Основного атрибута).
Что такое "Продвижение в Core Attributes" (Attribute Promotion)?
Это механизм автоматической эволюции схемы данных. Если система замечает, что многие поставщики начинают использовать определенный кастомный атрибут для одного типа информации (например, все стали указывать "Емкость аккумулятора" для телефонов), и этот атрибут популярен у пользователей, система автоматически добавит его в стандартный набор (Core) для этого типа.
Что важнее для ранжирования элемента: релевантность запросу или Item Rank?
Оба фактора критичны. Патент указывает формулу: FinalScore=QueryDependentRank∗ItemRank. Это означает, что высокая релевантность запросу (зависит от Title/Description) умножается на качество и полноту данных (Item Rank). Слабое звено в любом из множителей ухудшит итоговый результат.
Какой вес имеют разные поля при ранжировании в этой системе?
Патент дает четкое указание на веса: Метки (Labels) и Значения Атрибутов (Attribute values) имеют наибольший вес. Заголовки (Titles) имеют меньший вес, чем метки. Описания (Descriptions) имеют наименьший вес среди перечисленных. Это критически важный инсайт для оптимизации фидов.
Влияет ли этот патент на ранжирование обычных веб-страниц?
Напрямую нет. Патент описывает ранжирование элементов внутри структурированной базы данных (Google Base/Shopping), а не веб-страниц в основном индексе. Однако он подтверждает общие принципы Google по использованию структурированных данных и важности полноты информации для оценки качества сущностей, что косвенно применимо к использованию микроразметки (Schema.org) на сайтах.
Насколько важна свежесть данных согласно этому патенту?
Свежесть (Recency) упоминается как один из факторов, влияющих на расчет Item Rank. Кроме того, в описании механизма массовой загрузки указано, что обновленный фид должен отправляться не реже одного раза в 30 дней, чтобы элементы оставались в коллекции данных. Это подчеркивает важность регулярного обновления фидов.
Учитываются ли поведенческие факторы при работе этой системы?
Да, поведенческие факторы играют важную роль в выборе атрибутов для отображения в качестве фильтров. Система использует Popularity Rank, который учитывает CTR (как часто пользователи кликают на фильтр). Также упоминается, что если пользователи почти всегда применяют определенные фильтры к запросу (например, цену и локацию для запроса "ipod"), система может начать применять эти фильтры автоматически.

Google Shopping
SERP
Индексация

Персонализация
Поведенческие сигналы
Local SEO

Структура сайта
Краулинг

Персонализация
Поведенческие сигналы
SERP

Knowledge Graph
Семантика и интент

Ссылки
SERP
Структура сайта

Семантика и интент
Ссылки

SERP
Семантика и интент
EEAT и качество

EEAT и качество
Индексация
Семантика и интент

SERP
Семантика и интент
Поведенческие сигналы

EEAT и качество
SERP
Поведенческие сигналы

SERP
Персонализация
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа

Техническое SEO
Ссылки
