Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google агрегирует и отображает исторические тренды для продуктов со сложными атрибутами (например, цены или ставки)

    PROVIDING TREND DATA FOR PRODUCT CONTENT (Предоставление данных о трендах для продуктового контента)
    • US20150073871A1
    • Google LLC
    • 2015-03-12
    • 2012-03-13
    2012 Google Shopping Патенты Google

    Google использует систему для отслеживания изменений характеристик продуктов (цены, ставки по ипотеке) во времени. Система заранее определяет типичные сценарии поиска, периодически собирает данные по ним, агрегирует результаты в статистику (например, средняя цена за день) и сохраняет эту историю. Это позволяет быстро отображать графики трендов, когда пользователь выполняет похожий поиск.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему эффективного отслеживания, хранения и быстрого отображения исторических трендов для многозначных наборов данных (multi-valued data sets). Это актуально для результатов поиска по товарам, где атрибуты (например, цены или процентные ставки) предлагаются множеством поставщиков и постоянно меняются. Сложность заключается в том, чтобы сгенерировать однозначный временной тренд из большого объема флуктуирующих данных без необходимости выполнять сложные вычисления в реальном времени при запросе пользователя.

    Что запатентовано

    Запатентована система для генерации и предоставления данных о трендах (Trend Data) путем предварительного вычисления (pre-computation). Система периодически выполняет набор предопределенных запросов, называемых сценариями (Scenarios), которые репрезентативно охватывают продуктовое пространство. Полученные сырые результаты агрегируются за определенные периоды времени (например, ежедневно вычисляется средняя или лучшая цена). Эти агрегированные значения сохраняются в базе данных для быстрого извлечения.

    Как это работает

    Система функционирует в два основных этапа: офлайн-обработка и онлайн-обслуживание.

    • Офлайн (Сбор и Агрегация): Система периодически запускает предопределенные Scenarios для сбора сырых данных из источников (Product data sources). Затем эти данные обрабатываются: для каждого сценария и временного периода (например, дня) функция Aggregator вычисляет статистическое значение (среднее, лучшее). Результаты сохраняются как временные ряды (Data Time Series).
    • Онлайн (Обслуживание): Когда пользователь вводит запрос, система сопоставляет его с ближайшим предопределенным Scenario. Она извлекает уже рассчитанные агрегированные данные для этого сценария и отображает их в виде графика тренда.

    Актуальность для SEO

    Средняя. Базовая концепция предварительного вычисления и агрегации данных для отображения трендов остается крайне актуальной и используется в Google Shopping, Google Flights, Hotel Ads и финансовых вертикалях. Однако это инфраструктурный патент, и конкретная техническая реализация могла эволюционировать с момента подачи заявки.

    Важность для SEO

    Низкое влияние (2/10). Патент описывает внутреннюю инфраструктуру для обработки и отображения исторических данных в специализированных продуктовых вертикалях, а не алгоритмы ранжирования органической выдачи. Он имеет значение для SEO-специалистов, работающих с E-commerce или агрегаторами, подчеркивая важность точности и структурированности передаваемых продуктовых данных (фиды, микроразметка) для видимости в этих вертикалях.

    Детальный разбор

    Термины и определения

    Aggregator / Accumulator (Агрегатор / Аккумулятор)
    Функция или логический блок, который принимает набор значений за определенный период времени и вычисляет одно итоговое агрегированное значение (например, среднее, лучшее). Работает инкрементально.
    Attributes (Атрибуты)
    Характеристики товара. Примеры в патенте: процентная ставка (Interest Rate), годовая процентная ставка (APR), цена, минимальный депозит.
    Data Time Series (Временной ряд данных)
    Последовательность агрегированных значений для одного сценария за разные периоды времени (например, средний APR за каждый день).
    Multi-valued data sets (Многозначные наборы данных)
    Наборы данных, где для одного запроса в один момент времени существует множество результатов с разными значениями атрибутов.
    Product Content (Продуктовый контент)
    Информация о товарах, включающая их атрибуты. Примеры в патенте: ипотека, кредитные карты, депозитные сертификаты (CDs), автомобили.
    Product Data Source (Источник продуктовых данных)
    Внешние источники информации о товарах (веб-сайты поставщиков, фиды, API).
    Scenario (Сценарий)
    Предопределенный набор значений атрибутов запроса (pre-defined set of values for query attributes), используемый для периодического сбора данных. Представляет собой конкретную конфигурацию поиска (например, ипотека на 30 лет, сумма $500k, хороший кредитный рейтинг).
    Vertical (Вертикаль)
    Конкретный тип продукта или рыночная ниша (например, ипотечные кредиты, E-commerce).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает компьютерный метод генерации и предоставления данных о трендах.

    1. Периодическое выполнение на сервере набора запросов (set of queries/Scenarios) для продуктового контента. Этот набор запросов включает предопределенные значения атрибутов и обеспечивает репрезентативное представление продуктового пространства.
    2. Получение запроса на сортировку результатов по атрибуту и временным периодам (внутренний этап обработки).
    3. Генерация множества наборов результатов на основе запросов и периодов времени.
    4. Агрегация (Aggregating) набора значений из результатов для каждого запроса в каждый период времени.
    5. Периодическое сохранение каждого агрегированного набора значений в базу данных.
    6. Получение на сервере критериев запроса пользователя (query criteria) и временного диапазона.
    7. Сопоставление (Matching) критериев пользователя с одним из предопределенных запросов (сценариев).
    8. Извлечение из базы данных сохраненного набора значений, соответствующего сопоставленному запросу.
    9. Предоставление данных для отображения (display data) тренда.

    Ядро изобретения — это процесс предварительного вычисления (pre-computation) трендов. Система периодически выполняет предопределенные сценарии, агрегирует многозначные результаты в единичные статистические значения за период (например, среднее за день) и сохраняет их. Запрос пользователя затем сопоставляется с этими предварительно вычисленными данными для быстрого отображения тренда.

    Где и как применяется

    Этот патент описывает инфраструктурный процесс для специализированных продуктовых вертикалей, который затрагивает сбор, обработку и отображение структурированных данных.

    CRAWLING – Сканирование и Сбор данных (Data Acquisition)
    Система выполняет активный сбор данных путем периодического выполнения предопределенных запросов (Scenarios) к источникам данных (Product data sources). Это не стандартный краулинг веба, а целенаправленный сбор структурированной продуктовой информации (из фидов, API или веб-страниц).

    INDEXING – Индексирование и извлечение признаков (Aggregation)
    Основная обработка (пре-компьютинг). Система обрабатывает сырые данные, извлекает Attributes и применяет Aggregator для вычисления статистик (среднее, лучшее значение) за определенные периоды времени. Результаты сохраняются в виде временных рядов (Data Time Series) в специализированной базе данных.

    QUNDERSTANDING – Понимание Запросов (Scenario Matching)
    На этом этапе запрос пользователя интерпретируется и сопоставляется с ближайшим предопределенным Scenario, для которого уже рассчитаны тренды.

    METASEARCH – Метапоиск и Смешивание (Serving/Display)
    Извлеченные агрегированные данные используются для генерации специализированных блоков на SERP (например, график истории цен в Google Shopping) или в интерфейсе вертикали. Система смешивает эти блоки с другими результатами.

    Входные данные:

    • Предопределенные сценарии (Scenarios).
    • Сырые данные из Product data sources (атрибуты продуктов с временными метками).
    • Запрос пользователя.

    Выходные данные:

    • Агрегированные временные ряды данных о трендах (Trend Data).
    • График или таблица тренда для пользователя.

    На что влияет

    • Конкретные типы контента и Ниши: Влияет исключительно на структурированный продуктовый контент. В патенте детально проиллюстрированы финансовые продукты (ипотека, кредитные карты, депозиты). Также упоминаются автомобили. Актуально для E-commerce, Финансов, Путешествий.
    • Специфические запросы: Информационные и коммерческие запросы, где пользователи заинтересованы в историческом контексте (например, «график цен на товар X», «изменение ставок по ипотеке»).
    • Форматы контента: Влияет на генерацию графиков трендов и таблиц сравнения в SERP features.

    Когда применяется

    • Офлайн-процесс: Сбор и агрегация данных происходят периодически (например, ежедневно или ежечасно) для обновления базы данных трендов.
    • Онлайн-процесс (Триггеры активации): Активируется, когда пользователь запрашивает отображение тренда или когда поисковая система отображает продуктовый блок, который может быть сопоставлен с предопределенным сценарием.

    Пошаговый алгоритм

    Процесс А: Офлайн Пре-компьютинг (Сбор и Агрегация)

    1. Определение Сценариев: Формируется набор предопределенных запросов (Scenarios), которые репрезентативно охватывают продуктовое пространство.
    2. Периодический Сбор Данных: Система выполняет эти сценарии, обращаясь к источникам продуктовых данных. Результаты логируются с временными метками.
    3. Сортировка и Извлечение: Собранные сырые данные сортируются по сценарию и хронологически. Извлекаются интересующие числовые атрибуты (например, цена, APR).
    4. Группировка по Времени: Данные группируются по заданным периодам (например, по дням).
    5. Агрегация (Вычисление Статистики): Для каждой группы (Сценарий + Период) применяется Aggregator. Вычисляются статистические показатели (среднее значение, лучшее значение).
    6. Хранение Временных Рядов: Агрегированные значения сохраняются в базе данных, индексируемой по ключу сценария (Row Key), с разной степенью детализации (ежедневно, еженедельно).

    Процесс Б: Онлайн Обслуживание (Отображение Трендов)

    1. Получение Запроса Пользователя: Пользователь указывает критерии поиска и временной диапазон.
    2. Сопоставление Сценария: Система находит в базе данных предопределенный сценарий, который наиболее точно соответствует критериям пользователя.
    3. Извлечение Данных: Извлекается соответствующий временной ряд агрегированных данных (Data Time Series).
    4. Визуализация Тренда: Данные используются для построения графика или таблицы тренда.

    Какие данные и как использует

    Данные на входе

    Система использует структурированные продуктовые данные, собранные из внешних источников.

    • Контентные/Структурные факторы (Атрибуты Продукта): Критически важные данные. Система использует количественные атрибуты для расчета трендов (цена, APR, процентная ставка Interest Rate, APY, комиссии Fees) и качественные атрибуты для определения сценариев (местоположение, тип продукта, срок кредита, кредитный рейтинг Credit rating).
    • Временные факторы: Временные метки (timestamps) результатов запросов используются для сортировки данных и определения периодов агрегации.

    Другие типичные SEO-факторы (ссылочные, поведенческие) в данном патенте не упоминаются.

    Какие метрики используются и как они считаются

    • Метрики: Система вычисляет агрегированные статистики на основе сырых данных за определенные периоды.
      • Mean (Average) (Среднее значение).
      • Best Value (Лучшее значение). Критерий «лучшего» зависит от вертикали: минимум (например, для цены или APR) или максимум (например, для ставки по депозиту).
    • Временные Периоды: Агрегация может выполняться за разные интервалы (Daily, Weekly, Monthly) для оптимизации отображения разных временных диапазонов (Scoping).
    • Методы вычислений: Используется фреймворк агрегации (Aggregator/Accumulator). Он позволяет инкрементально обрабатывать данные. Например, для вычисления среднего Aggregator суммирует значения и ведет их подсчет, а в конце периода делит сумму на количество.

    Выводы

    1. Инфраструктурное решение, не алгоритм ранжирования: Патент описывает техническую инфраструктуру для отслеживания исторических трендов в специализированных продуктовых вертикалях (Shopping, Finance, Travel). Он не связан с алгоритмами ранжирования органического веб-поиска.
    2. Зависимость от предварительных вычислений (Pre-computation): Система полагается на офлайн-обработку и агрегацию. Тренды не вычисляются на лету при запросе пользователя; вместо этого Google периодически обрабатывает и сохраняет данные для предопределенных Scenarios.
    3. Обработка многозначных данных (Multi-valued data): Ключевая задача — преобразование множества предложений по одному запросу (например, цены от разных магазинов) в одно статистическое значение (среднее, лучшее) за период времени для построения тренда.
    4. Сопоставление сценариев (Scenario Matching): Для быстрого ответа система сопоставляет запрос пользователя с ближайшим предопределенным сценарием, для которого тренды уже рассчитаны.
    5. Фокус на структурированных данных: Система предназначена для работы с четко структурированными продуктовыми данными и атрибутами (цены, ставки). Это подчеркивает важность фидов данных и микроразметки для видимости в этих вертикалях.

    Практика

    ВАЖНО: Патент является инфраструктурным и не дает прямых рекомендаций для SEO в органическом поиске. Однако он критически важен для оптимизации в продуктовых вертикалях.

    Best practices (это мы делаем)

    Для SEO-специалистов, работающих с E-commerce, агрегаторами или поставщиками услуг:

    • Обеспечение точности и полноты структурированных данных: Это критично. Система полагается на сбор структурированных данных (Product Data Acquisition). Убедитесь, что продуктовые фиды (например, Google Merchant Center) и микроразметка Schema.org (Product, Offer) точны, актуальны и полны. Это гарантирует корректное извлечение атрибутов для анализа трендов.
    • Поддержание консистентности идентификаторов: Используйте стабильные идентификаторы продуктов (SKU, GTIN). Если идентификаторы часто меняются, системе будет сложно связать исторические данные с текущим продуктом и корректно отследить тренд.
    • Обеспечение доступности данных: Гарантируйте высокую доступность страниц продуктов и стабильность фидов/API, так как система полагается на периодический сбор данных.

    Worst practices (это делать не надо)

    • Предоставление нестабильных или неточных данных: Передача некорректных цен или атрибутов может привести к неправильному расчету трендов и потенциальному исключению из специализированных функций или продуктовых блоков.
    • Использование неструктурированных форматов: Размещение ключевой информации (цены, ставки) в изображениях или сложных скриптах, которые затрудняют извлечение данных.
    • Игнорирование требований к фидам данных: Несоблюдение спецификаций фидов (Shopping, Travel) приведет к тому, что данные не будут собраны и обработаны этой системой.

    Стратегическое значение

    Патент подтверждает стратегическую важность структурированных данных для продуктово-ориентированного поиска. Google инвестирует в создание собственных баз данных и сервисов сравнения (Shopping, Travel, Finance). Для бизнеса в этих вертикалях фокус на качестве данных, фидах и микроразметке становится не менее важным, чем традиционное SEO, для обеспечения видимости в функциях сравнения и анализа трендов.

    Практические примеры

    Сценарий: Отслеживание цен в Google Shopping

    1. Определение сценария (Google): Google определяет сценарий для популярного товара (например, «iPhone 15 Pro, 256GB, Черный»).
    2. Сбор данных (Google): Система ежедневно собирает цены на этот товар из фидов Merchant Center разных магазинов.
    3. Агрегация (Google): Aggregator обрабатывает все предложения за день и вычисляет статистику: «Средняя цена» и «Лучшая (минимальная) цена».
    4. Хранение (Google): Эти значения сохраняются в базе данных временных рядов для этого сценария.
    5. Отображение (Пользователь): Когда пользователь ищет этот товар, Google извлекает сохраненные данные и отображает график «Динамика цен» (Price insights), показывая историю изменения минимальной цены.
    6. Действие (Оптимизатор): Магазин должен убедиться, что его фид в Merchant Center корректен, актуален и содержит конкурентоспособные цены, чтобы участвовать в этом функционале и фигурировать в статистике.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в органическом поиске?

    Нет. Патент описывает инфраструктуру для сбора, агрегации и отображения исторических трендов в специализированных сервисах (например, Google Shopping или графики цен). Он не затрагивает алгоритмы, определяющие позиции сайтов в стандартной веб-выдаче.

    Что такое «Сценарий» (Scenario) в контексте этого патента?

    Scenario — это предопределенный поисковый запрос с фиксированным набором атрибутов. Например, «Ипотека на 30 лет, сумма $400k, кредитный рейтинг 720». Система периодически запускает эти сценарии для сбора данных и расчета трендов, вместо того чтобы пытаться рассчитать тренды для любого произвольного запроса пользователя.

    Как система обрабатывает ситуацию, когда по одному запросу есть много разных предложений (цен)?

    Это ключевая часть патента. Система собирает все предложения (например, цены от 50 разных магазинов) за определенный период (например, за день). Затем используется Aggregator, который вычисляет одно статистическое значение из этого набора — например, среднюю цену или лучшую (минимальную) цену за этот день.

    Происходит ли вычисление трендов в реальном времени?

    Нет. Патент подчеркивает, что сбор данных и агрегация происходят офлайн (пре-компьютинг) периодически. В реальном времени происходит только сопоставление запроса пользователя с уже вычисленными и сохраненными данными трендов. Это обеспечивает высокую скорость ответа.

    Для каких типов сайтов этот патент наиболее актуален?

    Он актуален для поставщиков структурированных продуктовых данных (E-commerce, банки, автодилеры, сайты путешествий) и агрегаторов. Для них важно предоставлять качественные данные (фиды, микроразметка), чтобы Google мог корректно отслеживать историю их продуктов и включать их в сервисы сравнения.

    Что означает «Лучшее значение» (Best Value) при агрегации?

    Это наиболее выгодное для пользователя значение атрибута за период. «Лучшее» зависит от контекста: для цены товара или ставки по ипотеке это минимальное значение, а для ставки по депозиту — максимальное. Система настраивается для каждой вертикали.

    Может ли система показать тренд для любого произвольного запроса пользователя?

    Система старается найти ближайший предопределенный Scenario, для которого данные уже рассчитаны. Если пользователь вводит очень специфический или редкий запрос, система сопоставит его с наиболее похожим стандартным сценарием, или данные о трендах могут быть не показаны.

    Какие данные собирает эта система?

    Система собирает числовые атрибуты продуктов. В патенте приведены примеры финансовых данных: APR, Interest Rate, APY, комиссии. Также это применимо к ценам на товары, авиабилеты, отели.

    Как этот патент связан с Google Shopping или Google Flights?

    Эта технология является основой для функций отслеживания цен в этих сервисах. Графики истории цен на товары в Google Shopping или анализ стоимости авиабилетов в Google Flights строятся с использованием описанного механизма сбора, агрегации и хранения исторических данных по предопределенным сценариям.

    Есть ли польза от этого патента для контентных сайтов (блогов, новостей)?

    Для стандартных контентных сайтов этот патент не имеет практической ценности, так как он сфокусирован исключительно на обработке структурированных продуктовых данных и их числовых атрибутов.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.