Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google оптимизирует получение данных о ценах и доступности от партнеров (отели, авиабилеты) в условиях ограниченной пропускной способности API

    GRANULAR SELECTION AND SCHEDULING OF QUERIES (Гранулярный выбор и планирование запросов)
    • US10410270B2
    • Google LLC
    • 2019-09-10
    • 2016-12-22
    2016 Google Shopping Патенты Google Свежесть контента

    Патент описывает инфраструктурный механизм Google для эффективного обновления кеша данных в вертикальных поисках (Google Hotels, Flights). Система рассчитывает ценность (Utility Value) для каждого потенциального запроса к API партнера на основе прогнозируемого спроса и частоты изменения данных (U=I/F). Это позволяет Google запрашивать только самые важные обновления, не превышая лимиты пропускной способности партнерских систем.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему поддержания актуальности динамических данных (например, цен и доступности отелей или авиабилетов) в кеше поисковой системы, получаемых от внешних партнерских систем (Partner Systems). Ключевая сложность в том, что многие партнеры требуют активного опроса (Pull-механизм) и устанавливают строгие ограничения на пропускную способность (Bandwidth Constraints), например, лимит запросов в секунду (QPS). Изобретение позволяет интеллектуально выбирать, какие данные запрашивать, чтобы максимизировать актуальность информации для пользователей, не нарушая технических ограничений партнеров.

    Что запатентовано

    Запатентована система гранулярного планирования запросов к API партнеров. Система рассчитывает Utility Value (Ценность) для каждой потенциальной комбинации объекта и маршрута (Property-Itinerary Combination), например, конкретного отеля на конкретные даты. Эта ценность определяется на основе прогнозируемой частоты обновления информации (Expected Update Frequency) и прогнозируемого спроса пользователей (Expected Impression Weight). Запросы с наибольшей ценностью приоритизируются и выполняются в рамках доступной пропускной способности.

    Как это работает

    Система работает в несколько этапов:

    • Прогноз частоты обновлений (F): Анализируется история изменения данных (например, цен) для конкретной и похожих комбинаций, чтобы предсказать будущую частоту изменений (Expected Update Frequency).
    • Прогноз спроса (I): Анализируется история поисковых запросов пользователей (User Impression Histories), чтобы предсказать популярность комбинации (Expected Impression Weight).
    • Расчет ценности (Utility Value, U): На основе прогнозов рассчитывается ценность запроса. В патенте (Claim 9) защищена формула: U = I / F.
    • Ранжирование и Ограничения: Все потенциальные запросы ранжируются по Utility Value. Устанавливается пороговое значение (Threshold Utility Value) так, чтобы запросы выше порога укладывались в Bandwidth Constraints партнера.
    • Выполнение: Запросы выше порога планируются и выполняются, обновляя кеш поисковой системы.

    Актуальность для SEO

    Высокая для вертикальных поисковых продуктов Google (Hotels, Flights, Events). Эффективное управление сбором данных от тысяч партнеров с ограниченными техническими возможностями API остается критически важной инфраструктурной задачей для поддержания качества и актуальности этих сервисов в 2025 году.

    Важность для SEO

    Патент имеет минимальное прямое влияние на традиционные SEO-стратегии (Оценка 2/10). Он описывает внутреннюю инфраструктуру вертикального поиска, а не механизмы сканирования или ранжирования общего веб-контента. Он важен для понимания того, как Google взаимодействует с поставщиками данных в этих вертикалях (и почему данные могут устаревать), но не предлагает конкретных действий для оптимизации обычных веб-сайтов.

    Детальный разбор

    Термины и определения

    Property (Объект)
    Единица контента, предоставляемая партнером. Примеры: конкретный отель, авиарейс, билет на концерт.
    Itinerary (Маршрут)
    Конкретные условия использования объекта. Примеры: даты заезда и выезда в отеле.
    Property-Itinerary Combination (Комбинация Объект-Маршрут)
    Конкретное предложение. Пример: Бронирование Отеля А с 5 по 10 декабря.
    Partner System (Партнерская система)
    Внешняя система (например, сайт бронирования, система авиакомпании), которая предоставляет данные поисковой системе по запросу через API (Pull-механизм).
    Expected Update Frequency (Ожидаемая частота обновления, F)
    Прогноз того, как часто информация (например, цена) будет меняться. Основан на анализе исторических данных (Average Expected Change Rate) для этой и похожих (similar) комбинаций.
    User Impression Histories (История показов пользователям)
    Логи поисковых запросов, используемые для анализа спроса.
    Relative Impression Weight (Относительный вес показа)
    Метрика популярности конкретного маршрута (Itinerary) по сравнению с другими маршрутами.
    Absolute Impression Weight (Абсолютный вес показа)
    Метрика общей популярности объекта (Property) по всем маршрутам (например, запросов в день).
    Expected Impression Weight (Ожидаемый вес показа, I)
    Прогнозируемое количество запросов для конкретной Property-Itinerary Combination. Вычисляется на основе относительного и абсолютного весов.
    Utility Value (Ценность/Полезность, U)
    Ключевая метрика для приоритизации запросов. Рассчитывается на основе Expected Impression Weight и Expected Update Frequency.
    Bandwidth Constraints (Ограничения пропускной способности)
    Технические лимиты на количество запросов, установленные партнерской системой (например, Queries Per Second — QPS).
    Threshold Utility Value (Пороговое значение ценности)
    Минимальное значение Utility Value, при котором запрос будет запланирован. Устанавливается так, чтобы не превысить Bandwidth Constraints.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод планирования запросов к партнерским системам.

    1. Система обрабатывает множество комбинаций Property-Itinerary. Для каждой комбинации выполняется:
      • Определение количества исторических изменений для группы похожих комбинаций.
      • Расчет Update Frequency (средняя ожидаемая скорость изменения) на основе этих данных.
      • Определение Relative Impression Weight маршрута и Absolute Impression Weight объекта на основе User Impression Histories.
      • Расчет Expected Impression Weight комбинации.
      • Определение использования пропускной способности (Bandwidth Usage) для выполнения запроса.
      • Расчет Utility Value на основе Expected Impression Weight и Update Frequency.
    2. Комбинации ранжируются для каждого партнера по их Utility Value.
    3. Определяется Threshold Utility Value для каждого партнера. Порог устанавливается так, чтобы суммарный объем запросов выше порога не превышал Bandwidth Constraints партнера.
    4. Система выполняет запросы (conducts queries) для комбинаций со значением выше установленного порога.

    Claim 9 (Зависимый от 1): Уточняет метод расчета Utility Value.

    Расчет Utility Value включает деление (dividing) Expected Impression Weight (I) на Update Frequency (F). Формула: U = I / F.

    Это ключевой и контринтуитивный момент патента. Поскольку частота обновления (F) находится в знаменателе, увеличение частоты изменений (например, частая смена цен) *снижает* общую ценность (Utility Value) запроса при прочих равных. Система предпочитает тратить ограниченные ресурсы на обновление популярных объектов со стабильными ценами.

    Где и как применяется

    Изобретение является инфраструктурным механизмом для вертикального поиска (Google Hotels, Google Flights) и не применяется в стандартном веб-поиске.

    CRAWLING – Сканирование и Сбор данных (Data Acquisition)
    Это основная область применения. Патент описывает механизм планирования сбора данных (Crawl Scheduling) через API (API fetching), а не традиционный веб-краулинг. Он определяет, какие данные запрашивать у партнеров и с какой частотой, оптимизируя использование ресурсов (API Query Budget).

    INDEXING – Индексирование и извлечение признаков
    Система использует исторические данные (частоту изменений цен, историю показов пользователям), которые хранятся и обрабатываются на этом этапе, для расчета прогнозных метрик (Utility Value). Полученные свежие данные поступают в индекс вертикального поиска.

    Входные данные:

    • Список объектов (Properties) и маршрутов (Itineraries).
    • Исторические данные об изменениях информации (цены, доступность).
    • История пользовательских запросов (User Impression Histories).
    • Bandwidth Constraints (лимиты QPS) от партнеров.

    Выходные данные:

    • Оптимизированное расписание запросов (Query Schedule) для каждого партнера.
    • Свежие данные в кеше поисковой системы.

    На что влияет

    • Конкретные типы контента и Ниши: Влияет исключительно на вертикали, зависящие от получения данных в реальном времени через API. Основные примеры в патенте: Отели (hotel data), Авиабилеты (flight or other transportation data) и Мероприятия (event data).
    • Актуальность данных (Freshness): Напрямую влияет на то, насколько актуальными будут цены и информация о доступности в результатах вертикального поиска Google.

    Когда применяется

    • Частота применения: Система работает постоянно или с высокой периодичностью для непрерывного управления потоком запросов к API. В патенте упоминаются интервалы пересчета от 30 секунд до часа или дня.
    • Условия работы: Необходимость поддержания актуальности кеша данных при наличии ограничений пропускной способности у партнеров, использующих Pull-механизм обновления.

    Пошаговый алгоритм

    Процесс планирования запросов:

    1. Сбор исходных данных: Система получает список доступных Property-Itinerary Combinations и актуальные Bandwidth Constraints для каждого партнера.
    2. Расчет Expected Update Frequency (F):
      • Для каждой комбинации извлекаются исторические данные об изменениях.
      • Идентифицируются похожие комбинации (например, той же длительности пребывания).
      • Рассчитывается средняя скорость изменений (Average Expected Change Rate) для этой группы. Это значение становится Expected Update Frequency (F).
    3. Расчет Expected Impression Weight (I):
      • Извлекается история пользовательских запросов.
      • Рассчитывается Relative Impression Weight для маршрута (популярность дат).
      • Рассчитывается Absolute Impression Weight для объекта (популярность отеля/рейса).
      • Вычисляется Expected Impression Weight (I) (обычно путем перемножения относительного и абсолютного весов).
    4. Расчет Utility Value (U):
      • Для каждой комбинации рассчитывается Utility Value (U). Согласно Claim 9, это U = I / F.
    5. Ранжирование и Фильтрация:
      • Для каждого партнера комбинации ранжируются по убыванию Utility Value.
      • Определяется Threshold Utility Value. Система выбирает порог так, чтобы суммарное потребление пропускной способности запросами выше порога не превышало Bandwidth Constraints.
    6. Планирование и Выполнение:
      • Запросы для комбинаций выше порога добавляются в расписание (Query Schedule). Запросы могут быть сгруппированы (буферизованы) для эффективности.
      • Система выполняет запросы и обновляет кеш полученными данными.

    Какие данные и как использует

    Данные на входе

    • Временные факторы (Historical Data): Исторические данные об изменении информации (цены, доступность). Критически важны для прогнозирования Expected Update Frequency. Учитывается дата изменения и дата начала маршрута.
    • Поведенческие факторы (User Behavior): Логи поисковых запросов (User Impression Histories). Используются для прогнозирования спроса и расчета Expected Impression Weight.
    • Технические факторы (System Constraints): Bandwidth Constraints, предоставленные партнерскими системами (лимиты QPS). Определяют общий объем доступных запросов.

    Какие метрики используются и как они считаются

    • Expected Update Frequency (F): Прогнозная скорость изменения данных. Считается как среднее количество изменений за период времени на основе исторических данных для группы похожих комбинаций.
    • Absolute Impression Weight: Популярность объекта. Считается как общее количество показов (запросов) объекта за период времени.
    • Relative Impression Weight: Популярность маршрута. Считается как доля показов конкретного маршрута от общего числа показов.
    • Expected Impression Weight (I): Прогнозный спрос на комбинацию. I=Absolute Impression Weight×Relative Impression WeightI = \text{Absolute Impression Weight} \times \text{Relative Impression Weight}I=Absolute Impression Weight×Relative Impression Weight
    • Utility Value (U): Ценность выполнения запроса. Формула, защищенная в Claim 9: U=IFU = \frac{I}{F}U=FI​

    Выводы

    1. Инфраструктурный фокус, не SEO: Патент описывает внутренние процессы сбора данных для вертикального поиска (Hotels, Flights). Он не имеет прямого отношения к ранжированию в органическом веб-поиске.
    2. Оптимизация ресурсов и нагрузки: Основная цель — эффективное использование ограниченной пропускной способности (Bandwidth Constraints) партнерских API для поддержания актуальности кеша Google.
    3. Логика приоритизации (Критически важно): Согласно формуле из Claim 9 (Utility Value = Спрос / Частота Обновлений), система приоритизирует запросы контринтуитивно. Высокая частота обновлений (F) снижает Utility Value (U) при прочих равных. Это означает, что Google предпочтет обновить данные для очень популярного предложения со стабильной ценой, чем для популярного предложения с часто меняющейся ценой.
    4. Прогнозирование на основе истории: Система полагается на анализ исторических данных для прогнозирования как поведения пользователей (спроса), так и поведения партнеров (частоты изменения цен), используя данные похожих маршрутов (Similar Itineraries) для повышения точности.
    5. Влияние популярности: Спрос (Expected Impression Weight) является ключевым фактором (числитель). Предложения с низким спросом с меньшей вероятностью будут часто обновляться, что объясняет, почему данные по нишевым запросам в вертикальном поиске часто устаревают.

    Практика

    ВАЖНО: Патент является инфраструктурным и не дает практических выводов для традиционного SEO. Следующие пункты применимы ТОЛЬКО для компаний (OTA, авиакомпании, сети отелей), которые передают данные в Google через API (используя Pull-механизм) для участия в вертикальном поиске.

    Best practices (Для поставщиков данных)

    • Оптимизация частоты обновления цен (с учетом U=I/F): Поскольку слишком частые изменения цен (высокая Update Frequency, F) математически *понижают* Utility Value согласно формуле из патента, это может уменьшить частоту запросов от Google. Поставщикам следует избегать избыточных технических обновлений, если фактическая цена не изменилась, чтобы не создавать «шум» в данных.
    • Стимулирование спроса: Увеличение популярности объекта (повышение Impression Weight, I) напрямую повышает Utility Value. Маркетинговые активности, увеличивающие спрос на платформе Google, приведут к более частому обновлению данных.
    • Обеспечение достаточной пропускной способности API: Убедитесь, что ваши Bandwidth Constraints (лимиты QPS) достаточны для обработки запросов Google. Более широкий канал позволит Google снизить Threshold Utility Value и чаще обновлять данные, включая менее приоритетные предложения.
    • Эффективная обработка групповых запросов: Патент упоминает буферизацию и группировку запросов. Убедитесь, что ваш API эффективно обрабатывает групповые запросы (например, запрос цен для нескольких отелей на одну дату) для максимизации эффективности обмена данными.

    Worst practices (Для поставщиков данных)

    • «Шумное» или чрезмерно волатильное ценообразование: Постоянное изменение цен на минимальные суммы может создать искусственно высокую Update Frequency (F). Согласно формуле U=I/F, это снизит Utility Value и ухудшит актуальность ваших данных в кеше Google по сравнению с более стабильными конкурентами.
    • Установление слишком низких лимитов QPS: Жесткие Bandwidth Constraints вынудят Google установить высокий Threshold Utility Value, что приведет к устареванию данных по большинству ваших предложений.

    Стратегическое значение

    Патент демонстрирует техническую сложность поддержания актуальности данных в реальном времени. Он подтверждает, что Google использует сложные data-driven модели для управления сбором данных, рассматривая его как задачу оптимизации ресурсов (API Query Budget). Ключевое стратегическое значение для партнеров заключается в понимании формулы U=I/F: Google предпочитает тратить ограниченные ресурсы на обновление популярных и относительно стабильных предложений.

    Практические примеры

    Сценарий: Влияние частоты изменения цен на приоритет обновления (на основе формулы U=I/F)

    Партнерская система имеет ограничение пропускной способности. Google рассчитывает Utility Value для двух отелей.

    Отель А (Популярный, Стабильные цены):

    • Expected Impression Weight (I): 1000 запросов/день.
    • Expected Update Frequency (F): 0.2 изменений/день (цены меняются раз в 5 дней).
    • Utility Value (U=I/F): 1000 / 0.2 = 5000.

    Отель Б (Популярный, Волатильные цены):

    • Expected Impression Weight (I): 1000 запросов/день.
    • Expected Update Frequency (F): 5.0 изменений/день (цены меняются 5 раз в день).
    • Utility Value (U=I/F): 1000 / 5.0 = 200.

    Результат: Несмотря на одинаковую популярность, Utility Value Отеля А (5000) значительно выше, чем у Отеля Б (200). Google запланирует обновление данных для Отеля А в первую очередь. Отель Б рискует отображаться с устаревшей ценой, если не хватит пропускной способности.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в обычном поиске Google (SEO)?

    Нет, этот патент не имеет отношения к общему веб-поиску. Он описывает исключительно инфраструктуру вертикального поиска (Google Hotels, Google Flights) и то, как Google планирует запросы к API партнеров для получения актуальных цен и доступности. Он не влияет на сканирование вашего сайта Googlebot или на алгоритмы ранжирования веб-страниц.

    Что такое Utility Value и как он рассчитывается?

    Utility Value (Ценность) — это метрика для определения приоритета запроса данных у партнера. Согласно патенту (Claim 9), она рассчитывается путем деления прогнозируемого спроса (Expected Impression Weight, I) на прогнозируемую частоту обновления данных (Expected Update Frequency, F). Формула: U=I/F.

    Формула U=I/F кажется нелогичной. Разве не нужно чаще обновлять то, что часто меняется?

    Это ключевой и контринтуитивный момент патента. Формула U=I/F означает, что чем чаще меняется цена (выше F), тем ниже ценность (U). Система оптимизирует использование ограниченных ресурсов, предпочитая обновлять популярные товары со стабильными ценами. Если цена меняется слишком часто, один запрос все равно не гарантирует актуальности надолго, поэтому система считает это менее эффективным использованием пропускной способности.

    Мы (отель/авиакомпания) часто меняем цены (динамическое ценообразование). Как это влияет на нас?

    Высокая частота изменений повышает вашу Update Frequency (F). Согласно формуле U=I/F, это снижает Utility Value ваших предложений. В условиях ограниченной пропускной способности API это может привести к тому, что Google будет реже запрашивать ваши актуальные цены, и пользователи увидят устаревшую информацию в кеше Google.

    Как отель может повысить частоту обновления своих данных в Google?

    Есть три пути, следующих из патента. Первый — увеличить спрос (I), что повысит Utility Value. Второй — снизить частоту ненужных обновлений цен (снизить F), что также повысит Utility Value. Третий — обеспечить большую пропускную способность вашего API (увеличить Bandwidth Constraints), что позволит Google запрашивать больше данных в целом.

    Как Google предсказывает популярность (Impression Weight)?

    Google использует историю поисковых запросов (User Impression Histories). Он рассчитывает общую популярность объекта (Absolute Impression Weight) и популярность конкретных дат или маршрута (Relative Impression Weight). Комбинация этих показателей дает прогноз спроса (Expected Impression Weight).

    Как Google предсказывает частоту обновления (Update Frequency)?

    Система анализирует, как часто менялась цена для этого предложения в прошлом. Для повышения точности она также анализирует историю изменений для похожих предложений (Similar Itineraries), например, бронирований такой же длительности. На основе этой истории вычисляется ожидаемая частота изменений.

    Что такое Bandwidth Constraints и кто их устанавливает?

    Bandwidth Constraints — это технические ограничения на количество запросов в единицу времени (например, QPS — запросов в секунду). Эти ограничения обычно устанавливаются поставщиком данных (отелем, авиакомпанией или их техническим провайдером) для защиты своих серверов от перегрузки со стороны Google.

    Может ли этот механизм объяснить, почему цены в Google Hotels иногда отличаются от цен на сайте отеля?

    Да, это одна из прямых причин. Если Utility Value предложения оказался ниже порога (Threshold Utility Value) из-за ограничений пропускной способности партнера или низкой популярности/высокой частоты изменений, Google может не успеть запросить актуальную цену и будет показывать устаревшие данные из своего кеша.

    Применяется ли этот механизм, если я использую Push API для отправки обновлений в Google?

    Нет. Патент специфически решает проблему ограничений пропускной способности при использовании Pull-механизма, когда Google должен активно запрашивать (планировать запросы) данные у партнера. Если партнер сам отправляет обновления (Push), этот механизм приоритизации запросов не требуется.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.