
Патент описывает инфраструктурную систему для эффективного сканирования социальных сетей. Контент разделяется на «Посты» (основной контент) и «Вовлеченность» (комментарии, ответы). Система адаптивно планирует сканирование: проверяет комментарии реже, если API социальной сети уведомляет об обновлениях, и чаще (по расписанию), если уведомлений нет. Это позволяет оптимизировать ресурсы и соблюдать лимиты API.
Патент решает задачу эффективного и гибкого планирования сканирования (crawling) контента из внешних API, в частности социальных сетей (managed account-type sources). Он направлен на оптимизацию использования ресурсов и соблюдение ограничений скорости запросов (API rate limits) при работе с контентом, который обновляется с разной частотой (например, посты и комментарии к ним).
Запатентована система универсального планирования для сбора данных из социальных сетей. Ключевая особенность — разделение контента источника на две категории: Posts (контент верхнего уровня) и Engagements (производный контент, например, комментарии и ответы). Система использует адаптивные стратегии планирования, отдельные очереди и рабочие процессы для каждой категории, чтобы оптимизировать сбор данных.
Система использует планировщик (Scheduler), который запускает отдельные потоки для Posts и Engagements. Задачи на сканирование помещаются в очередь (Scheduling Queue). Рабочие процессы (Managed Account Worker) извлекают задачи, запрашивают данные у API социальной сети (согласовывая это с Throttling Manager для контроля квот) и сохраняют их. Ключевой механизм — адаптация: если API уведомляет о новых комментариях, система ждет уведомления (оптимизируя запросы); если нет — проверяет обновления периодически на основе частоты (check rate).
Средняя. Патент описывает базовые инфраструктурные принципы управления краулингом через API. Эти принципы остаются актуальными для эффективного сбора свежих данных и управления нагрузкой на внешние сервисы. Однако это сугубо технический патент, не связанный с алгоритмами ранжирования.
Влияние на SEO минимальное (Инфраструктура). Патент описывает внутренние механизмы сбора данных из социальных сетей (CRAWLING), а не алгоритмы ранжирования веб-поиска. Он не содержит информации о факторах ранжирования или оценке качества контента. Он дает общее представление о том, как технически организован сбор социальных данных, но не предлагает прямых действий для SEO-специалистов.
Redis Queue) для задач на сканирование. Используются отдельные очереди для Posts и Engagements.rate limits).Engagements, если API социальной сети не поддерживает уведомления об обновлениях.Claim 1 (Независимый пункт): Описывает метод планирования сканирования (crawl) контента из социальной сети.
next fetch time).check rate).Ядро изобретения — это адаптивный механизм планирования, который оптимизирует ресурсы краулера в зависимости от возможностей API социальной сети. Тип 1 подразумевает, что API уведомляет систему о наличии новых комментариев (например, через счетчик комментариев). Система экономит ресурсы, не проверяя комментарии без необходимости. Тип 2 подразумевает, что API не предоставляет таких уведомлений, вынуждая систему регулярно опрашивать источник с использованием check rate.
Claim 16 (Зависимый от 1): Уточняет, что если социальная сеть (Типа 2) поддерживает ограничения скорости на основе пользователя (user-based rate limit), то расписание сканирования корректируется на основе этого ограничения.
Система динамически адаптирует частоту сканирования, чтобы избежать превышения квот API, выделенных социальной сетью для конкретного пользователя или аккаунта.
Патент полностью сосредоточен на этапе CRAWLING – Сканирование и Сбор данных (Crawling & Data Acquisition).
Он описывает инфраструктуру для планирования и выполнения запросов с целью получения контента через API социальных сетей, а не стандартное сканирование веб-страниц.
Взаимодействие компонентов:
Scheduling Queue.rate limits.Входные данные:
Managed Accounts).next fetch time) и частота проверок (Check Rate).Rate Limits) и токены авторизации.Выходные данные:
Batch Insert process.next fetch time).Rate Limits.Процесс планирования и сбора данных
Scheduler для определенного типа источника (социальной сети).Posts (верхний уровень) и Engagements (комментарии, ответы).next fetch time.active engagement objects), которые пора проверить на обновления.Scheduling Queue, чтобы избежать дублирования.Managed Account Worker подключается к очереди и извлекает задачу.Throttling Manager для проверки доступной квоты API.Blog Parsing Adapter) и отправляет данные в Batch Insert process.next fetch time.next fetch time устанавливается в null. Проверка приостанавливается до обнаружения нового контента.check rate).user-based rate limits), планировщик снижает частоту проверок (check rate), чтобы избежать блокировок.Патент фокусируется исключительно на технических и системных факторах, необходимых для управления краулингом.
Managed Account Type).Cursor Value) для пагинации ответов API.Check Rate ID).Rate Limits).Next Fetch Time).Fetch Interval).Actual User Limit=Application Daily Quota/Number of Current Users
Патент описывает исключительно инфраструктурные процессы управления краулингом социальных сетей и не дает практических выводов для SEO-специалистов.
Posts) и производного (Engagements), так как они имеют разные характеристики обновления и требуют разных стратегий сканирования.Check Rate), если уведомлений нет (Тип 2).Throttling Manager) и динамическую корректировку расписания.Патент является инфраструктурным и не дает практических выводов для SEO.
Не применимо. Патент не содержит рекомендаций для SEO.
Не применимо. Патент не описывает борьбу с SEO-манипуляциями.
Стратегическое значение для SEO минимально. Патент подтверждает, что у Google есть сложные технические решения для масштабного и эффективного сбора данных из социальных сетей. Это косвенно указывает на важность мониторинга социального контента. Однако патент не раскрывает, как именно эти собранные данные используются в алгоритмах ранжирования основного поиска.
Практических примеров для SEO нет, так как патент описывает внутреннюю работу краулера социальных сетей.
Описывает ли этот патент использование социальных сигналов в ранжировании?
Нет. Патент сосредоточен исключительно на этапе CRAWLING — как система планирует и технически осуществляет сбор данных (постов и комментариев) из социальных сетей через API. Он не содержит информации о том, как эти данные используются для ранжирования результатов веб-поиска.
В чем разница между "Posts" и "Engagements" в контексте патента?
Posts — это основной контент верхнего уровня (например, статус в социальной сети). Engagements (вовлеченность) — это производный контент, такой как комментарии, ответы, лайки к этому посту. Система планирует их сканирование и обрабатывает раздельно для повышения эффективности.
В чем заключается основная оптимизация краулинга, описанная в патенте?
Основная оптимизация заключается в адаптивном планировании сканирования комментариев (Engagements). Если API социальной сети уведомляет о новых комментариях (Тип 1), система ждет уведомления, экономя ресурсы. Если API не уведомляет (Тип 2), система будет регулярно проверять пост по расписанию (check rate). Это значительно экономит квоты API.
Какое значение этот патент имеет для SEO-специалиста?
Практическое значение минимально. Патент является сугубо инфраструктурным и не дает actionable-инсайтов для улучшения ранжирования сайтов. Он полезен для общего понимания сложности процессов сканирования данных из API, но не применим в повседневной SEO-практике.
Что такое "Throttling Manager" и зачем он нужен?
Throttling Manager — это централизованная система управления ограничениями скорости запросов (API rate limits). Он необходим, чтобы предотвратить блокировку приложения социальной сетью из-за слишком частых запросов. Все рабочие процессы должны получить разрешение от него перед выполнением запроса к API.
Может ли система изменить частоту сканирования автоматически?
Да. Если система определяет, что объем запланированных запросов приближается к исчерпанию квоты API (особенно при user-based rate limits), она может автоматически снизить частоту проверок (check rate), чтобы распределить нагрузку и избежать превышения лимитов.
Имеет ли этот патент отношение к стандартному веб-краулеру (Googlebot)?
Нет. Патент описывает систему для выборки данных через API для Managed Accounts (управляемых аккаунтов в социальных сетях). Это отличается от механизмов работы стандартного Googlebot, сканирующего общедоступный веб.
Что означает формула Actual User Limit?
Формула Actual User Limit = Application Daily Quota / Number of Current Users используется для динамического расчета допустимого количества запросов на одного пользователя. Это позволяет системе адаптировать частоту сканирования, чтобы не превысить лимиты, если общая квота приложения недостаточна для текущего числа пользователей.
Почему этот патент приписан Google, если изначально его подавала Salesforce?
На титульном листе патента заявителем (Applicant) указана Salesforce.com, Inc., а правопреемником (Assignee) — GOOGLE LLC. Это означает, что права на патент были переданы Google (вероятно, в результате приобретения технологии или компании) после подачи заявки.
Актуален ли этот патент, если он упоминает Google+?
Хотя Google+ как социальная сеть прекратила существование, описанные в патенте инженерные принципы универсальны. Адаптивное планирование и управление квотами API являются стандартными практиками при интеграции с любыми внешними платформами (например, LinkedIn, Twitter/X, Facebook).

SERP
Свежесть контента
Персонализация

Краулинг
Техническое SEO
Индексация

Свежесть контента
SERP
Антиспам

SERP

Индексация

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Ссылки

Персонализация
Поведенческие сигналы
SERP

Мультимедиа
Поведенческие сигналы
SERP

Свежесть контента
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Knowledge Graph
Семантика и интент
EEAT и качество

Поведенческие сигналы

Антиспам
Ссылки
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы
