
Патент описывает инфраструктуру Google для рендеринга веб-страниц в масштабах всего интернета. Вместо того чтобы запрашивать все внешние ресурсы (JS, CSS, изображения) в реальном времени, система использует итеративный подход. Если ресурс не найден в базе данных, процесс рендеринга останавливается, ресурс ставится в очередь на сканирование, и рендеринг перезапускается только после того, как все необходимое будет собрано. Это обеспечивает точное отображение страницы без перегрузки внешних серверов.
Патент решает фундаментальную инфраструктурную проблему: как эффективно и безопасно рендерить веб-страницы в масштабах всего интернета (миллиарды страниц) для целей индексации. Проблема заключается в том, что для полного рендеринга требуются внешние ресурсы (embedded objects), такие как JavaScript, CSS и изображения. Если система индексации будет запрашивать эти ресурсы в режиме реального времени для тысяч страниц одновременно, это приведет к перегрузке (DDoS-атаке) серверов, на которых размещены эти ресурсы. Патент предлагает механизм для асинхронного сбора ресурсов и рендеринга без перегрузки сети, а также решает проблемы консистентности и обработки динамических URL (Cache-Busting URLs).
Запатентована система итеративного офлайн-рендеринга веб-страниц. Ключевая особенность — разделение процессов сканирования и рендеринга. Система пытается отрендерить страницу, используя уже просканированные ресурсы. Если необходимый встроенный объект отсутствует в базе данных, процесс рендеринга прерывается, а отсутствующий объект ставится в очередь на сканирование. Рендеринг страницы перезапускается только после того, как отсутствовавший ресурс будет просканирован.
Система состоит из трех основных компонентов:
Crawl Time) в базу данных.Rendering Engine. Когда Rendering Engine запрашивает встроенный объект, Scheduling Engine проверяет его наличие в базе. Если объект есть, он отправляется рендереру. Если нет, Scheduling Engine останавливает рендеринг и поручает Web Crawling Engine просканировать объект. После сканирования процесс рендеринга исходной страницы инициируется заново.Cache-Busting URLs), заменяя случайные числа или текущее время на константы или время сканирования основной страницы, чтобы обеспечить консистентность. Рендеринг завершается только тогда, когда все ресурсы получены.Высокая. Рендеринг страниц с исполнением JavaScript является критически важной частью современного процесса индексирования Google (Web Rendering Service - WRS). Описанная в патенте инфраструктура, обеспечивающая эффективное управление ресурсами и итеративный сбор данных, остается фундаментально актуальной для работы поисковых систем в масштабе интернета.
Патент имеет среднее значение для SEO-стратегии, но критически важен для технического SEO. Он не описывает факторы ранжирования, но детально раскрывает инфраструктуру и логику процесса рендеринга. Понимание этого механизма объясняет, почему Google может не видеть страницу так же, как браузер, если критически важные ресурсы (JS, CSS) заблокированы от сканирования, медленно загружаются или недоступны. Это напрямую влияет на индексацию контента, особенно для сайтов, полагающихся на JavaScript (SPA/PWA).
image file), аналогично веб-браузеру. Он обнаруживает и запрашивает встроенные объекты и нормализует динамические URL.Claim 1 (Независимый пункт): Описывает основную архитектуру системы.
Web Crawling Engine сканирует страницу и сохраняет контент и Crawl Time в репозиторий.Rendering Engine рендерит страницу в файл изображения, когда все объекты получены.Scheduling Engine координирует процесс: Rendering Engine на встроенный объект.Rendering Engine.Web Crawling Engine.Система разделяет сканирование и рендеринг. Рендеринг зависит от наличия данных в репозитории. Если данных нет, инициируется сканирование, а не запрос в реальном времени.
Claim 5 (Зависимый от 1): Уточняет действие при отсутствии ресурса.
Если контент встроенного объекта не хранится в репозитории, Scheduling Engine инструктирует Rendering Engine прервать (exit) процесс рендеринга веб-страницы.
Подтверждается, что рендеринг полностью останавливается, если ресурс недоступен в базе.
Claim 10 (Независимый пункт): Описывает метод рендеринга с точки зрения итеративного процесса.
Rendering Engine: Rendering Engine к Scheduling Engine.Rendering Engine контент.exiting the rendering process), и планируется сканирование объекта.Фокус на итеративной природе: процесс повторяется до тех пор, пока не будут удовлетворены все зависимости.
Claim 12 (Зависимый от 10): Описывает обработку динамических URL (Cache-Busting).
Система определяет, генерируется ли URL объекта динамически (возвращая разный URL при каждом обнаружении). Если ДА: система генерирует один и тот же URL (generating the same URL) для этого объекта каждый раз.
Это критически важный механизм нормализации, позволяющий распознавать один и тот же ресурс, даже если его URL постоянно меняется.
Claim 13 и 14 (Зависимые от 12): Уточняют метод нормализации для URL, зависящих от времени.
Если URL генерируется на основе текущего времени, система генерирует URL, используя время, основанное на Crawl Time самой веб-страницы. Это время может быть получено путем округления Crawl Time до ближайшего кратного предопределенного значения.
Claim 15 (Зависимый от 12): Уточняет метод нормализации для URL, зависящих от случайных чисел.
Если URL генерируется на основе случайного числа, система генерирует URL, используя одно и то же фиксированное число вместо случайного каждый раз.
Изобретение является инфраструктурным и охватывает два ключевых этапа поиска.
CRAWLING – Сканирование и Сбор данных
Web Crawling Engine активно используется для первоначального сканирования HTML-страницы. Затем, по запросу от Scheduling Engine, он используется для сканирования любых отсутствующих встроенных ресурсов (JS, CSS, изображения и т.д.).
INDEXING – Индексирование и извлечение признаков
Основное применение патента. Описанный процесс является реализацией этапа Рендеринга (Web Rendering Service или WRS) внутри конвейера индексирования. Rendering Engine исполняет код и создает визуальное представление страницы, которое затем используется для анализа контента и извлечения признаков.
Входные данные:
Crawl Time) веб-страницы.Выходные данные:
Cache-Busting URLs).Алгоритм применяется во время процесса индексирования для любой веб-страницы, которую система решает отрендерить.
A. Логика Scheduling Engine (Планировщик)
Crawl Time веб-страницы.Crawl Time в локальную базу данных планировщика (Scheduling Database) для обеспечения консистентности версии.Crawl Time в Rendering Engine.Rendering Engine.Rendering Engine. Переход к шагу 4.Rendering Engine прервать процесс (или ожидание тайм-аута).Web Crawling Engine.Rendering Engine завершает работу успешно, процесс планирования завершен.B. Логика Rendering Engine (Рендерер)
Crawl Time страницы от Scheduling Engine.Cache-Busting). Crawl Time страницы.Scheduling Engine.Image Indexing Database.Патент фокусируется на инфраструктуре рендеринга и использует следующие типы данных:
Cache-Busting URLs).Crawl Time (время сканирования) основной веб-страницы. Это критически важный элемент, используемый для обеспечения консистентности рендеринга и нормализации динамических URL, зависящих от времени.Патент не описывает метрики ранжирования, но описывает конкретные методы обработки данных для рендеринга:
Crawl Time страницы. . В описании патента приведен пример PredefinedValue равный 2 дням (172,800 секунд).Embedded Objects) должны быть доступны для сканирования. Отсутствие даже одного ресурса остановит текущую попытку рендеринга (Claim 5).Crawl Time HTML-документа. Это обеспечивает детерминированный и консистентный рендеринг.Crawl Time), используя Scheduling Database для сохранения этой версии, даже если страница часто обновляется.app.a1b2c3.js), а не динамические параметры запроса (app.js?v=12345).Embedded Objects и не завершит рендеринг.Cache-Busting URLs. Хотя Google пытается их нормализовать (Claims 13-15), это усложняет процесс и может привести к ошибкам сопоставления ресурсов, если логика генерации слишком сложна.Web Crawling Engine, что задержит их попадание в базу данных и, как следствие, отложит успешный рендеринг страницы из-за итеративной природы процесса.Embedded Object. Если он недоступен или медленно отвечает, рендеринг будет прерван.Этот патент подчеркивает фундаментальные инфраструктурные вызовы, с которыми сталкивается Google при индексировании современного интернета, особенно с учетом распространения JavaScript-фреймворков. Для SEO-специалистов это подтверждает, что техническая оптимизация доступности и скорости загрузки ресурсов — это необходимое условие для корректной индексации. Понимание итеративного процесса рендеринга помогает диагностировать проблемы: контент может быть не проиндексирован не потому, что он некачественный, а потому, что Google буквально не смог его "увидеть" из-за отсутствия необходимых ресурсов во время попытки рендеринга.
Сценарий: Диагностика проблем с индексацией JavaScript-контента (SPA)
Rendering Engine пытается исполнить JavaScript. Запрос к API рассматривается как запрос на Embedded Object. Если ответ API отсутствует в базе, Scheduling Engine прерывает рендеринг и ставит URL API в очередь на сканирование.Web Crawling Engine просканирует его. При следующей итерации рендеринга Rendering Engine успешно получит данные и контент будет проиндексирован.Сценарий: Обработка скриптов аналитики с динамическими URL
/track?t=1727197271) для обхода кэша.Rendering Engine обнаруживает этот Cache-Busting URL (Claim 12). Чтобы не сканировать его как новый ресурс при каждом рендеринге, он применяет нормализацию (Claim 13). Он заменяет текущее время t на округленное время сканирования основного HTML документа.Означает ли этот патент, что Google рендерит каждую страницу несколько раз?
Не обязательно, но это возможно. Если все необходимые ресурсы (JS, CSS, изображения) уже просканированы и находятся в базе данных Google, страница может быть отрендерена за одну попытку. Однако, если какой-либо ресурс отсутствует, процесс рендеринга будет прерван и перезапущен позже, после того как ресурс будет просканирован. Этот итеративный процесс гарантирует полноту рендеринга.
Что произойдет, если заблокировать JavaScript или CSS в robots.txt?
Согласно патенту, JavaScript и CSS являются Embedded Objects. Если они заблокированы, Web Crawling Engine не сможет их просканировать. Когда Rendering Engine запросит эти ресурсы, Scheduling Engine не найдет их в базе данных и прервет процесс рендеринга. В результате Google не сможет увидеть страницу так, как ее видит пользователь, что негативно скажется на индексации.
Как этот итеративный процесс влияет на скорость индексации контента?
Он может значительно замедлить индексацию, особенно для сложных сайтов. Каждая итерация добавляет задержку, так как системе нужно поставить недостающие ресурсы в очередь на сканирование, дождаться их получения, а затем снова запланировать рендеринг всей страницы. Оптимизация цепочек запросов критически важна для ускорения этого процесса.
Что такое "Cache-Busting URLs" и почему Google их нормализует?
Cache-Busting URLs — это URL ресурсов, которые динамически изменяются при каждой загрузке (например, содержат случайное число или временную метку), чтобы обойти кэш браузера. Google нормализует их (заменяя переменные части на константы), чтобы избежать необходимости сканировать один и тот же ресурс снова и снова. Это обеспечивает консистентность рендеринга и экономит ресурсы системы.
Как Google определяет время для нормализации динамических URL?
Патент указывает, что вместо использования текущего времени в момент рендеринга система использует время, основанное на Crawl Time основного HTML-документа. Оно может быть округлено до определенного интервала (например, до двух дней, как указано в описании), чтобы обеспечить стабильность URL для этой конкретной версии страницы.
Влияет ли скорость загрузки JavaScript и CSS на этот процесс?
Да, существенно. Если ресурсы загружаются медленно, Web Crawling Engine потратит больше времени на их сканирование. Поскольку рендеринг страницы не завершится до тех пор, пока все ресурсы не будут просканированы и помещены в базу данных, медленная загрузка ресурсов задерживает финальный рендеринг и индексацию контента страницы.
Обрабатывает ли система ресурсы, загружаемые внутри JavaScript (например, запросы API)?
Да. В патенте указано, что Rendering Engine обнаруживает и запрашивает все встроенные объекты, включая вложенные. Если JavaScript делает запрос к API для получения контента, этот запрос рассматривается как запрос на Embedded Object. Если ответ API отсутствует в базе, рендеринг будет прерван, а URL API поставлен в очередь на сканирование.
Может ли Google отрендерить страницу частично, если не все ресурсы доступны?
Согласно патенту (Claim 10), рендеринг веб-страницы в финальный файл изображения происходит только после того, как контент *всех* встроенных объектов получен. Если хотя бы один объект не получен, процесс прерывается. Это подразумевает, что система стремится к полному, а не частичному рендерингу.
Какое значение этот патент имеет для JavaScript SEO (SPA/PWA)?
Значение критическое. Он детально объясняет, как Google подходит к рендерингу контента, зависящего от JavaScript. Для успеха SPA/PWA необходимо гарантировать, что все JS-бандлы и запросы API быстро загружаются, доступны для сканирования и не содержат ошибок. Итеративный характер процесса объясняет задержки в индексации нового контента на JS-сайтах.
Как этот патент связан с Web Rendering Service (WRS) Google?
Этот патент описывает базовую инфраструктуру и логику, которая лежит в основе Web Rendering Service. WRS — это реализация Rendering Engine, а описанные механизмы планирования (Scheduling Engine) и итеративного сбора ресурсов обеспечивают его масштабируемость и эффективность при обработке миллиардов страниц.

Индексация
Краулинг
SERP

Индексация

SERP

Краулинг
Свежесть контента
Индексация

Антиспам
Структура сайта
Индексация

Поведенческие сигналы
Персонализация
EEAT и качество

Поведенческие сигналы
Мультимедиа
SERP

Поведенческие сигналы
SERP

Knowledge Graph
EEAT и качество
Семантика и интент

Персонализация
Семантика и интент
Поведенческие сигналы

Local SEO
Поведенческие сигналы

Свежесть контента
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Индексация
Структура сайта

Ссылки
SERP
Структура сайта
