
Google использует специализированную архитектуру для рендеринга веб-страниц в пакетном режиме (для индексации). Система применяет «Виртуальные часы», чтобы избежать таймаутов при медленной загрузке ресурсов и ускорить процесс. Также она оптимизирует нагрузку, игнорируя ненужные скрипты (например, аналитику), дедуплицируя ресурсы и используя «Mock Images» (заглушки с размерами) для расчета макета страницы.
Патент решает проблему эффективности, надежности и масштабируемости рендеринга огромного количества веб-страниц (триллионы) в пакетном режиме (batch process), например, для индексации поисковой системой. Стандартный рендеринг неэффективен в масштабах веба из-за высокой латентности сети (fetch latency), частых таймаутов ожидания ресурсов и загрузки избыточного или ненужного контента (например, скриптов аналитики или тяжелых изображений).
Запатентована архитектура рендеринга и выборки, оптимизированная для пакетной обработки. Ключевым элементом является использование Virtual Clock (Виртуальных часов) в механизме рендеринга. Эти часы останавливаются во время ожидания загрузки ресурсов и выполнения задач, что позволяет избежать таймаутов и ускорить процесс. Также система включает оптимизированный Fetch Server, который использует правила перезаписи (Rewrite Rules) для дедупликации, черные списки (Blacklists) для игнорирования ненужного контента и Mock Images для ускорения расчета макета.
Система работает следующим образом:
Rendering Engine инициализирует Virtual Clock и список задач (Task List), включая финальную задачу остановки (Stop Task) через заданное время (например, 20 секунд виртуального времени).Virtual Clock стоит на месте. Это скрывает задержки сети и предотвращает таймауты. Когда система простаивает, Virtual Clock перематывается вперед ко времени следующей задачи.Fetch Server. Сервер применяет URL Rewrite Rules для выявления дубликатов (например, Cache-Busting URLs) или блокировки ненужных скриптов. Для изображений часто возвращаются только размеры (Mock Image), а не пиксельные данные.Virtual Clock достигает времени Stop Task. Генерируется результат рендеринга (Rendering Result), включающий DOM, макет и ошибки.Высокая. Рендеринг JavaScript-контента является критически важным компонентом современного поиска Google (Web Rendering Service - WRS). Описанные механизмы оптимизации необходимы для обработки динамических сайтов в масштабах интернета. Принципы, заложенные в патенте, лежат в основе того, как Googlebot обрабатывает и понимает современные веб-приложения.
Патент имеет критическое значение для технического SEO, особенно для сайтов, полагающихся на JavaScript (SPA/PWA). Он не описывает факторы ранжирования, но детально раскрывает инфраструктуру, которую Google использует для рендеринга. Понимание механизмов Virtual Clock, Stop Task и оптимизации выборки (игнорирование скриптов, Mock Images) позволяет точно понять, как Googlebot видит страницу, какие ресурсы он загружает и какие ограничения применяет во время рендеринга для индексации.
Rendering Engine. Управляет кэшированием, применением правил перезаписи и взаимодействием с краулером.Virtual Clock.Layout/Render Tree), изображение страницы, список загруженных ресурсов, ошибки JavaScript.Fetch Server для нормализации URL. Позволяют идентифицировать дублирующийся контент (например, из-за параметров сброса кэша — Cache-Busting URLs) или ресурсы в черном списке.Task List, запланированная на определенное время (например, 20 секунд). По достижении этого времени рендеринг завершается.Rendering Engine (парсинг HTML, выполнение JS, изменение стилей). Каждая задача имеет время выполнения, привязанное к Virtual Clock.Rendering Engine. Часы не идут в реальном времени: они стоят на месте во время ожидания выборки ресурсов и выполнения задач и перематываются (перескакивают) вперед во время простоя.Claim 1 (Независимый пункт): Описывает систему пакетного рендеринга с оптимизацией выборки (дедупликацией) и использованием виртуальных часов.
Virtual Clock и Task List. В список добавляется Stop Task с заданным временем выполнения.Virtual Clock.Virtual Clock: часы продвигаются вперед путем установки времени следующей задачи в списке; часы остаются неизменными (останавливаются), пока есть задачи, готовые к выполнению в текущее время (или, как указано в описании, ожидается ресурс).Rewrite Rule), что контент этого ресурса дублирует контент ранее полученного ресурса.Rendering Result, когда Virtual Clock достигает времени Stop Task.Claim 7 (Независимый пункт): Описывает метод пакетного рендеринга с фокусом на механизме Virtual Clock (аналогично Claim 1, но без акцента на дедупликацию).
Virtual Clock и Task List с добавлением Stop Task.Virtual Clock (остановка во время выполнения/ожидания, перемотка во время простоя).Rendering Result по достижении времени Stop Task.Claim 4 (Зависимый от 1): Описывает механизм черных списков.
Система идентифицирует ресурс и определяет, находится ли он в черном списке (blacklisted). Если да, возвращается ошибка без выборки контента, и рендеринг продолжается без этого ресурса.
Claim 6 (Независимый пункт) и Claim 11 (Зависимый от 7): Описывают использование Mock Images.
Система идентифицирует встроенное изображение и получает в ответ Mock Image, который содержит размеры изображения (взятые из Dimension Table), но пустое содержимое. Этот Mock Image используется при генерации Rendering Result.
Изобретение является ключевой частью инфраструктуры сканирования и индексирования Google, обеспечивающей работу Web Rendering Service (WRS).
CRAWLING – Сканирование и Сбор данных
Web-Crawling Engine (Googlebot) собирает сырой контент. Fetch Server взаимодействует с краулером для получения встроенных ресурсов (CSS, JS, Images). Запатентованные механизмы оптимизации (дедупликация, черные списки) снижают нагрузку на краулер и ускоряют сбор данных.
INDEXING – Индексирование и извлечение признаков
Основное применение патента. Indexing Engine запрашивает рендеринг у Render Server (WRS). Rendering Engine использует Virtual Clock для быстрого и детерминированного рендеринга страницы. Полученный Rendering Result (включая динамический контент, финальный DOM и Layout) используется индексатором для извлечения признаков и понимания структуры страницы.
Входные данные:
URL Rewrite Rules, кэш ресурсов (Embedded Item Table), Image Dimension Table (используются Fetch Server).Выходные данные:
Rendering Result: Включает Image (снимок страницы), DOM Tree, Layout (Render Tree), Errors (ошибки JS), список загруженных ресурсов.Layout).Алгоритм применяется всегда, когда поисковая система выполняет рендеринг страницы для индексации.
Stop Task.Процесс А: Рендеринг страницы (Rendering Engine и Virtual Clock)
Virtual Clock (например, 0 секунд). Создание Task List. Добавление начальных задач и Stop Task (например, 20 секунд).Fetch Server? Если ДА, Virtual Clock не двигается (система ждет или выполняет другие готовые задачи).Virtual Clock не двигается во время выполнения. Выполнение может порождать новые задачи (например, setTimeout) или запросы к Fetch Server.Virtual Clock перематывается ко времени следующей запланированной задачи.Stop Task, рендеринг завершается.Rendering Result (DOM, Layout, Errors) и возврат его запрашивающему процессу.Процесс Б: Обработка запроса ресурса (Fetch Server)
Rendering Engine.URL Rewrite Rules для нормализации URL (дедупликация) и проверки черных списков.Blacklisted), возврат ошибки.Embedded Item Table.Image Dimension Table. Если размеры найдены и не устарели, генерация и возврат Mock Image.Stale), возврат кэшированного контента.Mock Image в Rendering Engine.Патент фокусируется на инфраструктуре рендеринга и использует следующие типы данных:
URL Rewrite Rules.Mock Images и расчета макета (Layout). Патент явно указывает, что реальные пиксельные данные изображений часто не используются для экономии ресурсов.change rate), его типа или времени последнего сканирования.Mock Images.Batch-Optimized Architecture), оптимизированную для скорости, масштаба и детерминизма, а не для визуальной точности или интерактивности.Virtual Clock специально разработан для скрытия сетевых задержек (fetch latency). Система будет ждать загрузки ресурсов, так как время останавливается во время ожидания. Это опровергает миф о том, что Googlebot может не дождаться загрузки медленных скриптов.Stop Task, например, 5-20 секунд). Если процесс не завершится к этому моменту, он будет прерван.Blacklist. Дублирующиеся ресурсы (например, из-за cache-busting URL) дедуплицируются через URL Rewrite Rules.Layout Google использует Mock Images (заглушки с нужными размерами), а не реальные пиксельные данные. Для оценки структуры страницы важны только размеры изображений.Mock Images на основе этих размеров для расчета Layout, это критично для стабильности макета (Cumulative Layout Shift) во время рендеринга Googlebot.Virtual Clock гарантирует, что Googlebot дождется их загрузки, если они доступны.Stop Task. Хотя ожидание загрузки не тратит виртуальное время, сложный JS-код может замедлить процесс рендеринга.Blacklist) не нарушала отображение основного контента.Mock Images и может привести к некорректной оценке структуры страницы и высокому CLS.Blacklist (например, системы персонализации или A/B тестирования).Virtual Clock ускоряет время простоя, это увеличивает риск достижения Stop Task до появления контента.Rendering Result включает в себя ошибки (Errors). Наличие критических ошибок может прервать выполнение скриптов и привести к неполному рендерингу.Патент подтверждает стратегическую важность технического SEO и понимания процесса рендеринга. Google разработал инфраструктуру, устойчивую к медленной загрузке ресурсов, но ориентированную на быстрое извлечение структуры и контента. Для SEO это означает, что оптимизация Critical Rendering Path, обеспечение стабильности макета (CLS) и эффективное выполнение JavaScript являются приоритетами для обеспечения полной индексации современных веб-сайтов.
Сценарий: Обеспечение стабильности макета для Googlebot (CLS)
Mock Images. Если размеры изображений не были указаны в HTML, WRS не смог зарезервировать место и рассчитал Layout некорректно.width и height для всех тегов <img> и убедиться, что CSS корректно управляет адаптивностью (например, height: auto;).Layout с зарезервированным пространством под изображения с самого начала рендеринга. Это улучшает оценку визуальной стабильности страницы.Сценарий: Оптимизация рендеринга JavaScript-приложения (SPA)
Stop Task до того, как контент появится в DOM.Virtual Clock).Stop Task.Что такое «Виртуальные часы» (Virtual Clock) и как они влияют на рендеринг Googlebot?
Virtual Clock — это механизм симуляции времени при рендеринге. Он не идет в реальном времени. Он останавливается, когда Googlebot ждет загрузки ресурсов (CSS, JS, API) или выполняет задачи. Когда система простаивает, часы «перематываются» вперед. Это позволяет Googlebot избегать таймаутов при медленной загрузке ресурсов и значительно ускоряет общий процесс рендеринга.
Значит ли это, что скорость загрузки ресурсов (TTFB) не важна для Googlebot?
Скорость загрузки ресурсов менее критична для успешного завершения рендеринга, чем считалось ранее, так как Virtual Clock предотвращает таймауты. Однако скорость по-прежнему влияет на общий бюджет сканирования (Crawl Budget) в реальном времени, и ресурсы должны быть доступны (не возвращать ошибки).
Если Googlebot ждет все ресурсы, существует ли вообще лимит времени на рендеринг?
Да, существует. В начале рендеринга устанавливается задача остановки (Stop Task) на определенное виртуальное время (в патенте упоминаются примеры от 5 до 20 секунд). Если общий процесс рендеринга не завершится до достижения этого лимита виртуального времени, он будет прерван.
Как Google обрабатывает анимации и таймеры (setTimeout)?
Система обрабатывает их ускоренно. Если страница устанавливает таймер на 5 секунд (setTimeout(func, 5000)), и в это время нет других задач, Virtual Clock не будет ждать 5 реальных секунд. Он сразу перескочит на 5 секунд вперед и выполнит задачу таймера мгновенно.
Как Google обрабатывает изображения во время рендеринга?
Для экономии ресурсов Google часто не загружает реальные пиксельные данные. Вместо этого система использует Image Dimension Table, чтобы узнать размеры изображения, и создает заглушку (Mock Image) с этими размерами, но пустым содержимым. Этого достаточно для расчета макета страницы (Layout).
Какое практическое значение имеет использование Mock Images для SEO?
Это подчеркивает критическую важность указания атрибутов width и height для изображений в HTML или CSS. Поскольку расчет макета основан на этих размерах, их отсутствие может привести к нестабильности макета (Layout Shifts) во время рендеринга, что негативно сказывается на оценке страницы (например, метрика CLS).
Загружает ли Googlebot скрипты аналитики и трекинга?
Патент указывает, что система использует черные списки (Blacklists) для игнорирования ресурсов, ненужных для пакетного рендеринга. В качестве примера прямо упоминается Google Analytics. Скрипты, не влияющие на отображение контента или макет (аналитика, реклама, трекеры), скорее всего, игнорируются.
Что произойдет, если критически важный контент загружается через скрипт, который попал в Blacklist?
Если скрипт, необходимый для отображения контента, заблокирован (попал в Blacklist), этот контент не будет отрендерен и, следовательно, не будет проиндексирован. Необходимо избегать зависимости критического контента от сторонних скриптов, которые могут быть классифицированы как ненужные.
Как Google обрабатывает URL с динамическими параметрами (например, для сброса кэша)?
Система использует URL Rewrite Rules для дедупликации таких ресурсов (Cache-Busting URLs). Если система определяет, что разные URL ведут к одному и тому же контенту (например, отличаются только временной меткой), она использует ранее закэшированную версию. Это позволяет оптимизировать процесс сканирования.
Как система обеспечивает детерминированность рендеринга, если в коде используется текущее время (например, Date())?
Патент упоминает, что система может использовать значение Virtual Clock вместо реального времени. Это гарантирует, что при каждом рендеринге страницы функции, зависящие от времени, будут возвращать одно и то же значение, обеспечивая повторяемость (детерминированность) результатов и эффективность кэширования.

Индексация
Краулинг
Техническое SEO

SERP

Краулинг
Техническое SEO

Индексация
SERP
Краулинг

SERP

Ссылки
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

Ссылки
Антиспам
SERP

Техническое SEO
Ссылки

Мультиязычность
Семантика и интент
Ссылки

Семантика и интент
SERP
Поведенческие сигналы

Индексация
Ссылки
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Knowledge Graph
Семантика и интент
EEAT и качество
