Google использует механизм, позволяющий авторизованным владельцам сайтов напрямую отправлять структурированные данные (например, цены, наличие товара) в поисковый индекс. Этот процесс происходит по требованию («unscheduled update sequence»), значительно быстрее стандартного сканирования, и позволяет передавать приватные данные, недоступные публично на сайте.
Описание
Какую задачу решает
Патент решает две основные проблемы:
- Задержки обновления данных: Зависимость от стандартного графика сканирования (scheduled crawling) приводит к тому, что актуальные структурированные данные (например, цены, наличие товара) попадают в индекс с опозданием.
- Ограничение публичными данными: Стандартное сканирование не позволяет поисковой системе получить структурированные данные, которые владелец сайта не хочет или не может разместить на общедоступной веб-странице.
Что запатентовано
Запатентована система и метод, позволяющие авторизованному пользователю (verified user или authorized user) отправлять структурированные данные (search related structured data) для определенного URL напрямую в базу данных поисковой системы. Ключевая особенность — инициирование обновления записи URL во время «ранее незапланированной последовательности обновлений» (previously unscheduled update sequence), то есть по требованию (on-demand), минуя стандартный краулинг.
Как это работает
Система (Structured Data Association Engine) обрабатывает запросы от аутентифицированных пользователей двумя основными способами:
- Прямая отправка (Push Model): Пользователь отправляет запрос (например, через HTTP POST или API), содержащий сами структурированные данные и целевой URL. Система принимает эти данные без сканирования страницы.
- Целевое извлечение (Pull Model): Пользователь предоставляет private URL access key. Система использует этот ключ для доступа к специальной версии URL (например, добавляя ключ как параметр запроса), чтобы извлечь структурированные данные, которые могут быть недоступны при обычном сканировании.
Полученные данные дополняют (supplements) или заменяют (supplants) данные, полученные при стандартном сканировании (web crawl data). Данные также могут быть помечены ключом доступа (Access Key) для ограничения их использования в поиске.
Актуальность для SEO
Высокая. Механизмы обновления индекса по требованию критически важны в 2025 году, особенно для E-commerce и time-sensitive контента. Описанные в патенте принципы лежат в основе современных инструментов, таких как Google Indexing API (для быстрого обновления структурированных данных типа Jobs) и Google Merchant Center (прямая загрузка данных о товарах через фиды или Content API).
Важность для SEO
Патент имеет высокое значение (75/100) для технического и Enterprise SEO. Он описывает инфраструктуру, позволяющую вебмастерам активно управлять актуальностью своих структурированных данных в индексе Google, не дожидаясь краулера. Это напрямую влияет на видимость товаров, актуальность цен и отображение расширенных сниппетов (Rich Snippets), что является критическим фактором успеха в конкурентных нишах.
Детальный разбор
Термины и определения
- Search related structured data (Структурированные данные, связанные с поиском)
- Данные, относящиеся к документу, организованные в набор объектов с атрибутами. Упоминаемые форматы: PageMap, Microformats, RDFa, Microdata, meta tags.
- Verified User / Authorized User (Верифицированный / Авторизованный пользователь)
- Пользователь, подтвердивший право вносить изменения, связанные с URL (например, владелец сайта). Требуется аутентификация.
- Previously unscheduled update sequence (Ранее незапланированная последовательность обновлений)
- Обновление индекса по требованию пользователя, происходящее вне стандартного графика сканирования (scheduled crawling). Обеспечивает быстрое обновление.
- Web crawl data (Данные веб-сканирования)
- Данные, полученные поисковой системой путем стандартного сканирования общедоступного URL.
- Private URL access key (Приватный ключ доступа к URL)
- Ключ, предоставляемый пользователем системе. Используется для доступа к специальной версии URL, содержащей структурированные данные, которые могут быть невидимы без ключа (Метод Pull).
- Access Key (Ключ доступа — на уровне базы данных)
- Метка, ассоциируемая со структурированными данными в базе данных. Доступ к этим данным возможен только при предъявлении соответствующего ключа (например, для Custom Search Engine).
- Indexing quota (Квота на индексирование)
- Ограничение на количество или частоту отправок структурированных данных для URL, домена или пользователя.
- Structured Data Association Engine
- Компонент системы, отвечающий за прием, обработку и сохранение пользовательских структурированных данных.
Ключевые утверждения (Анализ Claims)
Патент содержит два ключевых независимых пункта (Claim 1 и Claim 10), описывающих разные аспекты механизма.
Claim 1 (Независимый пункт): Описывает метод прямой загрузки (Push).
- Система получает пользовательский запрос на ассоциацию структурированных данных с URL.
- Система получает эти данные от пользователя, причем данные принимаются без доступа к документу, на который указывает URL (т.е. без сканирования страницы).
- Система ассоциирует эти данные с записью URL в поисковой базе данных.
- Условие: по крайней мере часть данных дополняет (supplements) данные, полученные путем стандартного сканирования URL (web crawl data).
Claim 10 (Независимый пункт): Описывает метод обновления по требованию с авторизацией.
- Система получает от пользователя инструкцию по обновлению (update instruction), идентифицирующую URL и предоставляющую доступ к данным.
- Система получает данные аутентификации пользователя, подтверждающие его авторизацию.
- На основании авторизации система модифицирует соответствующую запись в базе данных.
- Условие: инструкция инициирует модификацию во время previously unscheduled update sequence (т.е. обновление по требованию).
Claim 6 и 13 (Зависимые): Уточняют возможность передачи приватных данных.
По крайней мере часть предоставленных пользователем структурированных данных недоступна (inaccessible) через стандартное сканирование URL.
Claim 16 и 17 (Зависимые от 10): Детализируют механизм извлечения (Pull).
URL может быть общедоступным URL, дополненным private access key. Данные, полученные через сканирование этого специального URL (с ключом), недоступны при сканировании общедоступного URL (без ключа).
Где и как применяется
Изобретение затрагивает этапы сбора данных и индексирования, предоставляя альтернативный конвейер данных.
CRAWLING – Сканирование и Сбор данных
Механизм позволяет обойти стандартное сканирование (при прямой загрузке — Push) или инициировать специализированное сканирование (при использовании private URL access key — Pull). Structured Data Association Engine выступает в роли приемника данных или специализированного краулера.
INDEXING – Индексирование и извлечение признаков
Основной этап применения. Structured Data Association Engine обрабатывает полученные данные и обновляет Content Database (поисковый индекс). На этом этапе происходит слияние: пользовательские данные могут дополнять (supplement) или заменять (supplant) существующие web crawl data. Также данным могут быть присвоены Access Keys для ограничения доступа.
RANKING / RERANKING – Ранжирование / Переранжирование
Поисковая система (Search Engine) использует эти обновленные структурированные данные для идентификации результатов, сортировки, фильтрации и формирования отображения результатов (например, Rich Snippets).
Входные данные:
- Запрос на обновление (Update instruction).
- Идентификатор URL.
- Данные аутентификации пользователя.
- Структурированные данные (при методе Push) ИЛИ Private URL access key (при методе Pull).
Выходные данные:
- Обновленная запись URL в Content Database с актуальными структурированными данными.
На что влияет
- Конкретные ниши или тематики: Наибольшее влияние в E-commerce (цены, наличие), а также для сайтов с вакансиями (Jobs), событиями (Events) и рецептами. Влияет на ниши, где актуальность структурированных данных критична.
- Специфические типы данных: В патенте упоминаются атрибуты total number of reviews (общее количество отзывов) и total number of downloads (общее количество загрузок) как примеры данных, которые могут быть отправлены этим методом, даже если они отсутствуют на странице.
- Специализированный поиск: Влияет на Custom Search Engines (CSE), позволяя использовать приватные структурированные данные для улучшения поиска.
Когда применяется
- Триггеры активации: Механизм активируется по явному запросу (user generated request или update instruction) от авторизованного пользователя.
- Временные рамки: Применяется по требованию (unscheduled update sequence). Ассоциация происходит в течение предопределенного периода времени (predefined time period); в патенте приведен пример «менее 6 часов».
- Условия и пороги: Применение ограничено квотами (indexing quota). Если квота превышена, запрос может быть отклонен или обработан с задержкой (например, первые запросы обрабатываются быстро, последующие медленнее).
Пошаговый алгоритм
Патент описывает два варианта реализации.
Вариант А: Прямая отправка данных (Push Model / Direct Submission)
- Аутентификация и Запрос: Авторизованный пользователь инициирует запрос на ассоциацию структурированных данных с URL.
- Передача данных: Пользователь отправляет структурированные данные (например, через HTTP POST) в Structured Data Association Engine. Система получает данные без сканирования целевого URL.
- Проверка квот: Система проверяет соблюдение indexing quota.
- Обработка и Ассоциация: Система обрабатывает данные и ассоциирует их с записью URL в Content Database в рамках unscheduled update sequence.
- Слияние данных: Новые данные сливаются с существующими web crawl data (дополнение или замена).
- (Опционально) Установка приватности: Если указан Access Key, данные помечаются для ограниченного доступа.
Вариант Б: Целевое извлечение (Pull Model / Private Key Crawl)
- Аутентификация и Запрос: Авторизованный пользователь отправляет update instruction и предоставляет private URL access key.
- Проверка квот: Система проверяет соблюдение indexing quota.
- Специализированное сканирование: Structured Data Association Engine обращается к целевому URL, используя предоставленный ключ (например, как параметр запроса).
- Получение данных: Сервер целевого URL, распознав ключ, отдает контент со структурированными данными (возможно, скрытыми от публичного доступа).
- Извлечение и Ассоциация: Система извлекает данные и ассоциирует их с записью URL в Content Database в рамках unscheduled update sequence.
- Слияние и Приватность: Данные сливаются с web crawl data и могут быть помечены Access Key.
Какие данные и как использует
Данные на входе
Патент фокусируется на механизме передачи данных.
- Структурные факторы (Основной ввод): Система принимает search related structured data. Упоминаемые форматы: PageMap (основной пример в патенте), meta tags, Microformats, RDFa, Microdata. Примеры атрибутов: title, review, publication date.
- Пользовательские факторы (Аутентификация): Данные для верификации пользователя (user authentication data), например, токен аутентификации.
- Технические данные (Ключи доступа):
- Private URL access key: Для доступа к специальной версии URL (Метод Pull).
- Access Key: Для маркировки данных в индексе как приватных.
Какие метрики используются и как они считаются
Патент не описывает метрики ранжирования, но упоминает операционные метрики:
- Indexing quota (Квота на индексирование): Предопределенное количество отправок за период времени. Система отслеживает использование квот для управления нагрузкой.
- Predefined time period (Предопределенный период времени): Гарантированное время обработки запроса (например, менее 6 часов).
- Уникальные атрибуты (Unique attribute type): Примеры данных, которые могут быть переданы этим методом и отсутствовать в web crawl data:
- total number of reviews (общее количество отзывов).
- total number of downloads (общее количество загрузок).
Выводы
- Индексирование по требованию (On-Demand Indexing): Google имеет инфраструктуру для приема структурированных данных напрямую от вебмастеров, позволяя обновлять индекс по требованию (unscheduled update sequence), минуя стандартное сканирование.
- Приоритет скорости: Система спроектирована для быстрого обновления критически важных данных в течение предопределенного периода времени (например, часов, а не дней).
- Поддержка приватных данных: Патент явно предусматривает индексацию структурированных данных, которые недоступны при публичном сканировании URL.
- Два механизма передачи (Push и Pull): Данные могут быть загружены напрямую (Push) или извлечены системой с использованием private URL access key (Pull).
- Контроль доступа в индексе: Индексированные данные могут быть защищены ключом (Access Key) на уровне базы данных, ограничивая их использование авторизованными системами (например, Custom Search Engines).
- Авторизация и Квоты: Доступ к механизму имеют только авторизованные пользователи (verified user), и его использование ограничено квотами (indexing quota).
- Слияние данных: Отправленные пользователем данные сливаются с web crawl data, при этом они могут как дополнять, так и заменять данные сканирования.
Практика
Best practices (это мы делаем)
- Внедрение механизмов прямой отправки: Для контента, где актуальность структурированных данных критична (E-commerce, Jobs, Events), необходимо использовать доступные реализации этого патента: Google Merchant Center Feeds/Content API (для товаров) и Google Indexing API (для вакансий и трансляций). Это гарантирует быструю доставку актуальных данных в индекс.
- Автоматизация подачи данных: Настроить интеграцию CMS/PIM систем для автоматической отправки обновлений при изменении информации на сайте (например, изменение цены или статуса наличия).
- Поддержание точности данных: Поскольку отправленные данные могут заменять (supplant) данные сканирования, критически важно обеспечить их абсолютную точность перед отправкой.
- Мониторинг квот и ошибок: Отслеживать использование indexing quota и обрабатывать ответы API, чтобы гарантировать доставку данных и своевременно реагировать на проблемы с лимитами или аутентификацией.
- Использование приватных атрибутов для CSE (если применимо): Если используется Google Custom Search Engine, применять механизм отправки приватных структурированных данных (с Access Key) для добавления атрибутов, полезных для внутренней фильтрации (например, внутренняя классификация, рейтинг поставщика), которые не должны быть видны публично.
Worst practices (это делать не надо)
- Полагаться только на стандартный краулинг: Игнорировать возможности прямой отправки для time-sensitive информации. Это приводит к неактуальной информации в SERP (неверные цены, недоступные товары) и потере трафика.
- Отправка противоречивых данных: Отправлять через API данные, которые противоречат публичному контенту на странице. Хотя система технически позволяет это (Claim 1), это может подорвать доверие поисковой системы.
- Игнорирование стандартной разметки на сайте: Отказываться от размещения Schema.org на веб-страницах, полагаясь исключительно на прямую отправку. Прямая отправка предназначена для дополнения и быстрого обновления, а не полной замены.
- Спам обновлениями: Злоупотреблять механизмом для незначительных изменений, что может привести к исчерпанию indexing quota.
Стратегическое значение
Патент подтверждает стратегический сдвиг Google от модели чистого сканирования к гибридной модели, включающей прямой прием данных от доверенных источников. Это повышает актуальность индекса и снижает нагрузку на краулинг. Для SEO это означает необходимость перехода от пассивной оптимизации к активному управлению данными в индексе через API и инструменты, реализуя концепцию Real-Time SEO для структурированных данных.
Практические примеры
Сценарий 1: Быстрое обновление наличия товара (E-commerce)
- Ситуация: На сайте интернет-магазина закончился товар. Стандартный краулер может не увидеть это изменение несколько дней.
- Действие (на основе патента — Push): Авторизованная система магазина генерирует обновленные структурированные данные (статус наличия) и отправляет их напрямую в Google (на практике – через Merchant Center Feed или Content API).
- Результат: Запись URL в индексе обновляется в течение короткого времени (unscheduled update sequence). Информация в Google Shopping и расширенных сниппетах актуализируется, предотвращая негативный опыт пользователей.
Сценарий 2: Индексация приватных данных для корпоративного поиска (CSE)
- Ситуация: Компания использует Google CSE для поиска по каталогу. Необходимо добавить фильтр по атрибуту «Маржинальность», который не должен быть виден публично.
- Действие (на основе патента — Push с Access Key): Компания настраивает отправку структурированных данных. Атрибут «Маржинальность» отправляется с указанием Access Key.
- Результат: Атрибут индексируется, но доступ к нему ограничен. Корпоративная поисковая система (CSE), настроенная на использование этого Access Key, может применять фильтр по маржинальности. Публичный поиск Google не имеет доступа к этому атрибуту.
Вопросы и ответы
Заменяет ли этот механизм стандартное сканирование (crawling)?
Нет, он его дополняет. Патент указывает, что отправленные данные supplements web crawl data (дополняют данные веб-сканирования). Основная цель – обеспечить быстрое обновление именно структурированных данных по требованию или предоставить данные, недоступные при обычном сканировании. Сканирование остального контента страницы происходит в обычном режиме.
Как быстро обновляются данные при использовании этого метода?
Обновление происходит значительно быстрее, чем при стандартном сканировании, в рамках «незапланированной последовательности обновления». Патент упоминает predefined time period (предопределенный период времени) и приводит пример «менее шести часов». На практике современные API могут отрабатывать за минуты или часы.
Что такое «Private URL access key» и как он работает (Pull Model)?
Это секретный ключ, который вебмастер предоставляет Google. Система использует этот ключ при обращении к URL (например, добавляя его как GET-параметр: ?key=secret). Сервер вебмастера, распознав ключ, отдает специальную версию страницы с дополнительными структурированными данными, которые скрыты от обычных пользователей и стандартного Googlebot.
Чем отличается «Private URL access key» от «Access Key»?
Private URL access key используется для получения данных с сайта вебмастера во время специализированного сканирования (Pull Model). Access Key используется для защиты данных уже внутри базы данных Google, чтобы ограничить доступ к ним (например, только для вашего Custom Search Engine).
Может ли кто угодно отправить структурированные данные для моего сайта?
Нет. Патент требует обязательной аутентификации. Отправлять данные может только verified user или authorized user (верифицированный или авторизованный пользователь), подтвердивший свои права на управление URL. На практике это реализуется через подтверждение прав в GSC или использование авторизованных API-ключей.
Можно ли отправить структурированные данные, которых нет на сайте?
Да, это одна из ключевых возможностей. Патент явно предусматривает отправку данных, которые недоступны при обычном сканировании (inaccessible through crawling). Это могут быть дополнительные атрибуты, которые вы не хотите показывать пользователям, но хотите предоставить поисковой системе (например, общее количество загрузок).
Как этот патент связан с Google Indexing API или Merchant Center?
Этот патент описывает базовую технологию и инфраструктуру, которая лежит в основе этих инструментов. Merchant Center реализует концепцию прямой загрузки (Push Model) структурированных данных о товарах. Indexing API реализует концепцию обновления по требованию (unscheduled update sequence) для определенных типов контента.
Что такое квоты на индексирование (Indexing quota) в контексте этого патента?
Это ограничения на частоту использования механизма обновления по требованию. Система ограничивает количество запросов за определенный период для предотвращения перегрузки. При превышении квоты запросы могут быть отклонены или обработаны с задержкой, что требует от SEO-специалистов мониторинга лимитов.
Что произойдет, если данные, отправленные напрямую, конфликтуют с данными на странице?
Патент указывает, что предоставленные пользователем данные могут как дополнять (supplement), так и заменять (supplant) данные, полученные при сканировании. В случае конфликта приоритет, вероятно, отдается данным, отправленным напрямую аутентифицированным пользователем, так как они считаются более актуальными.
Для каких типов сайтов этот механизм наиболее важен?
Он критически важен для сайтов с высокой частотой обновления данных, влияющих на принятие решений пользователем. Это E-commerce (цены, наличие), сайты вакансий, агрегаторы событий и билетов. Для них задержка в обновлении индекса может приводить к прямым финансовым потерям.