Патент Google описывает метод шифрования платного (premium) контента, позволяющий безопасно передавать весь контент пользователю, скрывая платную часть до авторизации. Ключевое значение для SEO: этот метод позволяет поисковым системам (явно указанным как доверенные стороны) получать доступ и индексировать полный текст контента, соблюдая бизнес-модель издателя и не нарушая правил поиска.
Описание
Какую задачу решает
Патент решает фундаментальный конфликт между необходимостью ограничения доступа к премиум-контенту (Paywall) и обеспечением его доступности для индексации поисковыми системами.
Он устраняет недостатки традиционных методов:
- Client-side методы: Контент доставляется полностью, но скрывается (например, через CSS/JS). Уязвимость: премиум-контент доступен в исходном коде страницы (plain text).
- Server-side методы: Контент доставляется только после авторизации. Проблема: усложняет кеширование, требует повторных запросов и создает риски клоакинга, если краулеру и пользователю отдается разный контент.
Изобретение позволяет безопасно доставлять весь контент в частично зашифрованном виде, обеспечивая доступ к полной версии только авторизованным субъектам, включая поисковые системы.
Что запатентовано
Запатентована система двухэтапного шифрования для управления доступом к контенту. Премиум-контент (Premium Content) шифруется уникальным симметричным ключом документа (First Cryptographic Key). Затем этот ключ и правила доступа (Access Data) шифруются с использованием публичных ключей авторизованных субъектов (Authorizers). Authorizers могут включать издателя, CDN и, что критически важно для SEO, поисковые индексаторы (search indexer).
Как это работает
Механизм работает следующим образом:
- Шифрование (Издатель): Издатель шифрует премиальную часть контента уникальным ключом (Key A). Затем он шифрует Key A, используя публичные ключи всех доверенных Authorizers (например, Googlebot, сервис подписки).
- Доставка: Пользователю или краулеру доставляется Partially Encrypted Media (бесплатный контент + зашифрованный премиум-контент + зашифрованные пакеты ключей).
- Запрос на доступ (Клиент): Клиент (браузер или краулер) отправляет свой пакет зашифрованных ключей и данные о своих правах доступа (Entitlement Data) соответствующему Authorizer.
- Авторизация (Authorizer): Authorizer расшифровывает пакет своим приватным ключом и проверяет права доступа. Если доступ разрешен, он возвращает клиенту ключ документа (Key A).
- Локальная дешифровка (Клиент): Клиент использует Key A для локальной расшифровки премиум-контента и отображает полную версию.
Актуальность для SEO
Высокая. Баланс между монетизацией контента (paywalls) и SEO-видимостью является критически важной задачей. Этот патент предлагает стандартизированное техническое решение, которое напрямую поддерживает рекомендации Google по работе с платным контентом (Flexible Sampling). Участие изобретателей, связанных с AMP и веб-стандартами (например, Malte Ubl), указывает на фокус на производительности и широком внедрении.
Важность для SEO
Влияние на SEO значительное (8/10), особенно для сайтов с моделями подписки. Хотя это инфраструктурный патент, а не алгоритм ранжирования, он предоставляет техническую основу для того, чтобы Googlebot (явно указанный как search indexer и потенциальный Authorizer) мог получить доступ и проиндексировать полный текст платного контента. Это напрямую влияет на то, как издатели должны реализовывать paywall, чтобы избежать проблем с клоакингом и обеспечить полную видимость в поиске.
Детальный разбор
Термины и определения
- Access Data (Данные доступа)
- Информация, определяющая необходимые права (access entitlements) для доступа к премиум-контенту. Например, «требуется годовая подписка». Может не содержать идентифицирующих пользователя данных.
- Authorizer (Авторизующий субъект)
- Сущность, которая проверяет права клиента и предоставляет ключ для дешифровки. Патент явно указывает, что Authorizer может быть издателем, поисковым индексатором (search indexer), сервисом кеширования (cache service), CDN или сервисом paywall (paywall service).
- Entitlement Data (Данные о правах)
- Данные, отправляемые клиентом (пользователем или краулером) авторизующему субъекту для подтверждения своих прав доступа (например, cookie, токен доступа).
- First Cryptographic Key (Первый криптографический ключ)
- Симметричный ключ шифрования (например, AES), уникальный для конкретного документа. Используется для шифрования и дешифровки Premium Content.
- Key Identifier (keyid) (Идентификатор ключа)
- Метка, включаемая в зашифрованную структуру данных, которая указывает, какой именно ключ Authorizer использовался. Применяется для поддержки ротации ключей.
- Partially Encrypted Media (Частично зашифрованный медиафайл)
- Итоговый файл, доставляемый клиенту. Содержит бесплатный контент в открытом виде и Premium Content в зашифрованном виде, а также зашифрованные структуры данных с ключами.
- Premium Content (Премиум-контент)
- Часть контента, доступ к которой ограничен (зашифрована).
- Second/Third Cryptographic Key (Второй/Третий криптографический ключ)
- Ключи, принадлежащие Authorizers. Обычно это публичные ключи (асимметричное шифрование), используемые издателем для шифрования First Cryptographic Key и Access Data.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает базовый метод создания частично зашифрованного контента.
- Генерация Partially Encrypted Media, который включает вторую (премиум) часть контента, зашифрованную с помощью First Cryptographic Key, и первую (бесплатную) часть, которая может быть отображена независимо.
- Шифрование First Cryptographic Key и Access Data с помощью Second Cryptographic Key.
- Включение этих зашифрованных данных в состав Partially Encrypted Media.
Claim 3 (Зависимый от 1): Вводит понятие внешнего авторизующего субъекта и делегирования авторизации.
- Генерация специфичной для авторизатора зашифрованной структуры данных путем шифрования данных с помощью Third Cryptographic Key, связанного с Authorizer, который отличается от издателя.
Claim 6 (Зависимый от 3): Определяет типы авторизующих субъектов. Это критически важный пункт для SEO.
- Authorizer включает в себя search indexer (поисковый индексатор), cache service, content delivery network (CDN) или paywall service.
Ядро изобретения заключается в методе, который позволяет издателю делегировать авторизацию доступа к зашифрованному контенту третьим сторонам, включая поисковые системы, путем предоставления им механизма для безопасного получения ключа дешифровки документа.
Где и как применяется
Этот патент описывает инфраструктуру доставки и доступа к контенту, затрагивая этапы сканирования и индексирования.
CRAWLING – Сканирование и Сбор данных
- На этом этапе краулер (например, Googlebot) запрашивает и получает Partially Encrypted Media. Файл содержит полный контент, но часть его зашифрована.
- Краулер получает тот же самый файл, что и обычный пользователь.
INDEXING – Индексирование и извлечение признаков
- Это ключевой этап применения для SEO. Если поисковая система является Authorizer (согласно Claim 6), система индексирования может обработать документ:
- Она находит структуру данных, зашифрованную ее публичным ключом.
- Используя свой приватный ключ, система расшифровывает структуру и получает First Cryptographic Key (ключ документа).
- Используя этот ключ, система локально расшифровывает Premium Content.
- Полный контент (бесплатный + премиум) анализируется, извлекаются признаки и он индексируется.
Входные данные (для системы индексирования):
- Partially Encrypted Media (например, HTML документ).
- Приватный ключ поисковой системы.
Выходные данные (после обработки системой индексирования):
- Полностью расшифрованный контент для анализа и индексации.
На что влияет
- Конкретные типы контента и ниши: В первую очередь влияет на издателей, использующих модели подписки (Paywall): новостные сайты, аналитические ресурсы, образовательные платформы.
- Определенные форматы контента: В основном влияет на документы, написанные на языке разметки (например, HTML), так как патент описывает встраивание данных в структуру документа (header, <script>).
- Взаимодействие с краулерами: Обеспечивает стандартизированный механизм для полного сканирования и индексации платного контента поисковыми системами.
Когда применяется
- Условия применения: Применяется издателями, которые хотят ограничить доступ к части своего контента для пользователей (Paywall), но при этом разрешить доступ доверенным третьим сторонам для целей индексации (Search Indexers) или кеширования (CDN). Это техническая реализация модели Flexible Sampling.
Пошаговый алгоритм
Процесс А: Подготовка контента (На стороне издателя)
- Генерация ключа документа: Создается уникальный случайный First Cryptographic Key (Key A).
- Шифрование контента: Premium Content шифруется с использованием Key A (симметричное шифрование, в описании упоминается AES-CTR-256).
- Создание структуры данных: Формируется структура, содержащая Key A и Access Data (правила доступа).
- Шифрование структуры данных: Эта структура шифруется для каждого Authorizer (включая Googlebot) с использованием его публичного ключа (асимметричное шифрование). Может добавляться keyid для идентификации используемого публичного ключа.
- Сборка документа: Формируется итоговый Partially Encrypted Media. Бесплатный контент остается открытым. Зашифрованный Premium Content вставляется (например, внутри тега <script>). Зашифрованные структуры данных вставляются в заголовок (header) документа.
- Публикация: Документ передается на хостинг-сервер.
Процесс Б: Доступ к контенту (Клиент и Authorizer)
- Получение документа: Клиент (браузер или Googlebot) загружает Partially Encrypted Media.
- Запрос авторизации: Клиент извлекает соответствующий зашифрованный пакет и отправляет его вместе со своими Entitlement Data (например, cookie или идентификатор краулера) к Authorizer.
- Обработка запроса (Authorizer):
- Authorizer использует keyid (если есть) для выбора нужного приватного ключа.
- Он использует приватный ключ для расшифровки пакета, получая Key A и Access Data.
- Он сравнивает Entitlement Data клиента с требуемыми Access Data.
- Принятие решения: Если доступ разрешен (например, у пользователя есть подписка, или это Googlebot), Authorizer отправляет Key A клиенту. В противном случае отказывает.
- Локальная дешифровка (Клиент): Получив Key A, клиент расшифровывает Premium Content локально.
- Отображение/Индексация: Полный контент отображается пользователю или отправляется на индексацию.
Какие данные и как использует
Данные на входе
Патент фокусируется на механизмах шифрования и контроля доступа, а не на ранжировании.
- Контентные факторы: Текст документа, разделенный на Free Content и Premium Content.
- Технические факторы: Структура документа (HTML). Упоминается использование тега <script> для хранения зашифрованного контента и размещение структур данных в заголовке (header) документа.
- Пользовательские факторы (и данные краулера): Entitlement Data – данные, идентифицирующие пользователя или краулера и его права доступа. Патент подчеркивает, что система может работать без раскрытия идентифицирующей пользователя информации.
- Криптографические данные: Симметричные и асимметричные ключи. Key Identifier (keyid) используется для управления ротацией ключей.
Какие метрики используются и как они считаются
В патенте не упоминаются метрики ранжирования или оценки качества контента. Описанные механизмы касаются только контроля доступа.
- Метод авторизации: Сравнение Entitlement Data клиента с Access Data, указанными издателем. Результат бинарный (Да/Нет).
- Методы шифрования: Используются симметричные (например, AES-CTR-256) для контента и асимметричные (публичный/приватный ключ) для защиты ключа документа.
Выводы
- Легитимизация доступа для поисковых систем: Критически важным выводом является то, что Search Indexers явно включены в список доверенных Authorizers (Claim 6). Это предоставляет стандартизированный и безопасный способ для поисковых систем индексировать полный текст платного контента.
- Решение проблемы клоакинга для Paywall: Использование этой системы позволяет издателям показывать полный контент Googlebot, но скрывать его от пользователей без подписки, не нарушая при этом правила о клоакинге. Краулер и пользователь получают идентичный файл, а доступ управляется через авторизованный криптографический процесс.
- Инфраструктура, а не ранжирование: Патент описывает техническую инфраструктуру для безопасной доставки контента (поддержка Flexible Sampling). Он не содержит информации о том, как этот контент будет ранжироваться.
- Двухуровневое шифрование: Используется комбинация симметричного (для контента) и асимметричного шифрования (для безопасной передачи ключа документа доверенным сторонам).
- Улучшение производительности и кеширования: Поскольку всем доставляется один и тот же Partially Encrypted Media, этот файл можно эффективно кешировать на уровне CDN. Дешифровка происходит локально на клиенте, что снижает нагрузку на сервер издателя и улучшает UX (не требуется перезагрузка страницы).
Практика
Best practices (это мы делаем)
Рекомендации актуальны для SEO-специалистов, работающих с сайтами, использующими Paywall.
- Внедрение безопасного Flexible Sampling: Рекомендуйте разработчикам использовать методы шифрования контента (подобные описанному в патенте или стандарт amp-subscriptions) вместо простой маскировки через CSS/JS. Это защищает контент и соответствует рекомендациям Google.
- Обеспечение доступа для Googlebot (Authorizer): При использовании систем шифрования необходимо убедиться, что Googlebot сконфигурирован как Authorizer и может успешно получить ключ для дешифровки Premium Content. Технически это требует шифрования ключа документа публичным ключом Google.
- Использование структурированных данных: Обязательно используйте разметку Schema.org (например, isAccessibleForFree в CreativeWork) для явного указания поисковым системам, какие части контента закрыты пейволом. Шифрование дополняет, а не заменяет эти сигналы.
- Мониторинг индексации полного текста: Регулярно проверяйте (например, через Google Search Console), что Googlebot действительно видит и индексирует полный текст статей, включая контент за Paywall.
Worst practices (это делать не надо)
- Использование клоакинга (Cloaking): Показ полного текста Googlebot по IP или User-Agent, но скрытие его от пользователей без использования стандартизированных методов сигнализирования. Это является нарушением правил.
- Блокировка доступа к платному контенту для Googlebot: Если Googlebot не видит контент за пейволом, он не сможет его проиндексировать и оценить. Страница будет ранжироваться только на основе бесплатного введения, что снижает ее потенциал.
- Использование клиентских методов скрытия (JS/CSS) без шифрования: Размещение полного текста Premium Content в HTML и скрытие его с помощью CSS или JavaScript. Это небезопасно, так как контент доступен в исходном коде.
Стратегическое значение
Патент подтверждает стратегическое намерение Google индексировать высококачественный контент, даже если он находится за paywall. Он предлагает техническое решение, которое устраняет трения между монетизацией и SEO. Для издателей это сигнал о том, что необходимо использовать безопасные и стандартизированные методы для управления доступом, которые уравновешивают монетизацию, безопасность и SEO-оптимизацию. Это указывает на усложнение технического SEO для сайтов с подпиской.
Практические примеры
Сценарий: Внедрение зашифрованного Paywall на новостном сайте с учетом SEO
- Задача: Новостной сайт хочет внедрить paywall, но обеспечить полную индексацию в Google.
- Реализация (по патенту):
- CMS настраивается так, чтобы при публикации статьи генерировался уникальный ключ (Key A).
- Введение остается открытым. Основная часть статьи шифруется Ключом А и помещается в HTML внутри тега <script>.
- Ключ А шифруется публичным ключом издателя И публичным ключом Googlebot. Зашифрованные ключи помещаются в <head>.
- Внедряется разметка Schema.org, указывающая на paywall.
- Процесс индексации: Googlebot при сканировании получает страницу, расшифровывает Ключ А своим приватным ключом, расшифровывает контент и индексирует статью целиком.
- Процесс для пользователя: Пользователь видит введение. При оформлении подписки его браузер получает Ключ А от издателя (Authorizer) и мгновенно отображает остальную часть статьи без перезагрузки.
Вопросы и ответы
Является ли описанный метод формой клоакинга (Cloaking)?
Нет. Клоакинг – это показ разного контента с целью манипуляции. Здесь же и пользователю, и краулеру доставляется один и тот же Partially Encrypted Media. Патент описывает легитимный механизм авторизации, позволяющий краулеру (как доверенному Authorizer) получить доступ к полному контенту для индексации. Это соответствует рекомендациям Google по Flexible Sampling.
Что означает термин ‘search indexer’ в роли ‘Authorizer’?
Это ключевой момент для SEO. Это означает, что поисковая система (например, Googlebot) может быть доверенной стороной. Издатель может специально зашифровать ключ документа публичным ключом поисковой системы, чтобы разрешить индексацию полного текста без предоставления публичного доступа.
Как именно Googlebot расшифровывает контент?
Издатель заранее шифрует ключ документа публичным ключом Googlebot. Когда Googlebot сканирует страницу, он получает этот зашифрованный пакет. Система Google, используя свой приватный ключ, расшифровывает пакет и извлекает ключ документа. Затем этот ключ используется для локальной расшифровки премиум-контента на стороне Google для индексации.
Заменяет ли эта система необходимость использования структурированных данных для Paywall (Schema.org)?
Нет, не заменяет. Структурированные данные (isAccessibleForFree) информируют поисковые системы о бизнес-модели и структуре контента. Описанная система шифрования является техническим механизмом реализации доступа. Рекомендуется использовать оба метода совместно.
Чем этот метод лучше серверной реализации Paywall (Server-side)?
Основное преимущество — улучшение UX и производительности. Весь контент загружается сразу. Когда пользователь авторизуется, контент мгновенно расшифровывается локально в браузере, без необходимости повторного запроса к серверу за полным текстом и без перезагрузки страницы. Также это упрощает кеширование на уровне CDN.
Что произойдет, если я просто скрою платный контент с помощью CSS (display: none)?
Это небезопасно, так как контент доступен в исходном коде (plain text). Кроме того, если вы не используете соответствующую разметку структурированных данных, Google может расценить это как маскировку (Cloaking), поскольку контент виден в коде, но скрыт от пользователя без явных указаний на пейвол.
Где в HTML размещается зашифрованный контент и ключи?
В патенте предлагается размещать зашифрованные структуры данных с ключами в заголовке документа (header). Зашифрованный Premium Content предлагается размещать внутри тега <script> в теле документа, заменяя им исходный открытый текст.
Использует ли этот метод два разных типа шифрования?
Да. Используется симметричное шифрование (например, AES-CTR-256, упомянутое в описании) для защиты самого контента — это быстро и эффективно для больших объемов текста. Асимметричное шифрование (публичный и приватный ключи) используется для безопасной передачи симметричного ключа авторизованным сторонам (Authorizers).
Связан ли этот патент с технологией AMP?
Да, связь прослеживается. Изобретатели патента (в частности, Malte Ubl) активно участвовали в разработке AMP. Описанный механизм очень похож на то, как работает компонент amp-subscriptions, предназначенный для реализации Paywall на AMP-страницах.
Какие риски несет использование этого метода для SEO?
Основной риск связан с ошибками в реализации. Если система настроена неправильно, или если ключ для Googlebot (как Authorizer) не предоставлен или зашифрован неверно, Googlebot не сможет расшифровать Premium Content. Это приведет к индексации только бесплатной части контента и снижению видимости в поиске.