
Google разрабатывает инфраструктуру для индексации данных напрямую из блокчейнов, фокусируясь на NFT. Система извлекает описания, историю транзакций и сами цифровые активы, следуя по ссылкам в блокчейне. Она оценивает качество и подлинность NFT, дедуплицирует контент и интегрирует проверенные NFT в поисковую выдачу как специализированные результаты.
Патент решает проблему неспособности традиционных поисковых систем напрямую взаимодействовать с данными блокчейна для идентификации, верификации и индексирования невзаимозаменяемых токенов (NFT). Существующие поисковые механизмы ограничены поиском веб-страниц (например, маркетплейсов), которые ссылаются на NFT, но не могут обрабатывать сами NFT как первичные объекты поиска. Изобретение создает инфраструктуру для извлечения структурированной информации из блокчейнов и интеграции Web3 контента в поисковую выдачу.
Запатентована система для систематического извлечения, обработки и индексирования данных о NFT непосредственно из вычислительных систем блокчейна. Система идентифицирует Token Data внутри кода блокчейна, извлекает описательные и транзакционные данные, а также сканирует связанные оффчейн-ресурсы (цифровые активы) по ссылкам (URI/URL). Ключевыми компонентами являются создание специализированной NFT Index Database, оценка качества (Quality) и определение подлинности (Authenticity) токенов.
Система функционирует как специализированный краулер и процессор для блокчейн-данных:
Blockchain Data (например, байт-кода) через доступ к узлам блокчейна (Blockchain Nodes).Identification Model).Descriptive Data (текст, названия) и Transaction Data (история, дата минтинга).Digital Resource).Synthetic Representation (превью) цифрового актива.NFT Index Database.Высокая. Патент опубликован в конце 2024 года и отражает стратегическое направление развития поиска в сторону интеграции Web3 и цифровых активов. Создание надежных механизмов для индексации и верификации блокчейн-данных является актуальной задачей для крупных поисковых систем.
Стратегическое влияние высокое (8.5/10). Этот патент описывает инфраструктуру для создания нового крупного вертикального поиска — NFT Search. Он не влияет напрямую на ранжирование традиционных веб-сайтов, но фундаментально меняет подход к видимости цифровых активов. Для создателей NFT, маркетплейсов и брендов в Web3 понимание этих механизмов критически важно, поскольку Authenticity (Подлинность) и Quality (Качество) вводятся как ключевые сигналы для этого типа контента.
Mint Date) и обнаружение мошенничества (Fraud Detection).Synthetic Representation.freeform text data).Token Data в сырых Blockchain Data.Resolution), уникальность (Differentiating) и безопасность контента (Offensive/Vulgar).electronic ledger), описывающие историю транзакций NFT.Claim 1 (Независимый пункт): Описывает базовый метод извлечения описательных данных (Descriptive Data).
blockchain data, содержащих код NFT.blockchain log.token data конкретного NFT.descriptive data внутри token data.descriptive data.Это определяет основной конвейер для идентификации NFT и извлечения его метаданных (например, названия, описания) непосредственно из структур блокчейна.
Claim 3 (Зависимый от 1): Детализирует использование ML/NLP для извлечения описаний.
Процесс идентификации descriptive data включает парсинг token data на сегменты и обработку каждого сегмента с помощью машинно-обученной модели NLP (machine-learned natural language processing model) для классификации сегментов. Это позволяет извлекать значимую информацию даже из неструктурированного текста в коде.
Claim 8 (Независимый пункт): Описывает метод извлечения контента путем сканирования ссылок (Off-chain crawling).
blockchain data.link - URI/URL/IPFS) в этих данных.landing page) по ссылке.content data (цифрового актива) на этой странице.content data.Это критически важный механизм, описывающий, как Google получает доступ к фактическому цифровому активу, который часто хранится вне блокчейна.
Claim 12 (Зависимый от 8): Уточняет механизм вложенного сканирования (Nested Crawling).
Система может определить вторую ссылку на первой целевой странице и перейти на вторую целевую страницу, чтобы найти content data. Это позволяет обрабатывать редиректы или сложные структуры хранения активов.
Claim 15 (Независимый пункт): Описывает комплексное извлечение разных типов данных.
Система извлекает как минимум два разных набора данных для одного NFT (например, freeform text data и transactional data из электронного реестра) и сохраняет их. Это обеспечивает создание полной индексной записи для NFT.
Изобретение описывает создание новой инфраструктуры сбора данных и вертикали поиска, затрагивая несколько этапов архитектуры.
CRAWLING – Сканирование и Сбор данных
Внедряется новый тип сканирования: система получает доступ к Blockchain Nodes для сбора Blockchain Data. Также критически важным является сканирование вне блокчейна (off-chain crawling): система следует по URI/URL, найденным внутри Blockchain Data, для получения Digital Assets (включая nested crawling).
INDEXING – Индексирование и извлечение признаков
Это ядро патента. Происходит анализ сырых данных, идентификация NFT и извлечение признаков (Descriptive Data, Transaction Data, Content Data). На этом этапе также происходит:
Synthetic Representations (превью).Quality Assessment): анализ разрешения, уникальности, безопасности контента.Deduplication и Authenticity Determination): обработка дубликатов и верификация на основе даты минтинга, источника и т.д.Извлеченные данные сохраняются в специализированной NFT Index Database.
RANKING – Ранжирование
Патент явно упоминает, что для ранжирования результатов NFT используются специфические сигналы: Релевантность (Relevance), Подлинность (Authenticity) и Контекст (Context).
METASEARCH – Метапоиск и Смешивание
Процесс смешивания четко описан. Результаты из NFT Index Database (NFT Search Results) объединяются с результатами из Web Database (General Web Results) для создания финальной SERP. Возможны различные форматы отображения (карусели, смешанные списки, Knowledge Panels).
Входные данные:
Blockchain Data (байт-код, транзакции).Выходные данные:
NFT Index Database.Synthetic Representations (превью активов).recursively crawling).Blockchain Trigger Events.Authenticity и Quality.Этап 1: Сбор данных и Идентификация
Blockchain Node и извлечение сырых Blockchain Data.Blockchain Log (возможно, с предварительной обработкой в песочнице (sandbox)).Identification Models (ML), проверка стандартов (EIP/ERC) или поиск Blockchain Trigger Events.Этап 2: Извлечение и Сегментация Данных
Segmentation Model и NLP для парсинга и извлечения Descriptive Data (названия, описания).Transaction Data на основе Token ID и Contract Address.Этап 3: Получение Контента (Off-chain Crawling)
Digital Resource.Representation Model для создания Synthetic Representation (превью).Этап 4: Оценка Качества и Индексирование
Quality Model (разрешение, уникальность, безопасность контента). Принятие решения об индексации (полностью, частично или отказ).Mint Date, обнаружение мошенничества. Принятие решения: сохранить (Keep), объединить (Merge) или удалить (Remove) запись.NFT Index Database.Blockchain Data).Token ID и Contract Address.Descriptive Data (названия, описания, неструктурированный текст), извлеченные из кода или связанных метаданных.Digital Assets (изображения, видео, аудио), полученные в результате off-chain сканирования.Transaction Data).Mint Date (Дата минтинга).Standard Data, например, EIP/ERC). Используется для идентификации NFT в коде блокчейна.Identification Model (вероятностные).Resolution (Техническое качество актива).Differentiating (Уникальность актива, защита от спама/копий).Offensive/Vulgar (Безопасность контента).Source Data) (приоритет on-chain).Mint Date) для определения оригинала.Fraud Detection).Relevance, Authenticity и Context как факторы для ранжирования NFT результатов.Identification Model, Segmentation Model, NLP models (для извлечения и классификации данных).Representation Model (для генерации превью).Quality Model (для оценки качества).NFT Index Database.Synthetic Representations).Authenticity явно указана как один из трех ключевых сигналов ранжирования для NFT, наряду с Релевантностью и Контекстом.Resolution), уникальность (Differentiating) и безопасность контента (Offensive/Vulgar).Identification и Segmentation Models) и NLP для понимания кода смарт-контрактов и извлечения описательных данных, что позволяет обрабатывать даже нестандартные реализации.Blended SERP), смешивая их с традиционными веб-результатами.Рекомендации для SEO-специалистов, работающих с NFT-проектами, маркетплейсами и креаторами (Web3 SEO):
Identification Model Google обнаруживает и корректно парсит Token Data.Synthetic Representation, индексация будет неполной.Resolution и Differentiating используются для фильтрации низкокачественного контента и спама.Authenticity является фактором ранжирования и система использует Fraud Detection, избегайте подозрительных схем транзакций и стремитесь к прозрачности происхождения активов.Vulgar/Offensive).Этот патент подтверждает намерение Google стать основным шлюзом для поиска в Web3. Он вводит новую парадигму SEO — Оптимизацию Цифровых Активов (Digital Asset Optimization). Видимость NFT теперь будет зависеть не только от популярности маркетплейсов, но и от того, насколько хорошо сам актив и его данные в блокчейне оптимизированы под требования сканирования, оценки качества и подлинности Google. Это может существенно изменить распределение трафика в экосистеме Web3.
Сценарий: Обеспечение видимости и верификации новой коллекции NFT в Google
Descriptive Data (название коллекции, номер токена, описание) в метаданные.Synthetic Representation.Authenticity Determination подтверждает, что это оригинальный минтинг.NFT Index Database. При поиске по названию коллекции NFT появляются в SERP с превью и, возможно, значком подлинности (badge), опережая копии или мошеннические токены.Что такое «Подлинность» (Authenticity) и как она влияет на ранжирование NFT?
Authenticity — это ключевой сигнал ранжирования, упомянутый в патенте наряду с релевантностью и контекстом. Она определяется путем сложного анализа, включающего проверку даты минтинга (Mint Date), анализ источника данных (on-chain надежнее off-chain), историю транзакций и обнаружение мошенничества (Fraud Detection). Цель — отделить оригинальные активы от копий или скама.
Как Google обрабатывает NFT, если цифровой актив (изображение/видео) хранится вне блокчейна (off-chain)?
Это стандартный сценарий, и система специально для него разработана. Она находит ссылку (URI/URL/IPFS) в данных блокчейна и выполняет сканирование (crawling) этой ссылки, чтобы получить фактический цифровой актив. Патент также описывает вложенное сканирование (nested crawling) для обработки редиректов. Доступность актива критически важна для индексации.
Какие критерии качества (Quality) Google применяет к NFT?
Патент описывает несколько критериев оценки качества. К ним относятся техническое качество актива (Resolution), его уникальность (Differentiating — защита от спама и незначительных вариаций), а также безопасность контента (отсутствие Offensive или Vulgar материалов). Низкое качество может привести к исключению из индекса.
Что происходит, если один и тот же NFT проиндексирован из разных источников (например, из блокчейна и с маркетплейса)?
Запускается процесс дедупликации (Deduplication). Система идентифицирует, что записи относятся к одному активу, и проводит Authenticity Determination. В результате система может выбрать каноническую запись (часто предпочитая данные из блокчейна), объединить (Merge) данные для обогащения индекса или удалить (Remove) менее надежную или дублирующую запись.
Что такое «Синтетическое представление» (Synthetic Representation) и как оно влияет на SEO?
Synthetic Representation — это превью или миниатюра цифрового актива, которую Google генерирует самостоятельно для отображения в SERP. Влияние на SEO значительно: качество и привлекательность этого превью будут напрямую влиять на CTR (Click-Through Rate) результатов поиска NFT.
Какие методы Google использует для обнаружения NFT в сложном коде блокчейна?
Используется гибридный подход. Во-первых, проверяется соответствие известным стандартам (например, EIP/ERC). Во-вторых, система ищет Blockchain Trigger Events (события смарт-контрактов). В-третьих, применяются модели машинного обучения (Identification Model) для распознавания паттернов, характерных для NFT, даже при отклонении от стандартов.
Какова роль NLP (обработки естественного языка) в индексации NFT?
NLP играет важную роль в извлечении Descriptive Data. Патент указывает на использование machine-learned natural language processing models для анализа сегментов данных токена (включая неструктурированный текст), чтобы понять название, описание и другие атрибуты NFT, что критично для определения текстовой релевантности.
Что должны делать создатели NFT для оптимизации своих активов под эту систему?
Ключевые действия: строгое соблюдение стандартов токенов, включение полных и точных описательных метаданных, а также обеспечение стабильного и доступного хостинга для цифрового актива по указанному в токене URI. Это три столпа для успешной индексации NFT в Google.
Как будут отображаться результаты NFT в поисковой выдаче?
Патент предлагает несколько вариантов интеграции. NFT Search Results могут смешиваться с общими веб-результатами, отображаться в виде выделенных блоков (например, каруселей изображений), появляться в Панелях Знаний (Knowledge Panel) и, вероятно, в вертикальных поисках, таких как Google Картинки. Они могут сопровождаться значками верификации (badge) или предупреждениями (warning).
Влияет ли этот патент на традиционное SEO для веб-сайтов?
Прямого влияния на ранжирование обычных сайтов нет. Однако косвенное влияние значительно: появление нативных результатов NFT в выдаче усилит конкуренцию за пространство в SERP и может снизить органический трафик на сайты маркетплейсов, так как пользователи смогут просматривать активы прямо в Google.

Семантика и интент
Индексация
SERP

Мультимедиа
SERP
Семантика и интент

Поведенческие сигналы
SERP
Мультимедиа

SERP

Индексация
Краулинг
SERP

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Local SEO

Ссылки
EEAT и качество
Свежесть контента

Поведенческие сигналы
Ссылки
SERP

Персонализация
Поведенческие сигналы
SERP

Структура сайта
SERP
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP
