Как Google индексирует NFT с блокчейнов и маркетплейсов, выявляя дубликаты и определяя подлинность

Google разрабатывает систему для индексации невзаимозаменяемых токенов (NFT) путем сканирования как непосредственно блокчейнов, так и веб-платформ (маркетплейсов). Патент описывает механизм дедупликации, который определяет, ссылаются ли разные записи индекса на один и тот же цифровой актив. Система анализирует подлинность, используя данные о транзакциях и дате создания, чтобы скорректировать индекс, удаляя или объединяя дубликаты и влияя на отображение NFT в результатах поиска.

Описание

Какую задачу решает

Патент решает проблему точного и эффективного индексирования Невзаимозаменяемых Токенов (NFT) для поисковых систем. Основная сложность заключается в том, что информация об NFT распределена между децентрализованными блокчейнами и централизованными веб-платформами (маркетплейсами). Это приводит к двум проблемам: 1) Один и тот же NFT может быть проиндексирован дважды (с блокчейна и с маркетплейса). 2) Разные NFT могут ссылаться на один и тот же или очень похожий цифровой актив (Digital Resource или Payload), что затрудняет определение подлинности и засоряет индекс. Система направлена на создание чистого, дедуплицированного индекса с верифицированными данными об NFT.

Что запатентовано

Запатентована система и метод для дедупликации NFT в поисковом индексе. Изобретение включает в себя процесс сканирования данных как непосредственно из Blockchain Computing System, так и с Digital Web Platform (например, маркетплейса). Система идентифицирует записи индекса, которые относятся к одному и тому же цифровому ресурсу, путем сравнения пейлоадов или идентификаторов (адресов контрактов, Token ID). После обнаружения дубликатов система проводит анализ подлинности (Authenticity Determination) и корректирует индекс путем объединения, удаления или маркировки записей.

Как это работает

Система работает в несколько этапов:

Сбор данных (Crawling): Система сканирует блокчейны для извлечения Blockchain Data и веб-платформы для извлечения Web Page Data.
Индексирование (Indexing): Извлеченные данные (Token Data) обрабатываются для создания записей в Index Database.
Обнаружение дубликатов (Duplicate Determination): Система сравнивает записи индекса. Сравнение может включать анализ пейлоадов (цифровых активов) с использованием ML-моделей, обработки изображений/текста или сравнение идентификаторов токенов.
Определение подлинности (Authenticity Determination): Для обнаруженных дубликатов система определяет, какая запись является канонической или подлинной. Используются такие факторы, как дата создания (Mint Date), анализ транзакций (Transaction Data) для выявления мошенничества и приоритет источника (например, данные с блокчейна могут иметь приоритет над данными с веб-страницы).
Корректировка индекса (Adjusting the Index Database): Индекс обновляется. Дубликаты могут быть объединены для обогащения данных, менее достоверные записи могут быть удалены, или записи могут быть помечены как дубликаты/подозрительные.

Актуальность для SEO

Высокая. По мере развития Web3 и роста интереса к NFT, интеграция блокчейн-данных в поисковые системы становится неизбежной. Проблемы мошенничества, копирования и верификации подлинности являются центральными в экосистеме NFT. Этот патент описывает foundational-инфраструктуру, необходимую Google для корректного отображения и ранжирования NFT в поиске.

Важность для SEO

Влияние на традиционное SEO низкое, так как патент сфокусирован на инфраструктуре индексирования специфического класса активов (NFT). Однако для SEO в сфере Web3, NFT-маркетплейсов, создателей цифрового контента и брендов, использующих NFT, этот патент имеет критическое значение. Он определяет, как Google будет находить, верифицировать и отображать NFT. Точность индексации и сигналы подлинности напрямую повлияют на видимость и трафик для этих сущностей в поиске Google.

Детальный разбор

Термины и определения

Blockchain Data (Данные блокчейна): Данные, полученные непосредственно из системы блокчейна. Включают встроенный код (embedded code), смарт-контракты, данные о транзакциях и метаданные, хранящиеся ончейн.
Digital Resource / Digital Asset / Payload (Цифровой ресурс / Цифровой актив / Пейлоад): Основной контент, связанный с NFT (например, изображение, видео, аудио, текст, 3D-модель). Может храниться ончейн или офчейн (по ссылке URI/URL/IPFS).
Digital Web Platform (Цифровая веб-платформа): Веб-сайт или интерфейс, где отображаются или продаются NFT (например, NFT-маркетплейс).
Duplication Data (Данные о дублировании): Данные, генерируемые системой при обнаружении того, что две или более записи индекса связаны с одним и тем же или похожим цифровым ресурсом.
Index Database (База данных индекса): Хранилище, содержащее проиндексированные данные о NFT, используемое поисковой системой для ответа на запросы.
Token Data (Данные токена): Информация, описывающая конкретный NFT, извлеченная из Blockchain Data или Web Page Data.
Validation Data / Authenticity (Данные валидации / Подлинность): Оценка достоверности и подлинности NFT. Определяется на основе анализа Duplication Data, даты создания, истории транзакций и источника данных.
Web Page Data (Данные веб-страницы): Данные, полученные путем сканирования Digital Web Platform, например, снепшот страницы листинга NFT.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод дедупликации при индексировании из двух разных источников.

Система получает Blockchain Data из блокчейн-системы.
Идентифицирует первые данные токена (NFT1), связанные с первым цифровым ресурсом (DR1).
Генерирует первую запись индекса для NFT1.
Система получает Web Page Data с цифровой веб-платформы.
Идентифицирует вторые данные токена (NFT2), связанные со вторым цифровым ресурсом (DR2).
Генерирует вторую запись индекса для NFT2.
Система определяет, что DR1 и DR2 являются одним и тем же цифровым ресурсом.
На основе этого определения система корректирует (Adjusting) базу данных индекса.

Это описывает механизм сравнения данных, полученных напрямую с блокчейна, с данными, полученными с веб-сайтов, для выявления и устранения дублирования в индексе.

Claim 11 (Независимый пункт): Описывает аналогичный процесс, но в более общем виде.

Генерация первого набора записей индекса путем сканирования (crawling) блокчейна.
Генерация второго набора записей индекса путем сканирования цифровой веб-платформы.
Определение того, что конкретная запись из первого набора связана с конкретной записью из второго набора.
Корректировка базы данных индекса в ответ на это определение.

Claim 12 (Зависимый от 11): Уточняет механизм определения связи между записями.

Связь определяется путем установления того, что первый пейлоад (first payload), связанный с первым NFT, совпадает со вторым пейлоадом (second payload), связанным со вторым NFT.

Это подтверждает, что сравнение цифровых активов (пейлоадов) является ключевым методом обнаружения дубликатов.

Claim 16 (Независимый пункт): Описывает процесс определения подлинности при наличии дубликатов.

Получение конкретной записи индекса и множества других записей.
Обработка этих записей для генерации Duplication Data, которые показывают, связаны ли другие записи с тем же цифровым ресурсом.
Генерация Validation Data на основе Duplication Data. Эти данные связаны с подлинностью (authenticity) NFT.
Предоставление Validation Data в качестве вывода.

Это описывает механизм, который не просто находит дубликаты, но и пытается определить, какой из них является подлинным, и может отображать эту информацию пользователю.

Claim 19 (Зависимый от 16): Уточняет, как определяется подлинность.

Генерация Validation Data включает определение подлинности записи путем установления того, что она связана с первым созданием (first minting) цифрового ресурса.

Это указывает на то, что время создания (хронология) является критически важным фактором для определения канонической версии NFT.

Где и как применяется

Изобретение затрагивает начальные этапы поисковой архитектуры, фокусируясь на сборе и обработке данных.

CRAWLING – Сканирование и Сбор данных
Система расширяет возможности сканирования за пределы традиционного веба. Она активно сканирует Blockchain Computing Systems (возможно, через блокчейн-ноды или API) и Digital Web Platforms (маркетплейсы).

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Система обрабатывает сырые Blockchain Data и Web Page Data для извлечения Token Data. На этом этапе происходит:

Feature Extraction: Извлечение метаданных, ссылок на цифровые ресурсы (Payloads), данных о транзакциях и времени создания.
Duplicate Determination: Сравнение новых записей с существующими в индексе для выявления дубликатов. Это включает сравнение пейлоадов с использованием ML-моделей (как указано в описании) или сравнение идентификаторов.
Authenticity Determination: Анализ признаков для расчета Validation Data (оценки подлинности).
Index Adjustment: Обновление Index Database путем объединения (merging), удаления (removing) или маркировки записей.

RANKING / RERANKING
Хотя патент напрямую не описывает ранжирование, он указывает, что корректировка индекса влияет на то, какие результаты поиска будут показаны. Validation Data (подлинность) может использоваться как сигнал ранжирования или для отображения предупреждений/значков в выдаче.

Входные данные:

Blockchain Data (код, смарт-контракты, транзакции).
Web Page Data (данные с маркетплейсов/листингов).
Цифровые ресурсы (Payloads), полученные по ссылкам из Token Data.

Выходные данные:

Updated Index Database (дедуплицированный индекс NFT).
Validation Data (данные о подлинности, связанные с записями индекса).

На что влияет

Конкретные типы контента: Влияет исключительно на Невзаимозаменяемые Токены (NFT) и связанные с ними цифровые активы (изображения, видео, аудио, AR/VR ассеты, доменные имена).
Специфические запросы: Запросы, связанные с поиском цифровых коллекционных предметов, цифрового искусства, Web3 активов и конкретных коллекций NFT.
Конкретные ниши или тематики: Искусство, гейминг, метавселенные, музыка, коллекционирование.

Когда применяется

Условия работы алгоритма: Алгоритм применяется в процессе индексирования, когда система обрабатывает данные, идентифицированные как Token Data, полученные либо с блокчейна, либо с веб-платформы.
Триггеры активации: Активация процесса дедупликации происходит при обнаружении двух или более записей индекса, у которых совпадают или достаточно похожи (substantially similar) цифровые ресурсы (пейлоады), либо совпадают ключевые идентификаторы (например, адрес контракта и Token ID).

Пошаговый алгоритм

Процесс А: Индексирование и Дедупликация

Сбор данных из Источника 1 (Блокчейн): Система получает Blockchain Data путем сканирования блокчейна.
Идентификация Токена 1: Система анализирует Blockchain Data (например, ища соответствие стандартам NFT) и идентифицирует первые Token Data (NFT1).
Извлечение Ресурса 1: Определяется цифровой ресурс (DR1), связанный с NFT1.
Генерация Записи Индекса 1: Создается первая запись в Index Database на основе NFT1 и DR1.
Сбор данных из Источника 2 (Веб-платформа): Система получает Web Page Data путем сканирования маркетплейса.
Идентификация Токена 2: Система анализирует Web Page Data и идентифицирует вторые Token Data (NFT2).
Извлечение Ресурса 2: Определяется цифровой ресурс (DR2), связанный с NFT2.
Генерация Записи Индекса 2: Создается вторая запись в Index Database на основе NFT2 и DR2.
Обнаружение Дублирования: Система сравнивает Запись 1 и Запись 2. Определяется, являются ли DR1 и DR2 одним и тем же ресурсом (например, с помощью анализа изображений, сравнения хэшей или latent encoding processing) или совпадают ли идентификаторы NFT1 и NFT2. Генерируются Duplication Data.
Корректировка Индекса: Если обнаружено дублирование, система корректирует Index Database. Это может включать объединение Записи 1 и Записи 2 для создания обогащенной записи или удаление одной из записей.

Процесс Б: Определение Подлинности (Authenticity Determination) (Применяется при обнаружении дубликатов в Процессе А)

Анализ Дубликатов: Система анализирует Duplication Data для нескольких записей (например, Запись 1 и Запись 2), ссылающихся на один и тот же ресурс.
Анализ Хронологии: Система извлекает временные данные (Mint Date). Определяется, какая запись связана с первым созданием (first minting) цифрового ресурса.
Анализ Транзакций: Анализируются Transaction Data для выявления признаков мошенничества (например, wash trading) или определения связи с оригинальным создателем.
Анализ Источника и Ссылок: Проверяется надежность источника данных (приоритет ончейн данных) и стабильность URI/URL пейлоада.
Генерация Validation Data: На основе анализа генерируется оценка подлинности для каждой записи.
Применение Валидации: Запись, признанная подлинной (например, первый минт), сохраняется или получает приоритет. Остальные могут быть удалены или помечены как копии/подозрительные.

Какие данные и как использует

Данные на входе

Система использует специфические данные, связанные с технологией блокчейн и веб-сканированием.

Технические факторы (Блокчейн):
- Blockchain Data: Встроенный код, смарт-контракты.
- Идентификаторы: Адреса контрактов, Token IDs.
- Стандарты: Соответствие стандартам NFT (например, EIP-721, упомянутым в описании).
- Ссылки на ресурсы: URI, URL или IPFS адреса, указывающие на пейлоад.
Технические факторы (Веб):
- Web Page Data: HTML, данные листингов с маркетплейсов.
- Надежность источника: Репутация веб-платформы или веб-сайта, на который ссылается URI.
Временные факторы:
- Mint Date: Дата и время создания NFT на блокчейне.
- Publication Time: Время первой публикации цифрового актива в вебе (используется для сравнения с Mint Date).
Поведенческие факторы (Транзакции):
- Transaction Data: История транзакций NFT. Используется для выявления мошеннических паттернов (например, циклические транзакции между двумя сторонами).
Мультимедиа факторы (Payload):
- Данные цифрового ресурса (изображения, видео, аудио, текст). Они используются для сравнения и определения сходства.

Какие метрики используются и как они считаются

Степень сходства пейлоадов (Payload Similarity): Метрика, определяющая, насколько похожи два цифровых ресурса. Рассчитывается с использованием методов анализа изображений (пиксельный анализ), видео, аудио, текста или анализа латентных кодировок (latent encoding analysis). Сходство определяется, если оно превышает определенный порог (threshold similarity).
Оценка подлинности (Authenticity/Validation Score): Метрика, определяющая вероятность того, что данный NFT является оригинальным и не мошенническим. Рассчитывается на основе эвристик и анализа данных:
- Хронология: Приоритет отдается первому минту (first minting).
- Приоритет источника: Данные ончейн приоритетнее офчейн; данные с блокчейна приоритетнее данных с маркетплейса; известные блокчейны/платформы приоритетнее неизвестных.
- Целостность ссылок: Проверка валидности и стабильности URI/URL пейлоада.
- Анализ мошенничества: Выявление подозрительных паттернов в Transaction Data.
Машинное обучение: Патент упоминает использование Machine-Learned Models для сравнения пейлоадов и потенциально для определения подлинности.

Выводы

Google индексирует блокчейн напрямую: Это ключевой вывод. Google не полагается только на информацию о NFT, найденную на веб-страницах. Система разработана для прямого сканирования (crawling) и интерпретации Blockchain Data для построения поискового индекса NFT.
Дедупликация как основа индекса NFT: Из-за природы NFT (распределенность данных, возможность копирования) дедупликация является критически важным процессом. Система должна решать конфликты между данными с блокчейна и данными с маркетплейсов.
Сравнение цифровых активов (Payloads): Для обнаружения дубликатов Google анализирует не только идентификаторы токенов, но и сами цифровые активы. Используются сложные методы, включая ML-модели и анализ медиа, чтобы определить, являются ли активы идентичными или «существенно похожими» (например, с разным разрешением или насыщенностью).
Подлинность (Authenticity) как ключевой сигнал качества: Патент уделяет значительное внимание определению подлинности NFT при наличии дубликатов. Это означает, что Google стремится идентифицировать каноническую версию NFT.
Факторы определения подлинности: Ключевыми факторами для определения оригинала являются хронология (приоритет first minting), история транзакций (выявление мошенничества) и надежность источника (приоритет ончейн данных над офчейн).
Влияние на отображение в поиске: Результаты дедупликации и оценки подлинности используются для корректировки индекса, что напрямую влияет на то, какие NFT будут показаны в поиске. Система может также отображать предупреждения (warnings) или значки (badges) на основе Validation Data.

Практика

Best practices (это мы делаем)

Рекомендации в первую очередь актуальны для NFT-маркетплейсов, создателей контента и SEO-специалистов, работающих в сфере Web3.

Обеспечение консистентности данных: Для маркетплейсов критически важно, чтобы данные, отображаемые на веб-странице (Web Page Data), полностью соответствовали данным на блокчейне (Blockchain Data). Любые расхождения могут быть интерпретированы системой как признак низкой достоверности.
Приоритет подлинности и провенанса: Для создателей NFT необходимо убедиться, что их работы являются оригинальными и что минтинг происходит до или одновременно с публикацией в вебе. Патент подтверждает, что first minting является сильным сигналом подлинности.
Стабильное хранение цифровых активов: Храните пейлоады (цифровые активы) используя надежные и стабильные решения (например, IPFS или стабильные URI). Изменение URI или контента по ссылке может негативно повлиять на оценку подлинности.
Прозрачность транзакций: Поддерживайте чистую и органичную историю транзакций. Сигналы, указывающие на реальный интерес и владение, будут способствовать положительной оценке подлинности.
Использование стандартов: При создании смарт-контрактов следуйте установленным стандартам NFT (например, EIP-721), чтобы облегчить Google корректное сканирование и интерпретацию Blockchain Data.

Worst practices (это делать не надо)

Создание копий и производных работ без разрешения: Система активно направлена на выявление дубликатов и понижение копий. Попытки засорить индекс (spam-dexing) путем создания множества NFT с одним и тем же или похожим пейлоадом будут пессимизироваться.
Манипуляции с транзакциями (Wash Trading): Патент явно упоминает анализ Transaction Data для выявления мошеннических трендов, таких как последовательные транзакции между двумя сторонами. Такие действия могут привести к маркировке NFT как подозрительного или его удалению из индекса.
Использование ненадежных источников и ссылок: Размещение NFT на сомнительных платформах или использование URI, ссылающихся на questionable websites, приведет к снижению рейтинга или удалению из индекса.
Изменение цифрового актива после минтинга: Если цифровой ресурс изменяется после создания NFT (если это не предусмотрено смарт-контрактом), это может быть расценено как попытка манипуляции и повлиять на дедупликацию и подлинность.

Стратегическое значение

Этот патент имеет важное стратегическое значение, так как демонстрирует активные усилия Google по интеграции Web3 технологий в основную поисковую инфраструктуру. Google признает NFT как отдельный класс активов, требующий специализированных методов сканирования (прямое сканирование блокчейнов) и индексирования. Стратегический фокус на дедупликации и подлинности указывает на стремление Google стать надежным источником информации в децентрализованном вебе. Для SEO это сигнал о том, что концепции цифрового провенанса и верифицируемой подлинности контента становятся все более важными, и эти принципы могут в будущем применяться не только к NFT.

Практические примеры

Сценарий: Индексирование и дедупликация популярного NFT

Исходные данные: Художник создает изображение (Digital Asset A) и минтит его на Ethereum (NFT 1) в 10:00. В 10:05 он размещает его на маркетплейсе OpenSea (Web Listing 1). Позже, в 12:00, мошенник копирует изображение и минтит его на Polygon (NFT 2).
Сканирование и Индексирование:
- Google сканирует блокчейн Ethereum и индексирует NFT 1 (Запись 1).
- Google сканирует OpenSea и индексирует Web Listing 1 (Запись 2).
- Google сканирует блокчейн Polygon и индексирует NFT 2 (Запись 3).
Дедупликация:
- Система сравнивает Запись 1 и Запись 2. Идентификаторы токенов и цифровой актив совпадают. Система объединяет (merge) записи, обогащая Запись 1 данными с OpenSea.
- Система сравнивает Запись 1 и Запись 3. Цифровые активы совпадают (Payload Similarity высокое), но идентификаторы токенов и блокчейны разные. Обнаружен дубликат.
Определение подлинности: Система сравнивает Mint Date. NFT 1 (10:00) был создан раньше, чем NFT 2 (12:00). NFT 1 определяется как first minting.
Результат в поиске: При поиске этого изображения Google покажет результат, соответствующий NFT 1. NFT 2 может быть исключен из индекса или показан с предупреждением о возможной подделке (Warning or Badge).

Вопросы и ответы

Означает ли этот патент, что Google теперь полноценно индексирует блокчейны?

Да, патент прямо указывает на процессы сканирования (crawling a blockchain) и получения данных (obtaining blockchain data) непосредственно из блокчейн-систем. Это не просто сканирование веб-страниц, посвященных блокчейну, а интерпретация самих данных блокчейна (смарт-контрактов, транзакций) для построения поискового индекса NFT.

Как Google определяет, что два разных NFT ссылаются на один и тот же контент?

Система использует несколько методов для сравнения пейлоадов (Payloads или Digital Resources). Патент упоминает обработку текста, изображений, видео, аудио и анализ латентных кодировок (latent encoding processing), часто с использованием машинного обучения. Система определяет, являются ли активы идентичными или «существенно похожими» (например, одно изображение с разным разрешением).

Если мой NFT проиндексирован и с блокчейна, и с маркетплейса, что произойдет?

Система идентифицирует это как дубликат. Согласно патенту, вероятным действием будет объединение (merging) этих двух записей для создания одной обогащенной записи в индексе. Это позволяет Google использовать надежность данных блокчейна, дополняя их контекстной информацией с маркетплейса.

Как Google определяет, какой NFT является подлинным, если найдено несколько копий?

Патент описывает процесс определения подлинности (Authenticity Determination), основанный на нескольких факторах. Ключевыми являются хронология (приоритет отдается первому минту — first minting), анализ истории транзакций для выявления мошенничества и приоритет надежности источника (например, данные ончейн считаются более надежными, чем офчейн).

Влияет ли этот патент на SEO моего обычного контентного сайта?

Напрямую — нет. Патент сфокусирован исключительно на индексировании и дедупликации NFT. Однако он демонстрирует растущие возможности Google по индексированию нетрадиционных источников данных (блокчейнов) и подчеркивает важность верифицируемой подлинности и провенанса цифрового контента, что является важным долгосрочным трендом.

Что должны делать NFT-маркетплейсы в свете этого патента?

Маркетплейсы должны обеспечить максимальную консистентность своих данных с данными блокчейна и активно бороться с размещением подделок. Высокая репутация платформы и чистота данных помогут Google рассматривать их как надежный источник, что может положительно сказаться на индексации и ранжировании размещенных у них NFT.

Может ли Google наказывать за мошеннические транзакции с NFT (Wash Trading)?

Да. Патент прямо упоминает анализ Transaction Data для выявления мошеннических трендов, таких как последовательные транзакции между двумя сторонами. Обнаружение таких паттернов используется при генерации Validation Data и может привести к маркировке NFT как подозрительного или его исключению из индекса.

Важно ли, где хранится сам цифровой актив (пейлоад)?

Да, это имеет значение. Патент упоминает анализ URL/URI/IPFS адресов. Недействительные, устаревшие или измененные адреса, а также ссылки на сомнительные веб-сайты могут снизить оценку подлинности. Также упоминается, что ресурсы, встроенные непосредственно в блокчейн, могут иметь приоритет над ресурсами, на которые просто ссылаются.

Как будут отображаться NFT в результатах поиска?

Патент предполагает несколько вариантов: отображение в отдельной панели (separate panel) или рядом с общими результатами поиска. Кроме того, результаты могут сопровождаться индикаторами, указывающими на то, что это NFT, а также значками валидации или предупреждениями (Warning or Badge) о подлинности.

Что делать, если я выпускаю легитимную ограниченную серию (например, 100 копий одного арта)?

Патент упоминает и этот случай. Система может идентифицировать и пометить (flag) такие не являющиеся дефицитными (non-scarce) цифровые ресурсы. Важно, чтобы смарт-контракт и метаданные четко отражали, что это ограниченная серия, чтобы система корректно интерпретировала эти дубликаты как легитимные, а не мошеннические копии.