Как Google контролирует доступ к поиску по лицам (и другим биометрическим данным) в медиахранилищах с помощью цифровых ключей

Патент Google описывает систему конфиденциальности для поиска людей в медиаконтенте (например, в Google Photos). Система позволяет пользователям разрешать другим искать себя на фото/видео с помощью отзываемых цифровых ключей. При этом сами биометрические данные (эмбеддинги лиц) хранятся в защищенном виде и не раскрываются ищущему пользователю.

Описание

Какую задачу решает

Патент решает проблему конфиденциальности и безопасности при использовании биометрических данных (в частности, эмбеддингов лиц, но также упоминаются голос, тело, отпечатки пальцев) для поиска в медиаконтенте (фото и видео). Основная уязвимость, которую он устраняет, — это риск утечки чувствительных эмбеддингов. Если бы эмбеддинг пользователя утек, его можно было бы использовать для идентификации человека в любых данных (например, в публичных видеопотоках) без его согласия. Патент предлагает механизм контролируемого доступа к функции поиска без раскрытия базовых эмбеддингов.

Что запатентовано

Запатентована система контроля доступа к функциям поиска и индексации на основе биометрических эмбеддингов. Суть изобретения заключается в использовании цифровых ключей (digital keys) и API в качестве посредников. Пользователь (User A) может разрешить другому пользователю (User B) искать себя в медиаконтенте, предоставив ему уникальный цифровой ключ. User B использует ключ для вызова API, который выполняет поиск на сервере, но User B никогда не получает доступ к самим эмбеддингам User A. Это позволяет User A в любой момент отозвать доступ, удалив ключ.

Как это работает

Система работает следующим образом:

Генерация данных пользователя: Система применяет машинно-обученную модель (machine-learned model) к набору изображений пользователя (User A) для создания набора данных пользователя (user-specific dataset), состоящего из эмбеддингов. Этот набор хранится в защищенном виде на сервере.
Индексация контента: Медиаконтент (например, фотоальбомы) индексируется с использованием той же модели для извлечения эмбеддингов всех обнаруженных лиц, формируя индексированную медиаинформацию (indexed media information).
Обмен доступом: User A генерирует уникальный цифровой ключ и делится им с User B.
Выполнение поиска: User B отправляет поисковый запрос через API, предоставляя цифровой ключ. API проверяет ключ, получает доступ к набору данных User A и сравнивает его с индексированной информацией.
Результат: API возвращает User B найденные фото/видео, не раскрывая эмбеддинги.

Актуальность для SEO

Высокая. Патент опубликован в 2024 году и крайне актуален для продуктов управления персональными медиа (например, Google Photos) и систем аутентификации. Он описывает критически важную инфраструктуру конфиденциальности для функций распознавания лиц в условиях повышенного внимания к защите биометрических данных.

Важность для SEO

Влияние на SEO (1/10) – Минимальное/Инфраструктура. Патент не имеет значения для SEO-стратегии продвижения сайтов в публичном веб-поиске. Он не описывает алгоритмы ранжирования, анализ веб-контента или сигналы качества сайтов. Патент описывает внутренние процессы Google, связанные с конфиденциальностью и функциональностью поиска в закрытых медиапродуктах, без прямых рекомендаций для SEO.

Детальный разбор

Термины и определения

API (Application Programming Interface): Программный интерфейс, который выступает посредником между пользователем, выполняющим поиск, и защищенными данными (эмбеддингами и индексом). API контролирует доступ на основе цифровых ключей.
Digital Key (Цифровой ключ): Уникальный идентификатор (токен авторизации), который пользователь (User A) предоставляет другому пользователю (User B) для авторизации поиска по эмбеддингам User A. Ключ связан с User-Specific Dataset и может быть отозван.
Embedding (Эмбеддинг): N-мерный вектор, являющийся числовым представлением входных данных (например, лица, голоса). Используется для представления характеристик человека на основе одного или нескольких образцов.
Indexed Media Information (Индексированная медиаинформация): Данные, полученные в результате применения Machine-Learned Model к медиаконтенту. Содержит эмбеддинги лиц (или других данных), обнаруженных в фото и видео.
Machine-Learned Model (Машинно-обученная модель): Модель (например, сверточная нейронная сеть), обученная генерировать эмбеддинги из медиаконтента. Используется как для создания User-Specific Dataset, так и для индексации контента.
User-Specific Dataset (Набор данных пользователя): Набор эмбеддингов конкретного пользователя, сгенерированный на основе эталонного набора образцов (например, изображений лица). Используется как эталон для поиска.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод контроля конфиденциальности, выполняемый системой поставщика услуг.

Система получает набор изображений лица первого пользователя.
Применяется Machine-Learned Model для генерации User-Specific Dataset (эмбеддингов).
Медиаконтент в хранилище индексируется с помощью той же модели для создания Indexed Media Information.
Система контролирует (через API) доступ второго пользователя, ищущего первого пользователя. Контроль основан на Digital Key, которым первый пользователь поделился со вторым.
Система получает поисковый запрос, включающий Digital Key.
API использует ключ для доступа к Indexed Media Information и идентификации совпадений (сравнивая User-Specific Dataset с индексом).
Система предоставляет результаты поиска (найденные фото/видео).

Ядро изобретения — использование цифрового ключа как авторизационного токена для доступа к функции поиска по биометрическим данным, при этом сами данные (эмбеддинги) остаются защищенными.

Claim 13 (Независимый пункт — Система): Описывает систему, реализующую метод, и детализирует механизм отзыва доступа.

Система настроена на выполнение шагов генерации датасета, индексации и контроля доступа (аналогично Claim 1).
Система получает от первого пользователя выбор на удаление (отзыв) Digital Key, ранее предоставленного второму пользователю.
Система получает последующий поисковый запрос от устройства второго пользователя, содержащий этот ключ.
Система возвращает пустой результат (no results), основываясь на определении, что ключ больше не включен в набор действующих ключей, связанных с User-Specific Dataset первого пользователя.

Claim 18 (Независимый пункт): Описывает метод с точки зрения взаимодействия пользователя.

Захват изображений первого пользователя.
Передача изображений системе провайдера для генерации User-Specific Dataset.
Передача Digital Key второму пользователю для авторизации поиска.
Выполнение поискового запроса с ключом через API и получение результатов.

Где и как применяется

Патент не относится к стандартной архитектуре веб-поиска, а описывает механизм для продуктов управления медиаконтентом (например, Google Photos) или систем аутентификации.

INDEXING – Индексирование и извлечение признаков (в контексте медиаконтента)

На этом этапе происходят два ключевых процесса:

Генерация эталона: Machine-Learned Model обрабатывает эталонные изображения пользователя для создания защищенного User-Specific Dataset.
Индексация хранилища: Та же модель обрабатывает весь медиаконтент в хранилище (фото/видео) для извлечения эмбеддингов всех обнаруженных лиц и сохранения их в Indexed Media Information.

RANKING / METASEARCH (в контексте выполнения медиа-запроса)

Основное применение патента происходит во время выполнения запроса на поиск человека:

Авторизация: Система (через API) получает запрос и Digital Key. Она проверяет валидность ключа. Это механизм контроля доступа.
Поиск совпадений (Retrieval/Matching): Если ключ валиден, API использует его для идентификации соответствующего User-Specific Dataset и выполняет сравнение этих эмбеддингов с Indexed Media Information для поиска совпадений.

Входные данные:

Эталонные изображения пользователя (для генерации User-Specific Dataset).
Медиаконтент в хранилище (для индексации).
Поисковый запрос от второго пользователя.
Digital Key (в составе запроса).

Выходные данные:

User-Specific Dataset (хранится защищенно).
Indexed Media Information (хранится защищенно).
Результаты поиска (список фото/видео, соответствующих запросу) или отказ в доступе.

На что влияет

Конкретные типы контента: Влияет на поиск в изображениях и видео. Также упоминается возможность применения к аудио (поиск по голосу).
Специфические запросы: Запросы, направленные на идентификацию конкретного человека (например, «фотографии с User A»).
Конкретные ниши: Применяется в системах хранения и управления персональными медиа-архивами (например, Google Photos). Не влияет на SEO для веб-сайтов.

Когда применяется

Триггеры активации: Активируется, когда пользователь инициирует поиск конкретного человека в медиахранилище.
Условия применения: Алгоритм поиска выполняется только при наличии двух условий: (1) Искомый человек предварительно создал свой User-Specific Dataset в системе; (2) Ищущий пользователь предоставил валидный Digital Key, выданный искомым человеком.
Исключения: Если ключ не предоставлен, не валиден или был отозван (удален), система возвращает пустой результат.

Пошаговый алгоритм

Процесс А: Настройка и Индексация (Офлайн или по мере поступления данных)

Получение эталонных изображений: Система получает набор изображений лица первого пользователя (User A).
Генерация эталонных эмбеддингов: Применяется Machine-Learned Model для создания User-Specific Dataset для User A. Данные сохраняются в защищенном виде.
Генерация ключей: Для User A создается набор Digital Keys для возможности предоставления доступа другим пользователям.
Индексация контента: Система обрабатывает медиаконтент. Применяется Machine-Learned Model для извлечения эмбеддингов всех лиц и создания Indexed Media Information.

Процесс Б: Выполнение Поиска (В реальном времени)

Получение запроса: Система получает запрос от второго пользователя (User B) на поиск фото/видео с User A. Запрос включает Digital Key, ранее полученный от User A.
Валидация ключа: API проверяет, является ли ключ авторизованным (существует ли он в наборе действующих ключей User A).
Обработка отказа: Если ключ не авторизован (отозван или недействителен), система возвращает пустой результат.
Идентификация эталона: Если ключ авторизован, API использует его для идентификации соответствующего User-Specific Dataset (User A).
Сравнение эмбеддингов: API сравнивает эмбеддинги из User-Specific Dataset с эмбеддингами в Indexed Media Information.
Формирование результатов: Идентифицируются медиафайлы, содержащие совпадающие эмбеддинги.
Предоставление ответа: Система возвращает найденные медиафайлы User B.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме контроля доступа и использует следующие типы данных:

Мультимедиа факторы: Изображения и видео. Это основной источник данных для генерации эмбеддингов. Упоминаются цветные изображения (color images) и изображения в ближнем инфракрасном диапазоне (near-infrared images). Также патент указывает на применимость к другим данным: голос, изображения всего тела, отпечатки пальцев.
Пользовательские факторы: Данные аккаунтов пользователей (для управления хранилищами и генерации ключей).
Системные данные: Digital Keys, используемые для авторизации.

Какие метрики используются и как они считаются

Embedding (Эмбеддинг): Ключевая метрика. Это n-мерный числовой вектор, генерируемый Machine-Learned Model. Он представляет собой сжатое представление характеристик биометрических данных.
Схожесть Эмбеддингов: Хотя патент не детализирует формулы сравнения, он подразумевает использование метрик схожести (similarity) или расстояния (distance) между эталонным User-Specific Dataset и эмбеддингами в Indexed Media Information для идентификации совпадений.
Статус Digital Key: Бинарная метрика (Валиден/Невалиден). Определяется наличием ключа в списке активных ключей пользователя.

Выводы

Фокус на конфиденциальности, а не на ранжировании: Патент описывает инфраструктуру защиты биометрических данных и контроля доступа, а не алгоритмы поиска или ранжирования. Он не о том, как лучше искать в вебе, а о том, как разрешить искать безопасно в закрытых системах.
Изоляция биометрических данных: Ключевой механизм гарантирует, что пользователь, выполняющий поиск, никогда не получает доступ к чувствительным данным — эмбеддингам искомого пользователя. Все операции сравнения выполняются внутри защищенной системы через API.
Цифровые ключи как основа контроля: Использование уникальных, отзываемых Digital Keys для каждого авторизованного пользователя является центральным элементом изобретения. Это обеспечивает гранулярный контроль доступа.
Отзыв доступа: Возможность мгновенно отозвать доступ путем удаления ключа является критически важной функцией безопасности.
Применимость к продуктам (Google Photos): Описанная система идеально соответствует функциональности поиска людей в персональных медиа-архивах.
Отсутствие влияния на SEO: Патент не содержит информации, которая может быть использована для улучшения стратегий SEO для веб-сайтов. Он не затрагивает веб-поиск, индексацию веб-страниц или факторы ранжирования.

Практика

ВАЖНО: Патент описывает внутренние инфраструктурные процессы Google, связанные с конфиденциальностью в медиапродуктах (например, Google Photos). Он не дает практических выводов или рекомендаций для SEO-специалистов, занимающихся продвижением сайтов в органическом веб-поиске.

Best practices (это мы делаем)

Не применимо к SEO. Патент не дает оснований для формирования лучших практик в области поисковой оптимизации сайтов.

Worst practices (это делать не надо)

Не применимо к SEO. Патент не описывает механизмы, направленные против каких-либо SEO-тактик.

Стратегическое значение

Стратегическое значение для SEO отсутствует. В более широком контексте патент подтверждает инвестиции Google в технологии машинного обучения (Machine-Learned Models, Embeddings) для глубокого анализа медиаконтента, а также важность построения надежных систем конфиденциальности при работе с чувствительными пользовательскими данными (биометрией). Это важно для понимания технологического уровня Google, но не влияет на долгосрочную SEO-стратегию.

Практические примеры

Практических примеров применения в SEO нет. Ниже приведен пример использования технологии в контексте продукта (например, Google Photos).

Сценарий: Поиск фотографий друга в своем альбоме

Настройка (User A — Анна): Анна использует Google Photos и включает распознавание лиц. Система создает ее User-Specific Dataset. Она хочет, чтобы ее друг Борис мог искать ее в своих фото. Она генерирует Digital Key K1 и отправляет его Борису.
Настройка (User B — Борис): Борис загружает свои фотографии. Система индексирует их, создавая Indexed Media Information.
Поиск: Борис хочет найти все фото с Анной. Он вводит запрос. Его приложение отправляет запрос в API Google, включая Digital Key K1.
Выполнение: API Google проверяет ключ K1, находит User-Specific Dataset Анны и сравнивает его с индексом альбома Бориса.
Результат: Борис видит фотографии с Анной. Он не получает доступ к ее биометрическим данным.
Отзыв: Если Анна решит запретить Борису поиск, она удаляет ключ K1. При следующем поиске Борис получит пустой результат.

Вопросы и ответы

Влияет ли этот патент на ранжирование изображений в поиске Google Images?

Нет, не влияет. Патент описывает механизм контроля конфиденциальности для поиска людей в медиаконтенте (вероятно, в персональных хранилищах типа Google Photos), а не алгоритмы ранжирования или индексации изображений в общем веб-поиске Google Images.

Что такое эмбеддинг (Embedding) в контексте этого патента?

Embedding — это n-мерный числовой вектор, который представляет собой математическое описание характеристик входных данных (например, лица или голоса). Он генерируется машинно-обученной моделью и используется системой для идентификации этого человека в другом медиаконтенте.

Как работает цифровой ключ (Digital Key)?

Digital Key — это токен авторизации. Пользователь А выдает его Пользователю Б. Когда Б выполняет поиск А, он предоставляет этот ключ системе через API. Система проверяет ключ и, если он действителен, использует связанные с ним эталонные эмбеддинги Пользователя А для выполнения поиска, не раскрывая сами эмбеддинги Пользователю Б.

Раскрываются ли мои биометрические данные (эмбеддинги), если я делюсь цифровым ключом?

Нет. Согласно патенту (Claim 2), User-Specific Dataset (ваши биометрические эмбеддинги) хранится в защищенном (зашифрованном) виде и недоступен пользователю, получившему ключ. Ключ только разрешает системе использовать эти данные для выполнения поиска по запросу этого пользователя.

Где эта технология используется? В Google Поиске или в Google Фото?

Патент описывает технологии, которые наиболее применимы к продуктам управления персональными медиа-архивами, таким как Google Photos. Он связан с функциями распознавания лиц и поиска конкретных людей в коллекциях фотографий и видео, а также может применяться в системах аутентификации.

Можно ли использовать понимание этой технологии для улучшения SEO сайта?

Нет. Этот патент не содержит информации о факторах ранжирования веб-сайтов, индексации веб-контента или других аспектах SEO. Он полностью сосредоточен на конфиденциальности и поиске по биометрическим данным в медиаконтенте.

Как отозвать доступ к поиску, предоставленный другому пользователю?

Доступ отзывается путем удаления (Delete) конкретного Digital Key, который был выдан этому пользователю (Claim 13). После удаления ключа система будет отклонять все последующие поисковые запросы, использующие этот ключ, и возвращать пустой результат.

Применяется ли эта технология только к распознаванию лиц?

Нет. Хотя распознавание лиц является основным примером, в описании патента явно указано, что техника применима к эмбеддингам, сгенерированным из других данных: голоса, изображений всего тела, отпечатков пальцев или сканов радужной оболочки глаза.

Как система обновляет данные, если внешность человека меняется?

Патент предусматривает механизм обновления User-Specific Dataset. Пользователь может добавлять новые изображения (Claim 6), которые будут обработаны моделью и добавлены в набор данных. Также пользователь может удалять старые или нерелевантные изображения (Claim 7), что приведет к обновлению набора данных. Это позволяет поддерживать актуальность эталона.

Какое стратегическое понимание работы Google дает этот патент SEO-специалисту?

Хотя прямой пользы для SEO нет, патент подтверждает высокий уровень компетенции Google в области машинного обучения и векторного представления данных (эмбеддингов). Он показывает, как Google использует эмбеддинги для глубокого понимания и индексации медиаконтента. Это подчеркивает общий тренд поисковых систем к семантическому анализу и пониманию сущностей, а не просто ключевых слов.