Google использует механизм для индексирования приватного контента (например, фото или файлов), доступного группе пользователей. Если часть документа (например, тег на фото) ограничена для подгруппы, система добавляет специальный индикатор. При поиске система проверяет этот индикатор, чтобы показывать ограниченную часть только авторизованным пользователям.
Описание
Какую задачу решает
Патент решает проблему управления доступом на уровне частей документа (sub-document level) в системах персонального поиска (Personal Search Systems). В таких системах контент является приватным (Private Content) и доступен определенной группе пользователей (Set of Users). Задача — обеспечить механизм, позволяющий ограничить доступ к определенным частям документа (например, приватным тегам на фотографии в общем альбоме) только для подмножества этой группы, не ограничивая доступ к документу в целом.
Что запатентовано
Запатентована система индексирования и поиска для приватного контента. Суть изобретения заключается в добавлении специального индикатора (restrict indicator) к метаданным документа во время индексации, если часть этого документа имеет ограничения доступа. Во время поиска система добавляет к запросу ограничения (restrictions), основанные на личности пользователя. Ограниченный контент возвращается только в том случае, если restrictions пользователя соответствуют restrict indicator документа.
Как это работает
Система работает в два этапа:
- Индексирование: Индексатор анализирует приватный документ и его метаданные (например, приватные теги, заметки к презентации). Если обнаруживается, что часть документа доступна только определенным пользователям, индексатор добавляет restrict indicator к метаданным и сохраняет их в персональном поисковом индексе (personal search index).
- Поиск: Когда пользователь отправляет запрос, поисковая система определяет его личность и добавляет к запросу соответствующие restrictions (права доступа). Поиск выполняется с учетом этих ограничений, фильтруя результаты путем сравнения restrictions запроса с restrict indicator в индексе.
Актуальность для SEO
Высокая для персонального поиска, но низкая для публичного веб-поиска. Патент описывает базовую инфраструктурную технологию, необходимую для управления конфиденциальностью и контролем доступа (ACL) в таких продуктах, как Google Photos, Google Drive или Gmail. Эти механизмы критически важны для соблюдения приватности пользователей.
Важность для SEO
Патент имеет минимальное значение (1/10) для традиционных SEO-стратегий, направленных на публичный веб-поиск. Он описывает исключительно внутренние инфраструктурные процессы Google для обработки Private Content и контроля доступа (ACL) в Personal Search Systems. Патент не содержит информации о факторах ранжирования, сигналах качества или методах оптимизации общедоступных веб-сайтов.
Детальный разбор
Термины и определения
- Document Portion (Часть документа)
- Определенный фрагмент документа, который может иметь собственные настройки доступа, отличные от документа в целом. Примеры: приватный тег на фото (private tag), заметки к презентации, определенные страницы в текстовом документе.
- Personal Search Index (Персональный поисковый индекс)
- Индекс, хранящий метаданные приватного контента, доступный для поиска только определенной группе пользователей.
- Private Content (Приватный контент)
- Документы (фото, видео, тексты, посты в блогах), которые видимы и доступны для поиска только определенной группе пользователей (Set of Users).
- Restrict Indicator (Индикатор ограничения)
- Метка, добавляемая к метаданным документа в индексе. Она указывает, что определенная часть документа (Document Portion) доступна только конкретным пользователям. Пример формата: private_tag=NameOfPerson_only_visible_to=NameOfImageOwner.
- Restrictions / Query Restrictions (Ограничения запроса)
- Параметры, добавляемые поисковой системой к запросу пользователя на основе его личности (User ID). Они определяют, к каким ограниченным частям документов пользователь имеет доступ.
- Set of Users (Группа пользователей)
- Определенный набор пользователей, имеющих доступ к корпусу приватного контента.
Ключевые утверждения (Анализ Claims)
Патент чисто технический и описывает внутренние процессы Google без прямых рекомендаций для SEO.
Claim 1 (Независимый пункт): Описывает процесс индексирования приватного контента с контролем доступа на уровне частей документа.
- Система получает документ из Private Content, доступного Set of Users.
- Извлекаются метаданные документа.
- Система определяет, основываясь на метаданных, содержит ли часть документа (Portion) информацию, доступную только конкретному пользователю из этой группы.
- Если ДА, к метаданным добавляется restrict indicator. Этот индикатор идентифицирует пользователя и соответствующую часть документа.
- Метаданные и restrict indicator сохраняются в personal search index.
Claim 3 (Зависимый от 1): Описывает процесс поиска с учетом ограничений.
- Система получает поисковый запрос от конкретного пользователя.
- К запросу добавляется restriction, основанная на информации, связанной с этим пользователем (например, его ID).
- Поиск результатов выполняется на основе запроса и добавленного restriction в personal search index. Результаты включают идентификацию документа с ограниченной частью.
Claim 4 (Зависимый от 3): Уточняет механизм идентификации результатов.
Идентификация документа в результатах поиска происходит путем сравнения restriction (добавленного к запросу) и restrict indicator (хранящегося в индексе).
Claim 7 (Зависимый от 5): Описывает обработку ситуации, когда у пользователя нет доступа к ограниченной части.
- Пользователь выбирает результат поиска, связанный с документом, содержащим ограниченную часть (restricted portion), к которой у него НЕТ доступа.
- Система предоставляет пользователю документ, но БЕЗ этой ограниченной части.
Где и как применяется
Изобретение применяется исключительно в рамках систем персонального поиска (Personal Search Systems) для обработки Private Content.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Индексатор (Indexer) обрабатывает приватные документы, извлекает метаданные и анализирует права доступа (ACL). На этом этапе принимается решение о добавлении restrict indicator к метаданным перед сохранением в personal search index.
QUNDERSTANDING – Понимание Запросов (в контексте персонального поиска)
Когда запрос поступает в систему персонального поиска, система должна идентифицировать пользователя и определить его права доступа. Эти права преобразуются в restrictions, которые добавляются к исходному тексту запроса для последующей фильтрации.
RANKING / RERANKING (в контексте персонального поиска)
На этапе отбора кандидатов из personal search index система использует модифицированный запрос (с добавленными restrictions) для фильтрации. Сравниваются restrictions запроса и restrict indicator документов. Документы (или их части), для которых нет совпадения, исключаются из выдачи или предоставляются в усеченном виде.
Входные данные:
- Приватный документ (изображение, текст и т.д.).
- Метаданные документа (включая ACL для документа и его частей).
- Во время поиска: Запрос пользователя и идентификатор пользователя (User ID).
Выходные данные:
- В индексе: Метаданные документа, возможно, с добавленным restrict indicator.
- При поиске: Набор результатов поиска, отфильтрованный в соответствии с правами доступа пользователя.
На что влияет
Патент не влияет на публичный веб-поиск.
- Конкретные типы контента: Влияет на приватный контент, где возможно частичное ограничение доступа: фотографии с тегами, документы с заметками, презентации.
- Специфические запросы: Влияет на любые запросы в рамках персонального поиска по приватному корпусу документов.
- Конкретные ниши или тематики: Не применимо к публичным нишам (авто, ecommerce, YMYL). Применимо только к экосистемам приватного контента (например, Google Photos, Google Drive).
Когда применяется
- При индексировании: Всегда, когда обрабатывается документ из Private Content, который потенциально может содержать части с отдельными правами доступа.
- Триггеры активации (Индексирование): Обнаружение в метаданных информации об ограничениях доступа для части документа (например, наличие private tag).
- При поиске: Всегда, когда выполняется запрос к personal search index, для обеспечения соблюдения прав доступа.
Пошаговый алгоритм
Процесс А: Индексирование документов с ограниченными частями
- Получение документа: Система получает документ из приватного контента, доступного группе пользователей.
- Извлечение метаданных: Индексатор извлекает метаданные из документа (размер, дата, автор, теги, ACL).
- Анализ ограничений: Система анализирует метаданные, чтобы определить, есть ли в документе части, доступ к которым ограничен для подмножества пользователей.
- Принятие решения: Определяется, нужно ли применять ограничения.
- Если НЕТ (весь документ доступен всей группе): Метаданные сохраняются в персональном индексе без специальных индикаторов.
- Если ДА (есть ограниченные части): Перейти к шагу 5.
- Добавление индикатора: Система генерирует и добавляет restrict indicator к метаданным. Индикатор идентифицирует ограниченную часть и пользователей, имеющих к ней доступ.
- Сохранение: Метаданные вместе с restrict indicator сохраняются в personal search index.
Процесс Б: Поиск документов с ограниченными частями
- Получение запроса: Система получает поисковый запрос от пользователя.
- Добавление ограничений к запросу: Система идентифицирует пользователя и добавляет к запросу restrictions, основанные на его правах доступа.
- Идентификация результатов: Система ищет в персональном индексе документы, соответствующие запросу и restrictions. Это включает сравнение restrictions запроса с restrict indicator документов в индексе.
- Ранжирование: Идентифицированные результаты ранжируются (Scoring).
- Предоставление результатов: Система предоставляет ранжированные результаты пользователю.
- Обработка выбора результата: Пользователь выбирает конкретный результат.
- Предоставление документа: Система предоставляет документ. Если документ содержит ограниченную часть:
- Если у пользователя есть доступ: Документ предоставляется полностью.
- Если у пользователя нет доступа: Документ предоставляется БЕЗ ограниченной части (например, изображение с размытой областью или без приватного тега).
Какие данные и как использует
Данные на входе
Патент фокусируется на обработке контроля доступа, а не на анализе контента для ранжирования.
- Контентные/Мультимедиа факторы: Приватные документы (изображения, текстовые документы, презентации).
- Метаданные: Информация, связанная с документом (размер, дата создания, автор, местоположение).
- Данные контроля доступа (ACL): Критически важные данные. Информация о том, какие пользователи или группы имеют доступ к документу и, что более важно, к его отдельным частям (например, private tags).
- Пользовательские факторы: Идентификатор пользователя (User ID), используемый во время поиска для определения его прав доступа (restrictions).
Какие метрики используются и как они считаются
Патент не описывает метрики для расчета релевантности или качества ранжирования (Scoring упоминается, но не детализируется). Он сосредоточен на метриках доступа:
- Restrict Indicator: Булев индикатор, хранящийся в индексе, который содержит условия доступа (кто и к какой части имеет доступ).
- Restrictions: Параметры запроса, отражающие права доступа текущего пользователя.
- Механизм сравнения: Ключевым вычислением является сравнение (matching) между Restrictions в запросе и Restrict Indicator в индексе. Это определяет, будет ли результат показан пользователю.
Выводы
- Патент не имеет практической ценности для публичного SEO: Это чисто инфраструктурный патент, описывающий обработку приватного контента. Он не дает никаких выводов для оптимизации общедоступных веб-сайтов.
- Контроль доступа на суб-документном уровне: Google разработал механизм для управления доступом не только к документам целиком, но и к их отдельным частям (например, тегам на фото) в рамках персонального поиска.
- Разделение ролей Индексатора и Поисковой системы: Индексатор отвечает за фиксацию ограничений доступа в индексе (через restrict indicator). Поисковая система отвечает за применение этих ограничений во время выполнения запроса (через restrictions).
- Фильтрация при поиске: Контроль доступа обеспечивается путем модификации запроса пользователя (добавлением его прав) и последующей фильтрацией результатов на основе сравнения прав пользователя и требований документа.
- Обработка отказа в доступе: Система может предоставлять документ, исключая из него ограниченные части, если у пользователя нет к ним доступа, вместо того чтобы полностью скрывать документ из выдачи.
Практика
ВАЖНО: Патент является инфраструктурным и описывает механизмы работы с приватным контентом. Он не дает практических выводов для SEO публичных веб-сайтов.
Best practices (это мы делаем)
Не применимо к SEO публичных сайтов. Патент не предлагает стратегий или тактик для улучшения ранжирования в общедоступном поиске Google.
Worst practices (это делать не надо)
Не применимо к SEO публичных сайтов. Патент не направлен против каких-либо SEO-манипуляций в публичном веб-поиске.
Стратегическое значение
Для SEO-стратегии значение отсутствует. Патент важен для понимания того, как Google технически реализует контроль доступа и конфиденциальность в своих персональных продуктах (Photos, Drive). Он подтверждает наличие сложных механизмов для обработки персональных данных и четкое разделение между публичным и приватным индексами.
Практические примеры
Практических примеров для SEO нет.
Пример работы механизма, описанного в патенте (не связанный с SEO):
Сценарий: Приватный тег на фото в общем альбоме
- Ситуация: Пользователь 1 загружает фотографию в альбом, доступный Пользователю 1 и Пользователю 2.
- Действие: Пользователь 1 добавляет тег с именем человека на фото, но помечает этот тег как «Приватный» (видимый только ему).
- Индексирование: Индексатор Google обрабатывает фото. Он видит приватный тег и добавляет restrict indicator в индекс: «Тег=ИмяЧеловека, ВидимыйТолько=Пользователь1».
- Поиск (Пользователь 1): Пользователь 1 ищет «Фото с ИмяЧеловека». Система добавляет его права (restrictions) к запросу. Права совпадают с restrict indicator. Фотография отображается в результатах с видимым тегом.
- Поиск (Пользователь 2): Пользователь 2 ищет «Фото с ИмяЧеловека». Система добавляет его права к запросу. Права НЕ совпадают с restrict indicator для этого тега. Фотография НЕ отображается в результатах по этому запросу (так как тег не видим Пользователю 2). Если Пользователь 2 ищет по другим критериям и находит это фото, он увидит его, но без приватного тега.
Вопросы и ответы
Влияет ли этот патент на ранжирование моего сайта в публичной выдаче Google (google.com)?
Нет, не влияет. Патент явно указывает, что он относится к системам персонального поиска (Personal Search Systems) и обработке приватного контента (Private Content), доступного ограниченной группе пользователей. Он не описывает алгоритмы ранжирования или сигналы качества для публичного веб-индекса.
Что такое «Personal Search Index» (Персональный поисковый индекс)?
Это отдельный индекс, который хранит данные о приватном контенте пользователя или группы пользователей, например, электронные письма, фотографии в Google Photos или документы на Google Drive. Этот индекс отделен от основного публичного веб-индекса Google и используется для предоставления персонализированных результатов поиска по личным данным.
Что такое «Restrict Indicator» и как он используется?
Restrict Indicator — это метка, которая добавляется к метаданным документа в персональном индексе во время индексации. Она указывает, что определенная часть документа (например, тег или заметка) имеет ограничения доступа. Во время поиска система сравнивает права пользователя с этим индикатором, чтобы решить, показывать ли эту часть контента.
Могу ли я как SEO-специалист повлиять на «Restrict Indicator» или «Restrictions»?
Нет. Эти механизмы являются частью внутренней инфраструктуры Google для управления контролем доступа (ACL) к приватному контенту. Они зависят от настроек конфиденциальности, установленных владельцами контента, а не от внешней SEO-оптимизации.
Описывает ли этот патент, как Google определяет релевантность контента?
Нет. Патент упоминает этап ранжирования (Scoring), но не детализирует его. Основное внимание уделено механизму фильтрации результатов на основе прав доступа, а не оценке их релевантности или качества.
Зачем SEO-специалисту знать об этом патенте, если он не влияет на публичный поиск?
Знание этого патента полезно для общего понимания архитектуры поиска Google, в частности, для понимания различий между обработкой публичного и приватного контента. Это помогает избежать неверных интерпретаций и фокусироваться на факторах, действительно влияющих на публичное ранжирование.
Что происходит, если у пользователя нет доступа к ограниченной части документа?
Патент описывает два варианта. Либо документ вообще не будет показан в результатах поиска (если запрос был направлен именно на ограниченную часть). Либо, если документ найден по другим критериям, он будет предоставлен пользователю, но без ограниченной части (например, приватный тег будет скрыт).
Какая разница между «Restrict Indicator» и «Restrictions»?
Restrict Indicator хранится в индексе вместе с документом и определяет, КТО имеет доступ к его частям. Restrictions генерируются во время поиска на основе личности текущего пользователя и определяют, К ЧЕМУ этот пользователь имеет доступ. Для показа результата необходимо их совпадение.
Может ли этот механизм использоваться для показа персонализированных результатов в основной выдаче?
Если Google подмешивает результаты из персонального индекса (например, из Gmail или Photos) в основную выдачу, то этот механизм будет использоваться для гарантии того, что пользователь видит только тот контент, к которому у него есть доступ. Однако сам механизм не влияет на ранжирование публичных результатов вокруг этого блока.
Применяется ли этот патент к разметке структурированных данных на моем сайте?
Нет. Разметка структурированных данных (Schema.org) предназначена для описания публичного контента. Этот патент описывает обработку приватных метаданных и ACL в закрытых системах.