Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google эффективно проверяет права доступа к защищенным документам во время поиска

    DOCUMENT ACCESS CONTROL (Контроль доступа к документам)
    • US7627569B2
    • Google LLC
    • 2009-12-01
    • 2005-06-30
    2005 Безопасный поиск Патенты Google

    Патент Google, описывающий инфраструктурный механизм для быстрой проверки прав доступа к защищенным документам. Вместо рекурсивной проверки групп в реальном времени, система заранее рассчитывает полный список членства пользователя (Membership List) и сравнивает его со списком доступа документа (ACL). Это позволяет мгновенно фильтровать результаты поиска (например, в Google Workspace или корпоративном поиске).

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему низкой производительности и высоких задержек при поиске по защищенным документам. Традиционные системы контроля доступа требуют рекурсивной проверки членства пользователя в группах (Aliases) непосредственно в момент запроса. Это медленно и ресурсоемко, особенно при сложных, глубоко вложенных иерархиях групп, и может требовать взаимодействия между разными серверами. Изобретение повышает скорость и масштабируемость поисковых систем при работе с приватным контентом.

    Что запатентовано

    Запатентован метод оптимизации проверки прав доступа к документам. Суть изобретения — отказ от рекурсивного анализа структуры групп в реальном времени. Вместо этого система заранее вычисляет и кэширует полный список членства пользователя (Membership List) — все группы, в которые он входит прямо или косвенно. Доступ определяется путем выполнения быстрой операции пересечения (Intersection) этого списка со списком контроля доступа (ACL) документа.

    Как это работает

    Система работает в двух режимах:

    • Офлайн (Предварительные вычисления): Система заранее анализирует иерархию групп и вычисляет Membership List для каждого пользователя. Этот список обновляется при изменении структуры групп.
    • Онлайн (Обработка запроса): Когда пользователь выполняет поиск:
      1. Система извлекает ACL потенциального результата поиска.
      2. Система извлекает из кэша Membership List пользователя.
      3. Выполняется операция пересечения двух списков.
      4. Если пересечение не пустое (есть хотя бы одна общая группа), доступ разрешается, и документ может быть показан в выдаче. В противном случае документ фильтруется.

    Актуальность для SEO

    Высокая (для инфраструктуры). Эффективное управление доступом критически важно для систем, обрабатывающих приватные данные в масштабе (Google Workspace, корпоративный поиск). Описанный механизм предварительного расчета и быстрого пересечения остается фундаментальным подходом для высокопроизводительных систем авторизации.

    Важность для SEO

    Влияние на публичное SEO минимальное (1/10). Патент имеет чисто инфраструктурное значение и не влияет на стратегии публичного веб-поиска. Он описывает внутренние процессы Google для управления доступом к защищенным (непубличным) документам. Он не содержит информации о ранжировании, оценке качества контента или любых других факторах, используемых в Google.com.

    Детальный разбор

    Термины и определения

    ACL (Access Control List)
    Список контроля доступа. Структура данных, ассоциированная с документом, которая определяет, какие пользователи или группы (Aliases) имеют права доступа к этому документу. В патенте ACL рассматривается как специфический тип Alias.
    Alias (Псевдоним/Группа)
    Идентификатор, представляющий группу участников. Участниками могут быть пользователи и/или другие группы (вложенные Aliases).
    Membership List (Список членства)
    Ключевой компонент изобретения. Заранее вычисленный список всех Aliases (групп), в которые пользователь входит прямо (Direct Member) или косвенно (Indirect Member), т.е. через членство во вложенных группах.
    Intersection (Пересечение)
    Операция сравнения Membership List пользователя и ACL документа для нахождения общих элементов (Alias). Ненулевое пересечение означает наличие прав доступа.
    Direct Member (Прямой участник)
    Пользователь или Alias, который непосредственно указан в составе другого Alias или ACL.
    Indirect Member (Косвенный участник)
    Пользователь, который является членом Alias, который, в свою очередь, является членом другого Alias или ACL.
    ACL Map (Карта ACL)
    Структура данных, отображающая соответствие между документами и их ACLs.

    Ключевые утверждения (Анализ Claims)

    Патент описывает внутренние процессы Google без прямых рекомендаций для SEO.

    Claim 1 (Независимый пункт): Описывает основной метод контроля доступа.

    1. Система ассоциирует пользователя с первым набором псевдонимов (Membership List). Важное условие: эта ассоциация происходит до получения запроса от пользователя.
    2. Система ассоциирует документ со вторым набором псевдонимов (ACL).
    3. При получении запроса система определяет, имеют ли первый и второй наборы общий псевдоним.
    4. Ключевой механизм: определение происходит путем пересечения (intersecting) наборов без рекурсивного анализа (without recursively analyzing) этих наборов в реальном времени.
    5. Доступ предоставляется, если общий псевдоним найден, и запрещается, если нет.
    6. Описан механизм обновления: если членство пользователя в группе меняется или меняется структура групп, первый набор (Membership List) подвергается действию (инвалидация, пересчет или модификация).

    Ядро изобретения — замена медленного рекурсивного анализа в реальном времени на быстрое пересечение предварительно рассчитанных списков.

    Claim 3 (Независимый пункт): Альтернативное описание метода, сфокусированное на процессе генерации.

    1. Генерация Membership List для пользователя (включая прямое и косвенное членство) до запроса пользователя.
    2. Назначение документу ACL.
    3. В ответ на запрос: пересечение Membership List и ACL для определения наличия общего псевдонима без рекурсивного анализа.
    4. Предоставление или запрет доступа на основе результата пересечения.
    5. Обновление (инвалидация, пересчет) Membership List при изменении структуры членства.

    Где и как применяется

    Изобретение применяется в инфраструктуре поиска для управления доступом к непубличному контенту (например, Google Workspace, Enterprise Search, персонализированный поиск).

    INDEXING – Индексирование и извлечение признаков
    На этом этапе система индексирует защищенные документы и ассоциирует с ними соответствующие ACL. Эта информация сохраняется в индексе (например, в ACL Map).

    (Офлайн-процессы / Обслуживание данных)
    Система заранее рассчитывает и кэширует Membership Lists для всех пользователей. Эти списки обновляются при любых изменениях в структуре групп (Aliases). Этот процесс может быть рекурсивным, но он выполняется заранее, а не в момент запроса.

    RANKING / RERANKING (Фильтрация результатов)
    Основное применение патента в контексте поиска. Система должна гарантировать, что пользователь увидит только доступные ему результаты. Патент предлагает два варианта реализации:

    1. Вариант 1: Фильтрация после поиска (Post-filtering, FIG. 6).
      1. Система выполняет стандартный поиск (RANKING) по всему корпусу и получает набор результатов.
      2. На этапе RERANKING для каждого документа выполняется проверка доступа: пересечение ACL документа и Membership List пользователя.
      3. Если пересечение пустое, документ удаляется из выдачи.
    2. Вариант 2: Фильтрация до поиска (Pre-filtering, FIG. 7).
      1. Система анализирует Membership List пользователя, чтобы определить все доступные ему ACL.
      2. Система определяет множество документов, ассоциированных с этими доступными ACL.
      3. Поиск (RANKING) выполняется только по этому подмножеству доступных документов.

    Входные данные:

    • Идентификатор пользователя и его запрос.
    • Предварительно вычисленный Membership List пользователя.
    • Корпус документов с ассоциированными ACL.

    Выходные данные:

    • Отфильтрованный список результатов поиска, содержащий только те документы, к которым у пользователя есть доступ.

    На что влияет

    • Типы контента и Среды: Влияет исключительно на системы поиска по защищенным (приватным) данным, где требуется контроль доступа. Примеры: корпоративный поиск, поиск в Google Drive, поиск по Gmail.
    • Публичный веб-поиск: Не оказывает никакого влияния на ранжирование или отображение общедоступных веб-страниц на Google.com.

    Когда применяется

    • Условия работы: Применяется при каждом поисковом запросе в системе, которая управляет доступом к документам с помощью ACL и Aliases, и когда пользователь идентифицирован (залогинен).

    Пошаговый алгоритм

    Процесс проверки доступа к документу (Real-time)

    1. Получение запроса: Система получает запрос на доступ к документу (например, как часть поискового запроса).
    2. Идентификация субъектов: Идентифицируется запрашивающий пользователь и запрашиваемый документ.
    3. Получение данных доступа: Система извлекает ACL документа и заранее вычисленный Membership List пользователя (например, из кэша).
    4. Пересечение (Intersection): Выполняется операция пересечения множеств Membership List и ACL.
    5. Принятие решения:
      1. Если результат пересечения не пустой (Intersection != Null), это означает наличие общего Alias. Доступ разрешается.
      2. Если результат пересечения пустой (Intersection = Null), общих Alias нет. Доступ запрещается (документ фильтруется из выдачи).

    Какие данные и как использует

    Данные на входе

    Патент фокусируется исключительно на инфраструктурных данных для управления доступом. Он не упоминает никаких факторов, используемых в публичном SEO (контентных, ссылочных, поведенческих и т.д.).

    • Инфраструктурные данные:
      • Идентификаторы пользователей и групп (Aliases).
      • Access Control Lists (ACLs): Права доступа, назначенные документам.
      • Membership Lists: Предварительно вычисленные списки членства пользователей.
      • Структуры данных, описывающие иерархию групп (используются в офлайн-процессе).

    Какие метрики используются и как они считаются

    В патенте не используются метрики ранжирования или оценки качества. Используется одна ключевая операция над множествами.

    • Проверка пересечения: Основная операция — это булева проверка пересечения множеств. Доступ разрешен, если: (MembershipList∩ACL)≠∅(Membership List \cap ACL) \neq \emptyset(MembershipList∩ACL)=​/∅
    • Условие срабатывания: Результат пересечения не равен нулю (Non-Null), что означает наличие хотя бы одного общего элемента.

    Выводы

    Патент описывает внутренние инфраструктурные процессы Google и не дает практических выводов для публичного SEO.

    1. Фокус на производительности и масштабируемости: Основная цель изобретения — обеспечить быструю проверку прав доступа в крупных системах, не замедляя при этом поиск.
    2. Предварительные вычисления вместо реального времени: Ключевая инновация заключается в отказе от ресурсоемкой рекурсивной проверки прав доступа в момент запроса. Вместо этого используется предварительный расчет полных списков членства (Membership Lists).
    3. Проверка через пересечение: Проверка доступа сводится к быстрой математической операции пересечения двух множеств (Membership List и ACL).
    4. Применимость к приватному поиску: Этот механизм является ключевым для работы сервисов с ограниченным доступом, таких как Google Workspace или корпоративный поиск, позволяя быстро фильтровать результаты.
    5. Отсутствие связи с ранжированием: Описанный механизм является бинарным фильтром (доступен/недоступен). Он не влияет на то, как ранжируются доступные документы между собой в публичном вебе.

    Практика

    ВАЖНО: Патент является инфраструктурным и не дает практических выводов для SEO-специалистов, работающих с публичным веб-поиском (Google.com).

    Best practices (это мы делаем)

    Практических рекомендаций для стандартного SEO, основанных на механизмах этого патента, нет.

    Worst practices (это делать не надо)

    Практических рекомендаций для стандартного SEO, основанных на механизмах этого патента, нет. Патент не направлен против каких-либо SEO-тактик.

    Стратегическое значение

    Для публичного SEO стратегическое значение нулевое. Патент важен для понимания того, как Google решает инженерные задачи масштабирования при обработке персонализированных и приватных данных, но он не дает никаких инсайтов о работе алгоритмов ранжирования Google.com.

    Практические примеры

    Практических примеров для публичного SEO нет. Ниже приведен пример работы механизма в контексте приватного поиска (например, Google Workspace) для иллюстрации.

    Сценарий: Поиск по корпоративным документам

    1. Структура групп: Пользователь User_A входит в группу «Инженеры». Группа «Инженеры» входит в группу «Технический департамент».
    2. Предварительное вычисление (Офлайн): Система заранее рассчитала Membership List для User_A: [«Инженеры», «Технический департамент»].
    3. Документ: Документ «Стратегия развития» имеет ACL: [«Менеджмент», «Технический департамент»].
    4. Поиск (Онлайн): User_A ищет «Стратегия развития». Система находит документ.
    5. Проверка доступа (Онлайн): Система выполняет пересечение: Membership List [«Инженеры», «Технический департамент»] ∩ ACL [«Менеджмент», «Технический департамент»].
    6. Результат: Пересечение = [«Технический департамент»]. Оно не пустое. Доступ разрешен. Документ показывается в выдаче. Этот процесс занимает миллисекунды.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование сайтов в публичном поиске Google.com?

    Нет, не влияет. Патент описывает исключительно инфраструктурный механизм для управления правами доступа (ACL) к приватным, защищенным документам. Он применяется в таких системах, как корпоративный поиск или Google Workspace, и не имеет отношения к алгоритмам ранжирования публичных веб-страниц.

    Что такое ACL и Membership List в контексте этого патента?

    ACL (Access Control List) — это список групп, которым разрешен доступ к конкретному документу. Membership List — это заранее рассчитанный полный список всех групп, в которые входит пользователь (прямо или косвенно). Система проверяет доступ, ища пересечение между этими двумя списками.

    Зачем Google понадобился этот механизм? Разве нельзя просто проверить права в момент запроса?

    Проверка прав в момент запроса (рекурсивный анализ иерархии групп) может быть очень медленной, особенно если структура групп сложная, многоуровневая и распределена по разным серверам. Этот патент предлагает способ значительно ускорить поиск по приватным данным, перенеся сложную работу по вычислению членства в офлайн-процесс.

    Что означает «без рекурсивного анализа» (without recursively analyzing) в формуле изобретения (Claims)?

    Это ключевой момент патента. Это означает, что система не тратит время на обход иерархии групп (например, проверку, входит ли Группа А в Группу Б, а та в Группу В) в момент обработки запроса пользователя. Вся сложная иерархия уже учтена в заранее рассчитанном Membership List. Проверка сводится к простому сравнению двух списков.

    Применяется ли этот механизм в Google Workspace (Gmail, Drive)?

    Хотя патент прямо не упоминает эти продукты, это идеальный сценарий использования описанной технологии. Управление доступом к файлам на Диске или письмам в Gmail требует быстрого и эффективного способа фильтрации контента на основе прав доступа пользователя и групп, что и решает данный патент.

    Описывает ли патент, как ранжируются доступные документы?

    Нет. Патент сфокусирован исключительно на механизме определения доступности документа для пользователя (бинарный фильтр: да/нет). Он не затрагивает вопросы релевантности или ранжирования тех документов, которые прошли фильтр доступа.

    Патент описывает фильтрацию до поиска и после поиска. В чем разница?

    Фильтрация после поиска (Post-filtering): система сначала ищет везде, а затем удаляет недоступные результаты из выдачи. Фильтрация до поиска (Pre-filtering): система сначала определяет множество доступных документов и ищет только среди них. Второй вариант эффективнее, если пользователь имеет доступ лишь к малой части общего корпуса документов.

    Что происходит, когда администратор меняет состав группы?

    Когда состав группы меняется, система инвалидирует (помечает как устаревшие) Membership Lists всех затронутых пользователей. Затем эти списки пересчитываются (в офлайн-режиме), чтобы отразить актуальную структуру доступа. Это гарантирует актуальность данных о правах.

    Влияет ли сложность иерархии групп на скорость проверки доступа?

    При использовании этого механизма — нет. Сложность иерархии влияет только на время предварительного расчета Membership List (офлайн). Сама проверка доступа в реальном времени (онлайн) происходит быстро, так как это простая операция пересечения двух списков.

    Есть ли хоть какая-то польза от этого патента для SEO-специалиста?

    Практическая польза для SEO минимальна. Патент дает общее представление об инфраструктуре, которую Google использует для обработки непубличных данных и решения задач масштабирования. Однако он не предоставляет никаких инсайтов или рекомендаций для оптимизации и продвижения публичных веб-сайтов.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.