Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google строит Корпоративные Графы Знаний с гранулярным контролем доступа для персонализации внутреннего поиска

    SEARCH PERSONALIZATION AND AN ENTERPRISE KNOWLEDGE GRAPH (Персонализация поиска и корпоративный граф знаний)
    • US9998472B2
    • Google LLC
    • 2018-06-12
    • 2015-05-28
    2015 Knowledge Graph Индексация Патенты Google Семантика и интент

    Патент Google описывает систему для корпоративного поиска (Enterprise Search). Она извлекает сущности и факты из внутренних документов компании, формируя Корпоративный Граф Знаний. Ключевая особенность — применение прав доступа (ACL) не к документу, а к каждому отдельному факту, что обеспечивает безопасность данных при персонализации поиска и работе цифровых ассистентов.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему поиска информации в разрозненных корпоративных системах (документы, email, базы данных), где критически важно соблюдать строгие политики безопасности и списки контроля доступа (Access Control Lists, ACLs). Задача — создать единую, семантически связанную поисковую систему (Enterprise Knowledge Graph) и обеспечить глубокую персонализацию, не нарушая при этом конфиденциальность данных.

    Что запатентовано

    Запатентована система для создания и использования Корпоративного Графа Знаний (Enterprise Knowledge Graph). Ключевым элементом является механизм применения контроля доступа не на уровне целого документа, а на уровне отдельного извлеченного факта (Entity Fact). Для этого создается Entity Fact ACL, который наследует права доступа от исходного ресурса. Это позволяет агрегировать информацию из разных источников, сохраняя гранулярный контроль безопасности.

    Как это работает

    Система функционирует следующим образом:

    • Сбор данных: Система интегрирует корпоративные ресурсы и их ACLs через API.
    • Извлечение: Из ресурсов извлекаются Сущности (Entities) (например, люди, проекты) и Факты (Entity Facts) (отношения между ними).
    • Гранулярный контроль доступа: Для каждого факта создается Entity Fact ACL путем наследования прав доступа исходного документа.
    • Индексация и Граф: Данные индексируются в Enterprise Knowledge Graph.
    • Выполнение поиска: При запросе система сначала фильтрует результаты, проверяя Entity Fact ACL каждого элемента, чтобы пользователь увидел только разрешенные данные.
    • Персонализация и Ранжирование: Доступные результаты ранжируются с учетом информации о пользователе (Member Information — роль, активность, связи в графе) и автоматически настраиваются (Auto-tuning) на основе поведения пользователей.

    Актуальность для SEO

    Высокая для сферы корпоративного поиска (Enterprise Search) и продуктов типа Google Cloud Search. Технологии Графов Знаний, NLP и управления доступом критически важны в этой области. Актуальность для публичного веб-поиска (Google.com) низкая, так как патент сфокусирован на закрытых системах и механизмах ACL.

    Важность для SEO

    Влияние на публичное SEO минимальное (2/10). Патент не описывает алгоритмы ранжирования google.com. Он относится исключительно к внутреннему корпоративному поиску. Однако он представляет значительный стратегический интерес, так как демонстрирует методологию Google по извлечению сущностей, построению графов знаний и использованию поведенческих сигналов для машинного обучения ранжирования в контролируемой среде.

    Детальный разбор

    Термины и определения

    ACL (Access Control List / Список контроля доступа)
    Список разрешений, прикрепленный к ресурсу. Он указывает, какие участники предприятия могут получать доступ или изменять данный ресурс.
    Auto-tuning (Автонастройка)
    Процесс автоматической корректировки Quality Score и ранжирования на основе имплицитной обратной связи от пользователей (например, кликов), без ручного вмешательства.
    Computer-implemented assistant (Цифровой ассистент)
    Программное обеспечение, использующее корпоративные и личные данные для проактивного выполнения рабочих задач (Enterprise Actions).
    Enterprise (Предприятие/Организация)
    Компания или юридическое лицо, контролирующее корпоративную информацию.
    Enterprise Knowledge Graph (EKG) (Корпоративный Граф Знаний)
    Графовая структура данных, где узлы представляют корпоративные сущности и ресурсы, а ребра — отношения (факты) между ними.
    Entity (Сущность)
    Объект или концепция (люди, проекты, отделы), извлеченная из ресурсов предприятия.
    Entity Fact (Факт о сущности)
    Отношение между двумя сущностями или атрибут сущности (например, «Jane Doe» — «VP of Sales»).
    Entity Fact ACL (Список контроля доступа к факту)
    Гранулярный ACL, применяемый к конкретному Entity Fact. Он наследуется от ACL исходного ресурса, из которого был извлечен факт.
    Member Information (Информация об участнике/сотруднике)
    Данные о сотруднике: роль, позиция, отдел, активность, связи с другими сущностями, данные календаря и почты.
    Quality Score (Оценка качества/релевантности)
    Метрика, используемая для ранжирования, указывающая уровень релевантности факта или сущности запросу и контексту пользователя.
    Resource (Ресурс)
    Единица контента предприятия (документ, email, запись в БД).

    Ключевые утверждения (Анализ Claims)

    ВАЖНО: Все Claims описывают систему, работающую исключительно в контексте корпоративного поиска (Enterprise Search).

    Claim 1 (Независимый пункт): Описывает основной процесс обработки запроса с гранулярным контролем доступа.

    1. Система получает запрос от участника предприятия.
    2. Выполняется поиск по индексу, содержащему информацию об участниках и корпоративные документы.
    3. Ключевой механизм (Deriving Entity Facts): Описан процесс извлечения фактов: для документа определяется первая сущность, вторая сущность и отношение между ними. Генерируется Entity Fact. Из одного документа извлекается множество фактов.
    4. Ключевой механизм (ACL Inheritance): Индекс содержит данные о правах доступа через Entity Fact ACLs. Каждый факт наследует (inherits) ACL того документа, из которого он был извлечен.
    5. Система определяет факты, доступные участнику, согласно Entity Fact ACLs (фильтрация).
    6. Система определяет релевантные результаты на основе Member Information (персонализация) и доступных фактов.
    7. Система предоставляет результаты.

    Claim 4 (Зависимый от 1): Уточняет ранжирование.

    Результаты ранжируются на основе релевантности по отношению к запросу И информации об участнике (Member Information).

    Claim 5 и 6 (Зависимые от 4): Детализируют метрики ранжирования.

    1. Определяется Quality Score для оценки релевантности.
    2. Quality Score может основываться на параметрах: mean reciprocal rank (средний обратный ранг), mean precision (средняя точность), average click position (средняя позиция клика), click through rate (CTR) и abandonment rate (показатель отказов).

    Claim 7 и 8 (Зависимые): Описывают механизм обратной связи (Auto-tuning).

    1. Система получает информацию о выборе пользователя (клик) из результатов поиска.
    2. Quality Score корректируется на основе этого выбора.
    3. Корректировка происходит автоматически (auto-tuning) без явного ввода пользователя.

    Где и как применяется

    Патент описывает архитектуру системы Корпоративного Поиска (Enterprise Search) и не применяется в публичном веб-поиске Google.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит основная работа по обработке данных:

    • Получение данных: Система (Integration System) получает ресурсы и их ACLs через API.
    • Извлечение признаков (NLP): Анализ контента для идентификации Entities и Entity Facts.
    • Определение доступа (Критический шаг): Определение Entity Fact ACL для каждого факта путем наследования ACL исходного ресурса.
    • Структурирование: Построение Enterprise Knowledge Graph (EKG).

    RANKING / RERANKING – Ранжирование и Переранжирование
    На этапе выполнения запроса:

    • Фильтрация доступа (Security Trimming): Система строго фильтрует результаты, проверяя Entity Fact ACL. Если доступа нет, факт не показывается.
    • Персонализация: Система определяет релевантность, используя EKG и Member Information (роль пользователя, активность, связи).
    • Ранжирование и Автонастройка: Результаты сортируются с использованием Quality Score, который учитывает поведенческие сигналы (CTR, клики) и автоматически настраивается (Auto-tuning).

    Входные данные:

    • Корпоративные ресурсы (документы, email) и их ACLs.
    • Информация об участниках (Member Information).
    • Запрос пользователя и логи взаимодействия с поиском.

    Выходные данные:

    • Персонализированные результаты поиска, отфильтрованные согласно политикам безопасности.

    На что влияет

    Патент влияет исключительно на внутренние системы поиска организаций (например, Google Cloud Search). Он не влияет на ранжирование веб-сайтов в публичном поиске Google.

    • Типы контента: Внутренние документы, электронная почта, базы данных предприятия.
    • Специфические запросы: Запросы, связанные с внутренними проектами, сотрудниками, отделами.

    Когда применяется

    • Условия работы: Алгоритм работает при каждом запросе пользователя в системе корпоративного поиска или при активации цифрового ассистента, интегрированного с этой системой.

    Пошаговый алгоритм

    Процесс А: Построение индекса и графа (Офлайн/Фоновый режим)

    1. Получение ресурсов: Система получает ресурсы предприятия и их ACLs.
    2. Идентификация Сущностей и Фактов: Анализ контента для извлечения Entities и определения отношений между ними (Entity Facts).
    3. Определение доступа к фактам (ACL Inheritance): Для каждого Entity Fact определяется Entity Fact ACL путем наследования ACL ресурса, из которого этот факт был извлечен.
    4. Хранение и Индексация: Сущности, Факты и их Entity Fact ACLs сохраняются и индексируются. Формируется Enterprise Knowledge Graph.

    Процесс Б: Выполнение поиска (Реальное время)

    1. Получение запроса: Система получает запрос от участника.
    2. Поиск кандидатов: Поиск в индексе сущностей и фактов, соответствующих запросу.
    3. Фильтрация доступа (Security Trimming): Система проверяет Entity Fact ACL для каждого кандидата. Определяются только те факты, к которым у участника есть доступ.
    4. Персонализация и Ранжирование: Система анализирует доступные факты в контексте Member Information и связей в EKG. Вычисляется Quality Score.
    5. Предоставление результатов: Пользователю предоставляется отсортированный список разрешенных результатов.
    6. Автонастройка (Auto-tuning): Система анализирует взаимодействие пользователя с результатами (клики) и корректирует Quality Score для будущих запросов.

    Какие данные и как использует

    Данные на входе

    Система использует данные, доступные в контексте корпоративной среды:

    • Контентные факторы: Содержимое корпоративных ресурсов (текст документов, email), используемое для извлечения сущностей и фактов.
    • Технические факторы (Безопасность): Access Control Lists (ACLs), связанные с каждым ресурсом. Критически важный входной сигнал.
    • Пользовательские факторы (Member Information): Роль сотрудника, должность, отдел, оргструктура, контакты, активность сотрудника, его календарь и электронная почта.
    • Поведенческие факторы: Взаимодействие участников с результатами поиска (клики, длительность кликов (long click/short click), пропуск результатов).

    Какие метрики используются и как они считаются

    • Entity Fact ACL: Метрика доступа. Рассчитывается путем прямого наследования ACL исходного ресурса.
    • Relevance (Релевантность): Определяется с использованием Enterprise Knowledge Graph. Близость узлов в графе (пользователя и результата) может указывать на более высокую релевантность.
    • Quality Score: Агрегированная метрика релевантности и качества результата для конкретного пользователя. Патент явно упоминает, что она может включать поведенческие метрики (Claim 6):
      • Mean reciprocal rank (Средний обратный ранг)
      • Mean precision (Средняя точность)
      • Average click position (Средняя позиция клика)
      • Click through rate (CTR)
      • Abandonment rate (Показатель отказов).
    • Auto-tuning: Механизм автоматической корректировки Quality Score на основе анализа взаимодействия пользователей с результатами поиска.

    Выводы

    1. Фокус на Корпоративном Поиске: Патент описывает инфраструктуру для Enterprise Search, а не для публичного Веб-поиска Google. Прямых выводов для SEO нет.
    2. Гранулярный контроль доступа (Entity Fact ACL): Ключевое изобретение — применение ACL на уровне отдельных извлеченных фактов, а не целых документов. Доступ к факту определяется доступом к исходному документу.
    3. Корпоративный Граф Знаний (EKG): Система строит EKG, извлекая сущности и отношения из внутренних ресурсов. Этот граф является основой для понимания контекста внутри организации.
    4. Глубокая Персонализация: Поиск сильно персонализирован на основе роли сотрудника, его активности и связей в EKG (Member Information).
    5. Использование Поведенческих Сигналов и Auto-tuning: Патент явно подтверждает использование поведенческих метрик (CTR, позиция клика, отказы) для оценки качества результатов и автоматической настройки ранжирования в этой системе.
    6. Интеграция с Ассистентами: Описанная инфраструктура также служит основой для работы проактивных цифровых ассистентов внутри организации.

    Практика

    Best practices (это мы делаем)

    Патент не дает прямых практических рекомендаций для SEO-продвижения публичных веб-сайтов. Однако он дает важные стратегические инсайты о подходах Google:

    • Фокус на Entity-First подходе: Патент демонстрирует отработанные механизмы Google для извлечения сущностей и фактов. В публичном SEO это подчеркивает необходимость фокусироваться на четком определении ключевых сущностей сайта (Авторы, Организация, Темы) и связей между ними.
    • Использование структурированных данных (Schema.org): Необходимо помогать Google распознавать сущности и их отношения, используя разметку. Это коррелирует с процессом Entity Fact Extraction, описанным в патенте.
    • Оптимизация под пользовательский опыт (UX/Behavior): Патент явно описывает использование поведенческих сигналов (CTR, клики) для Auto-tuning ранжирования. Это подтверждает важность оптимизации сниппетов и улучшения UX для публичного SEO.

    Worst practices (это делать не надо)

    • Игнорирование семантической структуры: Создание контента без учета сущностей и связей противоречит методологии Google, основанной на графах знаний.
    • Пренебрежение персонализацией и контекстом: Не учитывать, что релевантность для Google сильно зависит от контекста пользователя (даже если в публичном поиске этот контекст менее детализирован, чем в корпоративном).

    Стратегическое значение

    Патент критически важен для понимания технологических возможностей Google. Он подтверждает стратегический сдвиг в сторону семантического поиска (Графы Знаний), глубокой персонализации и машинного обучения на основе поведенческих сигналов (Auto-tuning). Хотя реализация для Enterprise Search отличается от публичного поиска (особенно в части ACL и доступности данных о пользователе), базовая философия универсальна. Это подтверждает долгосрочный тренд развития поиска в сторону Entity-Oriented Search.

    Практические примеры

    Практических примеров для публичного SEO нет. Ниже приведен пример работы механизма в корпоративной среде, как описано в патенте.

    Сценарий: Контроль доступа к фактам (Entity Fact ACL)

    1. Индексирование:
      • Ресурс А (Документ HR): Содержит факт «Зарплата Jane Doe = $50,000». ACL Ресурса А = только HR-директор «Mary».
      • Ресурс Б (Общая страница): Содержит факт «Jane Doe — Вице-президент». ACL Ресурса Б = Все сотрудники.
    2. Извлечение и Наследование:
      • Факт 1 («$50,000»). Entity Fact ACL = только Mary.
      • Факт 2 («Вице-президент»). Entity Fact ACL = Все сотрудники.
    3. Поиск (Сотрудник «Alvin»): Alvin ищет «Jane Doe».
    4. Фильтрация: Система проверяет доступ. Alvin не имеет доступа к Факту 1, но имеет доступ к Факту 2.
    5. Результат: Alvin видит должность Jane Doe, но не видит ее зарплату.

    Вопросы и ответы

    Описывает ли этот патент работу публичного поиска Google (google.com)?

    Нет. Патент строго сфокусирован на системах корпоративного поиска (Enterprise Search), предназначенных для индексации внутренних данных организации. Механизмы, описанные здесь, особенно касающиеся контроля доступа (ACLs), не применяются в публичном веб-поиске.

    Что такое Entity Fact ACL и почему это важно?

    Entity Fact ACL — это список контроля доступа, применяемый к отдельному факту, извлеченному из документа. Это критически важно для безопасности в корпоративном поиске, так как позволяет системе агрегировать информацию, но показывать пользователю только те фрагменты данных, к которым у него есть разрешение, унаследованное от исходного документа.

    Можно ли использовать инсайты из этого патента для улучшения SEO моего сайта?

    Напрямую — нет, так как он не описывает факторы ранжирования публичного веба. Стратегически — да, так как он подтверждает фокус Google на сущностях, графах знаний и использовании поведенческих сигналов для обучения систем ранжирования (Auto-tuning). Это подчеркивает важность работы над семантикой и UX.

    Что такое Enterprise Knowledge Graph (EKG)?

    Это Граф Знаний, построенный исключительно на основе внутренних данных компании (документы, email, базы данных). Он содержит корпоративные сущности (сотрудники, проекты) и отношения между ними. Он используется для определения контекста и связей внутри организации.

    Насколько сильно персонализирован поиск в этой системе?

    Поиск глубоко персонализирован. Система использует Member Information — роль сотрудника, его отдел, недавнюю активность, календарь, почту, а также его связи в EKG — чтобы определить, какие результаты будут наиболее релевантны для него.

    Патент упоминает использование CTR и Average Click Position. Подтверждает ли это использование поведенческих факторов в публичном ранжировании?

    Патент подтверждает, что Google использует эти метрики для расчета Quality Score и автоматической настройки ранжирования (auto-tuning) в системе корпоративного поиска. Это демонстрирует технологические возможности Google, но не является прямым доказательством использования этих же сигналов для ранжирования в публичном веб-поиске.

    Что такое «Auto-tuning» (Автонастройка) в контексте этого патента?

    Это процесс машинного обучения, при котором система автоматически корректирует оценку релевантности результатов на основе имплицитной обратной связи от пользователей. Если пользователи часто кликают на определенный результат, система адаптирует будущее ранжирование без ручного вмешательства.

    Имеет ли этот патент отношение к E-E-A-T?

    Концептуально — да, но в контексте корпоративной среды. Авторитетность и экспертиза в EKG определяются ролью сотрудника (Member Information) и его доступом к информации (ACLs). Это схоже с тем, как E-E-A-T сущностей влияет на ранжирование в публичном поиске, но использует другие сигналы.

    Что такое «Computer-implemented assistant», упоминаемый в патенте?

    Это цифровой помощник (аналог Google Assistant), который использует доступ к корпоративному графу знаний и личным данным сотрудника для проактивной помощи в рабочих задачах — например, планирование встреч, бронирование поездок или предоставление нужных документов перед встречей, соблюдая при этом все ACLs.

    Каков основной вывод для публичного SEO-специалиста из этого патента?

    Основной вывод — подтверждение технологических приоритетов Google. Патент показывает, что Google делает ставку на семантический поиск (Графы Знаний), глубокую персонализацию и машинное обучение на основе поведенческих сигналов. Это подчеркивает необходимость фокусироваться на качестве контента, пользовательском опыте и семантической разметке в публичном SEO.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2026 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.