Патент описывает инфраструктуру для создания кастомизированных поисковых систем (CSE). Пользователь может создать персональную поисковую систему, указав источники своего контента (соцсети, блоги) и предоставив учетные данные для доступа. Система индексирует этот контент, включая приватные данные, и генерирует код для встраивания поисковой строки, строго соблюдая при этом исходные настройки приватности (ACL).
Описание
Какую задачу решает
Патент решает проблему фрагментации цифрового контента пользователя. Пользователи генерируют значительный объем контента (посты, обзоры, фотографии), распределенного по различным сервисам (социальные сети, блоги, e-commerce). Другим людям сложно находить релевантный контент, созданный конкретным человеком, из-за этой разрозненности и потенциальных ограничений доступа (приватности).
Что запатентовано
Запатентована система для генерации пользовательских кастомизированных поисковых систем (Customized Search Engines, CSE). Пользователь (customizing user) может создать CSE, указав источники своего контента и предоставив системе учетные данные (credentials) для доступа к ним. Система индексирует контент, создавая user-specific indices, и предоставляет встраиваемый код для поисковой строки. Ключевой механизм — строгое соблюдение списков контроля доступа (Access Control Lists, ACL) при выполнении поиска другими пользователями.
Как это работает
Система работает в несколько этапов:
- Определение источников и авторизация: Пользователь через интерфейс (например, CSE Wizard) указывает источники своего контента (URL профилей, блогов) и предоставляет логины/пароли для доступа к ним.
- Индексация: Система использует эти учетные данные для сканирования контента (включая приватный) и связанных с ним ACL, создавая user-specific indices.
- Генерация интерфейса: Система генерирует программный код (например, JavaScript) для встраивания кастомной поисковой строки.
- Выполнение поиска и проверка ACL: Когда другой пользователь (searching user) выполняет поиск, система ищет по соответствующим индексам. Перед показом результата проверяется ACL. Если доступ разрешен, результат показывается. Если нет, может быть показано обобщенное представление (generic representation) с возможностью запросить доступ.
Актуальность для SEO
Низкая/Средняя. Хотя концепция кастомизированного поиска (Google Custom Search) существует, описанная в патенте реализация, требующая от пользователей предоставления учетных данных от сторонних сервисов для индексации приватного контента, не получила широкого распространения в таком виде из-за сложностей с безопасностью и приватностью. Однако базовые технологии управления доступом (ACL) и агрегации данных остаются актуальными для систем персонализированного поиска.
Важность для SEO
(1/10). Патент имеет минимальное значение для стандартных SEO-стратегий. Он описывает инфраструктуру для создания нишевых, персональных поисковых систем, работающих поверх курируемых или приватных данных. Патент не раскрывает алгоритмов ранжирования основного поиска Google и не дает никаких прямых рекомендаций по оптимизации сайтов для улучшения их позиций в органической выдаче.
Детальный разбор
Термины и определения
- Access Control List (ACL) (Список контроля доступа)
- Механизм, определяющий права доступа к объекту (контенту). ACL определяет аудиторию, которой разрешен доступ к конкретному фрагменту контента (например, посту в социальной сети). Критически важен для соблюдения приватности.
- Authentication data / Credentials (Учетные данные)
- Логины и пароли, предоставляемые создателем CSE, чтобы система могла получить доступ к непубличным данным в указанных источниках для индексации.
- Customized Search Engine (CSE) (Кастомизированная поисковая система)
- Поисковая система, созданная пользователем для поиска по определенному набору источников данных, обычно по контенту, созданному этим же пользователем.
- Customizing User (Настраивающий пользователь)
- Пользователь, который создает CSE, указывает источники своего контента и предоставляет доступ к ним.
- Data Source (Источник данных)
- Внешний сервис, где хранится контент пользователя (например, социальная сеть, блог-платформа, e-commerce сайт).
- Generic Representation / Generic Search Result (Обобщенный результат поиска)
- Заглушка или анонимизированная версия результата поиска. Показывается, если контент релевантен, но у ищущего пользователя нет прав доступа (он отсутствует в ACL). Может включать ссылку для запроса доступа (access request link).
- Searching User (Ищущий пользователь)
- Пользователь, который выполняет поиск с помощью созданного CSE.
- User-specific Index (Пользовательский индекс)
- Поисковый индекс, созданный исключительно на основе контента, специфичного для Customizing User, извлеченного из указанных им источников.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает полный цикл создания и использования кастомизированной поисковой системы с акцентом на контроль доступа.
- Система получает от настраивающего пользователя (customizing user) список источников данных. Эти источники содержат контент, созданный этим пользователем, для которого он указал определенную аудиторию (настройки приватности/ACL).
- Система генерирует один или несколько пользовательских индексов (user-specific search indices) для этого контента.
- Система генерирует программный код для отображения кастомизированной поисковой строки (CSE) и передает его пользователю для встраивания в веб-документ.
- [Действия при поиске]: Система получает поисковый запрос от ищущего пользователя (searching user).
- Определяются результаты поиска на основе индексов. По крайней мере один результат является результатом с контролируемым доступом, связанным с ACL.
- [Ключевой механизм приватности]: Результат с контролируемым доступом показывается, если ищущий пользователь идентифицирован в ACL.
- Обобщенное представление (generic representation) результата показывается, если ищущий пользователь НЕ идентифицирован в ACL. Это представление включает ссылку для запроса доступа.
Claim 2 (Зависимый от 1): Уточняет механизм доступа к данным для индексации.
Система получает аутентификационные данные (authentication data), такие как учетные данные для входа (логин/пароль), от настраивающего пользователя. Это позволяет системе получить доступ и проиндексировать приватный контент в источниках данных.
Claim 4 (Зависимый от 1): Описывает механизм интеграции CSE в общий поиск.
- Система получает поисковый запрос от ищущего пользователя в общей поисковой строке (general search box).
- Система определяет, что ищущему пользователю предоставлен доступ к некоторым (но не ко всем) существующим CSE.
- В ответ на запрос система предоставляет общие результаты поиска И результаты из тех CSE, к которым у пользователя есть доступ. Результаты из недоступных CSE исключаются.
Где и как применяется
Патент описывает инфраструктуру отдельного сервиса кастомизированного поиска (Customized Search Service), а не основную архитектуру веб-поиска Google. Он затрагивает следующие этапы в контексте работы этого сервиса:
CRAWLING – Сканирование и Сбор данных (для CSE)
Система выполняет целевое сканирование указанных data sources. В отличие от стандартного краулинга, здесь используются предоставленные пользователем credentials для доступа к приватному контенту. Извлекается контент и связанные с ним ACLs.
INDEXING – Индексирование (для CSE)
Извлеченный контент индексируется для создания user-specific indices. Критически важным является индексация не только контента, но и связанных с ним ACL.
METASEARCH – Метапоиск и Смешивание
Как описано в Claim 4, система может функционировать как метапоиск. Если пользователь использует общую поисковую строку, система определяет доступные ему CSE и смешивает результаты из них с результатами общего поиска.
RANKING / RERANKING – Ранжирование и Переранжирование (Фильтрация по ACL)
При получении запроса система использует user-specific indices. На этапе ранжирования или переранжирования происходит критически важная проверка ACL в реальном времени. Система должна сверить идентификатор ищущего пользователя с ACL каждого результата и отфильтровать или изменить результаты (до generic representation), если доступ запрещен.
Входные данные (при создании CSE):
- Список URL источников данных.
- Учетные данные (логин/пароль) для доступа к этим источникам.
Входные данные (при поиске):
- Поисковый запрос.
- Идентификационные данные ищущего пользователя (для проверки ACL).
Выходные данные:
- Список результатов поиска, отфильтрованный в соответствии с ACL.
На что влияет
- Типы контента: Влияет на возможность поиска по персональному контенту, который часто является приватным или полуприватным: посты в социальных сетях, личные блоги, обзоры на сайтах e-commerce, фотографии и видео.
- Влияние на SEO: Патент не влияет на ранжирование веб-сайтов в основном органическом поиске Google.
Когда применяется
- Условия активации (Создание): Когда пользователь решает создать поисковую систему по собственному контенту и предоставляет системе необходимые данные и разрешения (credentials).
- Условия активации (Поиск): Когда ищущий пользователь использует эту кастомизированную поисковую систему или использует общий поиск, имея доступ к определенным CSE.
- Проверка ACL: Активируется каждый раз при поиске для определения, следует ли показывать конкретный контент или заменить его на Generic Search Result.
Пошаговый алгоритм
Процесс А: Создание кастомизированной поисковой системы (CSE)
- Получение определения источников: Система получает от пользователя ввод, определяющий data sources (URL).
- Получение учетных данных: Система получает credentials (логин/пароль) для доступа к этим источникам (если требуется для приватного контента).
- Сканирование и Индексация: Система получает доступ к источникам, сканирует пользовательский контент и связанные ACLs.
- Генерация индексов: Создается user-specific index для каждого источника данных.
- Генерация кода: Система генерирует программный код для встраивания customized search box.
- Предоставление кода: Код передается пользователю.
Процесс Б: Выполнение поиска через CSE
- Получение запроса: Система получает поисковые термины от ищущего пользователя.
- Запрос к индексам: Поисковые термины используются как входные данные для соответствующих user-specific indices.
- Генерация предварительных результатов: Формируется набор потенциальных результатов поиска.
- Проверка ACL: Для каждого результата система определяет, связан ли он с ACL, и проверяет, идентифицирован ли ищущий пользователь в этом ACL.
- Модификация результатов: Если пользователь не идентифицирован в ACL, система генерирует generic search result (общее представление), сохраняя конфиденциальность.
- Передача результатов: Итоговый набор результатов (включая оригинальные результаты и общие представления) передается для отображения ищущему пользователю.
Какие данные и как использует
Данные на входе
Патент фокусируется на инфраструктуре доступа и индексации, а не на факторах ранжирования.
- Технические факторы: URL источников данных (Data Sources).
- Пользовательские факторы (Критические):
- От создателя CSE: Учетные данные (Credentials: логин/пароль) для доступа системы к приватным данным в источниках.
- От ищущего пользователя: Идентификационные данные пользователя, используемые для сверки со списками контроля доступа (ACL).
- Контентные факторы: Весь цифровой контент, доступный по предоставленным учетным данным в указанных источниках (текст, изображения, видео, обзоры).
- Структурные/Системные факторы: Списки контроля доступа (ACL), связанные с каждым элементом контента.
Какие метрики используются и как они считаются
- Проверка доступа (ACL Matching): Ключевым механизмом вычисления является бинарная проверка доступа: сравнение идентификатора ищущего пользователя со списками ACL. Результат проверки определяет формат отображения результата.
- Метрики ранжирования: Патент не детализирует конкретные формулы для ранжирования результатов внутри CSE. Однако в описании упоминается, что ранжирование может учитывать дополнительные данные:
- Геолокация (geo-location) ищущего пользователя.
- Релевантность (relevance).
- Степень разделения (degree of separation) между ищущим пользователем и создателем CSE (социальная близость).
- Свежесть контента (freshness).
Выводы
- Патент инфраструктурный, без прямых рекомендаций для SEO: Патент описывает архитектуру продукта для создания персональных поисковых систем (CSE), а не алгоритмы ранжирования основного веб-поиска Google. Практических выводов для стандартного SEO нет.
- Индексация приватного контента через учетные данные: Ключевой аспект изобретения — способность системы получать от пользователя учетные данные (credentials) для доступа и индексации его приватного контента, распределенного по разным сервисам.
- Приоритет контроля доступа (ACL): Система разработана так, чтобы строго соблюдать исходные настройки приватности контента. ACL определяет, что увидит ищущий пользователь, гарантируя, что приватный контент не станет публичным.
- Обработка отказа в доступе (Generic Representation): Если доступ запрещен, система использует заглушки (Generic Representation) и предоставляет механизм для запроса доступа, вместо того чтобы просто скрывать результат.
- Интеграция в общий поиск: Патент предусматривает возможность смешивания результатов из персональных CSE с результатами общего поиска, но только если ищущему пользователю явно предоставлен доступ к этим CSE (Claim 4).
Практика
ВАЖНО: Патент является инфраструктурным и не дает практических выводов для SEO-специалистов, работающих над продвижением сайтов в основном поиске Google.
Best practices (это мы делаем)
Для органического SEO рекомендации отсутствуют. Патент не содержит информации, которая помогла бы улучшить стратегии или тактики продвижения.
Worst practices (это делать не надо)
Не применимо. Патент не направлен против каких-либо SEO-манипуляций и не описывает механизмы пессимизации в основном поиске.
Стратегическое значение
Стратегическое значение для SEO минимально. Патент интересен с технической точки зрения, так как демонстрирует методы Google для индексации данных из разнородных источников (включая закрытые данные по предоставленным паролям) и сложного управления правами доступа (ACL) на уровне отдельных документов. Это имеет отношение к развитию персонализированного поиска, но не влияет на разработку долгосрочной SEO-стратегии для публичных веб-сайтов.
Практические примеры
Практических примеров для SEO нет.
Пример использования продукта, описанного в патенте (Не SEO):
Сценарий: Создание персонального поиска для блогера.
- Задача: Автор ведет публичный блог, закрытый канал в социальной сети и публикует обзоры на платформе e-commerce. Он хочет, чтобы аудитория могла искать по всем этим материалам в одном месте.
- Действие: Автор использует сервис CSE. Он указывает URL блога и профиля e-commerce. Для социальной сети он предоставляет системе свои учетные данные для индексации закрытого канала.
- Реализация: Автор получает код и встраивает поисковую строку на свой сайт.
- Результат для пользователя: Посетитель вводит запрос.
- Если посетитель не авторизован или не имеет доступа к закрытому каналу, он увидит результаты из блога и e-commerce. Вместо результатов из закрытого канала он увидит заглушки (Generic Representation).
- Если посетитель авторизован и имеет доступ к закрытому каналу (т.е. присутствует в его ACL), он увидит все результаты, включая приватный контент.
Вопросы и ответы
Влияет ли этот патент на ранжирование моего сайта в основном поиске Google?
Нет, этот патент не влияет на стандартное SEO и ранжирование в основном веб-индексе Google. Он описывает инфраструктуру для создания кастомизированных поисковых систем (CSE), которые работают поверх указанного пользователем набора данных, включая приватный контент.
Что такое ACL в контексте этого патента и почему это важно?
ACL (Access Control List) — это список контроля доступа, который определяет, кто может видеть определенный контент. Это критически важный компонент патента, поскольку система индексирует приватный контент. ACL гарантирует, что при поиске через CSE пользователь увидит только те результаты, к которым у него есть разрешение на доступ в исходном сервисе.
Зачем система просит предоставить логин и пароль от других сервисов (соцсетей, блогов)?
Система запрашивает учетные данные (Claim 2), чтобы получить доступ и проиндексировать контент, который не является публично доступным. Без этих данных краулер системы не сможет увидеть приватные посты или другой ограниченный контент, который пользователь хочет включить в свой персональный CSE.
Могу ли я использовать механизмы из этого патента для улучшения SEO моего коммерческого сайта?
Напрямую это сделать нельзя. Технология предназначена для агрегации контента, созданного конкретным пользователем (например, автором или экспертом), и управления доступом к нему. Это инструмент для создания узконишевого или персонального поиска, а не для стандартной SEO-оптимизации коммерческого ресурса.
Что такое «Generic Representation» (Обобщенный результат поиска)?
Это заглушка или анонимизированная версия результата поиска. Она показывается, когда система находит релевантный контент, но у ищущего пользователя нет прав на его просмотр (отсутствует в ACL). Это позволяет сохранить конфиденциальность контента и может включать ссылку для запроса доступа у владельца.
Описывает ли патент, как именно ранжируются результаты внутри CSE?
Нет, патент не детализирует алгоритмы ранжирования. Хотя упоминаются факторы вроде свежести или степени связи между пользователями, основное внимание уделяется механизмам генерации индексов на основе приватных данных и фильтрации результатов с помощью ACL.
Что означает интеграция CSE в общий поиск (Claim 4)?
Это означает, что если пользователь использует общую поисковую строку, система может автоматически подмешивать результаты из персональных CSE, к которым этому пользователю был предоставлен доступ. Например, при поиске система может показать результаты из интернета и одновременно результаты из CSE друга, если тот дал доступ.
Является ли это описанием Google Programmable Search Engine (ранее Google Custom Search)?
Это похожая концепция, но патент описывает более сложную реализацию. Ключевые отличия — это индексация закрытого контента, требующего авторизации (через предоставление паролей), и строгая проверка ACL для каждого результата в реальном времени, чего нет в стандартной функциональности Programmable Search Engine.
Может ли контент, проиндексированный через этот механизм, попасть в основной индекс Google?
Патент не предполагает, что приватный контент, проиндексированный для CSE, станет публично доступным или попадет в основной веб-индекс. Напротив, система разработана для строгого соблюдения приватности (ACL) и ограничения доступа только в рамках CSE или для авторизованных пользователей.
Какова основная ценность этого патента для SEO-специалиста?
Основная ценность — образовательная. Патент дает представление о том, как Google технологически решает задачи агрегации данных из множества источников и управления правами доступа (ACL) при обработке персонализированного контента. Практической ценности для оптимизации сайтов он не несет.