
Патент Google, описывающий технологию для локального (Desktop) или персонализированного поиска. Система отслеживает взаимодействие пользователя с контентом (события) и использует «схемы событий» для автоматической категоризации файлов, электронных писем и истории просмотров. Эти категории затем используются для предоставления релевантных результатов в ответ на неявные запросы, генерируемые системой на основе текущего контекста пользователя.
Патент решает проблему эффективной организации и поиска информации, локально доступной пользователю (на его устройстве или в личном индексе). Он направлен на улучшение поиска за счет автоматического создания динамических категорий на основе атрибутов контента и действий пользователя, в отличие от статических, вручную редактируемых категорий (таких как веб-директории или правила электронной почты), которые патент определяет как неэффективные.
Запатентована система автоматической категоризации контента, основанная на мониторинге взаимодействий пользователя на клиентском устройстве. Система идентифицирует «событие» (event), например, просмотр веб-страницы или печать документа, и определяет его формат с помощью Event Schema. На основе извлеченных атрибутов контент ассоциируется с существующей или новой категорией. Эти ассоциации (category-article pair) сохраняются и используются для ответа на поисковые запросы, в частности, на implicit queries (неявные запросы), генерируемые из контекста.
Система работает путем непрерывного мониторинга активности на клиентском устройстве:
articles). Эти действия фиксируются как events.Event Schema (например, схема для Email, схема для Документа), описывающая формат данных события.Association Data Record), связывающая контент с категорией.implicit query на основе текущего контекста пользователя (например, того, что он сейчас печатает) и ищет релевантные категории и статьи в этом локальном индексе.Средняя. Технология, описанная в патенте (подан в 2004 г.), легла в основу продуктов типа Google Desktop Search (ныне не поддерживается). Однако базовые принципы автоматической категоризации контента на основе атрибутов и поведения пользователей, а также использование контекста для генерации неявных запросов остаются актуальными в современных системах персонализированного поиска, рекомендательных системах и операционных системах.
Влияние на традиционное веб-SEO минимальное (2/10). Патент сфокусирован на локальном поиске (client device) и организации личной информации пользователя для ответа на implicit queries. Он не описывает механизмы ранжирования в глобальном веб-индексе Google. Он дает представление о том, как Google подходит к автоматической классификации контента на основе атрибутов и схем, но не содержит практических рекомендаций для оптимизации сайтов.
Category-Article Pair Identifier.Email Schema, Document Schema).Патент фокусируется на автоматической категоризации локального контента для использования в контекстном поиске по неявным запросам.
Claim 1 (Независимый пункт): Описывает основной метод поиска на основе категорий на клиентском устройстве.
event (взаимодействие со статьей, хранящейся на устройстве).Event Schema, соответствующая типу статьи. Схема определяет поля для типа статьи и поля, описывающие взаимодействие.Association Data Record, связывающая категорию и статью.implicit search query.Ядро изобретения — использование Event Schemas для структурирования пользовательских взаимодействий и последующая автоматическая категоризация контента, которая затем используется для ответов на implicit queries.
Claim 18 (Независимый пункт): Аналогичен Claim 1, но акцентирует внимание на автоматическом создании категории (automatically creating) на основе атрибутов события.
Система способна динамически генерировать новые категории, если подходящих существующих категорий не найдено.
Claim 21 (Независимый пункт): Вариант метода, где категория создается специально на основе полей схемы, которые описывают взаимодействие со статьей (fields that describe interactions).
Это позволяет категоризировать контент по действиям, например, создавать категории "Распечатанные" (Printed) или "Отправленные по почте" (Email-Sent).
Claim 24 (Независимый пункт): Описывает применение метода к веб-страницам (web page) с использованием ключевых слов.
keyword).category-keyword data store для поиска категории, связанной с этим ключевым словом.implicit search query, выполняется поиск.Изобретение применяется в рамках инфраструктуры локального или персонализированного поиска (например, Google Desktop Search), которая функционирует на клиентском устройстве.
CRAWLING – Сканирование и Сбор данных (Локальный)
В данном контексте "краулинг" заменяется мониторингом и захватом (Capture Processor). Система непрерывно отслеживает активность пользователя и события файловой системы на клиентском устройстве для сбора данных о локальных файлах, электронной почте и истории просмотров.
INDEXING – Индексирование и извлечение признаков (Локальный)
Основной этап применения патента. Indexer обрабатывает захваченные события. Он использует Event Schemas для извлечения атрибутов из контента и событий. На основе этих атрибутов происходит автоматическая категоризация и создание Association Data Records, которые сохраняются в локальном индексе (Data Store).
QUNDERSTANDING – Понимание Запросов (Контекстное)
Query System анализирует текущий контекст пользователя (например, содержимое открытого документа или вводимый текст) для генерации implicit queries. Также система идентифицирует категории в явных или неявных запросах.
RANKING – Ранжирование (Локальное)
Система выполняет поиск по локальному индексу, используя сгенерированный запрос. Поиск направлен на нахождение релевантных категорий и связанных с ними статей.
Входные данные:
Events) взаимодействия пользователя с контентом.Articles) – локальные файлы, электронные письма, веб-страницы.Event Schemas – предопределенные форматы.implicit query).Выходные данные:
Association Data Records (связи категория-статья), сохраненные в индексе.implicit queries, генерируемые на основе контекста. Также может улучшать явные запросы, позволяя пользователю искать или фильтровать по автоматически созданным категориям (например, "Бюджет Презентация").implicit query (например, пользователь вводит текст в документе и делает паузу или ставит точку), или когда пользователь вводит явный запрос в интерфейс локального поиска.Процесс А: Категоризация контента (Индексирование)
Event Schema на основе типа статьи и/или типа взаимодействия.Association Data Record, связывающая идентификатор статьи и идентификатор категории.Процесс Б: Поиск на основе категорий (Retrieval)
implicit query, сгенерированный на основе контекста, или явный запрос от пользователя.Association Data Records для найденных категорий. Этот шаг может включать обработку связей между категориями (иерархии).Система использует широкий спектр данных, доступных на клиентском устройстве, для категоризации.
events (печать, отправка по почте, копирование, просмотр). Используются для создания категорий, основанных на действиях.Патент не детализирует конкретные метрики ранжирования или формулы расчета. Он фокусируется на механизме категоризации и ассоциации.
category-keyword data store) с категориями.Патент описывает внутренние процессы Google для организации локального или персонализированного индекса пользователя и не содержит прямых рекомендаций для традиционного веб-SEO.
Local Index), а не для ранжирования в глобальном веб-индексе.Event Schemas для структурированного понимания того, что такое контент (тип файла, ключевые слова) и как с ним взаимодействовали (печать, отправка). Это позволяет системе автоматически и динамически создавать категории.implicit queries — поиска, инициированного системой на основе контекста пользователя в реальном времени.Этот патент является инфраструктурным и описывает технологии локального/персонализированного поиска (например, Google Desktop Search). Прямых практических выводов для стандартного SEO (продвижения сайтов в глобальном поиске Google.com) он не дает.
Хотя патент не направлен на веб-SEO, он подтверждает общие принципы хорошей организации информации, которые могут быть полезны косвенно:
Event Schemas. Обеспечение корректности метаданных в публикуемом контенте (например, PDF-файлах) помогает системам правильно его интерпретировать.Патент не выделяет конкретных SEO-тактик как неэффективных или опасных для веб-поиска.
Стратегическое значение патента заключается в понимании того, как Google развивал технологии персонализации и контекстного поиска. Он демонстрирует ранние подходы к использованию поведения пользователя и локального контекста (implicit queries) как сигналов для поиска информации. Хотя эти конкретные механизмы могут не использоваться в современном веб-поиске в том же виде, общая философия использования контекста и автоматической классификации остается фундаментальной для Google.
Практических примеров применения для веб-SEO нет, так как патент описывает локальный поиск. Ниже приведен пример того, как работает описанная в патенте система.
Сценарий: Автоматическая категоризация и контекстный поиск
Document Schema.Описывает ли этот патент, как Google классифицирует сайты для веб-поиска?
Нет. Патент сфокусирован исключительно на классификации локального контента (articles) на устройстве пользователя (client device) или в его персональном индексе. Он описывает механизмы для desktop search или персонализированного поиска, основанного на истории пользователя, а не алгоритмы ранжирования глобального веб-индекса.
Что такое "Event Schema" (Схема события) и почему это важно?
Event Schema — это определение формата для фиксации взаимодействия пользователя с контентом. Например, Email Schema будет включать поля для отправителя, получателя и темы, а Document Schema — поля для типа файла и автора. Это важно, так как позволяет системе структурированно извлекать атрибуты из любого события для последующей автоматической категоризации контента.
Что такое "Implicit Query" (Неявный запрос) в контексте этого патента?
Implicit Query — это запрос, который система генерирует автоматически, без ручного ввода пользователем. Он основан на текущем контексте пользователя. Например, если пользователь печатает текст в документе, система может использовать этот текст как неявный запрос для поиска релевантной информации в локальном индексе и отобразить ее в боковой панели.
Может ли система создавать категории на основе действий пользователя?
Да. Патент (в частности, Claim 21) описывает создание категорий на основе полей Event Schema, которые описывают взаимодействие. Это позволяет системе создавать категории, такие как "Распечатанные документы" (Printed) или "Отправленные по почте" (Emailed), основываясь на действиях пользователя с контентом.
Как система определяет, к какой категории отнести контент?
Система извлекает атрибуты из контента и связанного с ним события. Эти атрибуты могут включать тип файла, имя файла, ключевые слова из контента (особенно для веб-страниц, Claim 24), автора или действие пользователя. Затем система ищет соответствие этих атрибутов существующим категориям или автоматически создает новую.
Используются ли описанные в патенте технологии в продуктах Google сегодня?
Патент напрямую связан с технологиями Google Desktop Search, который больше не поддерживается. Однако базовые концепции автоматической классификации и контекстного поиска (implicit queries) по-прежнему используются в системах персонализации, Google Ассистенте, а также функциях поиска внутри ОС и браузеров (например, Chrome).
Могут ли категории быть связаны между собой?
Да, патент упоминает возможность связей между категориями. Они могут быть иерархическими (например, "PowerPoint" является подкатегорией "Презентации") или просто связанными по смыслу. Это позволяет при поиске по одной категории также находить контент, связанный с родственными категориями.
Есть ли в этом патенте какие-либо инсайты для SEO-специалистов, работающих над веб-сайтами?
Прямых инсайтов для веб-SEO нет. Однако патент подчеркивает важность четких атрибутов и семантики для автоматической классификации. Для SEO это косвенно подтверждает ценность хорошо структурированного контента с ясными ключевыми словами и корректными метаданными, что облегчает работу любых поисковых алгоритмов.
Откуда система берет исходные категории?
Патент описывает несколько способов. Базовые категории могут быть предопределены на основе зарегистрированных схем (например, Email, Document). Новые категории могут создаваться автоматически на основе атрибутов событий, выводиться из паттернов поиска пользователя или структуры его папок/закладок, а также создаваться пользователем вручную.
Чем этот подход отличается от простых правил фильтрации почты?
Правила фильтрации почты обычно требуют ручной настройки и основаны на простых условиях. Описанная система работает автоматически, использует более сложные Event Schemas для анализа множества атрибутов и действий, применяется к разным типам контента (не только почте) и динамически создает новые категории по мере необходимости.

Индексация
Local SEO
Поведенческие сигналы

Индексация
Local SEO
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы

Индексация
Персонализация
Семантика и интент

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Ссылки
SERP
EEAT и качество

Ссылки
SERP
Свежесть контента

Персонализация
EEAT и качество
Поведенческие сигналы

Ссылки
SERP

Персонализация
Поведенческие сигналы
Local SEO

Индексация
Ссылки
SERP

EEAT и качество
SERP
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Индексация
Ссылки
Техническое SEO
