
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного запуска фоновых поисковых запросов (имплицитных запросов), релевантных текущему контексту пользователя, часто с использованием персонализированных данных.
Патент решает проблему доступа к релевантной информации без необходимости явного поискового запроса. Пользователи часто не ищут информацию, которая могла бы быть им полезна, потому что они забывают о ее существовании (например, в старых письмах или локальных файлах) или не хотят отвлекаться от текущей задачи для формулирования запроса. Система направлена на проактивное предоставление этой информации на основе текущего контекста пользователя.
Запатентована система для генерации имплицитных (фоновых) поисковых запросов (implicit search query). Ядром изобретения является механизм идентификации и использования «именованных сущностей» (Named Entities). Система отслеживает контекст пользователя (события), идентифицирует в нем значимые сущности (имена людей, конкретные темы, email-адреса) и автоматически формирует поисковые запросы на их основе.
Система функционирует в двух основных режимах:
Named Entity List). Сущностям присваивается вес (Weight Attribute), отражающий их значимость.Events), такие как набор текста или чтение письма. Она идентифицирует именованные сущности в этом контексте. Затем формируется имплицитный запрос, в котором больший приоритет отдается сущностям с более высоким весом. Запрос выполняется (в локальном или глобальном индексе), и результаты проактивно показываются пользователю.Высокая. Технологии распознавания именованных сущностей (NER), описанные в патенте, являются фундаментальными для современного поиска и понимания языка (NLP). Хотя патент описывает применение этих технологий в контексте имплицитного поиска (например, Google Desktop или ранние версии проактивных ассистентов), сами методы NER критически важны для работы Knowledge Graph и семантического анализа контента в основном поиске Google.
Влияние на SEO косвенное, но значительное (6/10). Патент не описывает алгоритмы ранжирования основного веб-поиска. Однако он детально раскрывает методы, которые Google использует для идентификации, извлечения и приоритизации сущностей (NER). Понимание того, как Google определяет Named Entities (используя частотность, часть речи, капитализацию и т.д.), критически важно для оптимизации контента под Knowledge Graph и обеспечения правильной интерпретации тематики сайта.
Contextual Events (краткосрочные, например, последние набранные слова) и Real-time Events (более значимые, например, открытие файла).TF (частота термина в документе) и IDF (обратная частота документа – насколько редко слово встречается в корпусе документов). Слова с низким IDF (частые слова) часто игнорируются, а слова с высоким IDF могут быть идентифицированы как сущности.Claim 1 (Независимый пункт): Описывает основной метод генерации имплицитного запроса на основе взвешенных сущностей.
named entity terms) в хранилище данных, связанных с пользователем. Каждой сущности присвоен вес (associated weight), указывающий на вероятность того, что это значимая сущность.event), представляющее собой взаимодействие пользователя с документом (article).implicit search query) на основе сущностей и их весов. Запрос формируется так, что он в большей степени зависит от сущностей с высоким весом (более высокая вероятность значимости), чем от сущностей с низким весом.Claim 15 (Независимый пункт): Описывает схожий процесс с фокусом на пороговые значения для отображения результатов.
result set).associated score, например, релевантность) превышает определенный порог.Важно понимать, что этот патент описывает систему для имплицитного (контекстного) поиска, которая часто работает на стороне клиента (например, в браузере или как отдельное приложение) и использует персонализированные данные. Однако описанные технологии (NER) применяются и в основном веб-поиске Google.
INDEXING – Индексирование и извлечение признаков
Named Entity List. Используются методы NLP, такие как PoS Tagging и расчет IDF, для идентификации значимых сущностей.QUNDERSTANDING – Понимание Запросов
Event), извлекает из него Named Entities, используя Named Entity List, и формирует имплицитный запрос.RANKING и RERANKING
Входные данные:
Events): набранный текст, открытый документ, полученное сообщение.Named Entity List с весами (Weight Attribute).IDF и построения списка сущностей).Выходные данные:
Named Entity List часто строится на основе личных данных пользователя.Events). Это может быть набор определенного количества слов, завершение предложения (ввод знака препинания), открытие нового документа, получение email или сообщения в мессенджере.Процесс А: Построение и поддержка Списка Именованных Сущностей (Офлайн/Фоновый режим)
PoS Tagging для идентификации существительных и имен собственных.DF или IDF). Фильтрация слишком частых слов (например, общих имен или стоп-слов).Weight Attribute) каждой сущности на основе ее типа и значимости для пользователя.Named Entity List. Приоритетные сущности хранятся в оперативной памяти (RAM) для быстрого доступа.Процесс Б: Генерация Имплицитного Запроса (Реальное время)
Named Entity List.Weight Attribute имели большее влияние.Система использует широкий спектр данных, связанных с пользователем и его активностью:
IDF (т.е. редко встречающиеся в репозитории пользователя) добавляются в список сущностей.DF).IDF для определения важности термина. Предпочтение отдается более редким и специфичным терминам, а не общим словам. Это подчеркивает важность использования точной терминологии в контенте.Weight Attribute) и при генерации запросов отдает приоритет более значимым сущностям.Хотя патент фокусируется на имплицитном поиске, описанные методы NER имеют прямое отношение к тому, как Google анализирует веб-контент.
IDF (более редкие) с большей вероятностью будут идентифицированы как значимые сущности.PoS Tagging означает, что система анализирует структуру предложений для идентификации сущностей (например, определяя существительные и имена собственные по контексту и капитализации).Named Entity.PoS Tagging и снижает эффективность извлечения сущностей.Этот патент подтверждает стратегическую важность Named Entity Recognition (NER) в экосистеме Google. Успех в современном SEO напрямую зависит от способности структурировать информацию таким образом, чтобы поисковые системы могли легко идентифицировать ключевые сущности и их атрибуты. Стратегия должна быть направлена на построение семантического кокона и четкое определение тематики сайта через связанные сущности, а не просто набор ключевых слов.
Сценарий: Оптимизация страницы биографии эксперта
Цель – обеспечить точное извлечение сущностей, связанных с экспертом.
PoS Tagging для идентификации имен собственных как Named Entities.Named Entities.IDF и с большей вероятностью будут идентифицированы как значимые сущности, определяющие тематику.Описывает ли этот патент алгоритмы ранжирования основного веб-поиска Google?
Нет, этот патент описывает систему для имплицитного (проактивного) поиска, которая работает на основе текущего контекста пользователя и часто использует персонализированные данные. Он не описывает, как Google ранжирует веб-сайты в ответ на явные запросы на google.com. Однако он описывает технологии (NER), которые используются и в основном поиске.
Что такое «Именованная сущность» (Named Entity) согласно этому патенту?
Это термин, фраза или идентификатор, который система считает значимым. К ним относятся имена людей, email-адреса, "buddy names" в мессенджерах, названия организаций, а также часто используемые пользователем фразы или редкие термины (с высоким IDF), идентифицированные как существительные.
Как система определяет, какие сущности важнее?
Каждой сущности присваивается вес (Weight Attribute). Этот вес указывает на вероятность того, что термин является значимой сущностью. При генерации имплицитного запроса система отдает приоритет сущностям с более высоким весом (Claim 1).
Что такое PoS Tagging и почему это важно для SEO?
Part of Speech (PoS) Tagging — это процесс определения части речи для каждого слова в тексте (существительное, глагол и т.д.). Это важно для SEO, потому что Google использует этот анализ для более точного извлечения сущностей. Грамматически правильный и четко структурированный контент облегчает этот процесс и помогает поисковой системе лучше понять смысл текста.
Какова роль IDF (Inverse Document Frequency) в этом патенте?
IDF играет ключевую роль в идентификации сущностей. Система ищет термины (особенно существительные), которые редко встречаются в общем корпусе документов (высокий IDF). Такие редкие термины часто являются специфичными и значимыми, поэтому они добавляются в Named Entity List. Для SEO это означает важность использования точной и нишевой терминологии.
Использует ли Google мои личные данные (email, контакты) для этого?
Да, согласно патенту, система имплицитного поиска активно анализирует электронную почту, списки контактов, логи мессенджеров и локальные документы для построения персонализированного списка именованных сущностей (Named Entity List), релевантных конкретному пользователю.
Как этот патент связан с Knowledge Graph?
Патент описывает базовые технологии Named Entity Recognition (NER), которые необходимы для наполнения Knowledge Graph. Методы идентификации имен собственных, организаций и специфических тем, описанные здесь, используются для извлечения фактов из веб-контента и их последующего сохранения в базе знаний.
Стоит ли использовать очень редкие слова в контенте, чтобы они были распознаны как сущности?
Использование точной и специфичной терминологии (которая часто имеет высокий IDF) полезно для определения тематики контента. Однако это должны быть релевантные термины, понятные вашей целевой аудитории, а не искусственно вставленные редкие слова. Важен баланс между специфичностью и читабельностью.
Влияет ли капитализация слов на распознавание сущностей?
Да. Патент упоминает, что капитализация может использоваться в сочетании с PoS Tagging для идентификации имен собственных. Например, слово, которое обычно является глаголом, но написано с заглавной буквы в середине предложения, может быть интерпретировано как имя собственное (сущность).
Как SEO-специалисту применить знания из этого патента на практике?
Необходимо сосредоточиться на семантической оптимизации. Это включает четкое определение ключевых сущностей в контенте, использование специфичной терминологии (высокий IDF), поддержание правильной грамматической структуры для помощи PoS Tagging и использование микроразметки для явного указания сущностей.

Персонализация
Поведенческие сигналы
Local SEO

Персонализация
Поведенческие сигналы
Свежесть контента

Семантика и интент
Knowledge Graph
Индексация

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Семантика и интент
Мультимедиа

Knowledge Graph
EEAT и качество
Семантика и интент

Local SEO
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультиязычность
Персонализация

Персонализация
Ссылки

Семантика и интент
Поведенческие сигналы
Персонализация

EEAT и качество
Поведенческие сигналы
SERP

Ссылки
SERP
Структура сайта
