
Google использует систему для обнаружения «фильтрующих терминов» в запросах или результатах поиска. При обнаружении Google немедленно показывает только «отфильтрованные» (безопасные) результаты и предлагает доступ к службе верификации (например, подтверждение возраста). Если пользователь верифицирован, отображаются «нефильтрованные» (потенциально чувствительные) результаты. Это предотвращает полную блокировку выдачи при использовании чувствительных терминов.
Патент решает проблему чрезмерно ограничительной фильтрации поиска. В традиционных системах обнаружение неприемлемого контента (например, для взрослых) или «запрещенных» поисковых терминов часто приводило к полной блокировке всей поисковой выдачи до верификации пользователя. Это ухудшало пользовательский опыт, особенно для тех, кто ищет легитимную информацию, связанную с чувствительными темами (например, исследования о влиянии порнографии на общество), но не может пройти верификацию. Изобретение улучшает UX, предоставляя безопасные результаты немедленно.
Запатентована система фильтрации поиска, которая вместо полной блокировки выдачи предоставляет условный доступ к контенту. Если система обнаруживает Filtering Term в запросе или результатах (Search Instance), она немедленно предоставляет пользователю Filtered Content Items (безопасные результаты). Одновременно пользователю предлагается доступ к Verification Service (например, подтверждение возраста). Только после успешной верификации система предоставляет Unfiltered Content Items (полный набор результатов).
Система работает как посредник (Search Access Engine):
Search Instance (запрос или результаты) какие-либо Filtering Terms, используя Keyword Hash Map для учета контекста.Filtered Content Items. Это может быть сделано путем изменения исходного запроса (пре-фильтрация) или путем фильтрации полного набора результатов (пост-фильтрация).Verification Service.Access Approval), ему показываются Unfiltered Content Items. Статус может сохраняться в рамках Device Session.Высокая. Описанный механизм лежит в основе работы современных систем фильтрации контента, таких как Google SafeSearch, а также региональных или юридических ограничений (например, обязательная верификация возраста). Несмотря на дату патента, процесс остается фундаментальным для управления доступом к чувствительной информации в поиске.
Влияние на SEO (4/10). Патент носит преимущественно инфраструктурный характер и описывает механику ограничения доступа к контенту и верификации пользователя (Compliance/Safety), а не алгоритмы ранжирования. Он не описывает сигналы качества. Его значимость для SEO ограничена пониманием того, как контент классифицируется как чувствительный (SafeSearch), и как это влияет на его видимость в выдаче.
Filtering Term считается безопасным и не требует активации фильтрации (White-Listed).Access Approval (AA) или Access Denial (AD).Claim 1 (Независимый пункт): Описывает основной процесс, когда фильтрация инициируется на основе анализа запроса.
Filtering Term.FCI и UCI; Пользователю предоставляются FCI и доступ к Verification Service.Access Approval, предоставляются UCI. Если отказ — доступ к UCI блокируется.Критически важная часть Claim 1 детализирует механизм определения наличия фильтрующего термина с помощью Keyword Hash Map. Запрос сегментируется на компоненты. Компоненты сравниваются с хеш-картой, где каждый элемент имеет уровень (позицию в запросе) и статус (отфильтрованный/нефильтрованный). Запрос считается содержащим фильтрующий термин, если его компоненты соответствуют карте и последний компонент слова в запросе имеет статус «отфильтрованный».
Эта структура позволяет обрабатывать контекст. Например, если "Слово А" (BL), но "Слово А + Слово Б" (WL), то запрос "Слово А + Слово Б" не будет отфильтрован, так как статус последнего компонента будет WL.
Claim 8 (Зависимый от 1): Описывает метод генерации FCI путем пост-фильтрации. Система получает UCI по исходному запросу, затем исключает из них элементы, связанные с фильтрующим термином. Оставшиеся элементы становятся FCI.
Claim 9 (Зависимый от 1): Описывает метод генерации FCI путем пре-фильтрации (изменения запроса). Система генерирует revised query (например, удаляя термин или используя отрицательные булевы операторы — Claims 10, 11), выполняет поиск по нему и идентифицирует результаты как FCI.
Claim 13 (Зависимый от 12): Подчеркивает важность контекста. Запрос считается содержащим фильтрующий термин, только если его контекст не является одобренным (approved query context).
Изобретение применяется на нескольких этапах обработки запроса и формирования выдачи.
QUNDERSTANDING – Понимание Запросов
Search Access Engine анализирует запрос сразу после его получения. Используется Keyword Hash Map для проверки наличия Filtering Terms с учетом контекста. На этом этапе может происходить переписывание запроса (Query Revision), если выбран метод пре-фильтрации (Claim 9).
RANKING – Ранжирование
Система выполняет поиск. В зависимости от реализации, она либо запускает ранжирование по исходному запросу (чтобы получить UCI для пост-фильтрации), либо по измененному запросу (чтобы получить FCI).
RERANKING / METASEARCH – Переранжирование и Смешивание (Фильтрация)
Основное место применения логики патента. Если используется метод пост-фильтрации (Claim 8), то на этом этапе из UCI удаляются чувствительные элементы. Здесь принимается решение о том, какой набор результатов показать (FCI или UCI), и управляется интеграция доступа к Verification Service (например, показ предупреждения и ссылки).
Входные данные:
Filtering Terms (включая Keyword Hash Map и Approved Query Contexts).UCI, полученный от поисковой системы.Device Session).Выходные данные:
FCI ИЛИ набор UCI.Verification Service (ссылка, форма).Information Corpora, включая веб-страницы, изображения, видео и т.д.Алгоритм применяется при выполнении одного из условий (в зависимости от реализации):
Filtering Term, который не находится в одобренном (white-listed) контексте. Определение происходит с помощью Keyword Hash Map.Unfiltered Content Items), идентифицированные для запроса, включают или ассоциированы с Filtering Term (например, помечены как контент для взрослых).Процесс объединяет различные варианты реализации (FIG 6, 7, 8).
Search Access Engine получает запрос от пользовательского устройства.Search Instance анализируется. При анализе запроса используется Keyword Hash Map для проверки статуса (BL/WL) и контекста.Search Instance фильтрующий термин в неодобренном контексте? Unfiltered Content Items удаляются чувствительные результаты (Claim 8).Verification Service.Access Approval (AA) от Verification Service?Device Session на основе результата верификации для упрощения будущих поисков.Verification Service для подтверждения личности или возраста.Device Sessions (cookies, данные входа в аккаунт) используются для поддержания статуса верификации.UCI) анализируется (или используются их предварительные классификации), чтобы определить, соответствует ли он Filtering Terms.Verification Service.FCI), а не блокировать поиск полностью при обнаружении чувствительных терминов. Это позволяет пользователям получать доступ к информации, даже если их запрос затрагивает фильтруемые темы.Keyword Hash Map и проверка Approved Query Context явно указывают на то, что контекст фразы определяет, будет ли активирована фильтрация. Фраза может содержать фильтруемое слово, но быть разрешенной в целом.Search Instance).Approved Query Context и избежать попадания под фильтры, даже если используются потенциальные Filtering Terms.Filtering Terms, для привлечения внимания увеличивает вероятность фильтрации контента, даже если он по сути безопасен.Этот патент описывает техническую реализацию функций типа SafeSearch. Он подтверждает, что Google индексирует широкий спектр контента, но активно управляет доступом к нему. Это не патент о ранжировании, а о фильтрации выдачи. Для SEO-стратегии это означает, что основная задача — обеспечить максимально точную классификацию контента системами Google, чтобы он достигал целевой аудитории в соответствующем контексте и не был ошибочно скрыт фильтрами.
Сценарий: Академический ресурс, обсуждающий чувствительную тему.
Задача: Опубликовать статью "Социальное влияние контента для взрослых" так, чтобы она была доступна максимально широкой аудитории, включая пользователей с включенным SafeSearch.
Filtering Terms (например, "влияние порнографии").UCI (нефильтрованный контент) и скрыта от пользователей с SafeSearch.Approved Query Context. Статья классифицируется как безопасная и включается в FCI (отфильтрованный контент), оставаясь видимой для всех пользователей.Описывает ли этот патент алгоритмы ранжирования?
Нет, этот патент не связан с ранжированием. Он описывает исключительно механизмы фильтрации контента (например, SafeSearch) и процесс управления доступом к результатам поиска через верификацию пользователя. Он определяет, будет ли результат показан пользователю в данный момент, а не на какой позиции он должен находиться.
Что такое "Search Instance" (Поисковый экземпляр) в контексте патента?
Search Instance — это объект, который система проверяет на наличие фильтруемых терминов. Патент указывает, что это может быть либо сам текст запроса, введенный пользователем, либо набор результатов поиска (Unfiltered Content Items), сгенерированный в ответ на этот запрос. Это позволяет применять фильтрацию как до, так и после выполнения поиска.
Будет ли фильтр всегда срабатывать, если запрос содержит слово из черного списка?
Нет, не всегда. Патент уделяет большое внимание контексту. Механизмы Keyword Hash Map и проверка Approved Query Context позволяют создавать исключения. Если слово из черного списка используется в рамках разрешенной фразы или в безопасном контексте (например, академическом или новостном), фильтрация может не активироваться.
Что увидит пользователь, если не пройдет верификацию?
Пользователь продолжит видеть только Filtered Content Items (FCI) — безопасную часть выдачи. Доступ к полным результатам (Unfiltered Content Items, UCI), которые могут содержать чувствительный контент, будет запрещен. Важно, что пользователь не получает пустую выдачу, а получает безопасные результаты.
Нужно ли пользователю проходить верификацию при каждом запросе?
Нет. Патент описывает механизм Device Session. После успешной верификации система может классифицировать сессию как "одобренную" (например, с помощью cookies или через вход в аккаунт). В течение этой сессии пользователь будет автоматически получать нефильтрованные результаты без повторной верификации.
Как SEO-специалист может предотвратить фильтрацию безопасного контента?
Если контент безопасен, но затрагивает чувствительные темы, необходимо обеспечить максимальную ясность контекста, чтобы система распознала его как Approved Query Context. Также критически важно избегать смешивания безопасного и чувствительного контента на одном сайте или в одном разделе, так как это может привести к ошибочной классификации.
Что такое пре-фильтрация и пост-фильтрация?
Это два разных метода создания безопасной выдачи (FCI). Пре-фильтрация (Claim 9) изменяет запрос до его выполнения (например, удаляет фильтруемый термин) и ищет результаты по новому запросу. Пост-фильтрация (Claim 8) выполняет поиск по исходному запросу, получает полные результаты (UCI), а затем удаляет из них нежелательный контент.
Влияет ли этот механизм на видимость сайтов в нише Adult?
Да, напрямую. Контент таких сайтов, скорее всего, будет классифицирован как UCI и скрыт по умолчанию для пользователей с включенным SafeSearch или для тех, кто не прошел верификацию возраста. Видимость такого контента напрямую зависит от готовности и способности пользователя пройти верификацию.
Что такое Keyword Hash Map и зачем она нужна?
Это специализированная структура данных для эффективного хранения и поиска многословных фраз с учетом их статуса (разрешено/запрещено) и позиции слов. Она позволяет системе быстро проверять сложные контекстуальные правила, например, разрешать фразу "А Б В", даже если фраза "А Б" запрещена. Это обеспечивает точность работы фильтров.
Актуален ли этот патент, поданный в 2007 году?
Несмотря на дату подачи, описанные принципы и архитектура остаются высоко актуальными. Фильтрация контента и управление доступом к сенситивной информации являются фундаментальными задачами поисковых систем. Хотя конкретные методы классификации контента с тех пор значительно усложнились (например, с использованием ИИ), базовая логика обработки таких запросов осталась схожей.

Безопасный поиск
SERP

Безопасный поиск
SERP

Безопасный поиск
SERP

Безопасный поиск
Семантика и интент
SERP

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Local SEO
Семантика и интент
Поведенческие сигналы

SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Мультиязычность
Ссылки
SERP

Knowledge Graph
Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
Local SEO

Мультиязычность
Поведенческие сигналы

Ссылки
Семантика и интент
Индексация

Индексация
Краулинг
Ссылки

Семантика и интент
Индексация
Структура сайта
