Патент описывает систему оценки изображений на предмет нежелательного (например, взрослого) контента. Система анализирует не только само изображение и страницу, на которой оно размещено, но и агрегированные статистические данные по другим …
Безопасный поиск
Google использует легковесную модель машинного обучения для мгновенной классификации запросов в реальном времени, когда стандартные методы слишком медленные из-за задержек (latency constraint). Эта модель обучается офлайн и классифицирует новые запросы, …
Google использует гибридную систему для оценки контента, содержащего изображения (например, рекламных баннеров). Система автоматически анализирует изображения (распознает текст, объекты, определяет наличие обнаженной натуры) и агрегирует эти данные с оценками людей-эвалуаторов …
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос …
Google анализирует рейтинги контента (например, «для взрослых» или «для всех возрастов») в результатах поиска для вычисления «Оценки безопасности» (Safety Score) запроса. Если выдача содержит слишком много нежелательного контента или если …
Google использует систему для борьбы с лично нежелательным контентом (например, «revenge porn»). Система применяет два классификатора: один определяет, является ли контент нежелательным (например, порнографическим), а второй — является ли он …
Google использует механизм безопасности для защиты пользователей от вредоносных или нежелательных сайтов. Система оценивает репутацию ссылки в момент взаимодействия с ней. Если ссылка ведет на опасный ресурс (включая редиректы и …
Google анализирует результаты поиска, связанные с потенциальной поисковой подсказкой, и оценивает их безопасность на основе рейтингов контента. Если запрос часто ведет на нежелательный или небезопасный контент (например, для детей), он …
Google использует автоматизированную систему для выбора наиболее репрезентативных изображений бизнеса с его официального сайта. Система предпочитает локальные сайты филиалов, а не общие сайты сетей. Она анализирует структуру сайта для поиска …
Google использует автоматизированную систему для наполнения детских интерфейсов безопасным и интересным контентом. Система определяет темы, интересующие детей, через Knowledge Graph и внешние источники, рассчитывает «Оценку детской близости» (Children's Affinity Score) …
Google использует гибридную технику компьютерного зрения для оценки возраста людей на изображениях. Комбинируя результаты нескольких простых бинарных классификаторов возраста (например, «ребенок или взрослый») с помощью регрессора, Google генерирует конкретные оценки …
Google использует гибридную систему, сочетающую правила и модели машинного обучения, для автоматизации обработки запросов на удаление контента (например, PII). Система оценивает легитимность запроса, анализируя тип сайта, данные аккаунта пользователя и …
Патент описывает архитектуру Custom Search Engine (CSE). Система позволяет разработчикам определять спецификации для модификации входящих запросов, выбора базовых поисковых систем (например, Web, Scholar), условного комбинирования их результатов и последующего изменения …
Google анализирует поисковые сессии пользователей для обучения классификатора, выявляющего запросы о неприемлемом контенте (например, насилии, CSAM, терроризме). Система отслеживает, какие еще запросы вводил пользователь незадолго до или после ввода уже …
Google использует систему для защиты пользователей от утечек конфиденциальных данных (PII), таких как номера кредитных карт или SSN. Система анализирует контент на соответствие форматам PII и ищет связанные ключевые слова …
Патент описывает инфраструктурный механизм безопасности для систем управления контентом (CMS). Система автоматически разделяет статический контент (текст) и динамический контент (исполняемый код, например, JavaScript). Статический контент обслуживается с основного домена, а …
Система учится идентифицировать "сложные ложные срабатывания" — ситуации, когда локальные участки разных изображений (например, текстуры или узоры) очень похожи, но объекты в целом не совпадают. Google тренирует классификатор для фильтрации …
Google использует систему для унификации различных национальных систем возрастных рейтингов (например, PG-13 в США, 12А в Великобритании, 16+ в России) в единый глобальный стандарт. Это позволяет применять пользовательские настройки фильтрации …
Google использует механизм Keyword Hash Map для определения необходимости фильтрации запросов (например, SafeSearch). Система анализирует порядок слов и контекст, позволяя создавать исключения (whitelist), даже если запрос содержит потенциально чувствительные термины. …
Патент описывает инфраструктуру Google для создания пользовательских поисковых индексов (Custom Search Indexes), отдельных от основного веб-индекса. Он фокусируется на методах защиты конфиденциального контента, включая шифрование результатов и индексирование только метаданных, …