
Google использует систему для борьбы с лично нежелательным контентом (например, «revenge porn»). Система применяет два классификатора: один определяет, является ли контент нежелательным (например, порнографическим), а второй — является ли он любительским. Если контент одновременно нежелательный и любительский, он удаляется из выдачи. Система также проактивно анализирует запросы с низкой популярностью для выявления нового такого контента.
Патент решает задачу идентификации и подавления в поисковой выдаче «лично нежелательного контента» (Personally Objectionable Content, POC). POC определяется как нежелательный контент (например, оскорбительный, неприятный), тесно связанный с конкретным человеком и размещенный онлайн без его согласия (например, «revenge porn», буллинг, насилие). Ключевая проблема — отличить такой контент от контента, который является нежелательным в целом, но размещен с согласия (например, профессиональная порнография), и обеспечить его удаление из поиска для защиты репутации жертв.
Запатентована система для автоматического обнаружения и подавления POC. Система использует два ключевых классификатора: один определяет, является ли контент «нежелательным» (Objectionable Content), а второй — является ли он «профессионально созданным» (Professionally Produced Content). Контент классифицируется как POC, если он одновременно является нежелательным И НЕ является профессионально созданным (т.е. любительским). Система обрабатывает как жалобы пользователей, так и проактивно анализирует поисковые запросы для выявления нового POC.
Система работает в двух режимах:
Content Evaluation Engine анализирует его с помощью двух классификаторов. Если контент признан POC (Нежелательный + Любительский), он и его дубликаты добавляются в базу данных Resource Attributes (черный список) для фильтрации.Query Classifier определяет, ищет ли пользователь POC (например, запрос содержит имя, но не популярен). Если да, система агрессивно фильтрует весь Objectionable Content из выдачи и отправляет его на детальный анализ в Content Evaluation Engine для потенциального добавления в черный список.Высокая. Защита пользователей от неконсенсусного контента (Trust & Safety) и управление репутацией (ORM) являются критически важными задачами для Google. Этот патент описывает конкретную техническую реализацию политик Google по борьбе с «revenge porn» и подобным контентом, используя современные методы машинного обучения (включая нейронные сети) для классификации изображений и видео.
Влияние на общие SEO-стратегии низкое (3/10). Этот патент описывает не алгоритм ранжирования, а механизм фильтрации и подавления специфического типа контента. Однако он критически важен для специалистов по управлению репутацией (ORM) и владельцев сайтов в «чувствительных» нишах (например, Adult, UGC). Он объясняет механизм, с помощью которого Google отличает профессиональный контент от любительского неконсенсусного контента.
Resource Attributes и классификации запроса.Professionally Produced Content).Claim 1 (Независимый пункт): Описывает процесс проактивного (preemptive) обнаружения и фильтрации POC, инициированный поисковым запросом.
measure of popularity) НЕ достигает порогового значения (popularity threshold).Objectionable Content (Классификатор 1).Amateur Imagery (т.е. НЕ профессионального) (Классификатор 2).Ядро изобретения — использование непопулярности запроса как триггера для запуска глубокого анализа контента (двойная классификация) и последующая проактивная фильтрация этого контента в будущих запросах.
Claim 3 (Зависимый от 1 и 2): Детализирует последствия классификации.
Если ресурс определен как содержащий Objectionable Content и Amateur Imagery, он официально обозначается (designating) как содержащий POC. После этого он фильтруется как из результатов Query 1, так и из результатов Query 2.
Claim 6-10 (Зависимые от 1): Детализируют дополнительные методы определения того, что запрос ищет POC (в дополнение к низкой популярности из Claim 1).
famous person) или порноактера/актрисы.quality scores), удовлетворяющих пороговому значению.Изобретение затрагивает несколько этапов поиска, фокусируясь на обработке запросов и финальной фильтрации.
CRAWLING & INDEXING – Сканирование и Индексирование
Indexing Engines могут использовать базу данных Resource Attributes (черный список) при создании или обновлении индексов. Они могут либо полностью исключать ресурсы с POC из индекса, либо помечать их соответствующим образом. Content Evaluation Engine работает в офлайн или периодическом режиме для анализа контента и обновления Resource Attributes.
QUNDERSTANDING – Понимание Запросов
Query Classifier работает на этом этапе в реальном времени. Он анализирует запрос и начальные результаты поиска, чтобы определить намерение пользователя — ищет ли он POC. Это критически важно для активации агрессивной проактивной фильтрации.
RERANKING / METASEARCH – Переранжирование и Смешивание
Filtering Engine работает на финальном этапе формирования выдачи. Он выполняет подавление результатов:
Resource Attributes).Query Classifier определил, что запрос ищет POC, Filtering Engine может удалить все ресурсы, классифицированные как Objectionable Content (даже если они еще не подтверждены как POC).Filtering Engine может передавать новые подозрительные ресурсы (New Objectionable Resources) обратно в Content Evaluation Engine для глубокого анализа.Входные данные:
Resource Attributes.Выходные данные:
Resource Attributes (новые записи в черном списке).Система применяется в нескольких сценариях:
Filtering Engine всегда активен для удаления известного POC.Query Classifier определяет, что запрос ищет POC. Основной триггер (согласно Claim 1) — низкая популярность запроса (popularity threshold не достигнут). Дополнительные триггеры включают наличие имени, отсутствие признаков знаменитости, наличие чувствительных терминов и низкое качество выдачи (low quality scores).Процесс А: Обработка пользовательских жалоб (Реактивный режим)
Reporting Engine), идентифицирующие URL изображений, которые предположительно являются POC.Objectionable Content или нет (например, порнография, насилие).Professionally Produced или нет (Amateur Imagery).Resource Attributes.Процесс Б: Обработка запроса и проактивная фильтрация (Проактивный режим)
Query Classifier определяет, ищет ли запрос POC (используя сигналы: низкая популярность, наличие имени, отсутствие знаменитости и т.д.).Resource Attributes.Objectionable Content (используя Objectionable Content Classifier).Content Evaluation Engine для дальнейшего анализа (Процесс А, начиная с шага 3) для подтверждения, являются ли они POC.user reports), включающие URL ресурсов, URL изображений или сами файлы, а также метаданные (например, имя жертвы).measure of popularity (мера популярности) запроса. Также может использоваться популярность изображения (например, на основе статистики выбора в поиске).quality scores) в выдаче.Система использует несколько ключевых метрик и моделей:
popularity threshold. Низкая популярность является ключевым индикатором потенциального поиска POC (Claim 1).Quality scores топовых результатов (низкое качество — позитивный индикатор).Query Classifier также является моделью машинного обучения, использующей вышеупомянутые сигналы как признаки.Amateur Imagery).Objectionable Content И как Amateur Imagery (не профессиональный).popularity threshold), особенно содержащие имена, рассматриваются как потенциально ищущие POC (Claim 1). Это запускает агрессивную фильтрацию и глубокий анализ контента.Objectionable Content, даже если он еще не подтвержден как POC. Если интент другой — фильтруется только подтвержденный POC.Для большинства SEO-специалистов этот патент имеет ограниченное применение. Он актуален для ORM и специфических ниш.
Reporting Engine Google для отправки жалоб. Патент подтверждает, что система обработает эти жалобы, найдет дубликаты и удалит контент из поиска.Objectionable Content (например, порнографией), критически важно убедиться, что контент выглядит профессионально и имеет высокое качество. Это необходимо, чтобы Pro Content Classifier четко отличал ваш контент от любительского POC. Сигналы качества сайта (quality scores) также должны быть высокими.Objectionable, находятся в зоне высокого риска. Система активно ищет и подавляет такой контент, считая его потенциальным POC.quality scores в выдаче являются сигналом для Query Classifier, что запрос может искать POC (Claim 10), что приведет к агрессивной фильтрации.Патент демонстрирует сложность систем Google в обеспечении безопасности пользователей (Trust & Safety). Он показывает, как глубоко интегрированы классификаторы изображений (на основе ML/нейронных сетей) и классификаторы запросов для решения узких, но критически важных задач. Для SEO это подчеркивает, что Google может и будет полностью удалять контент из выдачи, если он нарушает определенные политики, используя при этом сложные технические критерии (как различие между профессиональным и любительским контентом).
Сценарий 1: Управление репутацией (ORM) — Реактивный режим
Reporting Engine), специалист отправляет жалобы на URL страниц и URL изображений.Content Evaluation Engine анализирует контент. Objectionable Content Classifier подтверждает наличие порнографии. Pro Content Classifier определяет контент как любительский. Контент признается POC. Система находит дубликаты на других сайтах.Resource Attributes и удаляются из поисковой выдачи.Сценарий 2: Проактивное обнаружение системой
Query Classifier анализирует запрос. Сигналы: содержит имя, содержит чувствительный термин («nude»), запрос имеет низкую популярность (ниже popularity threshold), [Имя Фамилия] не является знаменитостью.Filtering Engine активирует агрессивный режим. Все результаты в выдаче, которые классифицируются как Objectionable Content, удаляются из SERP. Одновременно эти URL отправляются на глубокий анализ в Content Evaluation Engine.Является ли описанный механизм фактором ранжирования?
Нет, это не фактор ранжирования. Патент описывает механизм подавления (suppression) или фильтрации. Ресурсы, идентифицированные как Лично Нежелательный Контент (POC), полностью удаляются из поисковой выдачи, а не понижаются в ней.
Как система определяет, является ли контент «профессиональным» или «любительским»?
Система использует специализированный классификатор (Pro Content Classifier), обученный на парах изображений. Модель (например, нейронная сеть) учится определять визуальные признаки, характерные для профессиональной съемки и продакшена. Это позволяет объективно оценить вероятность того, что контент является любительским.
Может ли этот механизм повлиять на мой сайт, если я работаю в нише Adult?
Да. Если ваш сайт содержит контент, который классифицируется как Objectionable (например, порнография), критически важно, чтобы он также был классифицирован как Professionally Produced. Если контент выглядит любительским и имеет низкое качество, система может ошибочно принять его за POC (например, revenge porn) и удалить из поиска.
Что такое «проактивная фильтрация» (preemptive filtering) в контексте этого патента?
Это механизм, при котором система удаляет контент из выдачи еще до того, как он был окончательно подтвержден как POC. Это происходит, если Query Classifier определяет, что пользователь ищет POC (например, по непопулярному запросу с именем). В этом случае система временно скрывает весь Objectionable Content и отправляет его на детальный анализ.
Почему низкая популярность запроса является триггером для поиска POC?
Жертвы POC, как правило, не являются знаменитостями. Поэтому запросы, связанные с ними (например, их имена + чувствительные термины), обычно имеют низкую частотность по сравнению с запросами о знаменитостях. Система использует это как сильный сигнал (Claim 1) того, что запрос может касаться частного лица.
Как система борется с распространением POC на другие сайты?
После того как изображение идентифицировано как POC (по жалобе или проактивно), система использует технологию поиска близких дубликатов (near-duplicates). Все найденные дубликаты и страницы, на которых они размещены, также помечаются как POC и удаляются из поиска.
Что делать, если мой контент был ошибочно классифицирован как POC?
Патент не описывает механизм апелляции. Однако он упоминает, что система регулярно обновляет классификации. Если нежелательный контент удален с ресурса, система при повторном анализе обновит Resource Attributes (черный список), и ресурс снова сможет появляться в поиске. Если контент не был удален, но классификация неверна, потребуются стандартные каналы связи с поддержкой Google.
Влияет ли этот патент на текстовый контент?
Патент в основном фокусируется на изображениях и мультимедийном контенте (image content, videos). Хотя POC может включать и текст (например, описание буллинга), основные механизмы классификации (Objectionable и Pro Content) описаны применительно к визуальному контенту.
Какие сигналы указывают на то, что запрос НЕ ищет POC?
Негативными индикаторами являются: высокая популярность запроса, наличие в запросе имени знаменитости или известного порноактера/актрисы, а также наличие в выдаче результатов с высокими оценками качества (quality scores) или результатов с профессиональных сайтов.
Использует ли система распознавание лиц для идентификации жертв?
Патент не упоминает использование технологии распознавания лиц. Идентификация связи контента с жертвой в основном происходит через контекст запроса (использование имени в запросе) или через информацию, предоставленную в жалобе пользователя. Система фокусируется на характеристиках самого контента и запроса.

Безопасный поиск
Семантика и интент
SERP

Безопасный поиск
Поведенческие сигналы
Семантика и интент

Мультимедиа
SERP
Поведенческие сигналы

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Безопасный поиск
SERP

Мультиязычность
Семантика и интент
Ссылки

Персонализация
Семантика и интент
SERP

Семантика и интент
Индексация
Структура сайта

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Ссылки
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Персонализация
Семантика и интент
Поведенческие сигналы

Local SEO
Поведенческие сигналы
