Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google фильтрует поисковые подсказки (Autocomplete) на основе безопасности контента в результатах поиска

    METHODS, SYSTEMS, AND MEDIA FOR PROVIDING SEARCH SUGGESTIONS BASED ON CONTENT RATINGS OF SEARCH RESULTS (Методы, системы и средства предоставления поисковых подсказок на основе рейтингов контента результатов поиска)
    • US12093317B2
    • Google LLC
    • 2024-09-17
    • 2015-02-20
    2015 Антиспам Безопасный поиск Патенты Google

    Google анализирует результаты поиска, связанные с потенциальной поисковой подсказкой, и оценивает их безопасность на основе рейтингов контента. Если запрос часто ведет на нежелательный или небезопасный контент (например, для детей), он блокируется и не показывается в Autocomplete. Это механизм фильтрации подсказок, а не ранжирования сайтов.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему показа нежелательных, неуместных или небезопасных (например, контент для взрослых, насилие) поисковых подсказок (Autocomplete) в процессе ввода запроса. Это особенно критично для сред, предназначенных для детей или при использовании режимов безопасного поиска (SafeSearch).

    Что запатентовано

    Запатентована система фильтрации поисковых подсказок. Ключевая особенность в том, что решение о показе подсказки принимается не только на основе ее текста, но и на основе анализа контента результатов поиска, которые эта подсказка возвращает. Если результаты поиска содержат слишком много нежелательного контента (определяется по Content Rating), подсказка блокируется.

    Как это работает

    Система работает в двух режимах:

    • Офлайн (Генерация списка): Анализируются логи предыдущих запросов. Для каждого запроса оцениваются Content Ratings топовых результатов поиска. На основе этого вычисляется оценка безопасности (Safety Score). Если оценка ниже установленного порога (т.е. безопасных результатов недостаточно), запрос попадает в список запрещенных (Disallowed List).
    • Онлайн (Фильтрация): Когда пользователь вводит часть запроса, система генерирует кандидатов подсказок. Эти кандидаты проверяются по Disallowed List. Запрещенные кандидаты удаляются, а оставшиеся (безопасные) показываются пользователю.

    Актуальность для SEO

    Высокая. Фильтрация контента, особенно для защиты детей (например, в YouTube Kids) и в общих режимах SafeSearch, является критически важной задачей для Google. Механизмы автозаполнения постоянно совершенствуются для предотвращения показа нежелательных или оскорбительных подсказок.

    Важность для SEO

    Влияние на SEO низкое (3/10). Патент описывает механизм работы поисковых подсказок (Autocomplete), а не алгоритмы ранжирования сайтов. Он не влияет напрямую на позиции сайта в выдаче. Однако он влияет на то, какие запросы пользователи будут вводить. Если запрос, релевантный сайту, будет классифицирован как «небезопасный» из-за общего качества контента в выдаче, он не появится в подсказках в защищенных режимах, что снизит его видимость и потенциальный трафик через Autocomplete.

    Детальный разбор

    Термины и определения

    Candidate Search Suggestions (Кандидаты поисковых подсказок)
    Предсказания полного поискового запроса (prediction of a complete search query), основанные на частично введенном тексте.
    Content Rating (Рейтинг контента)
    Метка, присвоенная результату поиска (например, видео, статье), указывающая на его пригодность для определенной аудитории (например, «для всех возрастов», «для взрослых», наличие насилия, ненормативной лексики).
    Disallowed List / List of search suggestions that are prohibited (Список запрещенных подсказок)
    Список запросов, которые система не должна предлагать в качестве подсказок, так как они ведут на контент, неподходящий для определенного возрастного диапазона (particular age range). Генерируется офлайн.
    Partial Search Query (Частичный поисковый запрос)
    Символы, введенные пользователем в строку поиска.
    Safety Score (Оценка безопасности)
    Метрика, рассчитываемая для запроса на основе типов контента (types of content) в его результатах поиска. Используется для определения, следует ли добавить запрос в Disallowed List.
    Safety Score Server (Сервер оценки безопасности)
    Компонент системы, отвечающий за генерацию и хранение Disallowed List и определение допустимости подсказок.
    Suggestion Completion Server (Сервер автозаполнения)
    Компонент системы, генерирующий кандидатов подсказок и фильтрующий их на основе данных от Safety Score Server.
    Threshold value (Пороговое значение)
    Заранее определенное минимальное количество безопасных результатов, необходимое для того, чтобы запрос считался допустимым для показа в подсказках.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод предоставления поисковых подсказок с фильтрацией.

    1. В ответ на получение частичного запроса (partial search query) с устройства пользователя идентифицируются кандидаты подсказок.
    2. Проверяется, включен ли каждый кандидат в предварительно определенный список запрещенных подсказок (Disallowed List). Эти подсказки считаются неподходящими (unsuitable for presentation) для пользователей определенного возраста.
    3. Механизм генерации списка (ключевая часть):
      1. Определяются оценки безопасности (Safety Scores) для множества ранее отправленных запросов. Оценки основаны на типах контента (types of content) результатов поиска, полученных по этим запросам в предыдущих поисках.
      2. Запросы добавляются в список на основании того, что их Safety Scores указывают на то, что они должны быть запрещены как неподходящие для данного возраста.
    4. Если один или несколько кандидатов включены в Disallowed List, создается модифицированная группа подсказок путем удаления этих запрещенных кандидатов.
    5. Модифицированная группа отображается на устройстве пользователя как продолжение частичного запроса.

    Claim 4 и 5 (Зависимые, в предыдущих версиях патента, контекст): Уточняют процесс после фильтрации.

    Оставшиеся (допустимые) подсказки могут быть ранжированы. Подмножество лучших подсказок отображается пользователю. Ранжирование может основываться на релевантности результатов поиска, связанных с подсказкой, для определенной демографической группы (particular demographic).

    Claim 6 (Зависимый): Описывает дополнительный уровень фильтрации.

    Система может проверять кандидатов по второму списку запрещенных подсказок (second list), который связан с учетной записью пользователя (например, родительский контроль).

    Где и как применяется

    Изобретение затрагивает инфраструктуру, обеспечивающую работу пользовательского интерфейса поиска, и использует данные о классификации контента.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе контенту (потенциальным результатам поиска, например, видео или веб-страницам) должны быть присвоены Content Ratings. Система должна уметь классифицировать контент как «безопасный», «взрослый» и т.д. Эти данные сохраняются для последующего использования.

    QUNDERSTANDING – Понимание Запросов
    Это основной этап применения патента. Система влияет на процесс формирования запроса пользователем через механизм Autocomplete.

    • Офлайн-процесс: Система (Safety Score Server) анализирует логи запросов (previously submitted search queries) и генерирует Disallowed List. Это происходит путем оценки Content Ratings результатов поиска для каждого запроса из логов и расчета Safety Scores.
    • Онлайн-процесс: Фильтрация кандидатов подсказок в реальном времени при вводе запроса пользователем. Suggestion Completion Server использует Disallowed List для удаления нежелательных подсказок.

    Входные данные:

    • Частичный запрос пользователя (Онлайн).
    • Disallowed List и опционально пользовательские списки блокировки (Онлайн).
    • Логи предыдущих запросов и их результаты (Офлайн).
    • Content Ratings результатов поиска (Офлайн).

    Выходные данные:

    • Отфильтрованный список поисковых подсказок (Онлайн).
    • Disallowed List (Офлайн).

    На что влияет

    • Конкретные типы контента: Наибольшее влияние на поиск медиаконтента (видео, аудио, игры), где система Content Ratings наиболее развита.
    • Специфические запросы: Влияет на любые запросы, если выдача по ним содержит значительное количество контента с нежелательным рейтингом, даже если сам текст запроса безобиден.
    • Определенные форматы и ниши: Критически важно для интерфейсов с ограниченным доступом, таких как детские приложения (например, YouTube Kids) или устройства с активированным режимом SafeSearch.

    Когда применяется

    • Триггеры активации: Ввод пользователем символов в строку поиска в интерфейсе, где активирована система фильтрации подсказок.
    • Условия работы: Алгоритм фильтрации работает при наличии предварительно сгенерированного Disallowed List. Эффективность зависит от качества классификации контента (Content Ratings).
    • Пороговые значения: Система использует пороговое значение (Threshold Value) при генерации Disallowed List. Например, если количество безопасных результатов меньше порога (например, меньше 30%), запрос блокируется.

    Пошаговый алгоритм

    Процесс А: Онлайн-обработка (Фильтрация подсказок в реальном времени)

    1. Получение ввода: Устройство пользователя получает частичный текст запроса от пользователя и передает его на Suggestion Completion Server.
    2. Генерация кандидатов: Сервер определяет кандидатов поисковых подсказок, соответствующих введенному тексту.
    3. Запрос на проверку: Сервер запрашивает у Safety Score Server индикацию о том, разрешен ли каждый кандидат.
    4. Проверка безопасности: Safety Score Server проверяет наличие кандидата в Disallowed List (и опционально в пользовательских списках блокировки).
    5. Передача результатов проверки: Safety Score Server передает индикации о допустимости кандидатов обратно.
    6. Фильтрация: Suggestion Completion Server удаляет кандидатов, помеченных как недопустимые.
    7. Ранжирование и отбор: Оставшиеся допустимые кандидаты ранжируются (например, по популярности или релевантности для демографии), и выбирается подмножество лучших.
    8. Отображение: Подмножество допустимых подсказок отправляется на устройство пользователя для отображения.

    Процесс Б: Офлайн-обработка (Генерация Disallowed List)

    1. Сбор данных: Получение списка ранее отправленных поисковых запросов (например, из логов).
    2. Получение результатов: Для каждого запроса в списке определяются Топ-N результатов поиска.
    3. Анализ рейтингов: Для Топ-N результатов определяется количество результатов, связанных с определенным Content Rating (например, «подходит для всех возрастов»).
    4. Расчет и сохранение метрики: Рассчитывается Safety Score (например, количество или пропорция безопасных результатов) и сохраняется в ассоциации с запросом.
    5. Применение порога: Сравнение Safety Score с пороговым значением (Threshold Value).
    6. Генерация списка: Запросы, которые не соответствуют пороговому значению (т.е. считаются небезопасными), добавляются в Disallowed List.

    Какие данные и как использует

    Данные на входе

    • Факторы классификации контента (Content Classification Factors): Критически важные данные – Content Ratings результатов поиска. Это предварительно рассчитанные метки, указывающие на пригодность контента для определенной аудитории.
    • Поведенческие факторы: Журналы запросов (previously submitted search queries) являются основой для офлайн-анализа. Они используются для определения популярных запросов и генерации Disallowed List.
    • Пользовательские факторы: Система может учитывать контекст пользователя для определения уровня фильтрации (particular age range). Упоминается возможность использования второго списка запрещенных подсказок, связанного с аккаунтом пользователя (user account authenticated on the user device), например, родительские настройки.

    Какие метрики используются и как они считаются

    • Safety Score (Оценка безопасности): Ключевая метрика. Количество или пропорция результатов в Топ-N выдачи по запросу, которые имеют определенный (безопасный) Content Rating. Рассчитывается офлайн.
    • Predetermined Threshold Value (Пороговое значение): Минимальное значение Safety Score, необходимое для того, чтобы запрос считался допустимым для показа в подсказках. Если порог не достигнут, запрос добавляется в Disallowed List.
    • Ранжирование подсказок: Упоминается, что после фильтрации оставшиеся подсказки ранжируются. Ранжирование может основываться на релевантности результатов поиска, связанных с подсказкой, для определенной демографической группы (relevance… to a particular demographic).

    Выводы

    1. Фильтрация Autocomplete основана на анализе SERP, а не только текста: Ключевой вывод — безопасность подсказки оценивается по тому, на какой контент ведут результаты поиска. Запрос блокируется в Autocomplete, если его SERP признан небезопасным для целевой аудитории.
    2. Критичность классификации контента (Content Rating): Система полагается на предварительную классификацию контента. Для показа в подсказках в защищенных режимах запрос должен возвращать достаточное количество результатов с соответствующим (безопасным) рейтингом.
    3. Офлайн-генерация списков блокировки: Процесс определения «плохих» запросов (Disallowed List) происходит офлайн на основе анализа логов и Топ-N результатов (расчет Safety Score), что позволяет быстро фильтровать подсказки в реальном времени.
    4. Контекстуальная адаптация: Система учитывает контекст пользователя (age range, demographic) как для фильтрации, так и для ранжирования разрешенных подсказок. Также предусмотрена интеграция с пользовательскими настройками (родительский контроль).
    5. Инфраструктурный механизм, не ранжирование: Патент описывает механизм фильтрации поисковых подсказок, а не ранжирования сайтов в основной выдаче. Прямых практических выводов для стандартного SEO мало.

    Практика

    Патент скорее инфраструктурный и не дает прямых практических рекомендаций для стандартного SEO (повышения позиций). Однако он важен для понимания работы Autocomplete, особенно в нишах, связанных с медиа, развлечениями и контентом для детей.

    Best practices (это мы делаем)

    • Обеспечение корректной классификации контента (Content Rating): Если вы работаете с контентом, который подлежит рейтингованию (видео, игры, приложения) или ориентирован на широкую/детскую аудиторию, критически важно обеспечить корректную маркировку и отсутствие триггеров для присвоения нежелательного рейтинга. Это позволит результатам считаться «безопасными» при расчете Safety Score для связанных запросов.
    • Мониторинг видимости в Autocomplete в разных режимах: Проверяйте, появляются ли ваши ключевые или брендовые запросы в поисковых подсказках при включенных режимах ограничения (SafeSearch, детские профили). Если запрос исчезает, это может быть индикатором того, что Google считает SERP по этому запросу небезопасным.
    • Анализ SERP на предмет «токсичных» соседей: Если ваш сайт ранжируется по запросу рядом с контентом для взрослых или спамом, общий Safety Score этого запроса может быть низким. Это может привести к исключению запроса из Autocomplete, даже если ваш собственный контент безопасен.

    Worst practices (это делать не надо)

    • Игнорирование рейтингов контента и сигналов безопасности: Публикация контента без четкой классификации или попытка обмануть систему рейтингов может привести к пессимизации контента и, как следствие, к исключению связанных с ним запросов из подсказок в защищенных режимах.
    • Смешивание разнородного контента: Размещение «взрослого» и «детского» контента в рамках одного ресурса таким образом, что по общим запросам в Топ-N попадает много контента с нежелательным рейтингом. Это приведет к снижению Safety Score этих запросов и их блокировке в Autocomplete.
    • Создание пограничного контента: Контент, который балансирует на грани допустимого (кликбейт, двусмысленные заголовки), рискует получить низкий Content Rating и негативно повлиять на видимость связанных запросов в Autocomplete.

    Стратегическое значение

    Патент подтверждает, что Google активно использует автоматизированные методы для классификации контента по безопасности (Content Ratings). Эти сигналы применяются на самых ранних этапах взаимодействия с пользователем — при формировании запроса (Autocomplete). Для SEO-стратегий в медиа-вертикалях и нишах, чувствительных к безопасности контента, критически важно учитывать, как Google классифицирует контент сайта и общую выдачу по целевым запросам.

    Практические примеры

    Сценарий: Фильтрация подсказок в приложении для поиска видео для детей (например, YouTube Kids)

    1. Пользователь вводит: «Как сделать бом».
    2. Кандидаты (без фильтрации): «Как сделать бомбочку для ванны», «Как сделать бомбу в майнкрафте», «Как сделать бомбу из селитры».
    3. Офлайн-анализ (Процесс Б): Google ранее проанализировал эти запросы.
      • Запрос 1 (Ванна): 95% результатов безопасны. Safety Score высокий.
      • Запрос 3 (Селитра): 10% результатов безопасны (много инструкций по созданию реальных взрывчатых веществ). Safety Score низкий. Запрос добавлен в Disallowed List для детского профиля.
    4. Фильтрация в реальном времени (Процесс А): Система проверяет кандидатов. Кандидат 3 обнаруживается в Disallowed List и удаляется.
    5. Результат: Пользователь видит только «Как сделать бомбочку для ванны» и «Как сделать бомбу в майнкрафте».

    SEO Задача: Если вы продаете наборы для бомбочек для ванны, ваш контент должен быть максимально четко классифицирован как безопасный (Craft/DIY), чтобы избежать случайной ассоциации с опасным контентом и не потерять видимость в Autocomplete.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в основном поиске Google?

    Нет, напрямую не влияет. Патент описывает механизм фильтрации поисковых подсказок (Autocomplete), а не алгоритмы ранжирования результатов поиска (SERP). Он определяет, какие запросы будут предложены пользователю при вводе текста, но не то, как сайты будут упорядочены в выдаче по этим запросам.

    Как система определяет, является ли подсказка «небезопасной»?

    Google не оценивает текст самой подсказки в реальном времени. Вместо этого система заранее (офлайн) анализирует Топ-N результатов поиска (SERP) по этому запросу. Если значительная часть этих результатов имеет нежелательный Content Rating (например, контент для взрослых, насилие), запросу присваивается низкий Safety Score, и он добавляется в список запрещенных подсказок (Disallowed List).

    Что такое Content Rating и как он определяется для моего сайта?

    Content Rating — это классификация контента по его пригодности для разных аудиторий. Патент не уточняет методы присвоения рейтинга. На практике Google использует комбинацию автоматических классификаторов (анализ текста, изображений, видео), метаданных (например, тег rating, настройки YouTube) и, возможно, сигналы от пользователей или асессоров.

    Мой сайт безопасен, но связанный с ним запрос исчез из Autocomplete. Почему?

    Это может произойти, если другие сайты в топе выдачи по этому запросу классифицированы как небезопасные. Система оценивает безопасность всей выдачи (SERP), а не отдельных сайтов. Если общий Safety Score запроса низок из-за ваших «соседей» по выдаче, запрос может быть заблокирован в Autocomplete в защищенных режимах.

    Как этот патент связан с SafeSearch?

    Это тесно связанные механизмы. SafeSearch фильтрует результаты поиска, а описанный в патенте механизм фильтрует поисковые подсказки. Оба механизма используют Content Rating для определения безопасности контента. Вероятно, что при активном SafeSearch система применяет более строгие пороги для Safety Score при фильтрации подсказок.

    Как я могу повлиять на Safety Score запросов, связанных с моим контентом?

    Вы можете повлиять на него косвенно, убедившись, что ваш контент, ранжирующийся в топе по этим запросам, четко классифицирован как безопасный. Если вытеснить из топа небезопасные результаты и заменить их качественным безопасным контентом, общий Safety Score запроса повысится, и он сможет вернуться в подсказки.

    Использует ли система только автоматические списки или учитывает ручные блокировки?

    Патент фокусируется на автоматическом создании списка на основе Safety Scores. Однако он также упоминает (Claim 6) возможность использования «второго списка» (second list), связанного с учетной записью пользователя (например, родительский контроль), который может быть создан вручную.

    Как часто обновляется список запрещенных подсказок (Disallowed List)?

    Патент указывает, что список генерируется в офлайн-режиме путем анализа логов предыдущих запросов за определенный период (например, день, неделя). Это подразумевает регулярное обновление списка для учета изменений в индексе, трендах поиска и обновлениях Content Ratings.

    Что означает ранжирование подсказок по «релевантности для демографической группы»?

    Патент указывает, что после удаления небезопасных подсказок оставшиеся могут быть переранжированы. Если система знает контекст пользователя (например, что это ребенок), она может повысить в подсказках запросы, которые более популярны или релевантны именно для этой демографической группы, а не только самые популярные запросы в целом.

    Имеет ли этот патент значение для SEO на YouTube?

    Да, для YouTube, и особенно для YouTube Kids, этот патент имеет прямое значение. Он объясняет, почему важно следить за тем, как ваш видеоконтент классифицируется платформой (Content Rating). Если видео ошибочно получает неверный возрастной рейтинг, это может привести к исключению связанных популярных запросов из подсказок, снижая трафик на ваше видео.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.