
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
Патент решает проблему определения истинного намерения пользователя (интента) для неоднозначных запросов, особенно когда интент связан с контентом, подлежащим фильтрации (например, порнография). Традиционные методы, основанные на анализе терминов запроса, могут быть неэффективны, если запрос не содержит явных ключевых слов или использует эвфемизмы (например, запрос "amateur"). Изобретение позволяет классифицировать интент запроса независимо от его содержания, основываясь на поведении пользователей при настройке фильтров поиска.
Запатентована система классификации запросов, которая определяет вероятность того, что запрос направлен на поиск контента определенного типа. Классификация основывается на анализе частоты использования этого запроса в unfiltered search operations (поиск с выключенным фильтром) по сравнению с filtered search operations (поиск с включенным фильтром). Система вычисляет нормализованное значение (Content Type Value), и если оно превышает порог, запрос классифицируется как Content Type Seeking Query.
Система анализирует логи поиска (Search Logs) и для каждого запроса подсчитывает, сколько раз он был отправлен с включенным контентным фильтром и сколько раз — с выключенным. Эти данные нормализуются относительно общего объема всех фильтрованных и нефильтрованных поисковых операций в системе. Затем вычисляется соотношение между этими двумя нормализованными значениями (Content Type Value). Если запрос непропорционально часто используется в нефильтрованном поиске, система классифицирует его как ищущий данный тип контента. Эта классификация затем используется для корректировки relevance scores: повышая или понижая результаты, содержащие контент данного типа.
Высокая. Понимание интента пользователя, особенно для неоднозначных запросов и чувствительных тем (включая взрослый контент, регулируемый SafeSearch), остается ключевой задачей поисковых систем. Описанный метод обеспечивает мощный поведенческий сигнал для классификации запросов, который не зависит от языка или конкретных терминов и адаптируется к изменениям в поведении пользователей.
Патент имеет высокое значение для SEO (75/100), особенно для сайтов, работающих в нишах с неоднозначным контентом или для брендов, чьи названия могут пересекаться с чувствительными тематиками. Он описывает конкретный механизм, как Google определяет, ищет ли пользователь "взрослый" (или иной фильтруемый) контент по запросу, который сам по себе не содержит стоп-слов. Это напрямую влияет на то, будут ли результаты определенного типа повышены или понижены в выдаче при отключенном фильтре.
Content Type Value превышает порог.Content Type Value не достигает порога.First Value и Second Value. Используется для классификации запроса.filter settings) для каждой поисковой операции.Claim 1 (Независимый пункт): Описывает основной метод классификации запросов с использованием нормализации данных об использовании фильтров.
Unfiltered Search Operations и второе количество вхождений (Non) в Filtered Search Operations.First Value (FV) = Noff / NoffTot.Second Value (SV) = Non / NonTot.First Content Type Value (CTV) как отношение FV к SV.first threshold), запрос классифицируется как First Content Type Seeking Query (CTSQ).First Content Type Independent Query.Ядро изобретения заключается в использовании нормализованных частот (FV и SV). Это позволяет учесть базовое распределение фильтрованных и нефильтрованных операций в системе. Например, если 90% всех поисков фильтрованные, нормализация позволяет выявить запросы, для которых пользователи отключают фильтр значительно чаще, чем в среднем по системе.
Claim 2 (Зависимый): Уточняет, что контент первого типа — это порнографический контент.
Claim 5 и 6 (Зависимые): Описывают механизм корректировки подсчета вхождений на основе сессий. Если в течение одной сессии запрос был отправлен сначала с одной настройкой фильтра, а затем с другой, то первое вхождение дисконтируется (не учитывается), а учитывается только последнее. Это повышает точность определения истинного намерения.
Claim 7 (Зависимый): Описывает применение классификации для понижения ранжирования. Если получен запрос для Unfiltered Search Operation (фильтр выключен) и этот запрос НЕ классифицирован как CTSQ, система понижает relevance score для всех ресурсов, содержащих контент первого типа.
Claim 8 (Зависимый): Описывает применение классификации для повышения ранжирования. Если получен запрос для Unfiltered Search Operation и этот запрос классифицирован как CTSQ, система повышает relevance score для всех ресурсов, содержащих контент первого типа.
Изобретение затрагивает этапы понимания запросов и ранжирования/переранжирования.
QUNDERSTANDING – Понимание Запросов
Основное применение патента. Система Query Classification System работает преимущественно в офлайн-режиме, анализируя Search Logs для классификации запросов. Этот процесс определяет интент запроса на основе исторических данных о фильтрации.
RANKING / RERANKING – Ранжирование и Переранжирование
На этих этапах используются результаты классификации. Когда поступает новый запрос в реальном времени, система проверяет его классификацию и настройки фильтрации текущей операции. В зависимости от этого (Claims 7 и 8), система корректирует relevance scores результатов, содержащих контент соответствующего типа.
Входные данные (Офлайн-процесс):
Search Logs, содержащие исторические данные о запросах (Qx).Выходные данные (Офлайн-процесс):
Classifications Store), где запросам присвоены метки (например, CTSQ или Independent).Входные данные (Онлайн-процесс):
Unfiltered Search Operation (Claim 7, 8).Content Type Value (CTV) достигает определенного порога (например, >1, или как указано в примере патента, >3 или <0.8).Процесс А: Классификация запросов (Офлайн)
Search Logs, содержащим множество запросов и соответствующие им настройки фильтрации.First Value (FV) = Noff / NoffTot.Second Value (SV) = Non / NonTot.Content Type Value (CTV) = FV / SV.Content Type Seeking Query (CTSQ).Content Type Independent.Процесс Б: Использование классификации при ранжировании (Онлайн)
Unfiltered Search Operation (фильтр выключен).relevance score для ресурсов, содержащих контент данного типа.Content Type Independent): Система уменьшает relevance score для ресурсов, содержащих контент данного типа.Патент фокусируется исключительно на анализе логов поиска и настроек фильтрации. Он не использует контентные, ссылочные или технические факторы для классификации запросов.
Search Logs.Система использует несколько ключевых метрики и строгий процесс нормализации.
Content Type Independent.relevance scores. Если запрос признан ищущим определенный контент (CTSQ), этот контент бустится. Если запрос признан нейтральным (Independent), то контент деликатного типа пессимизируется, даже если фильтр у пользователя выключен.CTSQ (например, из-за сленга), вы будете конкурировать с adult-контентом, получающим бустинг в нефильтрованной выдаче.Content Type Independent, Google будет активно понижать любые результаты, которые классифицированы как adult, даже в нефильтрованной выдаче. Это подчеркивает важность избегания случайного использования терминов или изображений, которые могут привести к неверной классификации страницы.CTSQ. По этим запросам система будет активно повышать релевантные результаты при выключенном фильтре.Independent), страница будет понижена в ранжировании.Content Type Independent, будут неэффективны. Система активно борется с показом такого контента по нейтральным запросам, даже если у пользователя отключен фильтр.Патент подтверждает, что Google использует агрегированные данные о поведении пользователей для понимания интента на уровне отдельных запросов. Это механизм "мудрости толпы" для интерпретации неоднозначности. Стратегически это означает, что интент запроса определяется не только семантикой слов, но и историческими паттернами взаимодействия пользователей с интерфейсом поиска (в данном случае, с фильтрами). Это снижает зависимость Google от лингвистического анализа и делает систему более устойчивой к новым терминам и сленгу.
Сценарий 1: Классификация неоднозначного запроса (Пример из патента: "Nurse")
CTSQ равен 3.0, то запрос "Nurse" (CTV 4.091) классифицируется как ищущий данный тип контента (например, adult).Сценарий 2: Классификация нейтрального запроса (Пример из патента: "Calculator")
Independent.Что такое Content Type Value (CTV) и почему важна нормализация при его расчете?
CTV — это соотношение между частотой использования запроса в нефильтрованном поиске и частотой его использования в фильтрованном поиске, при этом обе частоты нормализованы. Нормализация критически важна, потому что она учитывает базовое распределение использования фильтров в системе. Например, если 90% всех поисков происходят с включенным фильтром, нормализация позволяет выявить запросы, для которых пользователи отключают фильтр значительно чаще, чем эти базовые 10%, что является сильным сигналом интента.
Как система обрабатывает ситуации, когда пользователь меняет настройки фильтра во время поиска?
Патент описывает механизм обработки сессий (Claims 5 и 6). Если один и тот же запрос отправляется несколько раз в течение одной сессии с разными настройками фильтрации, система учитывает только последнюю настройку. Предыдущие считаются ошибками пользователя и дисконтируются при подсчете. Это повышает точность определения истинного намерения пользователя.
Влияет ли эта классификация на ранжирование, если у пользователя включен SafeSearch (Filtered Search Operation)?
Нет. Патент фокусируется на корректировке ранжирования только для Unfiltered Search Operations (SafeSearch выключен), как указано в Claims 7 и 8. Если фильтр включен, то контент соответствующего типа и так не будет показан по определению фильтрованной операции. Механизм корректировки применяется именно тогда, когда контент может быть показан.
Что произойдет, если мой сайт ошибочно классифицирован как adult, а запрос классифицирован как нейтральный (Content Type Independent)?
Это проблемный сценарий. Согласно Claim 7, если запрос классифицирован как нейтральный, а пользователь ищет в нефильтрованном режиме, система активно понизит relevance score для всех ресурсов, содержащих контент данного типа (в данном случае, adult). Ваш сайт будет пессимизирован в выдаче по этому запросу, даже если он релевантен по тексту.
Может ли этот патент использоваться для других типов контента, кроме adult?
Да. Хотя в патенте в качестве основного примера используется порнографический контент (Claim 2), описанный механизм является общим. Он может применяться к любым типам контента, для которых существуют фильтры, например, контент с насилием, или даже не связанные с безопасностью фильтры, такие как фильтры изображений ("черно-белые") или тематические фильтры ("только новости").
Как узнать, классифицирован ли мой целевой запрос как Content Type Seeking Query (CTSQ)?
Google не предоставляет эту информацию напрямую. Однако можно провести косвенный анализ. Сравните выдачу по запросу в режиме с включенным и выключенным SafeSearch. Если при выключенном SafeSearch в топе появляется много adult-контента, который сильно опережает другие результаты, вероятно, запрос имеет высокий CTV и классифицирован как CTSQ.
Заменяет ли этот механизм анализ ключевых слов для определения интента?
Нет, он дополняет его. Этот механизм особенно полезен, когда анализ ключевых слов не дает однозначного ответа (неоднозначные запросы) или когда используются новые термины/сленг, которые еще не известны лингвистическим моделям. Он обеспечивает основанный на данных способ классификации, независимый от языка и содержания.
Какие пороги (Thresholds) используются для классификации?
Патент не указывает точных значений, но утверждает, что порог для CTSQ должен быть больше 1 (Claim 3). В описании приводится пример, где порог для CTSQ может быть >3, а порог для Content Type Independent <0.8. Запросы в промежуточном диапазоне могут оставаться неклассифицированными в рамках этой системы.
Что делать, если мой информационный контент конкурирует с adult по неоднозначному запросу?
Если запрос классифицирован как CTSQ, конкурировать напрямую будет сложно, так как adult-контент получает преимущество (бустинг) в нефильтрованном поиске. Стратегия должна заключаться в уточнении семантики и таргетинге на более длинные, специфические запросы (long-tail), которые с меньшей вероятностью будут классифицированы как CTSQ.
Как быстро система реагирует на появление новых трендов или сленга?
Поскольку система основана на анализе Search Logs и не требует машинного обучения на контенте, она может реагировать относительно быстро. Как только новый термин начинает использоваться в поиске и пользователи начинают взаимодействовать с фильтрами при его вводе, система накапливает данные для расчета CTV. Скорость реакции зависит от частоты обновления офлайн-процесса классификации.

Безопасный поиск
SERP

Семантика и интент
Поведенческие сигналы
SERP

Безопасный поиск
Семантика и интент
SERP

Семантика и интент
Мультимедиа
SERP

Семантика и интент
Поведенческие сигналы
Мультимедиа

Local SEO
Поведенческие сигналы

Поведенческие сигналы
EEAT и качество
SERP

Семантика и интент
Поведенческие сигналы

EEAT и качество
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
SERP
Поведенческие сигналы

SERP
Семантика и интент
EEAT и качество

Семантика и интент
Индексация
Структура сайта

Семантика и интент
SERP
Персонализация

Семантика и интент
Ссылки
Knowledge Graph
