
Google использует механизм для автоматического создания фильтров поисковой выдачи (например, в виде тегов или «пузырьков»). Система анализирует контент страниц, уже отобранных для показа по запросу, извлекает из них ключевые слова и проверяет их полезность, используя данные о поведении пользователей. Затем система отбирает наиболее релевантные и разнообразные фильтры, позволяя пользователю уточнить свой интент в один клик.
Патент решает проблему неполноты пользовательских запросов и необходимости их уточнения. Традиционные методы полагаются на предопределенные (hardcoded) фильтры или фасеты, которые требуют ручной настройки, экспертных знаний и могут упускать новые или emergent термины. Изобретение автоматизирует процесс создания релевантных фильтров, динамически адаптируя их к текущему набору результатов поиска и интенту пользователя.
Запатентована система автоматической генерации фильтров результатов поиска, основанная на анализе контента ресурсов, релевантных исходному запросу. Система извлекает ключевые слова из этих ресурсов, оценивает их пригодность в качестве фильтров на основе исторических данных о запросах (Query Logs) и критериев значимости (Term Prominence), а затем применяет критерии разнообразия (Diversity Threshold), чтобы гарантировать, что предложенные фильтры помогают пользователю исследовать различные аспекты темы.
Система работает следующим образом:
Candidate Criteria. Ключевое условие — эти слова должны фигурировать в реальных запросах пользователей, по которым выбирались данные ресурсы (анализ Query Logs). Также применяются стоп-слова для удаления общих терминов.Filter Criteria:Term Prominence: Предпочтение отдается терминам, расположенным на видных местах в документах (например, в заголовках), что влияет на Quality Score фильтра.Diversity Filter: Система проверяет, насколько различаются наборы результатов при применении разных фильтров. Если два фильтра (например, «гуакамоле» и «гуак») дают почти одинаковые результаты (превышают Similarity Threshold), они объединяются или выбирается один.Высокая. Динамические фильтры (часто в виде «пузырьков» или тегов) являются стандартным элементом интерфейса Google Поиска, особенно для широких, категориальных или коммерческих запросов. Этот патент описывает базовый механизм их генерации и отбора, который остается актуальным для помощи пользователям в навигации и уточнении интента.
Влияние на SEO значительно (75/100). Хотя патент описывает механизм улучшения пользовательского интерфейса (UI/UX), он напрямую влияет на то, как пользователи взаимодействуют с выдачей и какой контент они потребляют. Понимание механизма генерации фильтров позволяет SEO-специалистам оптимизировать контент так, чтобы он соответствовал ключевым уточняющим интентам, которые Google идентифицирует как важные. Это влияет на видимость в отфильтрованной выдаче и на понимание того, какие атрибуты продукта или темы Google считает наиболее значимыми.
Difference Threshold) отфильтрованные выдачи, они могут быть объединены.Term Prominence).Quality Score.Claim 1 (Независимый пункт): Описывает основной метод генерации и применения фильтров.
Diversity Threshold):Difference Threshold).Ядро изобретения — динамическая генерация фильтров из контента SERP с обязательной проверкой разнообразия результатов, которые эти фильтры создают.
Claim 4 (Зависимый от 1): Уточняет, как определяются кандидаты в фильтры.
Определение кандидатов включает идентификацию набора запросов, по которым пользователи ранее выбирали (кликали) эти релевантные ресурсы. Это подтверждает использование исторических данных о поведении пользователей (Query Logs) для валидации того, какие ключевые слова действительно используются людьми для уточнения поиска.
Claims 5 и 6 (Зависимые от 4): Детализируют фильтрацию терминов на основе частотности в запросах.
Query Stop Terms — термины с высокой частотой в наборе запросов. Они исключаются из кандидатов.Informational Terms — термины с низкой частотой. Они включаются в кандидаты.Это механизм, похожий на TF-IDF, применяемый к корпусу запросов, связанных с ресурсами. Он гарантирует, что фильтры будут специфичными для домена.
Claim 8 (Зависимый от 1): Детализирует механизм обеспечения разнообразия.
Пары кандидатов, чьи отфильтрованные наборы результатов слишком похожи (достигают Similarity Threshold), группируются в один фильтр. Это процесс дедупликации фильтров (например, объединение синонимов).
Claim 9 (Зависимый от 1): Вводит оценку качества фильтров.
Для каждого кандидата определяется Quality Score на основе его расположения (locations) в ресурсах. Это подтверждает важность заметности (Term Prominence) термина внутри документа (например, заголовок против основного текста).
Изобретение функционирует на стыке нескольких этапов поисковой архитектуры, используя предварительно обработанные данные для генерации элементов SERP в реальном времени.
INDEXING – Индексирование и извлечение признаков
На этом этапе система извлекает контент и ключевые слова из ресурсов. Также рассчитываются и сохраняются сигналы о расположении и значимости терминов (Term Prominence), которые позже используются для расчета Quality Score фильтра.
QUNDERSTANDING – Понимание Запросов
Система использует этот этап для нескольких целей:
Query Logs для установления связей между запросами и ресурсами, которые пользователи выбирают в ответ на эти запросы. Это критически важно для валидации кандидатов в фильтры и определения Informational Terms.Categorical Query, что может служить триггером для активации системы.RANKING – Ранжирование
Этот этап предоставляет входные данные для системы: набор Responsive Resources (релевантных ресурсов), ранжированных по исходному запросу.
METASEARCH – Метапоиск и Смешивание / RERANKING (Генерация SERP)
Основное применение патента происходит здесь, при формировании финальной выдачи.
Responsive Resources.Diversity Filter) и значимости (Term Prominence).Входные данные:
Responsive Resources (результаты этапа Ranking).Term Prominence).Query Logs (связи запрос-ресурс, частотность терминов).Language Model (для определения синонимов).Выходные данные:
Categorical Queries (например, «кроссовки», «лучшие фильмы», «рестораны рядом»), где пользователю требуется помощь в уточнении интента.Categorical Query.Процесс А: Генерация фильтров
Responsive Resources.Keyword Corpus). Учитывается частота использования.Candidate Criteria для отбора потенциальных фильтров:Query Logs). Кандидаты должны быть релевантны этим запросам.Query Stop Terms (слишком частые, общие термины). Сохраняются Informational Terms (специфичные термины).Quality Score, учитывающий Term Prominence (расположение термина в ресурсах — заголовки, метаданные и т.д.).Similarity Threshold), группируются, и выбирается один представитель (например, с более высоким Quality Score).Diversity Threshold.Процесс Б: Обработка выбора фильтра
Filtered Set of Content.Система использует комбинацию контентных, структурных и поведенческих факторов, извлеченных из релевантных ресурсов и журналов запросов.
Quality Score фильтра.Language Model используется для определения схожести терминов (синонимы, стемминг, поведенческая схожесть, например, «гуак» и «калифорнийский стиль» в контексте ресторанов).locations) термина-кандидата в ресурсах (Term Prominence).Query Logs. Термин становится фильтром, только если пользователи действительно используют его в запросах, которые ведут к этим ресурсам (является Informational Term). Это подчеркивает важность соответствия контента реальному языку пользователей.Quality Score фильтра. Заметное расположение (например, в заголовках) повышает вероятность того, что термин будет выбран в качестве фильтра.Stop Terms и Informational Terms гарантирует, что фильтры будут специфичными для ниши, а не общеупотребительными словами.Diversity Filter гарантирует, что каждый предложенный фильтр открывает новый срез информации, группируя схожие варианты.Query Logs, критически важно использовать в контенте термины и фразы, которые пользователи реально применяют для уточнения поиска в вашей нише. Анализируйте отзывы, форумы и данные автодополнения (suggest).Term Prominence напрямую влияет на Quality Score термина и его выбор в качестве фильтра.Informational Terms и отсеивает общие Stop Terms. Например, вместо «хороший звук» используйте конкретные технологии или характеристики.Term Prominence будет низким.Stop Terms из-за высокой частоты в логах.Diversity Filter), использование релевантных синонимов, используемых пользователями, может увеличить охват и помочь системе понять основные атрибуты. Однако не стоит искусственно создавать контент под каждый микро-синоним.Патент подтверждает важность понимания не только основного интента запроса, но и ключевых направлений его уточнения (refinement paths). Стратегия SEO должна включать анализ динамических фильтров в выдаче как инструмента для понимания того, какие аспекты темы или атрибуты продукта Google считает наиболее важными для пользователей. Это напрямую влияет на контент-стратегию и структуру страниц, подчеркивая переход от простого текстового соответствия к структурному и семантическому выделению ключевых характеристик.
Сценарий: Оптимизация страницы категории E-commerce
Задача: Оптимизировать страницу категории «Беспроводные наушники».
Informational Term), использовать эту фразу, а не только «спортивные наушники».Как Google определяет, какие слова сделать фильтрами, а какие нет?
Google использует многоступенчатый процесс. Сначала извлекаются часто используемые слова из контента топовых результатов. Затем эти слова проверяются: используются ли они в реальных запросах пользователей, которые ведут к этим страницам (Query Logs). Далее отсеиваются слишком общие слова (Stop Terms) и предпочтение отдается специфичным (Informational Terms). Наконец, учитывается расположение слова на странице (Term Prominence) и обеспечивается разнообразие финального набора фильтров (Diversity Filter).
Влияет ли структура моей страницы на то, какие фильтры покажет Google?
Да, напрямую. Патент указывает на использование Term Prominence и расчет Quality Score для фильтра на основе его расположения в ресурсе. Термины, расположенные в заголовках или на видных местах, имеют больше шансов быть выбранными в качестве фильтров. Это подчеркивает важность четкой и логичной структуры контента для SEO.
Что такое «Фильтр разнообразия» (Diversity Filter) и зачем он нужен?
Diversity Filter гарантирует, что предложенные пользователю фильтры не дублируют друг друга. Система проверяет, насколько похожи результаты поиска после применения двух разных фильтров. Если результаты почти идентичны (например, при фильтрах «автомобиль» и «машина»), система объединит их или выберет только один. Это делается для того, чтобы предложить пользователю реальный выбор разных срезов информации.
Почему этот механизм важен для E-commerce и локального поиска?
Для этих ниш это критически важно, так как пользователи часто ищут товары или услуги по атрибутам (цвет, размер, функция, тип кухни, расположение). Этот механизм автоматически определяет ключевые атрибуты из карточек товаров, обзоров или описаний заведений и превращает их в удобные фильтры. Оптимизация структуры описания напрямую влияет на то, какие атрибуты Google сочтет важными.
Что такое «Категориальный запрос» (Categorical Query) в контексте этого патента?
Categorical Query — это широкий запрос, который относится к определенной категории, например, «бургеры», «кроссовки» или «фильмы». Для таких запросов стандартной выдачи часто недостаточно, и пользователю требуется уточнение. Механизм, описанный в патенте, особенно полезен именно для таких запросов, помогая сузить интент.
Как SEO-специалисту использовать знание этого патента на практике?
Необходимо анализировать динамические фильтры, которые Google показывает по вашим целевым запросам. Это даст понимание ключевых интентов и атрибутов. Затем нужно оптимизировать структуру контента (заголовки, списки), чтобы эти атрибуты были заметны (Term Prominence), и использовать язык, соответствующий реальным запросам пользователей (Query Logs).
Если я оптимизирую страницу под определенный термин, станет ли он фильтром в выдаче?
Не обязательно. Ваш термин должен быть извлечен из вашего контента (и, вероятно, из контента других топовых ресурсов), он должен быть валидирован через Query Logs (пользователи должны его использовать), он должен быть достаточно специфичным (Informational Term) и он должен пройти Diversity Filter. Оптимизация повышает шансы, но не гарантирует результат.
Что важнее: частота термина на странице или его расположение?
Важны оба аспекта. Частота (в рамках Keyword Corpus) является первичным сигналом для извлечения кандидата. Однако расположение (Term Prominence) используется для расчета Quality Score фильтра и принятия финального решения о его включении. Структурно выделенный термин часто имеет преимущество перед просто повторяющимся в тексте.
Могут ли отзывы пользователей повлиять на генерацию фильтров?
Да. В описании патента упоминается, что фильтры могут быть изучены из обзоров (item reviews) и описаний. Если пользователи часто упоминают определенные характеристики в отзывах, эти термины могут быть извлечены и использованы в качестве фильтров, при условии прохождения проверок качества и разнообразия.
Отличается ли этот механизм от стандартных фасетных фильтров на сайтах?
Да, ключевое отличие в том, что стандартные фасетные фильтры обычно предопределены разработчиками сайта на основе фиксированной структуры базы данных. Описанный в патенте механизм генерирует фильтры динамически на основе анализа неструктурированного контента ранжируемых страниц и валидирует их с помощью данных о поведении пользователей.

Семантика и интент

SERP
Антиспам
EEAT и качество

Персонализация
Поведенческие сигналы
SERP

SERP

Семантика и интент
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

SERP
EEAT и качество
Поведенческие сигналы

Knowledge Graph
Семантика и интент
Ссылки

Ссылки
Поведенческие сигналы
Мультимедиа

Антиспам
Ссылки
Техническое SEO

EEAT и качество
SERP
Ссылки

Мультимедиа
EEAT и качество
Ссылки

Поведенческие сигналы
Семантика и интент
SERP

Ссылки
Индексация
Техническое SEO

Поведенческие сигналы
Семантика и интент
SERP
