Google использует механизм для организации поисковой выдачи по широким запросам. Если результатов слишком много или активируются сигналы персонализации, система динамически группирует результаты по категориям (например, по типу, цене или характеристикам). Это помогает пользователям быстрее сориентироваться и уточнить свой интент, выбирая наиболее релевантную категорию.
Описание
Какую задачу решает
Патент решает проблему навигации пользователя в большом объеме результатов поиска, который возникает в ответ на широкие (broad) или недостаточно точно сформулированные запросы (poorly crafted search queries). Цель — помочь пользователю идентифицировать релевантную информацию и найти эффективные способы уточнения своего поискового намерения (useful query refinements) без необходимости вручную переформулировать запрос.
Что запатентовано
Запатентована система динамической и условной категоризации результатов поиска. Когда объем выдачи превышает определенный порог (threshold) или на основе других сигналов (например, user information), система кластеризует результаты в значимые категории. Эти категории оцениваются и фильтруются, после чего результаты представляются на SERP в структурированном виде под соответствующими заголовками.
Как это работает
Механизм работает на этапе формирования выдачи:
- Генерация результатов: Search Engine генерирует первоначальный набор результатов.
- Проверка триггеров: Categorization Engine оценивает необходимость организации выдачи. Основной триггер — превышение порогового значения по количеству результатов. Альтернативные триггеры включают персонализацию (user information) или локаль запроса.
- Категоризация: Если механизм активирован, результаты группируются. Категории могут быть предопределены (Categorization Database) или сгенерированы динамически (например, путем извлечения ключевых слов).
- Оценка и Ранжирование Категорий: Сами категории оцениваются (scoring), часто на основе Ranking Scores входящих в них результатов, и ранжируются.
- Отображение: Пользователю предоставляется выдача, где результаты сгруппированы под заголовками наиболее высоко оцененных категорий.
Актуальность для SEO
Высокая. Динамическая организация SERP и помощь пользователю в уточнении запроса являются ключевыми направлениями развития поиска. Механизмы, описанные в патенте, лежат в основе многих современных функций SERP, особенно в локальном поиске (Local Search), e-commerce и при поиске объектов с множеством атрибутов (отели, рестораны, товары), где категоризация помогает структурировать информацию.
Важность для SEO
Влияние на SEO умеренное/высокое (6.5/10). Патент не описывает базовые алгоритмы ранжирования, но определяет механизмы организации и представления результатов на SERP (Presentation Layer). Это имеет важное стратегическое значение, так как подчеркивает критическую важность атрибутов, структурированных данных и четкой классификации контента. Для видимости по широким запросам сайт должен не только быть релевантным, но и попадать в приоритетные категории, формируемые системой.
Детальный разбор
Термины и определения
- Categorization Database (База данных категоризации)
- Хранилище данных, которое может содержать предопределенные категории, назначенные ресурсам (веб-страницам) в процессе индексации.
- Categorization Engine (Механизм категоризации)
- Компонент системы, отвечающий за организацию результатов поиска в категории. Он принимает решение об активации категоризации, группирует результаты, оценивает и фильтрует категории.
- Category Heading (Заголовок категории)
- Текстовое описание категории на SERP, под которым отображаются сгруппированные результаты (например, «luxury hotels»).
- Index Log (Индексный журнал/Индекс)
- Хранилище индексированной информации о ресурсах, используемое Search Engine для генерации результатов.
- Ranking Score / Quality Score (Оценка ранжирования / Оценка качества)
- Числовая метрика. Применяется как к отдельным результатам, так и к категориям в целом. Оценка категории часто основывается на агрегированных оценках результатов внутри нее.
- Threshold (Порог активации)
- Пороговое значение (например, общее количество результатов поиска), при превышении которого может активироваться механизм категоризации.
- Threshold Score (Пороговая оценка категории)
- Минимальная оценка, необходимая для того, чтобы категория была отображена пользователю.
- User Information (Информация о пользователе)
- Данные о пользователе (история поиска, географические «check-ins», оставленные отзывы), которые могут использоваться как сигнал для активации и определения способа категоризации результатов.
Ключевые утверждения (Анализ Claims)
Claim 1 и 12 (Независимые пункты): Описывают основной процесс категоризации, активируемый порогом объема выдачи, с последующей фильтрацией.
- Система получает запрос и генерирует результаты.
- Определяется категория для каждого результата, только если количество результатов превышает порог (threshold).
- Производится оценка категорий (scoring the categories).
- Идентифицируется подмножество категорий, чья оценка выше пороговой (threshold score).
- Результаты передаются с инструкциями отобразить это подмножество (высокооцененных) категорий вместе с соответствующими им результатами.
Ядро изобретения — условная активация и обязательная оценка качества самих категорий перед их отображением.
Claim 7 (Зависимый): Детализирует расчет оценки категории.
Оценка (score) каждой категории основывается на оценках ранжирования (ranking scores) результатов, включенных в эту категорию.
Claim 11 (Зависимый): Детализирует метод формирования категорий.
Категории определяются на основе ключевых слов (keywords), извлеченных из результатов поиска.
Claim 22 (Независимый пункт): Описывает условное отображение SERP.
Система предоставляет результаты в виде некатегоризированного ранжированного списка, если количество результатов меньше порога, и в виде категоризированного ранжированного списка, если количество результатов больше порога.
Claim 23 (Независимый пункт): Описывает альтернативный механизм и триггер категоризации, основанный на персонализации.
- Система получает запрос и генерирует результаты.
- Результаты категоризируются на основе информации о пользователе (user information). (Claim 24 уточняет, что это может включать user check-in information).
- Категоризированные результаты предоставляются пользователю.
Этот вариант позволяет активировать категоризацию независимо от объема выдачи, фокусируясь на предпочтениях пользователя.
Где и как применяется
Описанный механизм в первую очередь работает на финальных этапах генерации поисковой выдачи, влияя на структуру и представление SERP.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит анализ ресурсов и потенциальное назначение им предопределенных категорий, которые сохраняются в Categorization Database. Также извлекаются ключевые слова и атрибуты. Патент упоминает майнинг данных с сайтов отзывов (например, Yelp, Google Places, Trip Advisor) для извлечения ключевых слов, которые могут использоваться как категории.
RANKING – Ранжирование
Search Engine генерирует стандартный набор результатов с их Ranking Scores.
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Уровень Представления)
Основное место применения патента. Categorization Engine анализирует результаты, полученные на этапе RANKING.
- Оценка триггеров: Проверяется общее количество результатов и/или другие сигналы (например, user information).
- Активация и Группировка: Если условие выполнено, Categorization Engine группирует результаты по категориям.
- Ранжирование Категорий: Категории оцениваются и ранжируются.
- Формирование SERP: Формируется итоговая структура SERP, где результаты отображаются сгруппированными.
Входные данные:
- Исходный поисковый запрос.
- Список результатов поиска с их Ranking Scores.
- Данные из Categorization Database.
- Извлеченные ключевые слова и атрибуты из контента/отзывов.
- User Information (история поиска, check-ins).
Выходные данные:
- Структурированная страница результатов поиска (SERP), где результаты сгруппированы по категориям, или стандартный список, если категоризация не применялась.
На что влияет
- Специфические запросы: Влияет преимущественно на широкие (broad) запросы, где интент пользователя не ясен и требуется уточнение (например, «ноутбуки», «отели в [город]»).
- Конкретные ниши или тематики: Наибольшее влияние оказывается на поиск объектов с множеством атрибутов. Это включает локальный бизнес (отели, рестораны), e-commerce, недвижимость. В патенте используется пример «San Francisco hotels».
Когда применяется
Алгоритм применяется при выполнении одного из условий активации (триггеров):
- Порог объема выдачи: Когда количество сгенерированных результатов поиска превышает определенный порог (Threshold).
- Персонализация: На основе User Information. Если история поиска, географические «check-ins» или отзывы пользователя указывают на определенные предпочтения, система может активировать соответствующую категоризацию.
- Другие сигналы: Упоминаются также локаль запроса (если регион подразумевает много результатов) и категория запроса.
Пошаговый алгоритм
- Получение запроса и Генерация результатов: Search Engine получает запрос и генерирует список результатов с их индивидуальными Ranking Scores.
- Оценка необходимости категоризации: Categorization Engine проверяет условия активации (например, превышено ли пороговое количество результатов или есть ли релевантные сигналы из User Information).
- Принятие решения о формате:
- Если категоризация НЕ требуется: Предоставить стандартный ранжированный список результатов. Процесс завершается.
- Если категоризация требуется: Перейти к шагу 4.
- Определение категорий: Categorization Engine определяет релевантные категории. Это может включать использование Categorization Database или динамическое определение на основе ключевых слов (keywords), извлеченных из контента результатов или сайтов отзывов.
- Кластеризация: Каждый результат назначается одной или нескольким релевантным категориям.
- Ранжирование категорий (Scoring): Система рассчитывает Ranking Score (или Quality Score) для каждой категории. Эта оценка базируется на агрегированных Ranking Scores результатов внутри категории.
- Фильтрация категорий: Отбираются только те категории, которые превышают пороговую оценку (threshold score) или содержат больше порогового числа результатов.
- Ранжирование внутри категорий: Результаты внутри каждой отобранной категории сортируются по их индивидуальным Ranking Scores.
- Формирование SERP: Система генерирует итоговую выдачу, отображая отобранные категории в порядке их ранжирования, и результаты под заголовком каждой категории.
Какие данные и как использует
Данные на входе
- Контентные факторы: Ключевые слова (keywords), извлеченные из контента ресурсов. В патенте прямо указано (Claim 11), что категории могут определяться на основе этих ключевых слов.
- Внешние данные (Отзывы): Упоминается использование данных, полученных с сайтов отзывов (review websites, например, Yelp, Google Places, Trip Advisor). Ключевые слова из отзывов, описывающие заведения, могут использоваться как категории.
- Пользовательские факторы (User Information): История поиска пользователя, история географических «check-ins», ранее оставленные пользователем отзывы. Эти данные используются как триггер для категоризации и влияют на выбор отображаемых категорий (Claim 23).
- Географические факторы: Локаль запроса (locale) используется как сигнал для оценки потенциального количества результатов и необходимости активации категоризации.
Какие метрики используются и как они считаются
- Ranking Score (Результата): Базовая оценка релевантности результата.
- Ranking Score / Quality Score (Категории): Оценка значимости и качества категории. Рассчитывается на основе Ranking Scores результатов, входящих в эту категорию (Claim 7).
- Порог активации (Threshold): Предопределенное значение общего количества результатов, служащее триггером для активации системы.
- Порог оценки категории (Threshold Score): Минимальная оценка, необходимая для отображения категории на SERP (Claim 1).
- Порог количества результатов в категории: Минимальное количество результатов, которое должна содержать категория для ее отображения (Claim 9).
Выводы
- Динамическая организация SERP для широких запросов: Google активно адаптирует структуру выдачи в ответ на широкие запросы. Вместо показа длинного списка разнообразных результатов, система предпочитает кластеризовать их по значимым атрибутам или темам для улучшения навигации.
- Критическая важность атрибутов и ключевых слов: Категории формируются на основе данных, связанных с результатами, в частности, на основе извлеченных ключевых слов (Claim 11) и данных из отзывов. Это подчеркивает важность наличия в контенте четких качественных и количественных атрибутов.
- Ранжирование и фильтрация категорий: Google не просто группирует результаты, но и ранжирует сами категории, основываясь на качестве и релевантности результатов внутри них (Claim 7). Отображаются только лучшие категории, прошедшие порог качества (Threshold Score).
- Категоризация как форма уточнения запроса: Представление категорий служит инструментом для помощи пользователю в уточнении интента (например, переход от запроса «отели» к выбору категории «бутик-отели»).
- Персонализация структуры SERP: Система может использовать User Information (историю поиска, check-ins, отзывы) для определения того, какие именно категории показать конкретному пользователю (Claim 23), что делает организацию SERP персонализированной.
Практика
Best practices (это мы делаем)
- Насыщение контента релевантными атрибутами и ключевыми словами: Для страниц объектов (товары, отели, услуги) критически важно включать четкие атрибуты, которые Google может использовать для категоризации. Используйте терминологию, принятую в нише и используемую пользователями для описания характеристик (например, «family friendly», «waterproof», «boutique hotel», «cheap»).
- Оптимизация под качественные характеристики: Включайте в текст качественные описания, которые могут быть извлечены как keywords для формирования категорий. Анализируйте язык, используемый на сайтах отзывов в вашей тематике, так как Google может использовать эти данные (с Yelp, Google Places) для генерации категорий.
- Использование структурированных данных (Schema.org): Внедряйте микроразметку для явного указания атрибутов (цена, рейтинг, класс, технические характеристики). Это облегчает Categorization Engine точное определение категорий и повышает шансы на попадание в релевантные кластеры на SERP.
- Построение Topical Authority в рамках подкатегорий: Сосредоточьтесь на создании авторитетного контента для конкретных вертикалей внутри широкой темы. Это повышает Ranking Score страницы, что, в свою очередь, повышает Ranking Score категории, в которую она входит.
Worst practices (это делать не надо)
- Поверхностный контент без четких атрибутов: Создание страниц с минимальным описанием, не позволяющим системе определить ключевые характеристики объекта. Такие страницы сложно категоризировать, и они могут проигрывать в выдаче по широким запросам.
- Создание неоднозначного контента: Контент, который сложно однозначно классифицировать, рискует не попасть ни в одну из приоритетных категорий, что снизит его видимость при активации механизма кластеризации.
- Игнорирование интента широких запросов и их уточнений: Оптимизация только под базовый широкий запрос без учета возможных уточнений и категорий, которые система может сформировать для помощи пользователю.
Стратегическое значение
Патент подтверждает стратегию Google по структурированию данных и улучшению пользовательского опыта через динамическую организацию выдачи. Для SEO это означает, что оптимизация должна выходить за рамки базовой текстовой релевантности и включать глубокую проработку атрибутов объекта (Attribute-based Optimization). Понимание того, какие категории Google выделяет в конкретной нише и по каким признакам (включая данные из отзывов и персонализацию) он их формирует, становится важной частью разработки контент-стратегии.
Практические примеры
Сценарий: Оптимизация страницы отеля для локального поиска
- Анализ запроса: По широкому запросу «Отели в Сан-Франциско» Google, вероятно, активирует категоризацию из-за большого количества результатов. Возможные категории: «Luxury», «Cheap», «Boutique», «Spa».
- Цель: Попасть в категорию «Boutique».
- Действия SEO-специалиста:
- Контент: Убедиться, что на сайте и в описании Google Business Profile четко используются термины «бутик-отель», «уникальный дизайн», «персонализированный сервис».
- Отзывы (UGC): Стимулировать гостей оставлять отзывы на Google Maps, Yelp, TripAdvisor, упоминая атрибуты бутика. Патент указывает, что эти данные могут использоваться для категоризации.
- Структурированные данные: Использовать разметку Schema.org/Hotel, указывая релевантные атрибуты и удобства.
- Ожидаемый результат: Categorization Engine извлекает атрибут «бутик» из контента и отзывов. При обработке запроса «Отели в Сан-Франциско» система идентифицирует отель как релевантный для категории «Boutique hotels». Если эта категория пройдет порог качества, она будет отображена на SERP с листингом отеля.
Вопросы и ответы
Как система определяет, какие категории использовать для группировки результатов?
Патент описывает несколько способов. Система может использовать предопределенные категории из Categorization Database. Также она может определять категории динамически, анализируя контент текущего набора результатов и извлекая из них общие ключевые слова (keywords) (Claim 11). Кроме того, упоминается майнинг ключевых слов с сайтов отзывов (например, Google Places, Yelp) для определения релевантных категорий.
Что является основным триггером для активации этой системы категоризации?
Основной триггер — это превышение порогового значения (threshold) общего количества результатов поиска (Claim 1), что часто случается при широких запросах. Однако патент также описывает альтернативный триггер, основанный на информации о пользователе (User Information) (Claim 23), что позволяет персонализировать структуру выдачи.
Как ранжируются сами категории?
Категории получают собственную оценку (Ranking Score или Quality Score). Согласно патенту (Claim 7), эта оценка основывается на Ranking Scores результатов, которые входят в данную категорию. То есть, категория, содержащая более релевантные и качественные (высоко ранжированные) результаты, будет показана выше других категорий.
Все ли возможные категории отображаются пользователю?
Нет. Патент описывает механизм фильтрации категорий с использованием Threshold Score (Claim 1). Если оценка категории ниже этого порога, она не будет отображена пользователю на SERP. Также может использоваться порог по количеству результатов в категории. Это гарантирует, что отображаются только полезные и качественные группировки.
Влияет ли этот механизм на базовое ранжирование моего сайта?
Прямо на расчет базовых Ranking Scores он не влияет. Патент описывает уровень представления (Presentation Layer). Однако он влияет на видимость сайта на SERP. Попадание в высоко ранжируемую категорию может значительно улучшить видимость по широкому запросу, в то время как отсутствие четких атрибутов для категоризации может снизить шансы на показ в этих блоках.
Что означает категоризация на основе «User Information»?
Это означает персонализацию структуры SERP. Система анализирует вашу историю поиска, местоположение, историю «check-ins» (Claim 24) или отзывы, чтобы понять ваши предпочтения. Например, если вы часто ищете бюджетное жилье, система может приоритизировать показ категории «Cheap hotels» при вашем поиске отелей.
Как SEO-специалисту оптимизировать сайт под этот механизм?
Ключевая задача — обеспечить наличие в контенте четких атрибутов и характеристик, которые Google может использовать для категоризации. Используйте релевантные ключевые слова, описывающие свойства товара или услуги, анализируйте язык отзывов и обязательно внедряйте структурированные данные (Schema.org), чтобы явно указать эти атрибуты системе.
Может ли одна страница попасть сразу в несколько категорий?
Да, патент предусматривает такую возможность (Claim 3). Например, отель может одновременно попасть в категорию «Luxury hotels» и «Hotel spas», если он соответствует критериям обеих категорий и обе категории прошли порог для отображения.
Для каких типов сайтов этот патент наиболее актуален?
Он наиболее актуален для сайтов, предлагающих объекты с множеством атрибутов. Это в первую очередь e-commerce, сайты локальных бизнесов (отели, рестораны), агрегаторы, сайты недвижимости и любые другие ресурсы, где пользователи часто начинают с широкого запроса и нуждаются в уточнении по характеристикам.
Как использование микроразметки связано с этим патентом?
Патент упоминает, что система поддерживает объединение структурированных уточнений (таких как цена или часы работы) с качественными текстовыми уточнениями. Микроразметка (Schema.org) является основным способом передачи этих структурированных данных поисковой системе, что помогает Categorization Engine лучше понять атрибуты страницы и точнее ее категоризировать.