Google автоматически анализирует набор результатов поиска, чтобы предложить пользователю способы сузить выдачу (фасеты). Система ранжирует эти предложения, основываясь на том, насколько равномерно они разделяют результаты (селективность), а также на исторических данных о том, какие уточнения пользователи выбирают чаще всего, представляя сначала наиболее полезные варианты.
Описание
Какую задачу решает
Патент решает проблему навигации и триажа (быстрой сортировки) больших объемов информации, таких как результаты поиска, содержимое почтового ящика или каталоги товаров. Когда запрос возвращает много результатов, пользователю сложно их просматривать или он не знает оптимальной стратегии для уточнения запроса. Система направлена на ускорение поиска нужной информации путем автоматического предложения эффективных уточнений.
Что запатентовано
Запатентована система автоматической генерации и ранжирования предложений по уточнению поискового запроса (фасетов). Ключевым элементом изобретения является метод ранжирования этих фасетов, который основывается на их селективности (насколько равномерно фасет разделяет текущий набор результатов) и, опционально, на взвешенных характеристиках фасетов, отражающих их историческую популярность и полезность.
Как это работает
Система работает итеративно после получения первоначального набора результатов поиска:
- Генерация кандидатов: Система автоматически генерирует Candidate Facets (например, «тип:PDF», «бренд:Nike», «от:John») на основе метаданных и контента в текущих результатах поиска.
- Расчет селективности: Для каждого фасета вычисляется, насколько равномерно он разделит текущий набор результатов. Идеальный фасет делит результаты примерно 50/50.
- Оценка характеристик: Система анализирует Facet Characteristics, такие как историческая частота использования этого фасета пользователями или тип оператора.
- Ранжирование: Фасеты ранжируются на основе комбинации селективности и взвешенных характеристик.
- Представление: Лучшие фасеты (Presentation Facets) отображаются пользователю.
- Уточнение: При выборе фасета система генерирует новый, уточненный запрос, обновляет результаты и повторяет процесс генерации фасетов.
Актуальность для SEO
Высокая. Фасетный поиск и предложения по уточнению запросов являются стандартом в современных поисковых интерфейсах, включая eCommerce, вертикальный поиск (Google Shopping, Images) и внутренний поиск (например, Gmail, который подробно рассматривается в патенте). Механизмы автоматического ранжирования этих предложений с использованием машинного обучения остаются критически важными для UX.
Важность для SEO
Влияние на SEO умеренное (5/10). Патент не описывает алгоритмы ранжирования документов в основном индексе. Он описывает, как Google помогает пользователям уточнять свои запросы после получения первоначальной выдачи. Это влияет на взаимодействие пользователей с SERP и распределение трафика по уточненным запросам. Наибольшее значение патент имеет для сайтов с большим количеством структурированных данных (eCommerce, каталоги), подчеркивая важность атрибутов для видимости в фасетном поиске.
Детальный разбор
Термины и определения
- Candidate Facets (Кандидаты в фасеты)
- Набор потенциальных уточнений запроса, автоматически сгенерированный на основе начального набора результатов поиска и предопределенного списка операторов.
- Facet (Фасет)
- Уточнение поискового запроса, определяющее свойства искомых результатов. Состоит из оператора и нуля или более операндов (например, type:PDF, from:john, has:attachment).
- Facet Characteristics (Характеристики фасета)
- Предопределенный набор свойств, используемых для оценки полезности фасета. Делятся на категории: историческая активность (популярность), влияние на результаты поиска (например, селективность) и внутренние характеристики (тип оператора/операнда).
- Historical Popularity (Историческая популярность)
- Показатель того, как часто пользователи выбирали определенный фасет в прошлом. Используется для определения весов характеристик фасета.
- Operator (Оператор) и Operand (Операнд)
- Компоненты фасета. Оператор определяет тип фильтрации (например, type:). Операнд – это значение (например, «PDF»).
- Presentation Facets (Представленные фасеты)
- Подмножество кандидатов в фасеты с наивысшим рейтингом, выбранное для отображения пользователю.
- Selectivity (Селективность)
- Ключевая метрика ранжирования фасетов. Определяется тем, насколько равномерно фасет разделяет текущий набор результатов поиска. Фасет, который делит результаты 50/50, считается высоко селективным.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает базовый метод генерации и ранжирования фасетов.
- Система генерирует начальный набор результатов поиска на основе начального запроса.
- Без дальнейшего участия пользователя (автоматически) система выполняет:
- Генерацию набора кандидатов в фасеты.
- Ранжирование кандидатов в соответствии с их селективностью.
- Определение селективности: она основана на том, насколько равномерно (evenly) каждый кандидат в фасеты (в сочетании с начальным запросом) разделяет (splits) начальный набор результатов поиска.
- Выбор нескольких представленных фасетов на основе рейтинга.
- Форматирование для отображения.
- В ответ на выбор пользователем одного из фасетов:
- Генерация пересмотренного запроса (начальный запрос + выбранный фасет).
- Генерация пересмотренного набора результатов.
Ядро изобретения — это автоматическое предложение уточнений, ранжированных по принципу максимального прироста информации (равномерное разделение выборки).
Claim 3 (Зависимый от 1): Добавляет дополнительный критерий ранжирования.
Система также определяет для каждого кандидата, какие из предопределенного набора Facet Characteristics к нему применимы. Ранжирование дополнительно основывается на этих характеристиках (в дополнение к селективности).
Claim 4 и 5 (Зависимые): Детализируют использование характеристик и весов.
Каждая Facet Characteristic имеет связанный вес (weight). Ранжирование частично основано на этих весах (Claim 4). Веса основаны на исторической популярности (historical popularity) фасетов с этой характеристикой (Claim 5). Это указывает на использование машинного обучения для оптимизации весов на основе реального поведения пользователей.
Где и как применяется
Изобретение применяется на финальных этапах обработки запроса, после того как основное ранжирование завершено, и фокусируется на интерфейсе пользователя (UI) и управлении сессией поиска.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна извлекать и индексировать структурированные данные и метаданные (атрибуты товаров, заголовки email), которые служат основой для генерации фасетов.
RANKING – Ранжирование
На этом этапе генерируется начальный набор результатов (initial set of search results) для исходного запроса.
RERANKING / UI Layer (Переранжирование / Уровень Интерфейса)
Основное применение патента. Система анализирует результаты, полученные на этапе RANKING.
- Анализ результатов: Facet Generation Module анализирует атрибуты в результатах поиска.
- Ранжирование фасетов: Facet Ranking Module оценивает кандидатов по селективности и характеристикам. Это ранжирование самих фасетов, а не документов.
- Формирование UI: User Interface Module отображает лучшие фасеты пользователю.
QUNDERSTANDING – Понимание Запросов
Когда пользователь выбирает фасет, система генерирует пересмотренный запрос (revised search query). Также исторические данные об использовании фасетов анализируются (офлайн) для обучения модели весов.
Входные данные:
- Начальный набор результатов поиска и их атрибуты.
- Предопределенный список операторов (Operator List).
- Данные об исторических действиях пользователей (для расчета весов характеристик).
Выходные данные:
- Ранжированный список представленных фасетов (элементы UI).
На что влияет
- Конкретные типы контента и ниши: Наибольшее влияние оказывается на области с хорошо структурированными данными. Это включает eCommerce (атрибуты товаров), каталоги, базы данных и вертикальный поиск (Google Shopping, Jobs), а также внутренний поиск (например, email).
- Специфические запросы: Влияет на широкие информационные и коммерческие запросы, которые возвращают большой или неоднозначный набор результатов, требующий дальнейшего уточнения.
Когда применяется
- Условия работы алгоритма: Алгоритм активируется после выполнения любого поискового запроса, который возвращает набор результатов, содержащий извлекаемые атрибуты.
- Триггеры активации: Генерация фасетов происходит автоматически («without further user input») после генерации начальных результатов.
Пошаговый алгоритм
Процесс А: Обработка запроса в реальном времени
- Генерация начальных результатов: Генерируется начальный набор результатов поиска. Опционально, этот набор может быть ограничен (например, топ-100) для повышения эффективности.
- Генерация кандидатов в фасеты: Система анализирует результаты и предопределенный список операторов. Генерируются все применимые фасеты (например, для оператора brand: генерируется фасет для каждого уникального бренда в результатах).
- Определение характеристик фасетов: Для каждого кандидата определяется, какие Facet Characteristics к нему применимы. Создается вектор характеристик (Characteristic Vector).
- Ранжирование кандидатов: Кандидаты ранжируются на основе:
- Селективности: Вычисляется, насколько равномерно фасет разделяет набор результатов. В описании патента приводится пример формулы: abs(N_T/2 — N_F), где N_T – общее число результатов, N_F – число результатов, соответствующих фасету.
- Взвешенных характеристиках: Рейтинг вычисляется на основе векторов характеристик и предопределенных весов (Weights for Facet Characteristics).
- Выбор представленных фасетов: Выбирается подмножество кандидатов с наивысшим рейтингом (Presentation Facets).
- Отображение: Представленные фасеты отображаются пользователю вместе с результатами поиска.
- Уточнение (Действие пользователя): Если пользователь выбирает фасет, генерируется пересмотренный запрос и новый набор результатов. Процесс повторяется с шага 2.
Процесс Б: Офлайн-обучение весов (Подразумевается)
- Сбор данных: Система регистрирует, какие фасеты пользователи выбирают в различных контекстах (Historical Popularity).
- Машинное обучение: Используются методы машинного обучения для корректировки весов Facet Characteristics, чтобы модель лучше предсказывала реальное поведение пользователей.
Какие данные и как использует
Данные на входе
- Контентные и Структурные факторы (из результатов поиска): Используются для генерации кандидатов в фасеты. Это атрибуты и метаданные объектов в выдаче. Например, в eCommerce это атрибуты товаров (бренд, размер, цена, цвет). В Email – поля заголовков (To, From, Date).
- Поведенческие факторы (Исторические данные): Журналы поисковых запросов и история выбора фасетов (индивидуальная или агрегированная). Используются для определения популярности фасетов и расчета весов для Facet Characteristics.
Какие метрики используются и как они считаются
- Selectivity (Селективность): Метрика, измеряющая равномерность разделения результатов (идеально 50/50).
- Facet Characteristic Weights (Веса характеристик фасетов): Числовые значения, присвоенные различным характеристикам фасетов, определенные с помощью машинного обучения.
- Historical Popularity (Историческая популярность): Патент описывает три подхода к измерению популярности:
- By facet: Общее количество использований фасета в истории.
- By terms in search query: Количество раз, когда фасет использовался вместе со всеми терминами текущего запроса в предыдущих запросах.
- By exact query: Количество раз, когда текущий запрос плюс фасет точно совпадали с предыдущим запросом.
- Facet Characteristics (Характеристики фасета): Помимо популярности и селективности, патент упоминает характеристики, основанные на типе оператора (например, to: может быть важнее cc:) и типе операнда (например, имя человека или домен).
Выводы
- Активное руководство поисковой сессией: Google не просто предоставляет результаты, но и активно направляет пользователя, предлагая оптимальные пути сужения выдачи (Query Refinement).
- Математическое определение «полезности» уточнения: Патент определяет полезность фасета двумя способами: структурно (через селективность) и поведенчески (через историческую популярность).
- Приоритет селективности для максимального прироста информации: Ключевым фактором ранжирования фасетов является селективность — предпочтение отдается фасетам, которые равномерно делят результаты (50/50). Это максимизирует количество информации, получаемой пользователем за один клик.
- Машинное обучение для оптимизации предложений: Система использует исторические данные о поведении пользователей для обучения модели весов (Facet Characteristic Weights). Это позволяет адаптировать предложения под реальные потребности пользователей.
- Зависимость от структурированных данных: Эффективность системы напрямую зависит от наличия и качества структурированных данных или метаданных в результатах поиска, из которых можно извлечь значимые фасеты (атрибуты, категории, типы).
Практика
Best practices (это мы делаем)
Оптимизация под вертикальный поиск Google (Shopping, Images, Jobs и т.д.):
- Максимальное использование структурированных данных (Schema.org): Внедряйте подробную микроразметку и используйте товарные фиды. Это позволяет поисковым системам извлекать значимые атрибуты вашего контента (цена, бренд, цвет, размер, автор), которые могут быть использованы в качестве фасетов.
- Обеспечение чистоты и консистентности данных: Убедитесь, что атрибуты заполнены точно и единообразно (например, используйте один формат для размеров и цветов). Это повышает вероятность того, что система сможет сгенерировать чистые фасеты, связанные с вашим сайтом.
- Анализ популярных атрибутов в нише: Изучайте, какие фасеты Google предлагает в вашей нише. Это указывает на атрибуты, которые система считает важными (популярными и селективными). Убедитесь, что эти атрибуты присутствуют в ваших данных.
Оптимизация внутреннего поиска на сайте (On-Site UX):
- Внедрение логики селективности: Применяйте логику патента для улучшения фасетной навигации на своем сайте. Ранжируйте фильтры динамически, отдавая предпочтение тем, которые наиболее эффективно сужают текущую выборку товаров.
- Использование данных о популярности: Отслеживайте, какие фильтры пользователи используют чаще всего, и поднимайте их выше в интерфейсе.
Worst practices (это делать не надо)
- Игнорирование структурированных данных: Отсутствие микроразметки или неполные фиды снижают способность Google извлекать атрибуты контента, уменьшая видимость сайта при использовании фасетного поиска или фильтров в выдаче.
- Неконсистентное заполнение атрибутов: Использование разных форматов или названий для одних и тех же атрибутов затрудняет агрегацию данных и генерацию полезных фасетов.
- Статическое ранжирование фильтров на сайте: Отображение фильтров в алфавитном порядке или показ фасетов с низкой селективностью (которые почти не меняют выдачу) ухудшает UX вашего сайта.
Стратегическое значение
Патент подтверждает важность структурированных данных не только для формирования расширенных сниппетов, но и для обеспечения навигации и уточнения запросов в поиске. Для SEO-стратегии, особенно в eCommerce и вертикалях, это означает, что необходимо уделять внимание тому, насколько хорошо контент структурирован для ответа на последующие уточняющие запросы. Также патент дает четкую методологию для улучшения UX внутреннего поиска на сайте.
Практические примеры
Сценарий: Оптимизация карточки товара в eCommerce для Google Shopping
- Ситуация: Пользователь ищет «кроссовки Nike Air Max». В выдаче Google Shopping много результатов.
- Работа алгоритма: Google анализирует результаты. Он видит, что результаты можно разделить по размеру, цвету и цене. Алгоритм рассчитывает селективность: разделение по размеру дает наиболее равномерное распределение. Также проверяется историческая популярность: фильтр по размеру используется очень часто.
- Предложение фасетов: Google отображает фильтры по размеру на первом месте в интерфейсе.
- Действия SEO-специалиста: Убедиться, что для всех кроссовок на сайте внедрена микроразметка Product и товарный фид с четко и консистентно указанными атрибутами size, color и price.
- Ожидаемый результат: Товары сайта корректно обрабатываются фильтрами Google. Пользователи, уточняющие свой запрос по размеру, видят релевантные предложения сайта, что увеличивает качественный трафик.
Вопросы и ответы
Влияет ли этот патент на алгоритмы ранжирования основного поиска Google?
Нет, напрямую не влияет. Патент описывает механизм генерации и ранжирования предложений по уточнению запроса (фасетов) после того, как первоначальная выдача уже сформирована. Это алгоритм уровня пользовательского интерфейса и управления поисковой сессией, а не ранжирования документов.
Что такое «селективность» (Selectivity) и почему она так важна в этом патенте?
Селективность — это мера того, насколько равномерно фасет разделяет текущий набор результатов поиска. Фасет, который делит 100 результатов на две группы по 50, имеет идеальную селективность. Google отдает приоритет высокой селективности, так как это максимизирует количество информации, которую пользователь получает одним кликом, и наиболее эффективно сужает поиск.
Как Google определяет, какие фасеты предложить пользователю?
Система автоматически анализирует атрибуты в текущих результатах поиска и генерирует кандидатов. Затем она ранжирует их на основе комбинации селективности (равномерности разделения) и исторической популярности (как часто пользователи выбирали этот фасет в прошлом). Пользователю показываются только топовые варианты.
Что такое «Характеристики фасета» (Facet Characteristics)?
Это предопределенные свойства, используемые для оценки полезности фасета. Патент делит их на три категории: 1) Историческая популярность; 2) Влияние на результаты (например, селективность); 3) Внутренние свойства (например, тип оператора brand: или тип значения «название компании»).
Использует ли Google машинное обучение в этом процессе?
Да. Патент указывает, что веса (weights), присваиваемые различным Facet Characteristics, основаны на исторической популярности. Упоминается использование машинного обучения для корректировки этих весов на основе реальных данных о выборе пользователей, чтобы улучшить качество предложений.
Как SEO-специалист может повлиять на фасеты, которые показывает Google в вертикальном поиске (например, Shopping)?
Напрямую контролировать генерацию фасетов нельзя, но можно оптимизировать контент для лучшего их извлечения. Ключевое действие – внедрение максимально подробных и чистых структурированных данных (Schema.org, фиды). Это позволяет Google точно определять атрибуты вашего контента, которые затем могут использоваться как фасеты.
Применяется ли этот патент только к поиску по email?
Нет. Хотя большинство примеров в патенте относятся к поиску по email (Gmail), в тексте и Формуле изобретения (Claim 6) явно указано, что метод также применим к поиску спецификаций продуктов и информации о характеристиках продуктов. Это делает его актуальным для eCommerce.
Как этот патент помогает в оптимизации внутреннего поиска на моем сайте?
Он предоставляет проверенную методологию для улучшения UX фасетной навигации. Вместо отображения фильтров в алфавитном порядке, ранжируйте их динамически на основе селективности (какие фильтры лучше всего сужают текущую выборку) и данных о поведении ваших пользователей (какие фильтры используются чаще).
Может ли система предложить фасет, которого нет в текущих результатах?
Нет. Согласно патенту, кандидаты в фасеты генерируются на основе начального набора результатов поиска. Если в результатах нет товаров определенного бренда, то фасет по этому бренду сгенерирован не будет.
Учитывает ли система персональную историю поиска при предложении фасетов?
Да. В патенте указано, что Facet Characteristics могут основываться на исторической активности как отдельного пользователя, так и сообщества пользователей. Если пользователь часто использует определенный фасет, он будет иметь больший вес при ранжировании предложений для этого пользователя.