Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске

Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).

Описание

Какую задачу решает

Патент решает проблему неоптимального представления результатов поиска, когда стандартный ранжированный список содержит смесь различных типов контента (например, веб-страницы, новости, видео, изображения). Пользователю, ищущему контент определенного типа, сложно ориентироваться в такой смешанной выдаче. Изобретение улучшает пользовательский опыт, структурируя SERP по категориям.

Что запатентовано

Запатентована система для динамической категоризации и реорганизации результатов поиска (Universal Search). Ключевым элементом является метод оценки и ранжирования самих категорий (вертикалей). Система рассчитывает оценку для каждой категории (Second Score) на основе ожидаемой частоты кликов (Selection Rate или CTR), связанной с позициями, которые занимают результаты этой категории в исходном ранжированном списке. Это позволяет вывести наиболее востребованные категории наверх.

Как это работает

Система работает следующим образом:

Первичное ранжирование: Генерируется стандартный ранжированный список результатов на основе их релевантности и качества (First Score).
Определение Selection Rates: Для каждой позиции в списке определяется ожидаемая частота выбора (Selection Rate, т.е. позиционный CTR). Эти данные берутся из Query Log или оцениваются.
Категоризация: Каждый результат классифицируется по типу (Веб, Новости, Видео и т.д.).
Оценка категорий: Для каждой категории рассчитывается Second Score. Эта оценка базируется на Selection Rates тех позиций, которые занимают топовые результаты данной категории. Если результат категории «Видео» занимает позицию 1 (с высоким CTR), категория «Видео» получает высокий Second Score.
Формирование SERP: Система выбирает лучшие категории на основе Second Scores и формирует итоговую выдачу, где результаты сгруппированы по этим категориям, а сами категории упорядочены.

Актуальность для SEO

Высокая. Механизмы Универсального поиска (Universal Search) и смешивания результатов (Blending) являются фундаментом современной поисковой выдачи Google. Понимание того, как Google выбирает и ранжирует вертикали (Новости, Картинки, Видео и т.д.) на основе ожидаемого вовлечения пользователя (Selection Rate), остается критически важным принципом организации SERP.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO-стратегии, особенно в контексте Universal Search. Он раскрывает механизм, определяющий видимость различных типов контента. Ключевой вывод: для обеспечения видимости категории (например, блока Видео) необходимо, чтобы контент этой категории занял высокие позиции в первичном смешанном ранжировании. Именно высокие позиции обеспечивают высокий Selection Rate, который повышает оценку всей категории.

Детальный разбор

Термины и определения

Categories (Категории): Типы контента или вертикали поиска. Примеры из патента: Web (Веб), Blog (Блоги), Video (Видео), News (Новости), Image (Изображения), Site (Сайты), Forum (Форумы).
First Score (Первая оценка): Исходная оценка ранжирования результата, основанная на релевантности запросу и/или качестве документа. Определяет позицию в первичном ранжированном списке.
Query Log (Журнал запросов): Хранилище исторических данных о запросах и поведении пользователей. Используется для определения Selection Rates.
Ranked list of search results (Ранжированный список результатов): Исходный список результатов, упорядоченный по First Scores, до применения категоризации.
Second Score (Вторая оценка / Оценка категории): Оценка, присваиваемая категории. Рассчитывается на основе Selection Rates результатов этой категории. Определяет порядок категорий в итоговой выдаче.
Selection Rate (Частота выбора / CTR): Метрика, отражающая вероятность клика. В контексте патента это преимущественно CTR, привязанный к конкретной позиции в ранжированном списке (позиционный CTR). Может быть фактической (Actual) или оценочной (Estimated).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод категоризации результатов поиска.

Система получает запрос и идентифицирует результаты с First Scores.
Результаты ранжируются по First Scores, формируя список, где каждый результат имеет позицию.
Определяется Selection Rate для каждой позиции. Механизм определения: система выборочно получает фактический (actual) Selection Rate из наблюдаемых кликов ИЛИ оценивает (estimated) его, и использует одно из этих значений.
Идентифицируются категории результатов.
Генерируются Second Scores для категорий. Оценка базируется на комбинации (например, среднем, максимальном значении) Selection Rates тех позиций, которые занимают результаты данной категории.
Выбирается набор категорий на основе Second Scores.
Выбираются результаты для этих категорий.
Генерируется итоговый документ с результатами.

Claim 5 (Зависимый): Уточняет процесс фильтрации.

Система может сравнивать First Scores с порогом и удалять результаты с низкой оценкой до генерации Second Scores. Низкокачественные или слаборелевантные результаты не влияют на оценку категорий.

Claim 6 (Зависимый): Уточняет механизм выбора результатов.

Выбор результатов включает выбор всех результатов, связанных с набором топовых позиций в исходном ранжированном списке. Это гарантирует, что наиболее релевантные результаты (Топ-N) будут включены в финальную выдачу, независимо от категоризации.

Claim 7 (Зависимый): Уточняет организацию финального документа.

Система может организовать выдачу так, что первая категория размещается в определенном месте (например, наверху) независимо от ее Second Score. Другие категории размещаются ниже и сортируются на основе их Second Scores. (Например, категория «Web» может быть зафиксирована наверху).

Где и как применяется

Изобретение применяется на финальных стадиях обработки запроса для формирования структуры Универсального поиска (Universal Search).

INDEXING – Индексирование и извлечение признаков
На этом этапе документы могут быть предварительно классифицированы по категориям (Web, News, Video и т.д.). Эта информация сохраняется в индексе.

RANKING – Ранжирование
На этом этапе генерируется первичный ранжированный список (Ranked list). Вычисляются First Scores, которые определяют исходные позиции результатов.

METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Основное применение патента. Система выполняет роль алгоритма смешивания (Blending Algorithm).

Оценка вовлеченности: Система определяет Selection Rates (позиционный CTR) для позиций в ранжированном списке.
Оценка Категорий: Рассчитываются Second Scores для каждой категории на основе Selection Rates ее результатов.
Структурирование: Система определяет, какие категории будут показаны и в каком порядке, формируя смешанный список.

RERANKING – Переранжирование
Происходит финальная реорганизация выдачи из линейного списка в структурированный документ, сгруппированный по категориям.

Входные данные:

Исходный запрос.
Ранжированный список результатов с их First Scores и позициями.
Данные о Selection Rates для позиций (из Query Log).
Информация о категориях для каждого документа.

Выходные данные:

Структурированный документ SERP, где результаты организованы по выбранным категориям.

На что влияет

Типы контента и Вертикали: Напрямую влияет на видимость и позиционирование различных вертикалей поиска (Новости, Картинки, Видео, Товары) в основной выдаче.
Специфические запросы: Наибольшее влияние оказывается на запросы с неоднозначным или множественным интентом, где релевантны разные типы контента (например, запрос по названию события, продукта или личности).

Когда применяется

Условия работы: Алгоритм применяется, когда в первичном ранжированном списке присутствуют результаты, относящиеся к разным категориям (вертикалям).
Опции пользователя: Патент предусматривает возможность для пользователя включить или отключить эту функцию группировки («Remove clustering» / «Cluster results»).

Пошаговый алгоритм

Процесс обработки запроса и категоризации результатов:

Получение запроса и первичное ранжирование: Идентифицируются релевантные документы, рассчитываются First Scores, и формируется исходный ранжированный список (Ranked list).
Определение Selection Rates: Для каждой позиции в списке определяется Selection Rate (позиционный CTR). Система использует фактические данные из Query Log или оценочные (прогнозные) значения.
Классификация результатов: Каждый результат ассоциируется с категорией (Web, News, Video и т.д.).
Фильтрация (Опционально, Claim 5): Результаты с First Score ниже порога могут быть удалены из рассмотрения.
Расчет Category Scores (Second Scores): Для каждой категории рассчитывается оценка. Оценка является функцией от Selection Rates позиций, которые занимают результаты этой категории (например, максимальное значение или среднее Топ-X значений).
Выбор категорий: Выбираются категории для отображения (например, Топ-T категорий с наивысшими Second Scores).
Выбор результатов для категорий: Для выбранных категорий отбираются результаты. Система может гарантировать включение Топ-A результатов из исходного списка (Claim 6).
Генерация SERP: Формируется финальный документ. Категории сортируются на основе их Second Scores, хотя одна категория может быть зафиксирована наверху независимо от оценки (Claim 7). Результаты внутри категории сортируются по First Scores.
Представление: Документ отправляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на организации выдачи и использует следующие типы данных:

Поведенческие факторы (Критически важные): Исторические данные о кликах из Query Log. Эти данные используются для определения Selection Rate (CTR) для конкретных позиций в выдаче.
Системные данные: First Scores (оценки ранжирования) и позиции результатов, полученные от основной системы ранжирования.
Данные о контенте (Классификация): Информация для определения категории документа. Упоминаются анализ контента, метаданных, URL (например, сравнение с регулярными выражениями) или типа файла.

Какие метрики используются и как они считаются

Selection Rate (Частота выбора / Позиционный CTR): Вероятность клика на определенную позицию. Может быть фактической (Actual) или оценочной (Estimated). Патент приводит примеры оценочных значений: 37.3% для поз. 1; 12.9% для поз. 2 и т.д. Система может использовать максимум или среднее из фактического и оценочного значений.
Second Score (Category Score): Оценка важности категории. Рассчитывается как функция от Selection Rates позиций, занятых результатами категории. Возможные функции:
- Максимальный Selection Rate среди результатов категории.
- Среднее или взвешенное среднее значение Топ-X Selection Rates результатов категории.
Пороги и Параметры: Порог для First Score (для фильтрации), количество выбираемых категорий (T), количество гарантированно включаемых топовых результатов (A).

Выводы

Структура SERP определяется ожидаемым поведением пользователей: Ключевой механизм патента — использование позиционного Selection Rate (ожидаемого CTR) для оценки и ранжирования целых категорий контента (вертикалей). Google определяет структуру Универсального поиска, прогнозируя, на что пользователи вероятнее всего кликнут.
Важность первичного ранжирования (First Score): Чтобы категория получила высокий Second Score и была показана высоко, ее результаты сначала должны занять высокие позиции в первичном смешанном ранжировании. Высокий First Score приводит к высокой позиции, что дает высокий Selection Rate.
Позиционный CTR как фактор ранжирования вертикалей: Система использует CTR позиции для определения важности категории. Занятие позиции 1 результатом из категории «Новости» значительно повышает шансы блока Новостей занять верхнюю позицию среди других блоков.
Гибкость представления (Blending Logic): Система не обязана строго следовать ранжированию по Second Score. Она может зафиксировать определенную категорию (например, «Web») наверху независимо от ее оценки (Claim 7).
Гарантия качества и релевантности: Система включает механизмы фильтрации низкокачественных результатов (по First Score, Claim 5) и гарантирует показ наиболее релевантных результатов из топа исходного списка (Claim 6).

Практика

Best practices (это мы делаем)

Оптимизация под общий поиск (General Ranking): Ключевая стратегия. Ваш контент (будь то видео, новость или статья) должен хорошо ранжироваться в общем поиске (иметь высокий First Score). Высокая позиция в общем ранжировании обеспечивает высокий Selection Rate, что повышает Second Score вашей категории и гарантирует ее видимость в итоговой структурированной выдаче.
Цельтесь в Топ-3 для активации вертикали: Поскольку Selection Rate экспоненциально падает с понижением позиции, критически важно занимать самые верхние места (Топ-1-3). Это значительно увеличивает вероятность того, что ваша категория будет показана и займет высокое место в SERP.
Анализ структуры SERP и интента: Анализируйте, какие категории (вертикали) Google считает важными для целевых запросов. Если для запроса категория «Видео» часто имеет высокий Second Score и отображается наверху, необходимо инвестировать в создание конкурентоспособного видеоконтента.
Создание разнообразного контента (Content Diversity): Разрабатывайте стратегию, охватывающую разные форматы. Если по запросу релевантны разные типы контента, наличие оптимизированных активов в разных вертикалях повышает общую видимость бренда.

Worst practices (это делать не надо)

Игнорирование общего ранжирования при работе с вертикалями: Полагаться только на то, что контент попадет в специфическую вертикаль (например, Google News) и будет показан автоматически. Если ваша новость не конкурентоспособна в общем ранжировании, ее позиционный Selection Rate будет низким, и блок Новостей может не появиться.
Фокус только на текстовом контенте в широких тематиках: Если интент запроса широкий, фокус только на статьях (категория Web) может привести к потере видимости, так как категории Video или Image могут получить более высокие Second Scores и занять более выгодные позиции.
Создание контента низкого качества: Контент с низким First Score может быть отфильтрован (Claim 5) еще до этапа категоризации и не будет способствовать видимости вашего сайта.

Стратегическое значение

Этот патент подтверждает, что Google активно использует данные о поведении пользователей (или их моделирование) для формирования структуры поисковой выдачи. Universal Search — это динамическая система, которая стремится вывести наверх тот тип контента, который с наибольшей вероятностью заинтересует пользователя. Стратегически это подчеркивает необходимость целостного подхода к SEO, объединяющего достижение высоких оценок релевантности (First Scores) и оптимизацию пользовательского опыта (Selection Rates).

Практические примеры

Сценарий: Определение приоритета категорий для запроса «Обзор iPhone 16»

Исходное ранжирование (Предположение) и Selection Rates:
Поз. 1 (SR 35%): Новость о дате выхода (Категория: News)
Поз. 2 (SR 15%): Видео-тизер (Категория: Video)
Поз. 3 (SR 10%): Статья на TechCrunch (Категория: Web)
Поз. 4 (SR 8%): Новость о характеристиках (Категория: News)
Расчет Category Scores (Second Scores) (Упрощенно, используя максимальный SR):
News Score: 35% (из-за Поз. 1)
Video Score: 15% (из-за Поз. 2)
Web Score: 10% (из-за Поз. 3)
Формирование SERP: Система организует выдачу, располагая категории на основе их оценок.
1. Блок «Новости» (включает результаты с Поз. 1 и 4).
2. Блок «Видео» (включает результат с Поз. 2).
3. Блок «Веб» (включает результат с Поз. 3).
Вывод для SEO: Для этого запроса новостной и видеоконтент имеют приоритет. Стратегия должна фокусироваться на создании контента, способного занять Топ-позиции в смешанном поиске для попадания в эти блоки.

Вопросы и ответы

Что такое «First Score» и «Second Score»?

First Score — это стандартная оценка ранжирования документа (релевантность и качество), определяющая его позицию в первичном смешанном списке. Second Score — это оценка, присваиваемая целой категории контента (например, «Новости» или «Видео»). Она определяет важность и позицию самой категории (блока) на финальной странице выдачи.

Что такое «Selection Rate» в контексте этого патента?

Это частота выбора или ожидаемый CTR. Важно, что для оценки категорий используется Selection Rate, привязанный к позиции в выдаче (позиционный CTR), а не CTR конкретного документа. Система определяет, как часто пользователи кликают на позицию №1, №2 и т.д., и использует эти данные.

Как именно рассчитывается «Second Score» (оценка категории)?

Она рассчитывается на основе Selection Rates тех позиций, которые занимают результаты данной категории. Если результат категории занимает позицию №1 (с высоким CTR), это значительно повышает Second Score категории. Патент предлагает использовать комбинацию этих Selection Rates, например, максимальное значение или среднее значение Топ-X результатов категории.

Откуда система берет данные о «Selection Rate»?

Эти данные берутся из Query Log. Система может использовать фактические (Actual) данные о кликах для данного запроса или использовать прогнозные (Estimated) значения, основанные на общих трендах. Также может использоваться комбинация этих значений.

Заменяет ли этот механизм стандартное ранжирование?

Нет, он дополняет его. Сначала происходит стандартное ранжирование на основе First Score. Затем описанный механизм используется для перегруппировки и организации финальной страницы выдачи (SERP). Это механизм смешивания (Blending) в рамках Универсального Поиска.

Как этот патент влияет на стратегию оптимизации под Google Images или Google Video?

Он подчеркивает, что для доминирования в блоках изображений или видео в основной выдаче ваш контент должен быть конкурентоспособен в общем поиске. Необходимо добиться высокого First Score, чтобы занять высокие позиции в исходном смешанном ранжировании. Это повысит Second Score соответствующей категории.

Может ли низкокачественный контент повлиять на оценку категории?

Патент предусматривает механизм фильтрации (Claim 5). Результаты с First Score ниже определенного порога могут быть исключены до расчета Second Scores. Таким образом, низкокачественный контент не должен влиять на оценку и видимость категории.

Всегда ли категория с наивысшим «Second Score» будет наверху выдачи?

Не обязательно. Патент (Claim 7) описывает возможность зафиксировать определенную категорию (например, стандартные веб-результаты) на определенной позиции (например, наверху) независимо от ее Second Score. Остальные категории будут ранжироваться ниже.

Как гарантировать, что мой результат попадет в финальную выдачу?

Необходимо иметь высокий First Score. Патент (Claim 6) упоминает механизм, который гарантирует включение Топ-N результатов из первичного ранжированного списка в финальную выдачу, даже после категоризации. Фокус на качестве и релевантности остается первостепенным.

Как система определяет категорию документа?

Патент упоминает несколько методов. Это может быть поиск информации о категории в индексе или использование классификаторов на лету, которые анализируют контент, метаданные, URL (включая сопоставление с регулярными выражениями) или тип файла документа.