Как Google динамически ранжирует вертикали поиска (Веб, Картинки, Новости, Карты) на основе прогнозируемого интента и контекста

Google использует систему для определения наиболее релевантной категории контента (вертикали поиска) для запроса. Анализируя текст запроса, агрегированные данные о поведении, индивидуальные профили и тип устройства (мобильный/десктоп), система вычисляет «значение вероятности» для каждой категории. Результаты упорядочиваются так, чтобы наиболее релевантная категория отображалась первой, оптимизируя выдачу.

Описание

Какую задачу решает

Патент решает проблему эффективности поиска, особенно критичную для мобильных устройств с ограниченным экраном и вводом. Если категория результатов по умолчанию (например, Веб) не соответствует намерению пользователя, ему неудобно переключаться на нужную вертикаль (например, Карты или Картинки). Система стремится автоматически определить интент и показать наиболее подходящую категорию первой, минимизируя усилия пользователя.

Что запатентовано

Запатентована система и метод для динамического упорядочивания category-directed result sets (категоризированных наборов результатов или вертикалей поиска). Суть изобретения — механизм определения порядка отображения этих категорий на основе предсказанной релевантности для данного запроса, пользователя и контекста. Это основополагающий патент для технологии Универсального Поиска (Universal Search).

Как это работает

Система работает следующим образом:

Генерация результатов: Поисковая система получает запрос и генерирует несколько наборов результатов из разных индексов (категорий).
Расчет релевантности категорий: Система вычисляет likelihood value (значение вероятности) для каждой категории. Этот расчет учитывает агрегированные данные о том, какие категории выбирают пользователи по схожим запросам (Relevance Data), индивидуальный профиль пользователя (Profile Database) и тип устройства (мобильное/десктоп).
Упорядочивание и отображение: Категории сортируются по этому значению. Результаты форматируются (например, в виде вкладок, вертикальных панелей или OneBox) и передаются пользователю, при этом категория с наивысшим likelihood value отображается первой или наиболее заметно.

Актуальность для SEO

Высокая. Хотя патент имеет приоритет от 2007 года, описанная концепция определения наиболее релевантного типа контента остается ядром современного поиска Google. Механизмы предсказания интента и выбора вертикалей (Images, Video, Shopping, Local) постоянно развиваются, но базируются на принципах этого патента. Это критически важно для понимания структуры SERP.

Важность для SEO

Патент имеет высокое стратегическое значение (85/100). Он объясняет механизм, посредством которого Google решает, какой тип контента (и, следовательно, какая вертикаль) получит приоритет в выдаче. Для SEO-специалистов это означает необходимость понимать, к какой категории Google относит их ключевые запросы, и оптимизировать контент под соответствующую вертикаль для достижения максимальной видимости.

Детальный разбор

Термины и определения

Category-directed result sets (Категоризированные наборы результатов): Наборы результатов поиска, полученные из определенного корпуса или индекса (вертикали), такого как Веб, Изображения, Новости, Карты, Видео, Покупки и т.д.
Likelihood Value (Значение вероятности): Рассчитанная оценка, представляющая вероятность того, что конкретная категория результатов соответствует намерению пользователя для данного запроса.
Location Indicia (Индикатор локальности): Значение или индикатор, показывающий, насколько тесно запрос коррелирует с локальным поиском.
MDIST / NMDIST (Mobile/Non-Mobile Distribution): Сегменты глобальной статистики, используемые в расчетах. MDIST — статистика для запросов с мобильных устройств. NMDIST — статистика для немобильных (десктопных) устройств.
One Box: Специальный формат отображения результатов, который предоставляет структурированную сводку или прямой ответ (например, погода, локальный поиск), часто в виде единого блока.
Profile Manager / Profile Database (Менеджер профилей / База данных профилей): Компоненты, которые хранят и управляют профилями пользователей, отслеживая, какие категории информации пользователь предпочитает или часто ищет.
Relevance Filter / Relevance Data (Фильтр релевантности / Данные о релевантности): Компонент, который хранит данные (например, статистические распределения или правила ML) о корреляции между запросами и категориями информации, основанные на агрегированном поведении пользователей.
Response Formatter (Форматировщик ответа): Компонент, который определяет порядок категорий на основе профиля и данных о релевантности, а затем форматирует результаты для отображения.
Whitelist/Blacklist (Белый/Черный список): Списки запросов или терминов, используемые для определения локального интента. Белый список содержит термины с высокой корреляцией с локальным поиском, черный — с низкой.

Ключевые утверждения (Анализ Claims)

Анализ основан на Claims, представленных в патенте US12019664B2 (выданном в 2024 году как продолжение более ранних заявок).

Claim 1 (Независимый пункт): Описывает метод предоставления результатов поиска в структурированном пользовательском интерфейсе (UI).

Система получает поисковый запрос от удаленного устройства.
Генерируются несколько различных category-directed result sets (например, первый и второй наборы из разных категорий).
Определяется порядок для этих наборов на основе поискового запроса.
Система передает код для генерации UI.
UI включает: (i) сводку (summary), связанную с одним или несколькими наборами результатов; (ii) отображение наборов результатов в определенном порядке; (iii) первый набор отображается в первой вертикально выровненной панели (first vertically aligned panel); (iv) второй набор отображается во второй панели (second panel).

Ядро Claim 1 в этой версии патента фокусируется не только на выборе порядка, но и на специфическом способе отображения в UI (сводки, вертикальные панели). Это описывает архитектуру модульной SERP.

Claim 3 (Зависимый от 1): Детализирует механизм определения порядка.

Для каждого набора вычисляется likelihood value.
Вычисление включает получение данных, связанных с другими похожими запросами от других устройств (использование агрегированной статистики).
Наборы упорядочиваются на основе этих значений.

Claim 4 и 5 (Зависимые от 3): Уточняют данные для расчета.

Данные включают распределение (distribution) корреляций между похожими запросами и категориями. Это распределение может быть разбито на суб-распределения (sub-distributions) на основе контекста: типа/модели устройства, географии или времени суток.

Claim 6 и 7 (Зависимые от 1): Описывают интерактивность UI.

При выборе элемента в вертикальной панели она расширяется (expand) для показа дополнительной информации и может сворачиваться (collapse) при повторном выборе. Это описывает поведение интерактивных модулей в выдаче.

Где и как применяется

Изобретение является ключевой частью этапа формирования поисковой выдачи, интегрируя данные из этапов понимания запроса и ранжирования.

QUNDERSTANDING – Понимание Запросов
На этом этапе система анализирует запрос, чтобы предсказать релевантность категорий (вертикалей). Используется Relevance Filter и данные машинного обучения для определения статистической связи между терминами запроса и категориями (например, расчет Location Indicia). В офлайн-режиме анализируются логи для обучения Relevance Filter.

RANKING – Ранжирование
Параллельно запускается поиск в различных индексах (Web, Images, News и т.д.) для генерации category-directed result sets.

METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Это основной этап применения патента. Response Formatter выполняет следующие действия:

Сбор данных: Запрашивает данные из Profile Manager (история пользователя) и Relevance Filter (агрегированные данные по запросу).
Расчет порядка: Вычисляет Likelihood Value для каждой категории, используя взвешенную комбинацию профиля, статистики и контекста устройства.
Формирование SERP: Определяет итоговый порядок категорий и форматирует выдачу (панели, вкладки, OneBox).

Входные данные:

Поисковый запрос.
Идентификатор пользователя/устройства (для доступа к профилю).
Контекст (Тип устройства, местоположение, время).
Сгенерированные наборы результатов из разных категорий.
Данные из Relevance Filter и Profile Database.

Выходные данные:

Код для генерации UI, форматирующий результаты в определенном порядке (упорядоченный набор категорий).

На что влияет

Специфические запросы: Наибольшее влияние на неоднозначные запросы, где интент может относиться к разным категориям (например, запрос [apple]).
Мобильные устройства: Патент особо подчеркивает важность механизма для мобильного поиска, где правильный выбор первой категории критичен.
Локальный поиск: Детально описаны механизмы определения локального интента (FIG 7A, 7B) и форматирования локальных результатов (Local OneBox).

Когда применяется

Алгоритм применяется при обработке большинства поисковых запросов, для которых доступно более одной категории релевантных результатов.

Условия активации: Всегда, когда система должна решить, в каком порядке отображать результаты из разных вертикалей.
Триггеры для специфических форматов: Активация OneBox происходит при высокой уверенности в интенте. Активация локального поиска происходит при высоком Location Indicia или наличии явных сигналов местоположения.

Пошаговый алгоритм

Процесс А: Упорядочивание категорий (Общий процесс, на основе FIG. 5)

Получение запроса: Запрос принимается от устройства.
Выполнение поиска: Запрос выполняется параллельно в нескольких индексах для генерации category-directed result sets.
Сбор контекстных данных: Response Formatter запрашивает профиль пользователя у Profile Manager и глобальные данные о релевантности (включая распределения для мобильных/десктопных устройств) у Relevance Filter.
Расчет релевантности категорий: Для каждой категории вычисляется Likelihood Value. Используется взвешенная комбинация профиля и глобальных данных (Equation 1 в патенте).
Фильтрация и Корректировка (Опционально): Если глобальные данные показывают нулевую корреляцию запроса с категорией, Likelihood Value может быть обнулено. Также может учитываться качество результатов внутри категории.
Упорядочивание: Категории сортируются по убыванию Likelihood Value.
Форматирование и передача: Response Formatter форматирует результаты (например, в виде панелей или вкладок) и передает код UI на устройство.

Процесс Б: Определение локального интента (Специфический процесс, FIG 7A/B)

Анализ запроса на наличие локации: Проверка явных указателей (ZIP-код, город).
Проверка дефолтной локации: Если явных указателей нет, проверяется сохраненная локация пользователя.
Генерация индикатора локальности: Рассчитывается Location Indicia (вероятность локального интента). Используются «белые» и «черные» списки запросов (сформированные офлайн путем анализа логов веб и локального поиска) или правила ML.
Принятие решения: Location Indicia используется для определения позиции локальных результатов относительно других категорий и выбора формата (например, Local OneBox).

Какие данные и как использует

Данные на входе

Система использует комбинацию данных о запросе, пользователе и агрегированном поведении.

Поведенческие факторы (Агрегированные): Журналы запросов (Query Logs) и действия пользователей (клики на категории/вкладки). Эти данные используются для обучения ML-моделей и создания Relevance Data (глобальной статистики).
Поведенческие факторы (Индивидуальные): Данные из Profile Database. История того, какие категории предпочитает конкретный пользователь.
Контентные факторы (Запрос): Текст запроса. Анализируются термины для определения корреляции с категориями, в том числе с использованием белых/черных списков.
Пользовательские факторы (Контекст и Устройство): Тип устройства (мобильное/десктоп), модель устройства. Используется для выбора соответствующего суб-распределения статистики (MDIST/NMDIST).
Географические и Временные факторы: Местоположение (явное, дефолтное или предполагаемое) и время суток также могут использоваться для сегментации статистики.

Какие метрики используются и как они считаются

Likelihood Value (Значение вероятности): Основная метрика для упорядочивания категорий.
Формула расчета (Equation 1): Патент предлагает формулу взвешенной суммы:
LIKELIHOOD = W1*PROFILE + W2*NMDIST + W3*MDIST.
Где PROFILE — оценка из профиля пользователя, NMDIST/MDIST — глобальные оценки для десктопных/мобильных устройств, W1/W2/W3 — весовые коэффициенты (Weighting Factors).
Location Indicia (Индикатор локальности): Метрика вероятности локального интента. Рассчитывается на основе списков или ML-классификатора.
Машинное обучение: Упоминается использование ML для анализа тренировочных данных (логи запросов) и генерации правил/оценок в Relevance Filter. ML определяет корреляции между признаками запроса и категориями.
Качество результатов: Упоминается, что порядок категорий может зависеть от качества результатов внутри категории (например, по количеству релевантных документов или их оценкам).

Выводы

Ранжирование вертикалей как ключевой этап поиска: Google рассматривает выбор правильной вертикали (категории) как критически важную задачу ранжирования. Порядок отображения вертикалей (Web, Images, News, Maps) динамичен и основан на предсказании интента.
Многофакторная модель предсказания: Система использует сложную взвешенную модель, комбинирующую агрегированное поведение пользователей (Global Distribution), индивидуальные профили (User Profile) и контекст устройства.
Критичность мобильного контекста: Патент явно выделяет мобильные устройства, используя отдельные статистические модели (MDIST и NMDIST). Это подтверждает, что интент для одного и того же запроса может кардинально отличаться на мобильном и десктопе.
Сложный механизм локального поиска: Существуют детальные механизмы (Location Indicia, белые/черные списки, ML-правила) для определения локального интента, даже без явного указания местоположения, и последующей приоритезации локальных результатов (Local OneBox).
Основа Универсального Поиска: Этот патент описывает фундаментальную логику Универсального Поиска — не просто смешивание результатов, а интеллектуальное ранжирование категорий контента перед их отображением.

Практика

Best practices (это мы делаем)

Анализ интента на уровне вертикали: Необходимо анализировать SERP по целевым запросам на разных устройствах, чтобы определить, какую вертикаль поиска (Веб, Видео, Картинки, Новости, Локальный) Google считает приоритетной. Это определяет тип контента, который нужно создавать и оптимизировать в первую очередь.
Оптимизация под приоритетные вертикали (Vertical Optimization): Фокусируйте усилия на оптимизации под ту вертикаль, которую Google предпочитает. Если приоритет у Видео, необходима Video SEO; если у Картинок — Image SEO.
Усиление локальных сигналов (Local SEO): Поскольку патент уделяет большое внимание механизмам определения Local Search (особенно на мобильных), критически важно работать над локальными факторами ранжирования и оптимизацией Google Business Profile для попадания в Local OneBox.
Мультиформатная стратегия контента: Развивайте присутствие в разных вертикалях. Наличие качественного контента в разных форматах увеличивает общую видимость сайта в рамках Универсального Поиска.

Worst practices (это делать не надо)

Игнорирование вертикалей поиска: Фокусироваться исключительно на традиционном веб-поиске («10 синих ссылок»). Если система прогнозирования Google определяет другую категорию как более релевантную, веб-результаты будут понижены.
Оптимизация только под десктоп: Игнорирование мобильного интента. Патент показывает, что Google использует разные модели (MDIST vs NMDIST). Стратегия должна учитывать различия в приоритетных категориях в зависимости от устройства.
Попытки ранжирования в нерелевантной категории: Тратить ресурсы на продвижение контента в вертикали, которую Google считает нерелевантной для данного запроса (низкий Likelihood Value).

Стратегическое значение

Патент подтверждает стратегию Google на переход от списка ссылок к сложной, смешанной выдаче, адаптированной под интент и контекст. Для SEO это означает, что стратегия продвижения должна быть гибкой и ориентированной на тот тип контента (категорию), который система считает наиболее полезным. Ранжирование становится многомерным: нужно не только быть лучшим в своей категории, но и продвигаться в той категории, которую Google ставит на первое место по данному запросу.

Практические примеры

Сценарий 1: Оптимизация для кофейни (Локальный бизнес)

Анализ запроса: SEO-специалист анализирует запрос [кофе рядом] на мобильном устройстве.
Наблюдение и Интерпретация: Google показывает Local OneBox (Карты) первым. Система определила высокий Location Indicia и максимальный Likelihood Value для категории «Local/Maps» на мобильном устройстве (высокий MDIST).
Действия SEO: Фокус смещается с написания статей на оптимизацию Google Business Profile, получение отзывов и обеспечение точности локальных данных для максимизации шансов попадания в Local OneBox.

Сценарий 2: Оптимизация информационного запроса [как выбрать палатку]

Анализ запроса: SEO-специалист анализирует выдачу.
Наблюдение и Интерпретация: Google часто показывает блок Видео перед веб-результатами. Система определила, что Likelihood Value для категории «Video» выше, чем для «Web», так как пользователи предпочитают смотреть обзоры.
Действия SEO: Приоритет отдается созданию качественного видеообзора и его оптимизации на YouTube/сайте, чтобы занять позиции в приоритетной вертикали Видео.

Вопросы и ответы

Как Google определяет, какая категория (Веб, Картинки, Новости) наиболее релевантна запросу?

Система вычисляет Likelihood Value (значение вероятности) для каждой категории. Этот расчет основывается на комбинации факторов: агрегированных данных о том, как пользователи взаимодействовали с похожими запросами в прошлом (Relevance Data), индивидуальном профиле пользователя (User Profile) и контексте (например, тип устройства).

Означает ли этот патент, что персонализация (профиль пользователя) важнее, чем сам запрос?

Не обязательно. Патент описывает механизм взвешивания. Система комбинирует данные профиля с глобальной статистикой по запросу. Веса могут быть настроены так, что глобальная статистика будет доминировать для запросов с ясным интентом, а профиль будет иметь большее влияние для неоднозначных запросов.

Как система определяет, является ли запрос локальным, если в нем нет названия города?

Патент описывает расчет Location Indicia. Это делается с помощью анализа терминов запроса на основе «белых списков» (термины с высокой локальной корреляцией, например, [пицца]) и «черных списков». Также могут использоваться правила машинного обучения и дефолтное местоположение устройства.

Как этот патент связан с Универсальным Поиском (Universal Search)?

Этот патент описывает базовый механизм работы Универсального Поиска. Он объясняет логику, по которой Google решает, какие вертикали включать в выдачу и, что самое важное, в каком порядке их располагать (ранжировать), основываясь на предсказанной релевантности.

Отличается ли обработка запросов для мобильных и десктопных устройств?

Да, отличается значительно. Патент явно разделяет статистические распределения для мобильных (MDIST) и немобильных (NMDIST) устройств. Это позволяет системе учитывать различный интент пользователей в зависимости от контекста устройства (например, более высокая вероятность локального поиска на мобильных).

Что такое OneBox в контексте этого патента?

OneBox – это специальный формат отображения результатов (например, погода, акции, локальный поиск), который предоставляет прямой ответ или структурированную сводку. Патент описывает механизмы для определения того, когда категория достаточно релевантна, чтобы быть показанной в таком приоритетном формате.

Как SEO-специалисту использовать знания из этого патента на практике?

Ключевое применение – это точный анализ интента и определение приоритетной категории для ваших запросов на разных устройствах. Необходимо оптимизировать контент под ту вертикаль (Картинки, Видео, Карты, Веб), которую Google ставит первой. Если вы игнорируете приоритетную категорию, вы теряете видимость.

Использует ли Google машинное обучение для выбора категорий?

Да, в патенте упоминается использование систем машинного обучения для анализа тренировочных данных (логов запросов) и генерации правил или оценок в Relevance Filter. Это позволяет автоматически выявлять корреляции между терминами запроса и категориями результатов.

Влияет ли качество результатов внутри категории на ее позицию среди других категорий?

Да. Патент упоминает, что даже если запрос сильно коррелирует с определенной категорией, эта категория может быть понижена или скрыта, если фактическое качество результатов в ней низкое (например, мало релевантных документов или низкие оценки ранжирования).

Что означают «вертикально выровненные панели» в Claims этого патента?

В Claims этой версии патента (US12019664B2) это относится к способу структурирования UI поисковой выдачи. Это описывает модульную SERP, где результаты разных категорий представлены в отдельных блоках или панелях (например, блок новостей, блок картинок), часто расположенных вертикально друг над другом, которые могут быть интерактивными (расширяться/сворачиваться).