Google анализирует неоднозначный запрос пользователя и создает гипотезы о том, какой корпус (Картинки, Видео и т.д.) может быть релевантен. Для каждой гипотезы запрос переписывается, выполняется поиск и оценивается качество результатов (например, по CTR или авторитетности ресурсов). Если качество достаточно высокое (превышает порог), Google покажет соответствующий вертикальный блок в основной выдаче; если нет – блок будет скрыт.
Описание
Какую задачу решает
Патент решает проблему обработки неоднозначных (ambiguous) или многословных запросов, особенно тех, которые получены через голосовой ввод или обработку естественного языка. В таких запросах часто неясно, какой именно тип контента (Resource Corpus) ищет пользователь. Система устраняет две проблемы: (1) неэффективность поиска по всем доступным корпусам одновременно и (2) негативный пользовательский опыт от показа низкокачественных или нерелевантных результатов из вертикальных поисков (например, блока Картинок низкого качества).
Что запатентовано
Запатентована система для выборочного поиска и отображения результатов из специализированных корпусов (вертикалей). Система генерирует несколько «поисковых гипотез» (search hypotheses) о том, какой корпус может быть интересен пользователю. Для каждой гипотезы исходный запрос переписывается в «запрос гипотезы» (hypothesis search query), оптимизированный под конкретный корпус. Поиск выполняется параллельно, после чего оценивается качество полученных результатов (search hypothesis score). Результаты отображаются только для тех гипотез, чья оценка качества превышает установленный порог (search hypothesis threshold).
Как это работает
Ключевой механизм включает несколько этапов:
- Генерация гипотез: Анализ n-грамм запроса для определения их семантической релевантности к различным типам корпусов (например, Картинки, Видео, Товары).
- Переписывание запроса: Модификация исходного запроса для каждой гипотезы путем удаления нерелевантных слов, добавления или замены терминов (например, замена «покажи» на «картинки»).
- Параллельный поиск: Выполнение поиска переписанными запросами в соответствующих корпусах.
- Оценка гипотез: Определение search hypothesis score для каждого набора результатов. Оценка может базироваться на авторитетности ресурсов ИЛИ на показателях вовлеченности пользователей (например, selection rates/CTR).
- Выборочное отображение: Показ результатов только для тех гипотез, чья оценка качества превышает пороговое значение.
Актуальность для SEO
Высокая. Механизмы смешивания универсальной выдачи (Universal Search blending), обработка голосовых запросов и эффективное определение интента пользователя остаются ключевыми задачами современного поиска. Этот патент описывает конкретный механизм принятия решений о том, когда запускать вертикальный поиск и когда отображать его результаты в основной выдаче.
Важность для SEO
Патент имеет высокое значение для SEO (8.5/10), особенно для стратегий продвижения в вертикальных поисках (Image SEO, Video SEO, Product SEO). Он описывает механизм, который определяет, будет ли контент из вертикали вообще показан в основной поисковой выдаче. Чтобы появиться в SERP, контент должен не только хорошо ранжироваться внутри своей вертикали, но и общий набор результатов должен быть признан достаточно качественным. Критически важно, что патент явно упоминает авторитетность ресурсов и показатели кликабельности (CTR) как метрики для принятия этого решения.
Детальный разбор
Термины и определения
- Hypothesis Evaluator (Оценщик гипотез)
- Компонент системы, который оценивает качество результатов поиска для каждого hypothesis search query, определяет search hypothesis score и применяет порог.
- Hypothesis Generator (Генератор гипотез)
- Компонент системы, который анализирует исходный запрос, определяет потенциально релевантные корпуса (search hypotheses) и генерирует hypothesis search query для каждого из них.
- Hypothesis Search Query (Запрос гипотезы)
- Переписанная версия исходного запроса, оптимизированная для поиска в конкретном корпусе. Может отличаться от исходного запроса путем удаления, добавления или замены терминов.
- Quality Metric Value (Значение метрики качества)
- Показатель, используемый для расчета search hypothesis score. Может основываться на качестве ресурсов (например, авторитетности) или на удовлетворенности пользователей (например, selection rates).
- Resource Corpus (Корпус ресурсов)
- Коллекция ресурсов определенного типа (например, корпус изображений, корпус видео, корпус товаров). Вертикальный индекс.
- Search Hypothesis (Поисковая гипотеза)
- Предположение системы о том, какой тип поиска (Search Type) и соответствующий корпус могут быть релевантны исходному запросу.
- Search Hypothesis Score (Оценка поисковой гипотезы)
- Числовое значение, отражающее качество набора результатов, полученных для конкретной гипотезы. Используется для принятия решения о показе результатов.
- Selection Rate (Показатель выбора/кликабельности)
- Метрика пользовательского поведения (CTR), основанная на частоте выбора результатов поиска пользователями. Упоминается как возможная основа для Quality Metric Value.
- Semantic Relevance (Семантическая релевантность)
- Мера того, насколько n-граммы из запроса соответствуют определенному типу корпуса. Используется на этапе генерации гипотез.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной процесс работы системы.
- Система определяет search hypotheses для входящего запроса. Каждая гипотеза соответствует отдельному Resource Corpus.
- Для каждой гипотезы:
- Генерируется hypothesis search query (переписанный запрос).
- Этот запрос отправляется в поисковый сервис для поиска в соответствующем корпусе.
- На основе полученных данных определяется search hypothesis score.
- Принятие решения:
- Если search hypothesis score соответствует пороговому значению (threshold): результаты поиска предоставляются пользователю.
- Если НЕ соответствует: результаты поиска НЕ предоставляются.
Система выполняет поиск по множеству различных корпусов и генерирует множество оценок для принятия решения о составе выдачи.
Claim 2 (Зависимый от 1): Детализирует процесс определения гипотез.
Гипотезы определяются путем парсинга запроса на n-граммы и оценки Semantic Relevance этих n-грамм к типу поиска (корпусу).
Claim 4 (Зависимый от 1): Уточняет генерацию hypothesis search query.
Сгенерированный запрос гипотезы может содержать n-граммы, отличные от n-грамм исходного запроса (т.е. происходит активное переписывание запроса).
Claim 5 (Зависимый от 1): Определяет способ расчета search hypothesis score.
Оценка поисковой гипотезы определяется путем вычисления Quality Metric Value для результатов поиска.
Claim 6 (Зависимый от 5): Описывает первый вариант расчета Quality Metric Value.
Метрика качества определяется как оценка качества ресурсов (quality score), идентифицированных в результатах поиска. Эта мера качества НЕ зависит от взаимодействий пользователя (например, авторитетность, E-E-A-T).
Claim 7 (Зависимый от 5): Описывает второй вариант расчета Quality Metric Value.
Метрика качества определяется как мера удовлетворенности пользователей (measure of user satisfaction) результатами поиска. Эта мера зависит от взаимодействий пользователей с результатами поиска (например, CTR, selection rates).
Где и как применяется
Изобретение применяется на нескольких ключевых этапах поиска для реализации Универсальной выдачи (Universal Search).
QUNDERSTANDING – Понимание Запросов
На этом этапе работает Hypothesis Generator. Система анализирует исходный запрос, выделяет n-граммы и оценивает их semantic relevance к различным корпусам (Triggering вертикалей). Если релевантность достаточна, генерируются search hypotheses. Затем для каждой гипотезы запрос переписывается (Query Rewriting) в hypothesis search query.
RANKING – Ранжирование
Система запускает параллельные процессы ранжирования. Каждый hypothesis search query отправляется в соответствующий вертикальный поисковый сервис (например, поиск по картинкам, поиск по видео) для генерации предварительных наборов результатов.
METASEARCH – Метапоиск и Смешивание
Основной этап применения патента. Здесь работает Hypothesis Evaluator. Система собирает результаты из вертикалей и вычисляет search hypothesis score для каждого набора.
- Оценка качества: Вычисление Quality Metric Value (на основе авторитетности или CTR).
- Применение порога: Сравнение search hypothesis score с порогом.
- Выборочное смешивание (Blending): Включение в финальную выдачу только тех вертикальных блоков, которые прошли порог качества.
Входные данные:
- Исходный поисковый запрос.
- Данные о семантической релевантности терминов к разным корпусам.
- Предварительно рассчитанные оценки качества ресурсов (авторитетность).
- Данные из логов поиска (Query Logs) и логов выборов (Selection Logs) для расчета CTR.
Выходные данные:
- Набор hypothesis search queries.
- Решение о показе/скрытии результатов для каждой гипотезы (вертикального блока).
- Финальная смешанная страница результатов поиска (SERP).
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы, где интент пользователя неясен (например, [Ягуар] – животное или машина?), а также на многословные запросы, характерные для голосового поиска (Claim 8) и естественного языка.
- Конкретные типы контента: Влияет на видимость контента из вертикальных корпусов (изображения, видео, товары, книги, новости) в основной веб-выдаче (Universal Search).
Когда применяется
- Триггеры активации (Генерация гипотезы): Алгоритм активируется, когда для исходного запроса удается сгенерировать одну или несколько search hypotheses путем анализа семантической релевантности n-грамм запроса (Claim 2).
- Условия отображения результатов: Результаты вертикального поиска отображаются только при условии, что search hypothesis score превышает установленный порог (search hypothesis threshold). Это гарантирует, что в выдачу попадают только качественные результаты из релевантных вертикалей.
Пошаговый алгоритм
Процесс обработки запроса и формирования универсальной выдачи:
- Получение и анализ запроса: Система получает исходный запрос (Q0).
- Генерация гипотез (Hypothesis Generator):
- Выделение n-грамм из запроса.
- Определение семантической релевантности n-грамм к различным типам поиска (Search Types).
- Определение search hypotheses (H1, H2, H3…) для типов поиска с достаточной релевантностью.
- Генерация запросов гипотез (Hypothesis Generator): Для каждой гипотезы генерируется hypothesis search query (Q1, Q2, Q3…). Это включает удаление, добавление или замену терминов для оптимизации под корпус.
- Параллельный поиск: Каждый запрос гипотезы отправляется в соответствующий вертикальный поисковый сервис.
- Получение результатов: Система получает наборы результатов для каждой гипотезы ({R1}, {R2}, {R3}…).
- Оценка гипотез (Hypothesis Evaluator): Для каждого набора результатов вычисляется search hypothesis score.
- Определяется Quality Metric Value. Это может быть оценка авторитетности ресурсов (Claim 6) ИЛИ оценка удовлетворенности пользователей/CTR (Claim 7).
- Применение порогов (Hypothesis Evaluator): Каждый search hypothesis score сравнивается с порогом.
- Формирование выдачи (Blending):
- Если оценка превышает порог: результаты для гипотезы включаются в выдачу (например, показывается блок картинок).
- Если оценка не превышает порог: результаты для гипотезы НЕ включаются в выдачу.
Какие данные и как использует
Данные на входе
- Контентные/Семантические факторы: N-граммы исходного запроса используются для определения semantic relevance к различным корпусам. Также используются базы данных или модели, определяющие, какие термины релевантны для каких типов поиска.
- Факторы качества/авторитетности (независимые от пользователя): Система может использовать предварительно рассчитанные оценки качества ресурсов (quality score), которые не зависят от взаимодействия с пользователем (Claim 6). Это могут быть сигналы авторитетности, аналогичные PageRank или E-E-A-T.
- Поведенческие факторы (зависимые от пользователя): Система может использовать данные об удовлетворенности пользователей (measure of user satisfaction), которые зависят от взаимодействия с результатами (Claim 7). В патенте упоминаются selection rates (показатели кликабельности/CTR), получаемые из Selection Logs.
Какие метрики используются и как они считаются
- Semantic Relevance (Семантическая релевантность): Метрика, определяющая связь между n-граммами запроса и типом корпуса. Используется для генерации гипотез.
- Search Hypothesis Score (Оценка поисковой гипотезы): Ключевая метрика для принятия решения о показе вертикального блока. Рассчитывается на основе Quality Metric Value.
- Quality Metric Value (Значение метрики качества): Агрегированная оценка качества набора результатов для гипотезы. Патент предлагает два основных способа расчета:
- На основе авторитетности (Claim 6): Агрегация оценок качества (quality scores) топовых ресурсов в наборе.
- На основе поведения (Claim 7): Агрегация показателей удовлетворенности пользователей, например, средний selection rate (CTR) топовых результатов.
- Search Hypothesis Threshold (Порог оценки гипотезы): Минимальное значение search hypothesis score, необходимое для отображения результатов. Может быть предопределенным или динамическим.
Выводы
- Механизм запуска вертикального поиска (Triggering): Патент описывает, как Google решает, какие вертикали (Картинки, Видео, Товары) следует задействовать. Это происходит через генерацию Search Hypotheses на основе семантической релевантности запроса.
- Двойной фильтр для Универсального Поиска: Для появления вертикального блока необходимо выполнение двух условий: (1) Запрос должен быть признан релевантным для корпуса (генерация гипотезы), и (2) Качество результатов поиска в этом корпусе должно быть высоким (Search Hypothesis Score выше порога).
- Активное переписывание запросов: Система не использует исходный запрос для поиска в вертикалях, а активно его модифицирует (создает Hypothesis Search Query), удаляя нерелевантные слова или добавляя/заменяя термины для лучшей работы в специфическом корпусе.
- Ключевые метрики качества для показа блоков: Патент явно выделяет два типа метрик для оценки качества вертикальной выдачи: (a) Авторитетность ресурсов и (b) Удовлетворенность пользователей / CTR (selection rates). Это подтверждает важность авторитетности и поведенческих факторов для видимости в Универсальном поиске.
- Обработка неоднозначных и голосовых запросов: Система специально разработана для улучшения обработки запросов, где интент неясен или запрос содержит многословные конструкции, характерные для естественного языка и голосового ввода (Claim 8).
Практика
Best practices (это мы делаем)
- Комплексная оптимизация в вертикалях (Image/Video/Product SEO): Необходимо добиваться высоких позиций внутри специализированных вертикальных поисков. Так как система оценивает качество топовых результатов для расчета search hypothesis score, важно быть в топе вертикали.
- Повышение авторитетности контента и хостов: Поскольку Quality Metric Value может основываться на авторитетности ресурсов (Claim 6), необходимо работать над сигналами качества и E-E-A-T страниц, на которых размещен вертикальный контент (изображения, видео).
- Оптимизация поведенческих факторов (CTR) в вертикалях: Поскольку Quality Metric Value также может основываться на selection rates (Claim 7), критически важно оптимизировать сниппеты в вертикальной выдаче. Создавайте качественные, информативные и привлекательные миниатюры (thumbnails) для изображений и видео для максимизации CTR.
- Анализ семантики и переписанных запросов: Анализируйте, как запросы вашей тематики могут быть переписаны для разных корпусов. Используйте термины, которые повышают semantic relevance к нужной вертикали (например, «видеообзор», «фотогалерея», «инструкция»).
Worst practices (это делать не надо)
- Игнорирование вертикального поиска: Фокусироваться только на основном веб-поиске неэффективно. Если система определяет высокую релевантность и качество в вертикали, соответствующий блок займет значительную часть SERP.
- Использование низкокачественного мультимедиа контента: Размещение нерелевантных или технически некачественных изображений и видео. Низкий Quality Metric Value не позволит результатам пройти пороговый фильтр.
- Размещение качественного вертикального контента на низкокачественных доменах: Если авторитетность ресурса низкая, это снизит Quality Metric Value (Claim 6) и уменьшит вероятность показа блока, даже если само изображение или видео релевантно.
Стратегическое значение
Патент подтверждает, что Универсальная выдача Google является динамической и основанной на качестве. Решение о показе вертикальных блоков принимается на лету и зависит от того, насколько хорошо контент в этой вертикали удовлетворяет предполагаемому интенту пользователя. Стратегически это подчеркивает необходимость интегрированного подхода к SEO, где оптимизация изображений, видео и других активов так же важна, как и текстовая оптимизация, и где поведенческие сигналы (CTR) играют роль не только в ранжировании, но и в самом факте показа результатов.
Практические примеры
Сценарий: Оптимизация видео-инструкции для попадания в основную выдачу по голосовому запросу.
- Исходный голосовой запрос: Пользователь спрашивает: [Окей Гугл, как мне завязать галстук Виндзор].
- Генерация гипотез: Hypothesis Generator определяет, что запрос семантически релевантен для Web, Images и Video.
- Переписывание запросов:
- Video Hypothesis Query: [завязать галстук Виндзор видео инструкция]. (Удалено «Окей Гугл, как мне», добавлено «видео инструкция»).
- Image Hypothesis Query: [схема завязывания галстука Виндзор].
- Выполнение поиска и Оценка: Система ищет видео и картинки.
- Видео А имеет высокий CTR (Claim 7) и размещено на авторитетном сайте о стиле (Claim 6). Search Hypothesis Score высокий.
- Лучшие картинки (схемы) имеют низкий CTR и размещены на слабых сайтах. Search Hypothesis Score низкий.
- Применение порога и Выдача: Гипотеза Видео проходит порог, гипотеза Изображений — нет.
- Результат: В основной выдаче будет показан блок с Видео А. Блок с картинками будет подавлен. Владелец Видео А получает максимальную видимость благодаря оптимизации качества и CTR.
Вопросы и ответы
Означает ли этот патент, что Google не покажет блок Картинок, если результаты поиска по картинкам низкого качества?
Да, именно это и описано в патенте. Система вычисляет оценку качества (search hypothesis score) для набора результатов из вертикали. Если эта оценка не превышает установленный порог (threshold), результаты для этой гипотезы (т.е. вертикальный блок) не будут предоставлены пользователю в основной выдаче, даже если запрос релевантен.
Как рассчитывается оценка качества (Search Hypothesis Score) для вертикального блока?
Патент предлагает два основных метода расчета метрики качества (Quality Metric Value). Первый (Claim 6) основан на оценках качества самих ресурсов, независимо от поведения пользователей (например, авторитетность, E-E-A-T). Второй (Claim 7) основан на мере удовлетворенности пользователей, например, selection rates (CTR) результатов поиска. Google может использовать один из этих методов или их комбинацию.
Влияет ли CTR моего контента на показ вертикальных блоков в выдаче?
Да, напрямую. Патент (Claim 7) явно указывает, что CTR (selection rate) может использоваться как метрика качества для принятия решения о том, показывать ли вертикальный блок вообще. Высокий CTR ваших материалов в вертикальном поиске (например, в Google Images или Video Search) увеличивает вероятность того, что этот блок появится в основной выдаче по связанным запросам.
Как система определяет, какие вертикали проверять для запроса?
Это определяется на этапе генерации гипотез (Hypothesis Generation). Система анализирует n-граммы исходного запроса и оценивает их семантическую релевантность (semantic relevance) к различным типам корпусов (Claim 2). Если релевантность достаточна, создается гипотеза для этого корпуса, и поиск запускается.
Как Google переписывает запросы для вертикалей?
Система модифицирует запрос для оптимизации под конкретный корпус, создавая Hypothesis Search Query. В патенте приводятся примеры удаления семантически нерелевантных слов (например, «мне», «некоторые»), замены терминов (например, «покажи» на «картинки» или «видео») или добавления уточняющих слов. Запрос гипотезы может содержать n-граммы, отличные от исходного запроса (Claim 4).
Как этот патент связан с голосовым поиском?
Патент имеет прямое отношение к голосовому поиску (Claim 8). Голосовые запросы часто бывают многословными и содержат фразы естественного языка, которые нерелевантны для поиска (например, «Окей Гугл, найди мне…»). Описанная система эффективно отсеивает шум, определяет релевантные корпуса и переписывает запрос для точного поиска.
Что важнее для показа вертикального блока: авторитетность сайта или CTR результатов?
Патент представляет эти факторы как альтернативные способы расчета Quality Metric Value (Claims 6 и 7). Оба подхода важны. Авторитетность обеспечивает базовое качество и надежность результатов, а высокий CTR свидетельствует о высокой релевантности и удовлетворенности пользователей. Для надежной стратегии необходимо работать над обоими направлениями.
Может ли система решить не показывать результаты основного веб-поиска?
В патенте упоминается, что результаты «дефолтного» поиска (веб-корпуса) могут предоставляться всегда. Однако также указано, что в других реализациях результаты дефолтного поиска могут оцениваться Hypothesis Evaluator точно так же, как и другие гипотезы, и могут быть скрыты, если их качество не соответствует порогу.
Что означает наличие Jakob Uszkoreit среди изобретателей?
Jakob Uszkoreit является одним из ключевых разработчиков архитектуры Transformer (статья «Attention Is All You Need»), которая лежит в основе современных больших языковых моделей (BERT, MUM). Его участие указывает на то, что данный патент тесно связан с глубоким пониманием естественного языка (NLP) и семантическим анализом запросов для определения интента и выбора релевантного корпуса.
Как SEO-специалисту использовать знание этого патента на практике?
Необходимо сосредоточиться на специализированной оптимизации для каждой релевантной вертикали. Это включает не только достижение топа внутри вертикали, но и максимальное улучшение привлекательности сниппетов (для повышения CTR) и повышение авторитетности страниц, на которых размещен контент. Это максимизирует вероятность того, что Google решит показать соответствующий вертикальный блок в основной выдаче.