
Google улучшает ранжирование в специализированных поисковых вертикалях (например, Музыка, Книги, Товары), где данных для оценки контента недостаточно (Sparse Corpora). Система использует сигналы из основного Веб-поиска (популярность запросов, CTR веб-страниц), чтобы определить авторитетность и популярность сущностей (песен, книг, товаров) и скорректировать их позиции в вертикальной выдаче.
Патент решает проблему неоптимального ранжирования в специализированных (вертикальных) поисковых системах, таких как поиск по музыке, книгам или фильмам. Эти системы оперируют «разреженными корпусами» (sparse corpora), где часто не хватает данных по каждому отдельному элементу (например, песне или товару), чтобы эффективно отличать их друг от друга и определять их относительную важность или популярность.
Запатентован метод использования данных из основного Веб-поиска (WWW-based corpus) для создания сигналов ранжирования в отдельном, не связанном с вебом корпусе (Non-Web based corpus). Суть изобретения заключается в импорте сигналов популярности из Веб-поиска для использования их в качестве независимых от запроса оценок (Query-Independent Scores) при ранжировании элементов внутри вертикального поиска.
Система работает путем переноса сигналов между корпусами:
WWW-based corpus (Веб-поиску).Query Volume/Frequency), а также поведенческие метрики (CTR) для результатов веб-поиска.Ranking Signal и используются для ранжирования элемента в разреженном корпусе, комбинируясь с его релевантностью запросу пользователя (Query-Dependent Score).Высокая. Интеграция вертикального поиска (Товары, Книги, Фильмы, Local) и использование глобальной популярности сущностей (Entity Popularity) являются критически важными в современной поисковой архитектуре. Этот патент описывает фундаментальный механизм, позволяющий Google использовать данные Веб-поиска для улучшения качества всех остальных своих продуктов.
Патент имеет значительное стратегическое влияние (7/10). Хотя он не описывает ранжирование в основном Веб-поиске, он критически важен для компаний, чьи продукты или контент представлены в вертикальных системах Google. Он устанавливает прямую связь между популярностью и авторитетностью сущности в Веб-поиске и ее ранжированием в Вертикальном поиске. Для успеха в вертикалях необходима сильная и оптимизированная представленность в основном вебе.
Query-Independent Score, полученный из WWW-Based Corpus. Включает First Score Signal и Second Score Signal.Ranking Signal, основанная на объеме (Query Volume) и/или частоте (Query Frequency) запросов элемента в Веб-поиске.Ranking Signal, основанная на метриках популярности (Popularity Metric) веб-страниц, найденных в результате поиска элемента в Веб-поиске.Query-to-Click ratio (отношение запросов к кликам) и Clickthrough ratio (CTR).Claim 1 (Независимый пункт): Описывает основной метод кросс-корпусного ранжирования.
First Information Corpus), который определен как не-веб корпус, документы которого недоступны в WWW.Query-Dependent Score (релевантность внутри первого корпуса).Query-Independent Score. Эта оценка включает: Ranking Signal, полученный путем поиска названия элемента во втором корпусе (Second Information Corpus), который определен как WWW-корпус. Первый и второй корпусы не пересекаются.Ranking Signal включает First Score Signal, основанный на частоте запросов этого элемента в WWW-корпусе (Query Frequency).Additional Score) из второго не-веб корпуса, включающая географическое положение источника запроса.Claim 3 (Зависимый от 1): Уточняет, что First Score Signal также основан на общем количестве выполненных поисков (Query Volume).
Claim 4 (Зависимый от 3): Уточняет, что Ranking Signal дополнительно включает Second Score Signal. Этот сигнал основан на метриках популярности (Popularity Metric) веб-страниц, найденных в результате поиска в WWW-корпусе.
Claim 5 (Зависимый от 4): Определяет Popularity Metric как Query-to-Click ratio и/или CTR для этих веб-страниц.
Claim 6 (Зависимый от 4): Описывает механизм контекстуального взвешивания. Second Score Signal повышается (взвешивается), если найденная веб-страница тематически релевантна вертикали (например, содержит связанные с музыкой термины или является музыкальной веб-страницей). Это гарантирует использование сигналов с релевантных по тематике веб-ресурсов.
Изобретение применяется в специализированных (вертикальных) поисковых системах Google, которые используют собственные базы данных, отличные от основного веб-индекса (например, Google Music, Books, Movies, Shopping/Products).
INDEXING – Индексирование и извлечение признаков
Основная часть работы происходит на этом этапе в офлайн-режиме. Система рассчитывает и сохраняет Query-Independent Scores для элементов в разреженном корпусе.
Sparse Corpus.WWW Corpus.WWW Corpus (логи запросов для Query Volume/Frequency и поведенческие данные для CTR).Ranking Signal и сохранение его в индексе Sparse Corpus, ассоциируя с соответствующей сущностью.RANKING – Ранжирование (внутри Вертикального поиска)
Во время выполнения запроса пользователя в вертикальном поиске система применяет рассчитанные сигналы:
Query-Dependent Score (релевантность внутри вертикали).Query-Independent Scores (включая Ranking Signal из WWW и локальные сигналы).Входные данные (Офлайн): Элементы из Sparse Corpus; Данные WWW Corpus (логи, индекс, клики); Данные из не-веб источников (продажи).
Выходные данные (Офлайн): Query-Independent Scores для каждого элемента.
Входные данные (Рантайм): Запрос пользователя; Геолокация пользователя; Предварительно рассчитанные Query-Independent Scores.
Выходные данные (Рантайм): Отранжированный список результатов вертикального поиска.
Ranking Signal на основе WWW данных происходит периодически (офлайн), так как популярность сущностей меняется. Применение этих сигналов происходит при каждом запросе в вертикальной поисковой системе.sparse corpora, где стандартных сигналов недостаточно для качественной дифференциации результатов.Процесс разделен на две основные фазы: офлайн-расчет сигналов и рантайм-ранжирование.
Фаза А: Офлайн-расчет Query-Independent Scores
Sparse Corpus и идентифицирует элементы (например, товары).WWW Corpus (Веб-поиску).Query Volume и Query Frequency для названия элемента.Popularity Metrics (CTR, Query-to-Click ratio) для этих веб-страниц.First Score Signal и Second Score Signal комбинируются.Ranking Signal комбинируется с другими не-веб сигналами (например, Sell Count).Query-Independent Score сохраняется в индексе Sparse Corpus.Фаза Б: Рантайм-ранжирование в Вертикальном поиске
Additional Score).Query-Dependent Score и скорректированный Query-Independent Score объединяются для получения финального балла.Система использует комбинацию данных из веб-корпуса и не-веб корпуса.
Данные из Веб-корпуса (WWW-based Corpus):
Query Volume: Общее количество поисковых запросов в веб-поиске, соответствующих элементу.Query Frequency: Частота выполнения поисковых запросов в веб-поиске за период.Query-to-click ratio: Отношение запросов к кликам для результирующих веб-страниц.Clickthrough ratio (CTR): Показатель кликабельности для результирующих веб-страниц.Данные из Не-веб корпуса (Non-Web based Corpus) и Пользовательские данные:
Sell Count: Количество продаж элемента.Play Count: Количество воспроизведений (для медиа).Release Date: Дата выпуска элемента.User Query Location: Местоположение пользователя (используется для корректировки ранжирования).Query Volume и Query Frequency.CTR и Query-to-Click ratio результатов веб-поиска.Second Score Signal, если результаты веб-поиска тематически связаны с вертикалью. Это критически важно для обеспечения релевантности импортируемых сигналов.First Score Signal и Second Score Signal.Query-Dependent Score и Query-Independent Score.Query Volume, Query Frequency и CTR из Веб-поиска как измеримые сигналы популярности и качества для ранжирования в других продуктах.non-overlapping), сигналы активно переносятся из богатого данными Веб-поиска для улучшения качества в разреженных корпусах (Sparse Corpora).CTR) со страниц, тематически связанных с вертикалью. Это обеспечивает релевантность импортируемых сигналов.Query Volume и Query Frequency напрямую улучшат ранжирование этих сущностей в соответствующем вертикальном поиске.CTR на этих страницах в Веб-поиске используется как Second Score Signal для повышения рейтинга в вертикалях.Query Volume или CTR. Это может быть неэффективно, так как система применяет взвешивание на основе тематической релевантности (контекста) веб-страниц, с которых получены сигналы.Second Score Signals (CTR).Патент подтверждает стратегию Google по оценке сущностей (Entities). Популярность в вебе становится универсальным фактором ранжирования во всей экосистеме Google. Для SEO-специалистов это означает, что долгосрочная стратегия должна быть направлена на развитие и продвижение сущностей (Entity Management) и генерацию устойчивого поискового интереса, а не только на техническую оптимизацию под конкретные платформы.
Сценарий: Ранжирование товара в Google Shopping
Два магазина продают одинаковую модель кроссовок. Оба оптимизировали фид для Google Shopping (Sparse Corpus), и их Query-Dependent Score близок.
Query Volume для бренда магазина. Низкий CTR на официальном сайте.Query-Independent Score.Query Volume для бренда магазина. Высокий CTR на официальном сайте и в обзорах на тематических площадках.Query-Independent Score за счет сильных веб-сигналов.Влияет ли этот патент на ранжирование моего сайта в основном Веб-поиске (синие ссылки)?
Нет, напрямую не влияет. Патент описывает импорт сигналов ИЗ Веб-поиска В Вертикальный поиск (например, Google Shopping или Books), а не наоборот. Он предназначен для улучшения ранжирования в специализированных базах данных (Sparse Corpora), где не хватает собственных сигналов для оценки качества.
Какие именно данные из Веб-поиска используются?
Используются четыре ключевых поведенческих метрики: Query Volume (объем запросов по сущности), Query Frequency (частота запросов), CTR (кликабельность результатов веб-поиска по этой сущности) и Query-to-Click ratio. Это подтверждает использование поведенческих данных как меры популярности.
Что такое "Sparse Corpus" и какие системы к нему относятся?
Sparse Corpus — это специализированная база данных Google, отделенная от основного веб-индекса, где данных для ранжирования недостаточно. Для SEO-специалистов это чаще всего означает Google Shopping (Products), Google Books, Google Movies, а также, вероятно, Google Local (Maps), если они функционируют как отдельные корпуса.
Как я могу использовать это знание для улучшения позиций в Google Shopping или Google Local?
Необходимо повышать популярность вашего бренда и конкретных товаров/услуг в основном Веб-поиске. Стимулируйте брендовый трафик и запросы по названию товара. Оптимизируйте сниппеты вашего официального сайта, чтобы максимизировать CTR в Веб-поиске. Эти сигналы популярности будут импортированы и улучшат ваше ранжирование в вертикалях.
Имеет ли значение, с каких сайтов Google берет CTR (Claim 6)?
Да, это критически важно. Патент указывает, что система применяет взвешивание (weighting), если веб-страница, с которой получен сигнал CTR, тематически релевантна вертикали (например, музыкальный сайт для музыкального поиска). Это означает, что CTR с авторитетных, тематических ресурсов более ценен, чем с сайтов общей тематики.
Как система обрабатывает ситуацию, когда у сущности есть несколько значений (например, "Ягуар" как животное и как автомобиль)?
Для этого используется механизм контекстуального взвешивания (Claim 6). Если поиск происходит в автомобильной вертикали, система будет придавать больший вес сигналам популярности, исходящим с автомобильных сайтов, тем самым фокусируясь на автомобиле, а не на животном.
Учитывает ли система только веб-сигналы для определения популярности?
Нет. Помимо веб-сигналов (Ranking Signal), система учитывает и локальные данные из не-веб источников (Non-Web Based Corpus). К ним относятся данные о продажах (Sell Count), количестве воспроизведений (Play Count), дате выпуска (Release Date) и геолокации пользователя.
Что означает, что корпусы "не пересекаются" (non-overlapping)?
Это означает, что документ, существующий в Веб-индексе (веб-страница), не существует в специализированной базе данных (как запись о товаре), и наоборот. Они хранятся отдельно, но система переносит сигналы между ними, связывая их через общие сущности (Entities).
Как система связывает элемент в вертикальном поиске с данными в Веб-поиске?
Система использует название элемента (например, имя артиста, название книги или товара) из вертикальной базы данных и выполняет поиск по этому названию в Веб-поиске. Это подчеркивает важность консистентного наименования и распознавания сущностей (Entity Recognition).
Что важнее для ранжирования в вертикальном поиске: релевантность запросу или популярность в вебе?
Система использует комбинацию обоих факторов. Сначала определяется релевантность (Query-Dependent Score). Затем популярность в вебе (Query-Independent Score) используется для корректировки ранжирования, особенно для различения результатов с похожей релевантностью. Популярность помогает выбрать лучший результат среди релевантных.

Google Shopping

Семантика и интент
Мультимедиа
Индексация

Поведенческие сигналы

EEAT и качество
Поведенческие сигналы
SERP

EEAT и качество
SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Поведенческие сигналы

SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Персонализация
SERP

Семантика и интент
SERP
Ссылки

Персонализация
Поведенческие сигналы
SERP

EEAT и качество
Ссылки

EEAT и качество
Ссылки

Поведенческие сигналы
Ссылки
SERP
