
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
Патент решает проблему обработки поисковых запросов, которые имеют несколько различных значений или интерпретаций (неоднозначные запросы). Например, запрос "Pool" может относиться к бассейну, бильярдному столу или заведению. Цель — определить наиболее вероятное намерение пользователя на основе коллективного поведения и скорректировать выдачу так, чтобы избежать показа нерелевантных результатов, соответствующих второстепенным интерпретациям.
Запатентована система для разрешения неоднозначности запросов путем анализа исторических данных о предпочтениях пользователей. Система использует метрики (преимущественно Click-Through-Rate (CTR)), связанные с парами запрос/категория. Анализируя распределение этих метрик, система определяет, является ли запрос неоднозначным, идентифицирует доминирующие категории (предпочтения) и корректирует ранжирование, повышая результаты из этих категорий.
Система работает в несколько этапов:
CTR для пар запрос/категория.CTR по категориям. Если ни одна категория значительно не доминирует или если энтропия (entropy) распределения высока, запрос считается неоднозначным.CTR (возможно, с подъемом по иерархии категорий); (2) Поиск "резкого падения" (sharp drop-off) в значениях CTR для выявления "несущественных" категорий.boosting) в ранжировании.Высокая. Понимание интента пользователя и обработка неоднозначных запросов являются фундаментальными задачами поиска. Хотя современные NLP-модели (BERT, MUM) значительно продвинулись в семантическом анализе, исторические поведенческие данные (CTR) остаются мощным сигналом для определения доминирующей интерпретации терминов-омонимов (например, "Apple", "Java"). Описанные механизмы лежат в основе определения основного интента для широких запросов.
Патент имеет высокое значение (8/10) для SEO, особенно при работе с широкими или неоднозначными ключевыми словами. Он демонстрирует конкретный механизм, как Google определяет доминирующий интент на основе агрегированных поведенческих сигналов (CTR по категориям). Если сайт нацелен на второстепенное намерение, он может быть систематически понижен, если система классифицирует этот интент как "несущественный" (inconsequential).
sharp drop-off) в упорядоченном списке метрик.user preference). Примеры включают CTR, продолжительность взаимодействия или количество взаимодействий.Inconsequential Categories.Claim 1 (Независимый пункт): Описывает основной метод разрешения неоднозначных запросов.
distribution) этих метрик.preferred categories) на основе метрик.boosting rankings) ранги результатов, соответствующих предпочтительным категориям.Claim 2 (Зависимый от 1): Уточняет, что метрикой является CTR, рассчитанный на основе исторических данных.
Claims 3 и 4 (Зависимые от 1): Уточняют методы определения неоднозначности.
entropy) распределения метрик заранее определенное значение.Claims 5 и 6 (Зависимые от 1): Уточняют методы идентификации предпочтительных категорий.
drop-off), превышающего заранее определенное значение, между двумя последовательными метриками в упорядоченном списке. Категории до падения считаются предпочтительными.Изобретение применяется на нескольких этапах поисковой архитектуры, в основном связанных с пониманием запроса и ранжированием.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна классифицировать контент (веб-страницы, сущности) по категориям. Эта информация необходима для последующего агрегирования метрик.
QUNDERSTANDING – Понимание Запросов
Основное применение патента. Включает:
CTR) для пар запрос/категория в Query/Category Metric Store.RANKING – Ранжирование / RERANKING – Переранжирование
Результаты этапа QUNDERSTANDING используются для влияния на ранжирование. Система получает информацию о предпочтительных категориях и использует ее для повышения (boosting) результатов, связанных с этими категориями, или понижения результатов из inconsequential categories.
Входные данные:
Query/Category Metric Store.Выходные данные:
mapping application) для поиска точек интереса (POI), например, для разрешения неоднозначности между типами бизнеса.Алгоритм активируется при обработке поискового запроса, но его корректирующее воздействие применяется только при выполнении определенных условий.
Ambiguous Query). Это происходит, если: Патент описывает несколько взаимосвязанных процессов.
Процесс А: Сбор данных и вычисление метрик (Офлайн или в реальном времени)
views counter) для всех связанных с ним категорий.clicks counter) для всех связанных с ним категорий.CTR для каждой пары запрос/категория.Query/Category Metric Store.Процесс Б: Обработка запроса (Основной поток)
Процесс В: Идентификация предпочтений методом порогов и иерархий
Процесс Г: Идентификация предпочтений методом резкого падения
sharp drop-off), превышающее порог (например, > 40%)?inconsequential). Завершить.duration of interaction) или количества взаимодействий.CTR) используются как источник истины для определения того, какие интерпретации (категории) неоднозначного запроса являются наиболее популярными.CTR (абсолютный подход) или (2) Анализ резкого падения CTR (относительный подход) для отделения основных интентов от второстепенных.boosting) результатов из предпочтительных категорий и потенциального подавления результатов из несущественных категорий (inconsequential).CTR. Анализируйте текущую выдачу, чтобы понять, какая интерпретация является основной.Query/Category Metric Store.CTR вашего контента вносит вклад в глобальную статистику для пары запрос/категория. Демонстрируя высокую вовлеченность, вы помогаете укрепить связь между запросом и вашей категорией в глазах Google.inconsequential (например, с помощью анализа резкого падения), ваш контент будет систематически понижаться.Патент подтверждает, что Google активно интерпретирует запросы, опираясь на "мудрость толпы" (агрегированные данные CTR), чтобы определить, что *на самом деле* ищут пользователи. Это подчеркивает переход от чисто текстовой релевантности к релевантности намерениям. Стратегически важно понимать не только семантику запроса, но и контекст его использования большинством пользователей. Борьба с устоявшимся доминирующим интентом по неоднозначному запросу обычно является проигрышной стратегией.
Сценарий: Оптимизация сайта о бильярде под запрос "Pool"
inconsequential. Результаты о бассейнах получают бустинг.Как система определяет, является ли запрос неоднозначным?
Патент предлагает два основных метода, основанных на распределении CTR по категориям. Первый — измерение энтропии (entropy). Если энтропия высока (распределение равномерное, без явных пиков), запрос неоднозначен. Второй — проверка доминирования. Если ни одна категория не имеет CTR, значительно превышающий все остальные (например, на 30-50%), запрос также считается неоднозначным.
Что такое "резкое падение" (sharp drop-off) и как оно используется?
"Резкое падение" — это значительное снижение CTR между двумя соседними категориями в списке, упорядоченном по популярности. Например, Категория А (35%), Категория Б (30%), Категория В (13%). Падение между Б и В составляет около 57%. Если это превышает установленный порог (например, 40%), система считает Категорию В и все последующие "несущественными" (inconsequential) для данного запроса.
Что происходит с результатами из "несущественных" категорий?
Патент указывает, что результаты из несущественных категорий могут быть проигнорированы (т.е. не представлены в выдаче) или пенализированы в их оценках ранжирования. Это означает, что если ваш контент соответствует интенту, который Google считает несущественным для данного запроса, он будет активно понижаться в выдаче.
Как используется иерархия категорий в этом патенте?
Иерархия используется в методе пороговых значений. Если на низком уровне (например, "Японский ресторан" и "Тайский ресторан") ни одна категория не превышает порог CTR, система поднимается на уровень выше. Она агрегирует метрики дочерних категорий в родительскую (например, "Азиатский ресторан") и проверяет порог на этом уровне. Если родительская категория превышает порог, она используется для бустинга результатов.
Насколько важен мой собственный CTR для этого алгоритма?
Ваш CTR важен двояко. Во-первых, он влияет на ранжирование вашей страницы напрямую (как поведенческий сигнал). Во-вторых, он вносит вклад в глобальную статистику для пары запрос/категория, хранящуюся в Query/Category Metric Store. Поддерживая высокий средний CTR для вашей категории, вы увеличиваете вероятность того, что система будет считать эту категорию предпочтительной.
Как я могу помочь Google правильно категоризировать мой контент?
Патент упоминает, что категоризация может основываться на анализе ключевых слов или данных из внешних источников. Для SEO это означает необходимость использования четкой терминологии, соответствующей вашей нише, использование микроразметки Schema.org для явного указания типа контента или сущности, а также поддержание сильной тематической фокусировки и иерархии сайта.
Что делать, если мой бизнес нацелен на второстепенный интент неоднозначного запроса?
Если вы продаете бильярдные столы, а запрос "pool" в основном интерпретируется как бассейны, ранжирование по этому термину будет крайне затруднено. Стратегия должна заключаться в отказе от борьбы за этот общий термин и фокусировке на более длинных и точных запросах (long-tail), где ваше намерение является доминирующим и неоднозначность отсутствует.
Использует ли этот патент только CTR в качестве метрики?
Хотя CTR используется в качестве основного примера метрики предпочтения пользователя и фигурирует в Claims, патент упоминает, что могут использоваться и другие метрики. Примеры включают продолжительность взаимодействия пользователя с результатом (duration of interaction) и количество взаимодействий.
Применяется ли этот механизм ко всем типам поиска?
Патент упоминает применение как для веб-поиска, так и для поиска в картографических приложениях (mapping application). Концептуально он может применяться в любой поисковой системе, где контент может быть категоризирован, а поведение пользователей отслеживается.
Как этот патент соотносится с современными алгоритмами типа BERT или MUM?
BERT и MUM фокусируются на семантическом и контекстуальном понимании языка. Этот патент фокусируется на поведенческом анализе для определения доминирующего интента. Вероятно, современные системы используют комбинацию подходов: NLP-модели (BERT/MUM) для понимания возможных интерпретаций и классификации контента, а поведенческие данные (как в этом патенте) для определения того, какая интерпретация является наиболее популярной на практике.

Семантика и интент
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы

Поведенческие сигналы
EEAT и качество
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа

Семантика и интент
Ссылки
Knowledge Graph

Поведенческие сигналы
Семантика и интент
Мультимедиа

Антиспам
Ссылки
Техническое SEO

Семантика и интент
SERP
Поведенческие сигналы
