Google динамически регулирует минимальный порог эффективности (например, CTR или сигналы вовлеченности). Если релевантность результата определена с низкой степенью уверенности (например, через семантическое расширение запроса), ему необходимо показать более высокую эффективность, чтобы пройти фильтры, по сравнению с результатами, точно соответствующими запросу.
Описание
Какую задачу решает
Патент решает проблему баланса между полнотой выдачи (Recall) и ее качеством (Precision), особенно при использовании механизмов расширения запроса (Query Expansion) или ослабленного соответствия (Relaxed Match). Когда система расширяет поиск, включая связанные термины для увеличения охвата, возрастает риск показа менее релевантных результатов. Изобретение призвано гарантировать, что результаты с низкой уверенностью в совпадении будут показаны только в том случае, если они демонстрируют исключительно высокую эффективность (Performance).
Что запатентовано
Запатентована система, которая динамически корректирует минимальный порог эффективности (Minimum Performance Threshold), необходимый для показа элемента (документа или рекламы). Корректировка зависит от показателя уверенности в совпадении (Match Confidence). Если уверенность низкая (например, совпадение по связанному слову — Relaxed Match), пороговое значение эффективности повышается. Если уверенность высокая (точное совпадение — Strict Match), порог может быть стандартным или сниженным.
Как это работает
Механизм работает следующим образом:
- Расширение запроса: Система может расширить исходный запрос, добавив связанные слова (например, на основе совместной встречаемости в поисковых сессиях).
- Оценка уверенности: Для каждого найденного элемента определяется мера уверенности (Confidence Measure) в его релевантности. Strict Match дает высокую уверенность, Relaxed Match — низкую.
- Динамический порог: На основе меры уверенности система устанавливает Minimum Performance Threshold (например, минимальный CTR или уровень вовлеченности). Чем ниже уверенность, тем выше порог.
- Фильтрация: Элементы, чья эффективность (Performance Value) ниже установленного для них индивидуального порога, отфильтровываются из выдачи.
Актуальность для SEO
Высокая. Понимание и расширение запросов (например, с использованием BERT, MUM), а также использование метрик эффективности (вовлеченности) являются центральными элементами современного поиска. Описанный принцип баланса между типом соответствия и требуемой эффективностью остается фундаментальным, особенно в эпоху семантического поиска, который часто опирается на Relaxed Match.
Важность для SEO
Патент имеет высокое значение для SEO-стратегии (8/10). Хотя он преимущественно иллюстрируется на примере рекламы, в тексте (Раздел 4.2.4) прямо указано, что он применим и к общему поиску информации (general information retrieval). Это подтверждает, что Google может использовать метрики эффективности (например, CTR или другие сигналы вовлеченности) как динамический фильтр качества. Ключевой вывод: если ваш контент релевантен запросу лишь косвенно (Relaxed Match), он должен демонстрировать выдающиеся поведенческие метрики, чтобы конкурировать с контентом, имеющим прямое соответствие (Strict Match).
Детальный разбор
Термины и определения
- Confidence Measure / Match Confidence (Мера уверенности в совпадении)
- Показатель, отражающий степень уверенности системы в релевантности найденного элемента запросу. Зависит от типа используемого совпадения (Match Function).
- Item (Элемент)
- Объект, извлекаемый в ответ на запрос. В патенте это могут быть рекламные объявления (Ads) или документы (Documents) в контексте общего поиска информации.
- Performance Threshold (Порог эффективности)
- Минимальное значение метрики эффективности, которому должен соответствовать элемент для прохождения фильтрации. Упомянутые метрики: Selection Rate (например, CTR) и Conversion Rate.
- Performance Value (Значение эффективности)
- Фактическая или прогнозируемая метрика эффективности элемента (CTR, конверсия, вовлеченность).
- Query Term Expansion (Расширение термина запроса)
- Процесс добавления связанных слов или фраз к исходному запросу.
- Relaxed Match (Ослабленное/Расширенное совпадение)
- Метод поиска, при котором элемент считается релевантным, если он соответствует связанному слову, а не исходному термину запроса. Характеризуется низкой Match Confidence.
- Strict Match (Строгое/Точное совпадение)
- Метод поиска, требующий точного или фразового соответствия исходному запросу. Характеризуется высокой Match Confidence.
- Word/Phrase Relationship Information (Информация о взаимосвязи слов/фраз)
- База данных, хранящая связанные слова и веса. Связь определяется на основе совместной встречаемости (co-occur) слов в последовательных запросах одной сессии (Раздел 4.2.1).
- Rewrite Multiplier (Множитель перезаписи)
- Коэффициент (Score Adjustment Parameter), используемый для корректировки оценки ранжирования или порога эффективности. Обновляется на основе эмпирических данных об эффективности (Раздел 4.2.2).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает метод фильтрации результатов, полученных через расширение запроса.
- Система принимает информацию поискового запроса, включающую слово.
- Определяются одно или несколько слов, связанных с этим словом.
- Генерируется запрос элемента, включающий исходное и связанные слова.
- Извлекаются элементы. Каждый элемент имеет Performance Value (например, CTR или конверсия).
- Ядро изобретения: Применяется Minimum Performance Threshold для фильтрации. При этом элементы, извлеченные на основе связанных слов (Relaxed Match), должны соответствовать более высокому минимальному порогу эффективности, чем элементы, извлеченные на основе исходного слова (Strict Match).
- Отфильтрованные элементы отправляются для рендеринга.
Claim 8 (Независимый пункт): Описывает более общий метод, использующий меру уверенности.
- Система принимает информацию поискового запроса.
- Определяются релевантные элементы, и каждому присваивается Confidence Measure.
- Ядро изобретения: Применяется Minimum Performance Threshold для фильтрации. Этот порог является функцией от Confidence Measure.
Claim 9 и 10 (Зависимые от 8): Уточняют характер функции.
- Минимальный порог эффективности увеличивается по мере уменьшения меры уверенности (Claim 9).
- Минимальный порог эффективности уменьшается по мере увеличения меры уверенности (Claim 10).
Где и как применяется
Хотя патент в основном использует примеры из системы показа рекламы (Ad Server), он явно указывает (Раздел 4.2.4) на применимость к общему поиску информации (general information retrieval).
QUNDERSTANDING – Понимание Запросов
На этом этапе применяются операции расширения запроса (Query Term Expansion Operations). Система использует Word/Phrase Relationship Information (рассчитанную офлайн на основе логов сессий) для поиска связанных терминов.
RANKING – Ранжирование (Отбор и оценка кандидатов)
Система использует как исходный, так и расширенный запрос для поиска элементов (L1 Retrieval). Для каждого элемента извлекается его Performance Value и определяется тип соответствия (Match Confidence).
RERANKING – Переранжирование (или L2/L3 Ranking — Фильтрация)
Основное применение патента. Система устанавливает индивидуальный Minimum Performance Threshold для каждого элемента на основе его Match Confidence. Элементы, чья эффективность ниже их индивидуального порога, удаляются из набора результатов или значительно понижаются.
Входные данные:
- Информация поискового запроса.
- Информация о взаимосвязи слов/фраз.
- Данные об эффективности элементов (CTR, Conversion Rate, сигналы вовлеченности).
- Информация о типе совпадения (Match Type/Confidence) для каждого элемента.
Выходные данные:
- Отфильтрованный набор элементов, прошедших соответствующий порог эффективности.
На что влияет
- Специфические запросы: Наибольшее влияние на запросы, где активируется расширение запроса (семантически неоднозначные, широкие, информационные запросы).
- Типы контента: Влияет на контент, который ранжируется по связанным терминам, синонимам или интенту (Relaxed Match), а не по точным ключевым словам из запроса (Strict Match). Патент отмечает особую эффективность для коротких документов, таких как реклама (Раздел 4.2.4).
- Ниши: Может сильно влиять на ниши, где наблюдается разрыв между формулировками пользователей и терминологией экспертов, требуя активного расширения запросов.
Когда применяется
- Триггеры активации: Алгоритм активируется, когда для определения релевантности используются различные типы совпадений с разной степенью уверенности, в частности, когда используется Relaxed Match.
- Условия применения: Применяется, когда система использует пороги эффективности для фильтрации результатов.
- Ограничения: В патенте упоминается (Раздел 4.2.4), что расширение соответствия может требовать значительных вычислительных ресурсов и может применяться выборочно, когда есть избыточные ресурсы (например, использование свободных циклов CPU).
Пошаговый алгоритм
Процесс А: Обработка запроса и фильтрация результатов (Runtime)
- Получение запроса: Система принимает исходный поисковый запрос.
- Расширение запроса: Система определяет связанные слова/фразы, используя Word/Phrase Relationship Information. Создается расширенный запрос.
- Извлечение элементов: Система ищет элементы, релевантные исходному и/или расширенному запросу.
- Определение Confidence Measure и Performance Value: Для каждого элемента определяется:
- Мера уверенности (Высокая для Strict Match, Низкая для Relaxed Match).
- Значение эффективности (например, CTR или вовлеченность).
- Расчет Performance Threshold: Для каждого элемента устанавливается минимальный порог эффективности как функция от его Confidence Measure. (Низкая уверенность → Высокий порог).
- Дифференцированная фильтрация: Сравнивается Performance Value элемента с его индивидуальным Performance Threshold. Если значение ниже порога, элемент отфильтровывается.
- Рендеринг: Оставшиеся элементы отправляются пользователю (возможно, после дополнительного ранжирования).
Процесс Б: Обновление параметров (Offline, описано в Разделе 4.2.2)
- Сбор данных: Анализ логов показов и кликов, идентификация взаимодействий с результатами, полученными через Relaxed Match.
- Расчет эмпирической эффективности: Сравнение наблюдаемых кликов (observed_clicks) с наивно предсказанными (naively_predicted_clicks) для конкретного расширения запроса.
- Обновление параметров: Корректировка Rewrite Multiplier (параметра корректировки оценки) для этого расширения с использованием формулы, которая позволяет плавно переходить от начальной оценки к эмпирическим данным.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Критически важные данные. Используются Performance Value, такие как Click-Through Rate (CTR) и Conversion Rate, для фильтрации. Также используются логи поисковых сессий (Query Logs) офлайн для определения взаимосвязей между словами (совместная встречаемость в последовательных запросах одной сессии).
- Контентные/Таргетинговые факторы: Термины в элементах или критерии таргетинга используются для определения совпадения с запросом.
Какие метрики используются и как они считаются
- Match Confidence / Confidence Measure: Метрика, зависящая от типа совпадения (Strict vs Relaxed).
- Performance Value: Метрики эффективности (Selection Rate, Conversion Rate).
- Minimum Performance Threshold: Динамически рассчитываемый порог. Является функцией от Match Confidence. Патент упоминает возможность корректировки порога, например, путем умножения базового порога на множитель больше единицы для Relaxed Match (Claim 3).
- Rewrite Multiplier: Коэффициент корректировки. В патенте приводится формула для его обновления (Раздел 4.2.2):
new_multiplier = (N * initial_multiplier + observed_clicks) / (N + naively_predicted_clicks). Это демонстрирует механизм обучения фактическому влиянию расширенного соответствия на эффективность.
Выводы
- Компенсация риска при семантическом поиске: Google управляет риском снижения релевантности при использовании семантического (расширенного) поиска. Если система не уверена в точном соответствии (Low Match Confidence), она требует от документа доказательств высокого качества в виде сильных исторических показателей эффективности (High Performance Value).
- Дифференцированные требования к качеству: Требуемый уровень «качества» или «вовлеченности» не является статичным. Он зависит от того, как именно документ соответствует запросу. Точное соответствие (Strict Match) дает презумпцию релевантности и снижает порог; семантическое соответствие (Relaxed Match) требует доказательств эффективности и повышает порог.
- Критичность вовлеченности для Long-Tail и семантики: Чтобы успешно ранжироваться по семантически связанным запросам и «длинному хвосту» (где точное совпадение маловероятно), документ должен демонстрировать исключительно сильные сигналы вовлеченности пользователей, чтобы преодолеть повышенные Performance Thresholds.
- Применимость к органическому поиску: Патент прямо заявляет о применимости к общему поиску документов (Раздел 4.2.4). Это служит подтверждением того, что метрики эффективности (поведенческие факторы) могут использоваться как динамический фильтр качества в органическом поиске.
Практика
Best practices (это мы делаем)
- Максимизация удовлетворенности пользователя и вовлеченности: Это ключевая стратегия. Поскольку метрики эффективности (Performance Value) используются как фильтр, критически важно создавать контент, который максимально полно отвечает на интент и вовлекает пользователя. Высокая эффективность может помочь преодолеть повышенный Performance Threshold при ранжировании по семантическим запросам (Relaxed Match).
- Оптимизация органического CTR: В патенте CTR (Selection Rate) явно указан как метрика эффективности. Оптимизация сниппетов (Title, Description) для повышения кликабельности напрямую способствует преодолению порогов эффективности.
- Точная оптимизация под ключевые интенты: Для обеспечения Strict Match (высокая уверенность) необходимо проводить тщательный анализ ключевых слов и использовать точные формулировки в контенте. Это снижает требования к минимальной эффективности для прохождения фильтров.
- Построение Topical Authority с фокусом на качестве: Создание авторитетного контента, охватывающего тему целиком, увеличивает вероятность ранжирования через Relaxed Match. Однако этот контент должен быть высокоэффективным и вовлекающим, чтобы соответствовать повышенным требованиям.
Worst practices (это делать не надо)
- Создание поверхностного контента для широкого охвата (например, Programmatic SEO низкого качества): Если контент слабо отвечает на интент и имеет низкие поведенческие метрики, он будет отфильтрован из-за высокого Performance Threshold при Relaxed Match, даже если он семантически связан с запросом.
- Игнорирование поведенческих метрик: Рассматривать SEO только как оптимизацию текста и ссылок опасно. Если система использует эффективность как фильтр, низкий CTR или плохая вовлеченность могут привести к потере позиций, особенно при ранжировании по широким или семантическим запросам.
- Узкая оптимизация без учета семантики: Фокус исключительно на Strict Match без учета связанных концептов ограничивает потенциальный охват, игнорируя механизмы Query Expansion, которые использует Google.
Стратегическое значение
Патент подчеркивает, что релевантность не бинарна. Google использует градации уверенности в релевантности и компенсирует низкую уверенность высокими требованиями к эффективности. Это объясняет, почему в эпоху семантического поиска требования к качеству контента и пользовательскому опыту возрастают. Стратегия должна включать как работу над прямой релевантностью (для Strict Match), так и над повышением эффективности контента (для прохождения порогов при Relaxed Match).
Практические примеры
Сценарий: Фильтрация органической выдачи при расширении запроса
Предположим, Google применяет логику патента к органическому поиску.
- Исходный запрос: «Идитарод» (гонка на собачьих упряжках).
- Расширение запроса: Google определяет связанные термины на основе сессий (Раздел 4.2.1), например, «Аляска» и «маламут».
- Извлечение результатов:
- Страница А: Официальный сайт гонки (Strict Match по «Идитарод»). Эффективность (Performance Value) = 10%.
- Страница Б: Туристический гид по Аляске (Relaxed Match по «Аляска»). Эффективность = 15%.
- Страница В: Статья о породе Маламут (Relaxed Match по «маламут»). Эффективность = 4%.
- Установка порогов (Гипотетические значения):
- Базовый порог (для Strict Match/High Confidence): 5%.
- Повышенный порог (для Relaxed Match/Low Confidence): 12%.
- Фильтрация и результат:
- Страница А проходит (10% > 5%).
- Страница Б проходит (15% > 12%). Ее высокая эффективность компенсировала низкую уверенность в совпадении.
- Страница В НЕ проходит (4% < 12%). Несмотря на семантическую связь, ее эффективность недостаточна для преодоления повышенного порога.
Вопросы и ответы
Что такое «Match Confidence» (Уверенность в совпадении) и как она определяется?
Это показатель уверенности системы в релевантности результата запросу. Он определяется типом совпадения. Если результат точно соответствует ключевым словам запроса (Strict Match), уверенность высокая. Если результат найден через синонимы или связанные термины, добавленные системой в процессе расширения запроса (Relaxed Match), уверенность низкая.
Как связаны Match Confidence и Performance Threshold?
Связь обратная. Чем ниже уверенность системы в релевантности результата (Match Confidence), тем выше устанавливается минимальный порог эффективности (Performance Threshold), который этот результат должен преодолеть. Для точных совпадений порог эффективности ниже (Claims 9 и 10).
Применяется ли этот патент к органическому поиску или только к рекламе?
Патент в основном использует примеры из рекламы, но прямо заявляет в разделе «Alternatives and Extensions» (Раздел 4.2.4), что он применим к общему поиску информации (general information retrieval) для нахождения документов. Таким образом, описанные механизмы могут использоваться и в органическом поиске для фильтрации документов.
Подтверждает ли этот патент использование CTR как фактора ранжирования?
Да, в контексте этого патента CTR (Selection Rate) используется как ключевая метрика эффективности (Performance Value). Однако он используется не как прямой сигнал ранжирования (выше CTR = выше позиция), а как динамический фильтр. Результаты должны преодолеть минимальный порог CTR (или другой метрики эффективности), чтобы быть показанными.
Как Google определяет связанные слова для расширения запроса (Query Expansion)?
В патенте предлагается метод, основанный на анализе логов поисковых сессий (Раздел 4.2.1). Связанными считаются слова, которые часто встречаются вместе в последовательных запросах в рамках одной сессии (co-occur in consecutive queries from the same session). Это позволяет выявлять связи на основе реального поведения пользователей.
Что это значит для SEO при работе с семантикой и синонимами (Relaxed Match)?
Это означает, что для успешного ранжирования по семантически связанным запросам ваш контент должен демонстрировать исключительно высокие показатели эффективности (поведенческие факторы, вовлеченность). Требования к качеству и вовлеченности для такого контента выше, чем для контента, точно оптимизированного под запрос.
Стоит ли фокусироваться на точном вхождении ключей или на широком охвате темы?
Необходим баланс. Точное вхождение ключей помогает достичь Strict Match, что снижает требования к порогу эффективности. Широкий охват темы увеличивает шансы на Relaxed Match, но требует очень высоких показателей эффективности контента для попадания в выдачу.
Что такое «Rewrite Multiplier» и как он работает?
Rewrite Multiplier — это параметр корректировки оценки (Score Adjustment Parameter), используемый для Relaxed Match. Система динамически обновляет его на основе реальных данных об эффективности (кликах), используя формулу, описанную в Разделе 4.2.2. Это позволяет системе самообучаться и уточнять, насколько хорошо работает конкретное расширение запроса на практике.
Может ли страница с низким CTR ранжироваться высоко?
Да, если она имеет очень высокую уверенность в совпадении (Strict Match). В этом случае система применяет более низкий Minimum Performance Threshold. Однако страница все равно должна преодолеть этот сниженный базовый порог эффективности.
Влияет ли этот алгоритм на скорость работы поиска?
Патент упоминает (Раздел 4.2.4), что использование расширенного соответствия (Relaxed Match) требует дополнительных вычислительных ресурсов. Поэтому система может применять его выборочно, например, когда есть свободные ресурсы CPU или в периоды низкой нагрузки, чтобы не замедлять ответ пользователю.