Google использует механизм улучшения качества поисковой выдачи. Если по исходному запросу в топе ранжируется слишком много низкокачественных сайтов, система находит связанный альтернативный запрос, который возвращает высококачественные результаты. Затем эти результаты агрессивно повышаются в ранжировании и подмешиваются в исходную выдачу, чтобы гарантировать пользователю доступ к качественному контенту.
Описание
Какую задачу решает
Патент решает проблему ситуаций, когда стандартные алгоритмы ранжирования формируют поисковую выдачу (SERP), в которой доминируют ресурсы с сайтов, классифицированных как низкокачественные (low-quality sites). Цель изобретения — модифицировать такой набор результатов, чтобы гарантировать, что в топе выдачи будут присутствовать ресурсы с сайтов, идентифицированных как высококачественные (high-quality sites), даже если они могут быть менее релевантны исходной формулировке запроса.
Что запатентовано
Запатентована система, которая выборочно использует альтернативные запросы для улучшения качества SERP. Если определенное пороговое количество (N) топовых результатов по исходному запросу размещено на низкокачественных сайтах, система активирует поиск по альтернативному запросу (alternative query). Этот альтернативный запрос подобран так, чтобы возвращать результаты с высококачественных сайтов. Результаты альтернативного запроса затем объединяются с исходными, причем высококачественным результатам дается значительное повышение (boost) в ранжировании.
Как это работает
Система работает в несколько этапов:
- Оценка качества SERP: Анализируется качество сайтов в топе выдачи по исходному запросу.
- Триггер: Если количество низкокачественных сайтов превышает порог N, система инициирует поиск альтернативы.
- Получение альтернативного запроса: Система использует заранее подготовленную базу данных соответствий (Alternative Query Mapping Database) для поиска альтернативного запроса, связанного с исходным.
- Валидация: Проверяется, что выдача по альтернативному запросу содержит достаточно высококачественных сайтов (порог M). При генерации альтернатив также учитывается пересечение с исходной выдачей (порог X).
- Масштабирование и объединение: Вычисляется Scaling Factor, который значительно повышает Ranking Scores высококачественных результатов из альтернативной выдачи. Затем результаты объединяются. Описанная формула масштабирования может гарантировать, что лучший высококачественный результат займет первую позицию в итоговой выдаче.
Актуальность для SEO
Высокая. Борьба с низкокачественным контентом и продвижение авторитетных источников (связанное с концепцией E-E-A-T) остаются центральными задачами Google. Этот патент описывает конкретный и агрессивный метод ‘переписывания’ выдачи на лету при неудовлетворительном качестве SERP. Учитывая, что одним из изобретателей является Navneet Panda, этот механизм тесно связан с общей философией алгоритмов качества Google.
Важность для SEO
Патент имеет критическое значение для SEO-стратегии (9/10). Он демонстрирует конкретный механизм, позволяющий Google предпочесть авторитетность (High-Quality Site) прямой текстовой релевантности. Если сайт классифицирован как Low-Quality, этот механизм может активно вытеснять его из топа, даже если он занимает позицию №1. Если сайт классифицирован как High-Quality, он может давать дополнительный трафик по смежным запросам, где наблюдается дефицит качества.
Детальный разбор
Термины и определения
- Alternative Query (Альтернативный запрос)
- Второй запрос, используемый системой, если результаты первого (исходного) запроса признаны низкокачественными. Он берется из заранее определенного соответствия (predetermined mapping).
- Alternative Query Mapping Database (База данных соответствия альтернативных запросов)
- Хранилище данных, содержащее заранее рассчитанные соответствия между исходными и альтернативными запросами. Генерируется офлайн.
- Conceptual graph of queries (Концептуальный граф запросов)
- Структура данных, используемая в офлайн-процессе для поиска кандидатов в альтернативные запросы. Узлы представляют запросы и их топовые результаты. Связи указывают на взаимоотношения между запросами, например, на основе пересечения результатов.
- High-quality site (Высококачественный сайт)
- Сайт, предварительно идентифицированный как качественный. Определение может основываться на Site Quality Score выше определенного порога или на включении в ‘белый список’ (whitelist).
- Low-quality site (Низкокачественный сайт)
- Сайт, предварительно идентифицированный как низкокачественный. Определение может основываться на Site Quality Score ниже определенного порога или на включении в ‘черный список’ (blacklist).
- Measure of confidence (Мера уверенности)
- Метрика, используемая в офлайн-процессе для выбора наилучшего альтернативного запроса среди кандидатов. Учитывает такие факторы, как пересечение результатов (Порог X), количество высококачественных сайтов (Порог M) и схожесть терминов запросов.
- Ranking Score (Оценка ранжирования)
- Числовое значение, определяющее позицию ресурса в результатах поиска.
- Scaling Factor (Коэффициент масштабирования)
- Множитель, применяемый к Ranking Scores высококачественных результатов из альтернативной выдачи для их повышения в объединенном рейтинге.
- Site Quality Score (Оценка качества сайта)
- Метрика, присваиваемая сайту и используемая для его классификации как high-quality или low-quality.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной процесс реагирования на поисковый запрос и активации альтернативного поиска.
- Система получает первый запрос и его результаты (с Ranking Scores).
- Проверяется Условие 1: идентифицировано ли пороговое количество (N) топовых результатов как ресурсы с low-quality sites.
- Если ДА, система получает второй (альтернативный) запрос из predetermined mapping (заранее определенного соответствия).
- Система получает результаты для второго запроса.
- Проверяется Условие 2: идентифицировано ли пороговое количество (M) топовых результатов второго запроса как ресурсы с high-quality sites.
- Если ДА, система предоставляет один или несколько результатов из второго набора в ответ на первый запрос.
Ядром изобретения является условный рабочий процесс, который активируется только тогда, когда качество исходной SERP низкое (Условие 1) И существует лучшая альтернатива (Условие 2). Этот процесс критически зависит от предварительно рассчитанных классификаций качества сайта и предварительно сгенерированных соответствий запросов.
Claim 6 (Зависимый): Детализирует механизм объединения и переранжирования результатов.
- Вычисляется Scaling Factor. Он является функцией от Ranking Score лучшего результата в первом наборе (R1) и выбранного результата во втором наборе (R2).
- Вычисляется масштабированная оценка (scaled ranking score) для результата из второго набора путем умножения его исходной оценки на Scaling Factor.
- Происходит финальное ранжирование объединенного набора на основе исходных и масштабированных оценок.
Описывается, как рассчитывается бустинг. Это не фиксированное повышение, а динамическое, зависящее от относительных оценок лучшего исходного результата и лучшего высококачественного альтернативного результата.
Claim 7 (Зависимый от 6): Определяет конкретную формулу для Scaling Factor.
Формула определена как .
Цель — вывести высококачественный результат (с оценкой R2) выше лучшего результата исходной выдачи (с оценкой R1). Новая оценка R2′ = R2 * ((R1+1)/R2) упрощается до R1+1. Это агрессивный механизм бустинга, который математически гарантирует, что лучший результат из альтернативного запроса займет первую позицию в объединенной выдаче (при условии, что более высокие оценки означают лучший ранг).
Claim 16 (Зависимый от 1): Описывает офлайн-процесс генерации mapping of queries to alternative queries.
- Анализируется журнал запросов (record of queries).
- Идентифицируются запросы, чьи результаты содержат больше порогового числа низкокачественных сайтов.
- Генерируются кандидаты в альтернативные запросы. Указанные методы: (i) замена термина запроса из базы данных замен (database of substitute query terms), или (ii) построение и обход Conceptual graph of queries.
- Кандидаты оцениваются по measure of confidence.
- Лучший кандидат (или кандидаты) выбирается как альтернативный запрос, и создается соответствие (mapping).
Это подтверждает существование значительной офлайн-инфраструктуры, посвященной анализу логов запросов, выявлению проблемных SERP и проактивному поиску высококачественных альтернатив с использованием как лексических замен, так и семантического анализа через концептуальный граф.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные на этапе индексирования, и влияя на финальные этапы ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно оценить качество сайтов и присвоить им Site Quality Score или классифицировать их (например, с помощью ‘белых’ и ‘черных’ списков). Эти данные сохраняются для последующего использования.
QUNDERSTANDING – Понимание Запросов (Офлайн-компонент)
Система заранее (офлайн) анализирует логи запросов, строит Conceptual graph of queries и генерирует Alternative Query Mapping Database. Это часть глобального понимания пространства запросов и их взаимосвязей.
RANKING – Ранжирование
На этом этапе генерируется первый набор результатов для исходного запроса с использованием стандартных Ranking Scores. Также генерируются результаты для альтернативного запроса, если он активирован.
RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента происходит на этих финальных этапах в реальном времени.
- Оценка качества SERP: Система анализирует результаты этапа RANKING, используя данные о качестве сайтов.
- Триггер и Альтернативный поиск: Если качество SERP низкое (порог N достигнут), система получает альтернативный запрос из базы данных и выполняет дополнительный поиск.
- Смешивание и Переранжирование: Если качество альтернативной SERP высокое (порог M), система вычисляет и применяет Scaling Factor к высококачественным результатам и объединяет два набора. Происходит финальная сортировка.
Входные данные:
- Исходный запрос пользователя.
- Первый набор результатов с их Ranking Scores.
- Данные о качестве сайтов (Site Quality Scores или классификация).
- Alternative Query Mapping Database.
Выходные данные:
- Объединенный набор результатов поиска с пересчитанными (масштабированными) Ranking Scores.
На что влияет
- Конкретные ниши или тематики: Наибольшее влияние ожидается в нишах, подверженных спаму, или в чувствительных тематиках (потенциально YMYL), где качество критично и где часто встречаются низкокачественные сайты, оптимизированные под специфические запросы.
- Специфические запросы: Влияет на запросы, для которых стандартное ранжирование приводит к выдаче низкого качества. Это могут быть запросы, где сигналами релевантности легко манипулировать.
Когда применяется
Алгоритм применяется выборочно при выполнении строго определенных условий:
- Триггер активации: Когда по крайней мере пороговое число N топовых результатов по исходному запросу размещено на сайтах, идентифицированных как low-quality sites.
- Пороговые значения (N): Порог N может быть конкретным числом (например, 3, 5, 10, 20) или процентом от топовых результатов (например, 30%, 50%, 80%, 90%).
- Условие применения: Алгоритм используется, только если существует подходящий альтернативный запрос в predetermined mapping, который удовлетворяет критериям качества (порог M).
Пошаговый алгоритм
Процесс А: Обработка запроса в реальном времени
- Получение запроса и первичных результатов: Система получает первый запрос и генерирует первый набор результатов с Ranking Scores.
- Оценка качества SERP: Анализируются сайты топовых результатов.
- Проверка триггера (Порог N): Определяется, размещены ли более чем N топовых результатов на low-quality sites.
- Если НЕТ: Предоставить первый набор результатов.
- Если ДА: Перейти к следующему шагу.
- Получение альтернативного запроса: Система ищет альтернативный запрос в Alternative Query Mapping Database.
- Генерация вторичных результатов: Получается второй набор результатов для альтернативного запроса.
- Валидация альтернативы (Порог M): Проверяется, содержит ли второй набор M high-quality sites в топе. (В патенте также упоминается опциональная проверка дополнительных критериев, таких как пересечение результатов).
- Если НЕТ: Предоставить первый набор результатов или (опционально) попробовать другой альтернативный запрос.
- Если ДА: Перейти к следующему шагу.
- Расчет Scaling Factor: Вычисляется коэффициент масштабирования. Например, используется формула: .
- Применение Scaling Factor: Ranking Scores высококачественных ресурсов из второго набора умножаются на Scaling Factor.
- Объединение и ранжирование: Два набора объединяются и сортируются по итоговым оценкам.
- Предоставление результатов: Объединенный набор предоставляется пользователю.
Процесс Б: Офлайн-генерация базы альтернативных запросов
- Анализ логов: Система анализирует журнал запросов (record of queries) за определенный период (час, день и т.д.).
- Идентификация проблемных запросов: Выявляются запросы, где превышен порог N низкокачественных сайтов в топе.
- Генерация кандидатов: Для проблемных запросов генерируются кандидаты путем замены терминов (substitute query terms) или обхода Conceptual graph of queries.
- Валидация кандидатов: Проверяется выполнение критериев для кандидатов. В патенте упоминается проверка порога X (пересечение результатов между исходным и альтернативным запросом) и порога M (количество высококачественных сайтов в выдаче кандидата).
- Оценка и выбор: Рассчитывается measure of confidence, выбирается лучший кандидат.
- Сохранение соответствия: Связь сохраняется в Alternative Query Mapping Database.
Какие данные и как использует
Данные на входе
Патент фокусируется на механизме смешивания и не детализирует расчет базовых оценок релевантности. Он оперирует следующими данными:
- Факторы качества сайта (Site Quality Factors): Критически важные данные. Используются предварительно рассчитанные Site Quality Score или ‘белые’/’черные’ списки для классификации сайтов как low-quality или high-quality.
- Поведенческие факторы (косвенно): Журналы запросов (record of queries) используются в офлайн-процессе для анализа и генерации базы альтернативных запросов.
- Системные данные: Ranking Scores, полученные от основной поисковой системы для обоих наборов результатов. База данных замен терминов (database of substitute query terms).
Какие метрики используются и как они считаются
- Порог N: Минимальное количество/процент low-quality sites в топе исходной выдачи для активации алгоритма.
- Порог M: Минимальное количество high-quality sites в топе альтернативной выдачи.
- Порог X: Минимальное пересечение результатов между исходной и альтернативной выдачей (используется для обеспечения релевантности при генерации базы).
- Scaling Factor: Коэффициент для повышения оценок. Конкретная формула: .
- Measure of confidence: Метрика для выбора лучшего альтернативного запроса в офлайн-процессе, агрегирующая данные по порогам X и M, а также схожесть терминов.
Выводы
- Приоритет качества над прямой релевантностью: Патент демонстрирует готовность Google пожертвовать прямой релевантностью исходному запросу ради повышения общего качества выдачи. Система предпочтет результат с high-quality site по связанному запросу, чем результат с low-quality site по исходному запросу, если качество исходной выдачи неудовлетворительное.
- Агрессивное повышение (Aggressive Boosting): Механизм Scaling Factor крайне агрессивен. Описанная формула математически гарантирует, что лучший высококачественный результат займет позицию №1, вытеснив исходного лидера.
- Критичность Site Quality: Site Quality Score является не просто фактором ранжирования, а триггером для изменения логики обработки запроса. Классификация сайта как low-quality активирует защитные механизмы, направленные на его вытеснение из топа.
- Обеспечение релевантности через пересечение: Чтобы избежать подмешивания совершенно нерелевантного контента, система использует порог X (пересечение результатов между запросами) как обязательное условие при офлайн-генерации альтернативных запросов.
- Зависимость от предварительных вычислений: Система полагается на офлайн-процессы для оценки качества сайтов и генерации базы альтернативных запросов, что позволяет ей быстро применять корректировки в реальном времени.
- Концептуальный Граф Запросов: Google использует Conceptual graph of queries для понимания связей между запросами на основе общих результатов, что позволяет находить семантически близкие альтернативы, даже если они не содержат общих ключевых слов.
Практика
Best practices (это мы делаем)
- Фокус на глобальном качестве сайта (E-E-A-T): Это ключевая стратегия. Необходимо добиться классификации сайта как high-quality site. Это защищает от понижения данным алгоритмом и дает стратегическое преимущество: сайт сможет получать агрессивный бустинг (Scaling Factor) и появляться в выдаче по альтернативным запросам в нишах с низким качеством контента.
- Расширение семантического охвата (Topical Authority): Создавайте контент, который широко охватывает тему, а не оптимизирован только под узкий набор ключей. Это повышает вероятность того, что ваш контент будет признан релевантным для альтернативного запроса, который Google может использовать для улучшения выдачи по связанному исходному запросу.
- Мониторинг качества SERP в нише: Анализируйте выдачу. Если в топе доминируют сайты низкого качества (спам, MFA, дорвеи), это возможность для high-quality site занять лидирующие позиции за счет активации этого механизма, даже при более слабой прямой оптимизации под конкретный запрос.
Worst practices (это делать не надо)
- Игнорирование сигналов качества сайта: Стратегии, основанные только на манипуляции с ключевыми словами или ссылками без работы над общим качеством и авторитетностью сайта (E-E-A-T), крайне рискованны. Даже при достижении ТОП-1 по релевантности, сайт будет вытеснен, если система классифицирует его как low-quality и активирует этот механизм.
- Создание узкоспециализированных сайтов низкого качества: Этот патент напрямую направлен против тактик, когда создается множество сайтов (MFA, Дорвеи), оптимизированных под конкретные запросы, но не имеющих авторитета. Их доминирование в выдаче является триггером для поиска замены на авторитетных ресурсах.
- Фокус только на релевантности контента страницы: Недостаточно иметь релевантную страницу, если весь сайт имеет низкий Site Quality Score. Алгоритм оценивает качество на уровне сайта-источника для принятия решения о применении механизма.
Стратегическое значение
Патент подтверждает стратегический приоритет оценки качества сайта в целом. Site Quality является мета-фактором, который может переопределить стандартное ранжирование, основанное на релевантности. Долгосрочная SEO-стратегия должна быть направлена на построение авторитетных, надежных брендов и ресурсов. Этот механизм также объясняет, почему иногда в выдаче появляются результаты, которые кажутся менее релевантными тексту запроса, но принадлежат очень авторитетным сайтам.
Практические примеры
Сценарий: Вытеснение низкокачественного сайта в YMYL-нише
- Исходный запрос (Query 1): «быстрое средство от мигрени без рецепта»
- Исходная выдача (SERP 1): Топ-3 занимают агрессивные аффилиатные сайты с сомнительными рекомендациями и отсутствием медицинского авторитета. Google классифицирует их как low-quality sites. Порог N превышен.
- Активация механизма: Система ищет альтернативу в Alternative Query Mapping Database.
- Альтернативный запрос (Query 2): «лечение мигрени в домашних условиях»
- Альтернативная выдача (SERP 2): В топе авторитетные медицинские ресурсы (например, Mayo Clinic, WebMD), классифицированные как high-quality sites. Пороги M (качество) и X (пересечение результатов) достигнуты.
- Масштабирование и объединение: Система рассчитывает Scaling Factor по формуле и повышает Ranking Score статьи Mayo Clinic так, чтобы она гарантированно заняла позицию №1 в SERP 1.
- Результат: Пользователь, введя Query 1, видит на первом месте Mayo Clinic, а низкокачественные аффилиатные сайты смещаются вниз, несмотря на их прямую оптимизацию под исходный запрос.
Вопросы и ответы
Как система определяет, является ли сайт высококачественным (high-quality) или низкокачественным (low-quality)?
Патент не раскрывает конкретных факторов, но указывает на использование предварительно рассчитанного Site Quality Score, который сравнивается с порогами. Также упоминается возможность использования ‘белых’ (whitelist) и ‘черных’ (blacklist) списков, подготовленных вручную или иными методами. На практике это соответствует сигналам E-E-A-T и результатам работы алгоритмов оценки качества контента.
Насколько агрессивно повышаются результаты из альтернативного запроса?
Повышение крайне агрессивное. Описанная в патенте формула Scaling Factor математически гарантирует, что лучший высококачественный результат из альтернативной выдачи получит итоговую оценку выше, чем лучший результат из исходной выдачи (R1). Это означает, что он займет первую позицию в объединенном списке.
Как Google обеспечивает релевантность, если показывает результаты для другого запроса?
Релевантность обеспечивается на этапе генерации базы альтернативных запросов (офлайн). Система проверяет, что между топовыми результатами исходного и альтернативного запросов есть значительное пересечение (порог X). Это гарантирует, что оба запроса семантически связаны и ведут к похожему набору документов, что снижает риск показа нерелевантного контента.
Что такое ‘Концептуальный граф запросов’ (Conceptual graph of queries) и как он используется?
Это структура данных, используемая для офлайн-анализа. Узлы в графе — это запросы и их результаты, а связи указывают на взаимоотношения. Система использует этот граф для поиска альтернативных запросов. Связь устанавливается, если два запроса имеют достаточное количество общих результатов в топе. Это позволяет находить семантически близкие запросы, которые не обязательно имеют общие ключевые слова.
Может ли этот механизм помочь моему высококачественному сайту ранжироваться по запросам, под которые он не оптимизирован?
Да, это одно из ключевых преимуществ для high-quality sites. Если ваш сайт является авторитетным источником в теме, он может быть выбран в качестве результата для альтернативного запроса и затем агрессивно повышен в выдаче по исходному запросу, где наблюдается дефицит качества, даже если прямая оптимизация под этот исходный запрос отсутствует.
Что делать, если мой сайт был вытеснен из топа результатом, который кажется менее релевантным?
Необходимо критически оценить качество вашего сайта и сравнить его с конкурентом. Весьма вероятно, что ваш сайт был классифицирован как low-quality (или недостаточно качественный), а конкурент как high-quality, и система активировала этот механизм. В этом случае необходимо сосредоточиться на улучшении общих сигналов качества сайта (E-E-A-T) и повышении авторитетности всего ресурса.
Применяется ли этот алгоритм ко всем запросам?
Нет. Он активируется выборочно (Selectively). Триггером является условие, что значительное количество (порог N) топовых результатов размещено на низкокачественных сайтах. Кроме того, должен существовать подходящий альтернативный запрос в базе данных. В большинстве случаев используется стандартное ранжирование.
Как часто обновляется база альтернативных запросов (Alternative Query Mapping Database)?
Патент указывает, что генерация базы происходит офлайн путем анализа журналов запросов за определенный период (час, день и т.д.). Это подразумевает периодическое обновление базы для отражения изменений в контенте интернета, поведении пользователей и изменениях в оценках качества сайтов.
Что важнее для SEO в контексте этого патента: качество страницы или качество сайта?
Качество сайта (Site Quality) является определяющим фактором в этом конкретном механизме. Именно классификация сайта как low-quality или high-quality запускает весь процесс или делает сайт бенефициаром этого механизма. Это подчеркивает критическую важность работы над репутацией, экспертностью и авторитетностью всего домена.
Какова связь этого патента с алгоритмом Google Panda?
Одним из изобретателей является Navneet Panda. Патент был подан после запуска алгоритма Panda и развивает идеи интеграции сигналов качества сайта в процесс ранжирования. Логично предположить, что алгоритмы типа Panda (или современные системы, такие как Helpful Content System) отвечают за вычисление Site Quality Score, а описанный механизм использует эти оценки для агрессивной корректировки выдачи в реальном времени.