SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google подмешивает результаты из альтернативных запросов, чтобы вытеснить низкокачественные сайты из топа выдачи

SELECTIVELY GENERATING ALTERNATIVE QUERIES (Выборочное генерирование альтернативных запросов)
  • US9135307B1
  • Google LLC
  • 2012-12-27
  • 2015-09-15
  • SERP
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм улучшения качества поисковой выдачи. Если по исходному запросу в топе ранжируется слишком много низкокачественных сайтов, система находит связанный альтернативный запрос, который возвращает высококачественные результаты. Затем эти результаты агрессивно повышаются в ранжировании и подмешиваются в исходную выдачу, чтобы гарантировать пользователю доступ к качественному контенту.

Описание

Какую проблему решает

Патент решает проблему ситуаций, когда стандартные алгоритмы ранжирования формируют поисковую выдачу (SERP), в которой доминируют ресурсы с сайтов, классифицированных как низкокачественные (low-quality sites). Цель изобретения — модифицировать такой набор результатов, чтобы гарантировать, что в топе выдачи будут присутствовать ресурсы с сайтов, идентифицированных как высококачественные (high-quality sites), даже если они могут быть менее релевантны исходной формулировке запроса.

Что запатентовано

Запатентована система, которая выборочно использует альтернативные запросы для улучшения качества SERP. Если определенное пороговое количество (N) топовых результатов по исходному запросу размещено на низкокачественных сайтах, система активирует поиск по альтернативному запросу (alternative query). Этот альтернативный запрос подобран так, чтобы возвращать результаты с высококачественных сайтов. Результаты альтернативного запроса затем объединяются с исходными, причем высококачественным результатам дается значительное повышение (boost) в ранжировании.

Как это работает

Система работает в несколько этапов:

  • Оценка качества SERP: Анализируется качество сайтов в топе выдачи по исходному запросу.
  • Триггер: Если количество низкокачественных сайтов превышает порог N, система инициирует поиск альтернативы.
  • Получение альтернативного запроса: Система использует заранее подготовленную базу данных соответствий (Alternative Query Mapping Database) для поиска альтернативного запроса, связанного с исходным.
  • Валидация: Проверяется, что выдача по альтернативному запросу содержит достаточно высококачественных сайтов (порог M). При генерации альтернатив также учитывается пересечение с исходной выдачей (порог X).
  • Масштабирование и объединение: Вычисляется Scaling Factor, который значительно повышает Ranking Scores высококачественных результатов из альтернативной выдачи. Затем результаты объединяются. Описанная формула масштабирования может гарантировать, что лучший высококачественный результат займет первую позицию в итоговой выдаче.

Актуальность для SEO

Высокая. Борьба с низкокачественным контентом и продвижение авторитетных источников (связанное с концепцией E-E-A-T) остаются центральными задачами Google. Этот патент описывает конкретный и агрессивный метод 'переписывания' выдачи на лету при неудовлетворительном качестве SERP. Учитывая, что одним из изобретателей является Navneet Panda, этот механизм тесно связан с общей философией алгоритмов качества Google.

Важность для SEO

Патент имеет критическое значение для SEO-стратегии (9/10). Он демонстрирует конкретный механизм, позволяющий Google предпочесть авторитетность (High-Quality Site) прямой текстовой релевантности. Если сайт классифицирован как Low-Quality, этот механизм может активно вытеснять его из топа, даже если он занимает позицию №1. Если сайт классифицирован как High-Quality, он может давать дополнительный трафик по смежным запросам, где наблюдается дефицит качества.

Детальный разбор

Термины и определения

Alternative Query (Альтернативный запрос)
Второй запрос, используемый системой, если результаты первого (исходного) запроса признаны низкокачественными. Он берется из заранее определенного соответствия (predetermined mapping).
Alternative Query Mapping Database (База данных соответствия альтернативных запросов)
Хранилище данных, содержащее заранее рассчитанные соответствия между исходными и альтернативными запросами. Генерируется офлайн.
Conceptual graph of queries (Концептуальный граф запросов)
Структура данных, используемая в офлайн-процессе для поиска кандидатов в альтернативные запросы. Узлы представляют запросы и их топовые результаты. Связи указывают на взаимоотношения между запросами, например, на основе пересечения результатов.
High-quality site (Высококачественный сайт)
Сайт, предварительно идентифицированный как качественный. Определение может основываться на Site Quality Score выше определенного порога или на включении в 'белый список' (whitelist).
Low-quality site (Низкокачественный сайт)
Сайт, предварительно идентифицированный как низкокачественный. Определение может основываться на Site Quality Score ниже определенного порога или на включении в 'черный список' (blacklist).
Measure of confidence (Мера уверенности)
Метрика, используемая в офлайн-процессе для выбора наилучшего альтернативного запроса среди кандидатов. Учитывает такие факторы, как пересечение результатов (Порог X), количество высококачественных сайтов (Порог M) и схожесть терминов запросов.
Ranking Score (Оценка ранжирования)
Числовое значение, определяющее позицию ресурса в результатах поиска.
Scaling Factor (Коэффициент масштабирования)
Множитель, применяемый к Ranking Scores высококачественных результатов из альтернативной выдачи для их повышения в объединенном рейтинге.
Site Quality Score (Оценка качества сайта)
Метрика, присваиваемая сайту и используемая для его классификации как high-quality или low-quality.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс реагирования на поисковый запрос и активации альтернативного поиска.

  1. Система получает первый запрос и его результаты (с Ranking Scores).
  2. Проверяется Условие 1: идентифицировано ли пороговое количество (N) топовых результатов как ресурсы с low-quality sites.
  3. Если ДА, система получает второй (альтернативный) запрос из predetermined mapping (заранее определенного соответствия).
  4. Система получает результаты для второго запроса.
  5. Проверяется Условие 2: идентифицировано ли пороговое количество (M) топовых результатов второго запроса как ресурсы с high-quality sites.
  6. Если ДА, система предоставляет один или несколько результатов из второго набора в ответ на первый запрос.

Ядром изобретения является условный рабочий процесс, который активируется только тогда, когда качество исходной SERP низкое (Условие 1) И существует лучшая альтернатива (Условие 2). Этот процесс критически зависит от предварительно рассчитанных классификаций качества сайта и предварительно сгенерированных соответствий запросов.

Claim 6 (Зависимый): Детализирует механизм объединения и переранжирования результатов.

  1. Вычисляется Scaling Factor. Он является функцией от Ranking Score лучшего результата в первом наборе (R1) и выбранного результата во втором наборе (R2).
  2. Вычисляется масштабированная оценка (scaled ranking score) для результата из второго набора путем умножения его исходной оценки на Scaling Factor.
  3. Происходит финальное ранжирование объединенного набора на основе исходных и масштабированных оценок.

Описывается, как рассчитывается бустинг. Это не фиксированное повышение, а динамическое, зависящее от относительных оценок лучшего исходного результата и лучшего высококачественного альтернативного результата.

Claim 7 (Зависимый от 6): Определяет конкретную формулу для Scaling Factor.

Формула определена как (R1+1)/R2(R_1+1)/R_2(R1​+1)/R2​.

Цель — вывести высококачественный результат (с оценкой R2) выше лучшего результата исходной выдачи (с оценкой R1). Новая оценка R2' = R2 * ((R1+1)/R2) упрощается до R1+1. Это агрессивный механизм бустинга, который математически гарантирует, что лучший результат из альтернативного запроса займет первую позицию в объединенной выдаче (при условии, что более высокие оценки означают лучший ранг).

Claim 16 (Зависимый от 1): Описывает офлайн-процесс генерации mapping of queries to alternative queries.

  1. Анализируется журнал запросов (record of queries).
  2. Идентифицируются запросы, чьи результаты содержат больше порогового числа низкокачественных сайтов.
  3. Генерируются кандидаты в альтернативные запросы. Указанные методы: (i) замена термина запроса из базы данных замен (database of substitute query terms), или (ii) построение и обход Conceptual graph of queries.
  4. Кандидаты оцениваются по measure of confidence.
  5. Лучший кандидат (или кандидаты) выбирается как альтернативный запрос, и создается соответствие (mapping).

Это подтверждает существование значительной офлайн-инфраструктуры, посвященной анализу логов запросов, выявлению проблемных SERP и проактивному поиску высококачественных альтернатив с использованием как лексических замен, так и семантического анализа через концептуальный граф.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные на этапе индексирования, и влияя на финальные этапы ранжирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно оценить качество сайтов и присвоить им Site Quality Score или классифицировать их (например, с помощью 'белых' и 'черных' списков). Эти данные сохраняются для последующего использования.

QUNDERSTANDING – Понимание Запросов (Офлайн-компонент)
Система заранее (офлайн) анализирует логи запросов, строит Conceptual graph of queries и генерирует Alternative Query Mapping Database. Это часть глобального понимания пространства запросов и их взаимосвязей.

RANKING – Ранжирование
На этом этапе генерируется первый набор результатов для исходного запроса с использованием стандартных Ranking Scores. Также генерируются результаты для альтернативного запроса, если он активирован.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента происходит на этих финальных этапах в реальном времени.

  1. Оценка качества SERP: Система анализирует результаты этапа RANKING, используя данные о качестве сайтов.
  2. Триггер и Альтернативный поиск: Если качество SERP низкое (порог N достигнут), система получает альтернативный запрос из базы данных и выполняет дополнительный поиск.
  3. Смешивание и Переранжирование: Если качество альтернативной SERP высокое (порог M), система вычисляет и применяет Scaling Factor к высококачественным результатам и объединяет два набора. Происходит финальная сортировка.

Входные данные:

  • Исходный запрос пользователя.
  • Первый набор результатов с их Ranking Scores.
  • Данные о качестве сайтов (Site Quality Scores или классификация).
  • Alternative Query Mapping Database.

Выходные данные:

  • Объединенный набор результатов поиска с пересчитанными (масштабированными) Ranking Scores.

На что влияет

  • Конкретные ниши или тематики: Наибольшее влияние ожидается в нишах, подверженных спаму, или в чувствительных тематиках (потенциально YMYL), где качество критично и где часто встречаются низкокачественные сайты, оптимизированные под специфические запросы.
  • Специфические запросы: Влияет на запросы, для которых стандартное ранжирование приводит к выдаче низкого качества. Это могут быть запросы, где сигналами релевантности легко манипулировать.

Когда применяется

Алгоритм применяется выборочно при выполнении строго определенных условий:

  • Триггер активации: Когда по крайней мере пороговое число N топовых результатов по исходному запросу размещено на сайтах, идентифицированных как low-quality sites.
  • Пороговые значения (N): Порог N может быть конкретным числом (например, 3, 5, 10, 20) или процентом от топовых результатов (например, 30%, 50%, 80%, 90%).
  • Условие применения: Алгоритм используется, только если существует подходящий альтернативный запрос в predetermined mapping, который удовлетворяет критериям качества (порог M).

Пошаговый алгоритм

Процесс А: Обработка запроса в реальном времени

  1. Получение запроса и первичных результатов: Система получает первый запрос и генерирует первый набор результатов с Ranking Scores.
  2. Оценка качества SERP: Анализируются сайты топовых результатов.
  3. Проверка триггера (Порог N): Определяется, размещены ли более чем N топовых результатов на low-quality sites.
    • Если НЕТ: Предоставить первый набор результатов.
    • Если ДА: Перейти к следующему шагу.
  4. Получение альтернативного запроса: Система ищет альтернативный запрос в Alternative Query Mapping Database.
  5. Генерация вторичных результатов: Получается второй набор результатов для альтернативного запроса.
  6. Валидация альтернативы (Порог M): Проверяется, содержит ли второй набор M high-quality sites в топе. (В патенте также упоминается опциональная проверка дополнительных критериев, таких как пересечение результатов).
    • Если НЕТ: Предоставить первый набор результатов или (опционально) попробовать другой альтернативный запрос.
    • Если ДА: Перейти к следующему шагу.
  7. Расчет Scaling Factor: Вычисляется коэффициент масштабирования. Например, используется формула: (R1+1)/R2(R_1+1)/R_2(R1​+1)/R2​.
  8. Применение Scaling Factor: Ranking Scores высококачественных ресурсов из второго набора умножаются на Scaling Factor.
  9. Объединение и ранжирование: Два набора объединяются и сортируются по итоговым оценкам.
  10. Предоставление результатов: Объединенный набор предоставляется пользователю.

Процесс Б: Офлайн-генерация базы альтернативных запросов

  1. Анализ логов: Система анализирует журнал запросов (record of queries) за определенный период (час, день и т.д.).
  2. Идентификация проблемных запросов: Выявляются запросы, где превышен порог N низкокачественных сайтов в топе.
  3. Генерация кандидатов: Для проблемных запросов генерируются кандидаты путем замены терминов (substitute query terms) или обхода Conceptual graph of queries.
  4. Валидация кандидатов: Проверяется выполнение критериев для кандидатов. В патенте упоминается проверка порога X (пересечение результатов между исходным и альтернативным запросом) и порога M (количество высококачественных сайтов в выдаче кандидата).
  5. Оценка и выбор: Рассчитывается measure of confidence, выбирается лучший кандидат.
  6. Сохранение соответствия: Связь сохраняется в Alternative Query Mapping Database.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме смешивания и не детализирует расчет базовых оценок релевантности. Он оперирует следующими данными:

  • Факторы качества сайта (Site Quality Factors): Критически важные данные. Используются предварительно рассчитанные Site Quality Score или 'белые'/'черные' списки для классификации сайтов как low-quality или high-quality.
  • Поведенческие факторы (косвенно): Журналы запросов (record of queries) используются в офлайн-процессе для анализа и генерации базы альтернативных запросов.
  • Системные данные: Ranking Scores, полученные от основной поисковой системы для обоих наборов результатов. База данных замен терминов (database of substitute query terms).

Какие метрики используются и как они считаются

  • Порог N: Минимальное количество/процент low-quality sites в топе исходной выдачи для активации алгоритма.
  • Порог M: Минимальное количество high-quality sites в топе альтернативной выдачи.
  • Порог X: Минимальное пересечение результатов между исходной и альтернативной выдачей (используется для обеспечения релевантности при генерации базы).
  • Scaling Factor: Коэффициент для повышения оценок. Конкретная формула: (R1+1)/R2(R_1+1)/R_2(R1​+1)/R2​.
  • Measure of confidence: Метрика для выбора лучшего альтернативного запроса в офлайн-процессе, агрегирующая данные по порогам X и M, а также схожесть терминов.

Выводы

  1. Приоритет качества над прямой релевантностью: Патент демонстрирует готовность Google пожертвовать прямой релевантностью исходному запросу ради повышения общего качества выдачи. Система предпочтет результат с high-quality site по связанному запросу, чем результат с low-quality site по исходному запросу, если качество исходной выдачи неудовлетворительное.
  2. Агрессивное повышение (Aggressive Boosting): Механизм Scaling Factor крайне агрессивен. Описанная формула (R1+1)/R2(R_1+1)/R_2(R1​+1)/R2​ математически гарантирует, что лучший высококачественный результат займет позицию №1, вытеснив исходного лидера.
  3. Критичность Site Quality: Site Quality Score является не просто фактором ранжирования, а триггером для изменения логики обработки запроса. Классификация сайта как low-quality активирует защитные механизмы, направленные на его вытеснение из топа.
  4. Обеспечение релевантности через пересечение: Чтобы избежать подмешивания совершенно нерелевантного контента, система использует порог X (пересечение результатов между запросами) как обязательное условие при офлайн-генерации альтернативных запросов.
  5. Зависимость от предварительных вычислений: Система полагается на офлайн-процессы для оценки качества сайтов и генерации базы альтернативных запросов, что позволяет ей быстро применять корректировки в реальном времени.
  6. Концептуальный Граф Запросов: Google использует Conceptual graph of queries для понимания связей между запросами на основе общих результатов, что позволяет находить семантически близкие альтернативы, даже если они не содержат общих ключевых слов.

Практика

Best practices (это мы делаем)

  • Фокус на глобальном качестве сайта (E-E-A-T): Это ключевая стратегия. Необходимо добиться классификации сайта как high-quality site. Это защищает от понижения данным алгоритмом и дает стратегическое преимущество: сайт сможет получать агрессивный бустинг (Scaling Factor) и появляться в выдаче по альтернативным запросам в нишах с низким качеством контента.
  • Расширение семантического охвата (Topical Authority): Создавайте контент, который широко охватывает тему, а не оптимизирован только под узкий набор ключей. Это повышает вероятность того, что ваш контент будет признан релевантным для альтернативного запроса, который Google может использовать для улучшения выдачи по связанному исходному запросу.
  • Мониторинг качества SERP в нише: Анализируйте выдачу. Если в топе доминируют сайты низкого качества (спам, MFA, дорвеи), это возможность для high-quality site занять лидирующие позиции за счет активации этого механизма, даже при более слабой прямой оптимизации под конкретный запрос.

Worst practices (это делать не надо)

  • Игнорирование сигналов качества сайта: Стратегии, основанные только на манипуляции с ключевыми словами или ссылками без работы над общим качеством и авторитетностью сайта (E-E-A-T), крайне рискованны. Даже при достижении ТОП-1 по релевантности, сайт будет вытеснен, если система классифицирует его как low-quality и активирует этот механизм.
  • Создание узкоспециализированных сайтов низкого качества: Этот патент напрямую направлен против тактик, когда создается множество сайтов (MFA, Дорвеи), оптимизированных под конкретные запросы, но не имеющих авторитета. Их доминирование в выдаче является триггером для поиска замены на авторитетных ресурсах.
  • Фокус только на релевантности контента страницы: Недостаточно иметь релевантную страницу, если весь сайт имеет низкий Site Quality Score. Алгоритм оценивает качество на уровне сайта-источника для принятия решения о применении механизма.

Стратегическое значение

Патент подтверждает стратегический приоритет оценки качества сайта в целом. Site Quality является мета-фактором, который может переопределить стандартное ранжирование, основанное на релевантности. Долгосрочная SEO-стратегия должна быть направлена на построение авторитетных, надежных брендов и ресурсов. Этот механизм также объясняет, почему иногда в выдаче появляются результаты, которые кажутся менее релевантными тексту запроса, но принадлежат очень авторитетным сайтам.

Практические примеры

Сценарий: Вытеснение низкокачественного сайта в YMYL-нише

  1. Исходный запрос (Query 1): "быстрое средство от мигрени без рецепта"
  2. Исходная выдача (SERP 1): Топ-3 занимают агрессивные аффилиатные сайты с сомнительными рекомендациями и отсутствием медицинского авторитета. Google классифицирует их как low-quality sites. Порог N превышен.
  3. Активация механизма: Система ищет альтернативу в Alternative Query Mapping Database.
  4. Альтернативный запрос (Query 2): "лечение мигрени в домашних условиях"
  5. Альтернативная выдача (SERP 2): В топе авторитетные медицинские ресурсы (например, Mayo Clinic, WebMD), классифицированные как high-quality sites. Пороги M (качество) и X (пересечение результатов) достигнуты.
  6. Масштабирование и объединение: Система рассчитывает Scaling Factor по формуле (R1+1)/R2(R_1+1)/R_2(R1​+1)/R2​ и повышает Ranking Score статьи Mayo Clinic так, чтобы она гарантированно заняла позицию №1 в SERP 1.
  7. Результат: Пользователь, введя Query 1, видит на первом месте Mayo Clinic, а низкокачественные аффилиатные сайты смещаются вниз, несмотря на их прямую оптимизацию под исходный запрос.

Вопросы и ответы

Как система определяет, является ли сайт высококачественным (high-quality) или низкокачественным (low-quality)?

Патент не раскрывает конкретных факторов, но указывает на использование предварительно рассчитанного Site Quality Score, который сравнивается с порогами. Также упоминается возможность использования 'белых' (whitelist) и 'черных' (blacklist) списков, подготовленных вручную или иными методами. На практике это соответствует сигналам E-E-A-T и результатам работы алгоритмов оценки качества контента.

Насколько агрессивно повышаются результаты из альтернативного запроса?

Повышение крайне агрессивное. Описанная в патенте формула Scaling Factor (R1+1)/R2(R_1+1)/R_2(R1​+1)/R2​ математически гарантирует, что лучший высококачественный результат из альтернативной выдачи получит итоговую оценку выше, чем лучший результат из исходной выдачи (R1). Это означает, что он займет первую позицию в объединенном списке.

Как Google обеспечивает релевантность, если показывает результаты для другого запроса?

Релевантность обеспечивается на этапе генерации базы альтернативных запросов (офлайн). Система проверяет, что между топовыми результатами исходного и альтернативного запросов есть значительное пересечение (порог X). Это гарантирует, что оба запроса семантически связаны и ведут к похожему набору документов, что снижает риск показа нерелевантного контента.

Что такое 'Концептуальный граф запросов' (Conceptual graph of queries) и как он используется?

Это структура данных, используемая для офлайн-анализа. Узлы в графе — это запросы и их результаты, а связи указывают на взаимоотношения. Система использует этот граф для поиска альтернативных запросов. Связь устанавливается, если два запроса имеют достаточное количество общих результатов в топе. Это позволяет находить семантически близкие запросы, которые не обязательно имеют общие ключевые слова.

Может ли этот механизм помочь моему высококачественному сайту ранжироваться по запросам, под которые он не оптимизирован?

Да, это одно из ключевых преимуществ для high-quality sites. Если ваш сайт является авторитетным источником в теме, он может быть выбран в качестве результата для альтернативного запроса и затем агрессивно повышен в выдаче по исходному запросу, где наблюдается дефицит качества, даже если прямая оптимизация под этот исходный запрос отсутствует.

Что делать, если мой сайт был вытеснен из топа результатом, который кажется менее релевантным?

Необходимо критически оценить качество вашего сайта и сравнить его с конкурентом. Весьма вероятно, что ваш сайт был классифицирован как low-quality (или недостаточно качественный), а конкурент как high-quality, и система активировала этот механизм. В этом случае необходимо сосредоточиться на улучшении общих сигналов качества сайта (E-E-A-T) и повышении авторитетности всего ресурса.

Применяется ли этот алгоритм ко всем запросам?

Нет. Он активируется выборочно (Selectively). Триггером является условие, что значительное количество (порог N) топовых результатов размещено на низкокачественных сайтах. Кроме того, должен существовать подходящий альтернативный запрос в базе данных. В большинстве случаев используется стандартное ранжирование.

Как часто обновляется база альтернативных запросов (Alternative Query Mapping Database)?

Патент указывает, что генерация базы происходит офлайн путем анализа журналов запросов за определенный период (час, день и т.д.). Это подразумевает периодическое обновление базы для отражения изменений в контенте интернета, поведении пользователей и изменениях в оценках качества сайтов.

Что важнее для SEO в контексте этого патента: качество страницы или качество сайта?

Качество сайта (Site Quality) является определяющим фактором в этом конкретном механизме. Именно классификация сайта как low-quality или high-quality запускает весь процесс или делает сайт бенефициаром этого механизма. Это подчеркивает критическую важность работы над репутацией, экспертностью и авторитетностью всего домена.

Какова связь этого патента с алгоритмом Google Panda?

Одним из изобретателей является Navneet Panda. Патент был подан после запуска алгоритма Panda и развивает идеи интеграции сигналов качества сайта в процесс ранжирования. Логично предположить, что алгоритмы типа Panda (или современные системы, такие как Helpful Content System) отвечают за вычисление Site Quality Score, а описанный механизм использует эти оценки для агрессивной корректировки выдачи в реальном времени.

Похожие патенты

Как Google принудительно добавляет в выдачу результаты с авторитетных сайтов, используя модифицированные запросы и сайт-ограниченный поиск
Google использует механизм для гарантированного включения результатов с авторитетных сайтов в поисковую выдачу. Если исходный запрос содержит ключевое слово, связанное с авторитетным источником, или если качество стандартной выдачи низкое, система выполняет дополнительный поиск. Этот поиск строго ограничен рамками авторитетного сайта и использует модифицированную (часто агрессивно расширенную) версию исходного запроса. Полученный результат затем внедряется в топ выдачи.
  • US9659064B1
  • 2017-05-23
  • EEAT и качество

  • SERP

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google может генерировать альтернативные запросы из контента страниц и встраивать их в сниппеты
Google использует механизм для помощи пользователям в уточнении их поискового намерения. Система анализирует текст веб-страниц в результатах поиска и находит фразы, похожие на исходный запрос или характеризующие документ. Эти фразы затем встраиваются непосредственно в сниппеты как кликабельные предложения для нового поиска, облегчая навигацию и уточнение запроса.
  • US9183323B1
  • 2015-11-10
  • Семантика и интент

  • SERP

Как Google тестирует изменения в критериях индексации без перестроения всего индекса
Google использует систему для эффективного тестирования и оценки различных критериев отбора ресурсов для включения в индекс. Вместо затратного перестроения индекса для каждого эксперимента, система симулирует, как разные процессы отбора повлияют на выдачу. Это позволяет сравнивать гипотетические индексы с помощью A/B тестов или асессоров, ускоряя разработку и улучшение качества индекса.
  • US8489604B1
  • 2013-07-16
  • Индексация

  • SERP

Как Google обучается распознавать синонимы, анализируя текст сниппетов в результатах поиска
Google использует текст сниппетов для улучшения систем понимания запросов. Анализируя, какие слова часто появляются в сниппетах релевантных или кликабельных результатов, система выявляет потенциальные синонимы для исходных ключевых слов. Это позволяет автоматически расширять будущие запросы, включая эти синонимы для повышения полноты выдачи.
  • US20140358904A1
  • 2014-12-04
  • Семантика и интент

  • SERP

Популярные патенты

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google решает, показывать ли прямой ответ, анализируя частоту использования естественного языка в исторических запросах о факте
Google анализирует исторические данные о том, как пользователи ищут конкретный факт. Если они часто используют естественный язык (например, «какая высота у Эйфелевой башни»), система считает, что пользователи действительно ищут этот факт. На основе этого рассчитывается «Оценка поиска фактов» (Fact-Seeking Score). Эта оценка используется как сигнал ранжирования, чтобы решить, нужно ли показывать прямой ответ (Factual Answer) и насколько высоко его разместить в результатах поиска.
  • US9396235B1
  • 2016-07-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

seohardcore