
Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
Патент решает задачу обеспечения своевременности и актуальности предложений связанных запросов (Related Search Suggestions). Цель — динамически обновлять эти предложения, чтобы они отражали недавние события и текущие тренды (recent and current events), а не только исторически популярные ассоциации. Например, если произошло землетрясение в Пхеньяне, система должна предложить "pyongyang earthquake" при поиске "North Korea".
Запатентована система для динамической генерации "свежих" связанных поисковых предложений. Система выявляет запросы, которые недавно стали популярными (Fresh Queries), анализируя логи различных поисковых вертикалей. Ключевым элементом является двухэтапная валидация этих запросов: обязательное наличие достаточного количества новостных результатов (news results) в выдаче и подтверждение качества через анализ поведения пользователей (например, CTR).
Система работает в двух режимах: офлайн-генерация кандидатов и онлайн-сопоставление.
Corpus-based data (возвращать достаточно news results) и Session-based data (иметь хорошие поведенческие метрики, например CTR).Высокая. Концепция свежести (QDF - Query Deserves Freshness) и интеграция данных в реальном времени (включая упомянутые в патенте микроблоги, такие как Twitter/X) остаются критически важными для Google. Описанные механизмы лежат в основе работы Google Trends и динамического обновления блоков "Related Searches" в ответ на текущие события.
Патент имеет существенное значение для SEO (7.5/10). Он не описывает ранжирование основного веб-поиска, но раскрывает механизм формирования важной SERP-фичи. Это критически важно для News SEO, стратегий работы с трендами (Newsjacking) и управления репутацией (SERM). Патент подчеркивает, что для получения видимости в контексте трендов необходима комбинация скорости, новостной релевантности и высокого вовлечения пользователей (CTR).
Fresh Query, который прошел валидацию по наличию News Results и поведенческим метрикам. Из этих запросов формируется финальный список предложений.News Results.rate of change), отклонение от ожидаемой частоты (deviation from expected frequency) или достижение порогового числа вхождений.Search Logs за Recent Time Period.term-weighted edit distance). Учитывает синонимы и стоп-слова.Click-Through Rate (CTR) и количество кликов.CTR, количество кликов и данные об уточнениях запросов (Refinement).Claim 1 (Независимый пункт): Описывает основной метод генерации свежих связанных предложений.
prior queries) из недавнего периода времени (recent time period), которые удовлетворяют критерию (criterion).candidate queries).threshold number of news results).match) запросу пользователя.related search suggestions.Ядро изобретения — это двухэтапная фильтрация: сначала идентификация статистического тренда в логах, а затем обязательная валидация этого тренда через наличие актуального новостного контента в выдаче.
Claim 2 (Зависимый от 1): Детализирует ранжирование предложений.
Ранжирование сопоставленных запросов основывается на проценте новостных результатов в выдаче по этому запросу и данных о релевантности (relevance data), указывающих на взаимодействие пользователя с результатами.
Claim 5 (Зависимый от 2): Уточняет relevance data.
Данные о релевантности включают CTR результатов поиска и/или количество кликов по результатам.
Claim 6 (Зависимый от 1): Определяет критерии соответствия (match).
Соответствием считается кандидат, который является суперстрокой (superstring), уточнением (refinement) или близок (near) к запросу пользователя.
Изобретение применяется на нескольких этапах поисковой архитектуры, сочетая офлайн-анализ и обработку в реальном времени.
INDEXING – Индексирование и извлечение признаков
Система зависит от быстрого индексирования и способности классифицировать контент как News Results (новости, блоги, микроблоги). Эти данные необходимы для валидации кандидатов (Corpus-based data).
QUNDERSTANDING – Понимание Запросов (Офлайн-процессы)
Основная часть работы по подготовке данных. Система (Fresh Query Component) выполняет:
Search Logs и Result Selection Logs.Corpus-based data и Session-based data (CTR).Candidate Queries.METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Онлайн-процессы)
При обработке запроса пользователя:
Matching Component) сопоставляет запрос с пулом Candidate Queries.Ranking Component) ранжирует подходящие кандидаты.Входные данные:
CTR и Refinements).News results).Выходные данные:
News Results: новостные статьи, свежие видео, посты в блогах и микроблогах.Алгоритм применяется при выполнении строгих условий:
News results (например, 50% результатов являются новостными).CTR выше порога 30%).Candidate Queries в базе.Процесс А: Офлайн-генерация Кандидатов
Search Logs (Новости, Веб, Блоги и т.д.) за недавний период времени.Fresh Queries проверяются для генерации Candidate Queries: News Results. Если нет, запрос отбрасывается.CTR результатов и количество кликов. Если показатели ниже порогов, запрос отбрасывается.Процесс Б: Онлайн-обработка запроса пользователя
Candidate Queries те запросы, которые совпадают с запросом пользователя (уточнение, суперстрока или близость).CTR новостных результатов в выдаче.Search Logs: Частота запросов, временные метки, IP-адреса/cookies. Критичны для выявления трендов и фильтрации спама.Session-based data: CTR, количество кликов, время пребывания (dwell time). Используются для валидации качества свежих запросов.Refinement). Используются для определения связи между запросами.Recent time period и расчета скорости изменения частоты запросов.News results (новости, блоги, микроблоги, видео, изображения). Используется для валидации актуальности тренда (Corpus-based data).User Profile).Rate of change in query frequency: Скорость роста объема запросов.Deviation from expected frequency: Отклонение фактической частоты от прогнозируемой статистической модели.Threshold number of occurrences: Абсолютное количество запросов за период.News results в Топ-N выдачи (например, порог 50%).CTR результатов по запросу (например, порог 30%).Refinement Count/Fraction: Количество или доля пользователей, использующих запрос как уточнение.Term-weighted edit distance: Метрика для расчета Nearness.News Results в выдаче критически важно для подтверждения того, что всплеск интереса связан с реальным событием. Это подчеркивает тесную связь между Веб-поиском и индексами свежего контента (Новости, Блоги, Микроблоги).CTR и клики используются как обязательный фильтр качества. Трендовые запросы с низким вовлечением пользователей отбрасываются.sanity checks) для фильтрации клик-спама и искусственных трендов, например, путем анализа количества уникальных IP-адресов.recent time period (часы/дни).News Results является обязательным условием валидации тренда, критически важно, чтобы контент быстро попадал в новостные индексы и классифицировался как актуальный.CTR используется для валидации качества и ранжирования свежих запросов. Необходимо создавать максимально привлекательные и релевантные сниппеты (Title, Description) для трендового контента, чтобы подтвердить его ценность для системы.News Results, включая блоги, микроблоги, видео и изображения. Использование этих форматов для освещения трендовых тем повышает шансы на идентификацию контента как новостного.CTR или плохое вовлечение приведут к тому, что система не валидирует связанный запрос как качественный.Патент подтверждает стратегию Google на обеспечение максимальной актуальности выдачи (QDF). Он демонстрирует, как Google соединяет понимание трендов с качеством контента для улучшения навигации пользователя. Для SEO это означает, что стратегии, основанные на трендах, требуют комплексного подхода: скорость публикации, оптимизация под новостные индексы и генерация реального интереса пользователей (поисковый спрос и клики). Это подчеркивает важность синергии между SEO, PR и SMM.
Сценарий: Реакция на внезапное событие (Спортивный матч)
Fresh Query из-за отклонения от нормы.News results и пользователи активно кликают на них (высокий CTR). Запрос проходит фильтрацию и становится Candidate Query.Как именно Google определяет, что запрос является "свежим"?
Система анализирует логи поиска за недавний период (от минут до дней) и использует три основных критерия: значительная скорость изменения частоты (резкий рост популярности), существенное отклонение от ожидаемой частоты, рассчитанной по историческим данным (например, в 3 раза выше стандартного отклонения), или простое превышение порогового количества запросов за период.
Насколько важны новостные результаты для попадания в свежие подсказки?
Они критически важны. Согласно патенту (Claim 1), наличие порогового количества News results в выдаче является обязательным условием валидации трендового запроса. Это позволяет Google убедиться, что тренд связан с реальными событиями, а не является случайным всплеском или спамом.
Используется ли CTR для генерации и ранжирования этих подсказок?
Да, CTR (и количество кликов) используется на двух этапах. Во-первых, как фильтр качества (Relevance data) на этапе генерации кандидатов: если у трендового запроса низкий CTR, он отбрасывается. Во-вторых, CTR используется как один из факторов ранжирования финального списка подсказок, наряду с количеством новостных результатов и степенью свежести.
Как этот патент связан с Google Trends?
Патент описывает базовые механизмы, которые лежат в основе работы Google Trends. Система идентификации Fresh queries на основе анализа частот и отклонений напрямую соотносится с тем, как Google Trends выявляет популярные запросы. Патент также упоминает Trend Logs как один из источников данных.
Можно ли манипулировать этими свежими подсказками?
Манипулировать сложно из-за многоуровневой защиты. Попытки искусственно создать тренд (Click Spam) фильтруются с помощью "sanity checks" (например, проверка количества уникальных IP). Кроме того, необходимо обеспечить наличие качественных News results и высокий CTR по этим результатам, что труднодостижимо без реального интереса пользователей.
Влияет ли этот механизм на органическое ранжирование?
Патент не описывает влияние на ранжирование основного органического поиска (синих ссылок). Он фокусируется на генерации блока связанных запросов (Related Searches). Однако он подтверждает, что Google активно отслеживает свежесть и поведенческие сигналы, что косвенно связано с алгоритмами ранжирования типа QDF.
Какие источники данных использует Google для поиска трендов?
Основным источником являются логи поиска из различных вертикалей: Web Search Logs, News Search Logs, Blog Search Logs, Image Search Logs, Video Search Logs и Trend Logs. Также упоминается возможность использования внешних источников, таких как микроблоги (например, Twitter/X) и сайты закладок.
Что такое "Refinement" (Уточнение запроса) в контексте этого патента?
Это ситуация, когда пользователь вводит один запрос, а затем в той же сессии вводит другой запрос для уточнения своих намерений. Система использует эти данные (Session-based data), чтобы определить связь между запросами. Свежий запрос может быть показан как подсказка, если он часто является уточнением исходного запроса пользователя.
Как использовать этот механизм в SERM (Управление репутацией)?
В SERM это важно для мониторинга негативных трендов. Если появляется негативный трендовый запрос, связанный с брендом, он может попасть в свежие подсказки. Понимая, что для этого требуется наличие News results, стратегия реагирования должна включать быстрое создание альтернативного (позитивного или нейтрального) новостного контента, чтобы повлиять на состав News results и CTR.
Включают ли "News results" только традиционные новостные сайты?
Нет. Патент дает широкое определение. Они включают не только новостные статьи, но и новые результаты из блогов, информацию из микроблогов, мини-блогов и сайтов закладок, а также новые изображения, видео и веб-страницы. Это подчеркивает важность широкого спектра актуального контента.

Семантика и интент
SERP

Семантика и интент
SERP

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Мультимедиа
Семантика и интент

Ссылки
Антиспам
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Персонализация
Индексация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Ссылки
SERP
EEAT и качество

Мультиязычность
Поведенческие сигналы

Свежесть контента
Поведенческие сигналы
SERP

EEAT и качество
Поведенческие сигналы
SERP
