SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента

FRESH RELATED SEARCH SUGGESTIONS (Свежие предложения по связанным поискам)
  • US8412699B1
  • Google LLC
  • 2009-06-12
  • 2013-04-02
  • Свежесть контента
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.

Описание

Какую проблему решает

Патент решает задачу обеспечения своевременности и актуальности предложений связанных запросов (Related Search Suggestions). Цель — динамически обновлять эти предложения, чтобы они отражали недавние события и текущие тренды (recent and current events), а не только исторически популярные ассоциации. Например, если произошло землетрясение в Пхеньяне, система должна предложить "pyongyang earthquake" при поиске "North Korea".

Что запатентовано

Запатентована система для динамической генерации "свежих" связанных поисковых предложений. Система выявляет запросы, которые недавно стали популярными (Fresh Queries), анализируя логи различных поисковых вертикалей. Ключевым элементом является двухэтапная валидация этих запросов: обязательное наличие достаточного количества новостных результатов (news results) в выдаче и подтверждение качества через анализ поведения пользователей (например, CTR).

Как это работает

Система работает в двух режимах: офлайн-генерация кандидатов и онлайн-сопоставление.

  • Идентификация трендов (Офлайн): Анализируются логи поиска (веб, новости, блоги и т.д.) для выявления запросов с резким ростом частоты или значительным отклонением от ожидаемой популярности в недавний период.
  • Валидация кандидатов (Офлайн): Идентифицированные "свежие" запросы фильтруются. Кандидат должен удовлетворять критериям Corpus-based data (возвращать достаточно news results) и Session-based data (иметь хорошие поведенческие метрики, например CTR).
  • Сопоставление и Ранжирование (Онлайн): При получении запроса от пользователя система ищет среди предварительно отобранных кандидатов те, которые связаны с текущим запросом (уточнение, суперстрока или близость), ранжирует их и показывает пользователю.

Актуальность для SEO

Высокая. Концепция свежести (QDF - Query Deserves Freshness) и интеграция данных в реальном времени (включая упомянутые в патенте микроблоги, такие как Twitter/X) остаются критически важными для Google. Описанные механизмы лежат в основе работы Google Trends и динамического обновления блоков "Related Searches" в ответ на текущие события.

Важность для SEO

Патент имеет существенное значение для SEO (7.5/10). Он не описывает ранжирование основного веб-поиска, но раскрывает механизм формирования важной SERP-фичи. Это критически важно для News SEO, стратегий работы с трендами (Newsjacking) и управления репутацией (SERM). Патент подчеркивает, что для получения видимости в контексте трендов необходима комбинация скорости, новостной релевантности и высокого вовлечения пользователей (CTR).

Детальный разбор

Термины и определения

Candidate Query (Кандидатный запрос)
Fresh Query, который прошел валидацию по наличию News Results и поведенческим метрикам. Из этих запросов формируется финальный список предложений.
Corpus-based data (Данные на основе корпуса документов)
Данные, используемые для валидации свежих запросов путем анализа состава выдачи. Основной показатель — количество News Results.
Criterion (Критерий свежести)
Условие для идентификации трендового запроса: скорость изменения частоты (rate of change), отклонение от ожидаемой частоты (deviation from expected frequency) или достижение порогового числа вхождений.
Fresh Query (Свежий запрос)
Запрос, идентифицированный как недавно ставший популярным на основе анализа Search Logs за Recent Time Period.
Nearness (Близость)
Метрика семантической схожести между запросами, основанная на взвешенном по терминам расстоянии редактирования (term-weighted edit distance). Учитывает синонимы и стоп-слова.
News Results (Новостные результаты)
Широкое определение контента: новостные статьи, новые посты в блогах (включая микроблоги, мини-блоги, сайты закладок), новые изображения, видео и новые веб-страницы.
Refinement (Уточнение запроса)
Запрос B является уточнением запроса A, если значительное число пользователей вводят запрос B после запроса A в рамках одной сессии.
Relevance data (Данные о релевантности)
Данные, отражающие поведение пользователей по отношению к результатам поиска. Включают Click-Through Rate (CTR) и количество кликов.
Session-based data (Данные на основе сессий)
Данные о поведении пользователей, используемые для валидации качества. Включают CTR, количество кликов и данные об уточнениях запросов (Refinement).
Superstring (Суперстрока)
Запрос, который содержит все термины другого запроса плюс один или несколько дополнительных терминов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации свежих связанных предложений.

  1. Система выбирает множество предыдущих запросов (prior queries) из недавнего периода времени (recent time period), которые удовлетворяют критерию (criterion).
  2. Критерий Свежести: Определяется как скорость изменения частоты, отклонение от ожидаемой частоты или пороговое количество вхождений.
  3. Система выбирает из них Кандидатов (candidate queries).
  4. Критерий Валидации: Выбор основан на определении того, что результаты поиска по запросу включают пороговое количество новостных результатов (threshold number of news results).
  5. В ответ на запрос пользователя система выбирает из Кандидатов те, которые соответствуют (match) запросу пользователя.
  6. Система предоставляет выбранные запросы как related search suggestions.

Ядро изобретения — это двухэтапная фильтрация: сначала идентификация статистического тренда в логах, а затем обязательная валидация этого тренда через наличие актуального новостного контента в выдаче.

Claim 2 (Зависимый от 1): Детализирует ранжирование предложений.

Ранжирование сопоставленных запросов основывается на проценте новостных результатов в выдаче по этому запросу и данных о релевантности (relevance data), указывающих на взаимодействие пользователя с результатами.

Claim 5 (Зависимый от 2): Уточняет relevance data.

Данные о релевантности включают CTR результатов поиска и/или количество кликов по результатам.

Claim 6 (Зависимый от 1): Определяет критерии соответствия (match).

Соответствием считается кандидат, который является суперстрокой (superstring), уточнением (refinement) или близок (near) к запросу пользователя.

Где и как применяется

Изобретение применяется на нескольких этапах поисковой архитектуры, сочетая офлайн-анализ и обработку в реальном времени.

INDEXING – Индексирование и извлечение признаков
Система зависит от быстрого индексирования и способности классифицировать контент как News Results (новости, блоги, микроблоги). Эти данные необходимы для валидации кандидатов (Corpus-based data).

QUNDERSTANDING – Понимание Запросов (Офлайн-процессы)
Основная часть работы по подготовке данных. Система (Fresh Query Component) выполняет:

  • Анализ Search Logs и Result Selection Logs.
  • Идентификацию трендов (расчет частот, отклонений).
  • Валидацию трендов с использованием Corpus-based data и Session-based data (CTR).
  • Генерацию пула Candidate Queries.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Онлайн-процессы)
При обработке запроса пользователя:

  • Система (Matching Component) сопоставляет запрос с пулом Candidate Queries.
  • Система (Ranking Component) ранжирует подходящие кандидаты.
  • Результаты встраиваются в SERP как блок "Related Searches".

Входные данные:

  • Логи поиска из разных вертикалей (Web, News, Blog, Image, Video, Trend Logs).
  • Логи кликов и сессий (для расчета CTR и Refinements).
  • Индекс (для определения доли News results).
  • Запрос пользователя.

Выходные данные:

  • Ранжированный список свежих связанных запросов.

На что влияет

  • Специфические запросы: Запросы, для которых актуальна свежесть (QDF — Query Deserves Freshness), связанные с новостями, событиями, трендами, запусками продуктов. Также влияет на общие запросы, по которым появился новостной инфоповод.
  • Конкретные типы контента: Контент, классифицируемый как News Results: новостные статьи, свежие видео, посты в блогах и микроблогах.
  • Конкретные ниши или тематики: Медиа, спорт, развлечения, политика, технологии и другие динамичные ниши.

Когда применяется

Алгоритм применяется при выполнении строгих условий:

  • Триггеры свежести (Офлайн): Запрос должен показать резкое увеличение частоты или значительное отклонение от прогнозируемой модели трафика. В патенте упоминаются примеры порогов: отклонение в 3 раза выше стандартного или более 25000 показов с полуночи.
  • Условия валидации (Офлайн):
    • Корпусные: Запрос должен возвращать достаточное количество News results (например, 50% результатов являются новостными).
    • Поведенческие: Запрос должен иметь хорошие метрики вовлеченности (например, CTR выше порога 30%).
  • Условия показа (Онлайн): Для текущего запроса пользователя должны существовать подходящие (совпадающие) Candidate Queries в базе.

Пошаговый алгоритм

Процесс А: Офлайн-генерация Кандидатов

  1. Сбор данных (Scanning): Система сканирует Search Logs (Новости, Веб, Блоги и т.д.) за недавний период времени.
  2. Идентификация "Свежих запросов" (Fresh Queries Identification): Выявляются запросы, удовлетворяющие критериям свежести (рост частоты или отклонение от нормы).
  3. Фильтрация и Валидация (Query Filtering): Идентифицированные Fresh Queries проверяются для генерации Candidate Queries:
    • Проверка по корпусу (Corpus-based data): Проверяется, содержит ли выдача по запросу пороговое количество News Results. Если нет, запрос отбрасывается.
    • Проверка по поведению (Session-based data): Анализируется CTR результатов и количество кликов. Если показатели ниже порогов, запрос отбрасывается.
    • Санитарная проверка (Sanity Checks): Отбрасываются запросы, похожие на спам (например, отправленные с малого числа IP-адресов).
  4. Сохранение Кандидатов: Запросы, прошедшие валидацию, сохраняются.

Процесс Б: Онлайн-обработка запроса пользователя

  1. Получение запроса: Система получает запрос от пользователя.
  2. Сопоставление (Matching): Система ищет в базе Candidate Queries те запросы, которые совпадают с запросом пользователя (уточнение, суперстрока или близость).
  3. Ранжирование (Ranking): Совпавшие кандидаты ранжируются на основе комбинации факторов:
    • Количество и CTR новостных результатов в выдаче.
    • Степень свежести (сила тренда).
    • Качество результатов (по кликовым данным).
    • Персонализация (на основе истории поиска пользователя).
  4. Пост-фильтрация: Могут быть удалены кандидаты, чья выдача слишком похожа на выдачу исходного запроса (например, если менее 50% результатов отличаются).
  5. Предоставление результатов: Ранжированный список предоставляется для отображения.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Ключевые):
    • Search Logs: Частота запросов, временные метки, IP-адреса/cookies. Критичны для выявления трендов и фильтрации спама.
    • Session-based data: CTR, количество кликов, время пребывания (dwell time). Используются для валидации качества свежих запросов.
    • Паттерны уточнения запросов (Refinement). Используются для определения связи между запросами.
  • Временные факторы: Временные метки в логах используются для определения Recent time period и расчета скорости изменения частоты запросов.
  • Контентные/Корпусные факторы: Классификация результатов поиска как News results (новости, блоги, микроблоги, видео, изображения). Используется для валидации актуальности тренда (Corpus-based data).
  • Пользовательские факторы: История поиска пользователя может использоваться для персонализации ранжирования предложений (User Profile).

Какие метрики используются и как они считаются

  • Метрики свежести (Freshness Metrics):
    • Rate of change in query frequency: Скорость роста объема запросов.
    • Deviation from expected frequency: Отклонение фактической частоты от прогнозируемой статистической модели.
    • Threshold number of occurrences: Абсолютное количество запросов за период.
  • Метрики валидации (Validation Metrics):
    • Доля или количество News results в Топ-N выдачи (например, порог 50%).
    • CTR результатов по запросу (например, порог 30%).
    • Общее количество кликов.
  • Метрики сопоставления (Matching Metrics):
    • Refinement Count/Fraction: Количество или доля пользователей, использующих запрос как уточнение.
    • Term-weighted edit distance: Метрика для расчета Nearness.

Выводы

  1. Автоматическое обнаружение трендов (QDF): Google активно использует статистический анализ объема поисковых запросов для автоматического выявления трендов и событий. Отклонение от ожидаемой частоты является ключевым сигналом свежести.
  2. Обязательная валидация трендов через новостной контент: Наличие News Results в выдаче критически важно для подтверждения того, что всплеск интереса связан с реальным событием. Это подчеркивает тесную связь между Веб-поиском и индексами свежего контента (Новости, Блоги, Микроблоги).
  3. Поведенческие сигналы как фильтр качества: CTR и клики используются как обязательный фильтр качества. Трендовые запросы с низким вовлечением пользователей отбрасываются.
  4. Многофакторное ранжирование предложений: Ранжирование связанных запросов учитывает не только силу тренда, но и количество новостного контента, поведенческие метрики и персонализацию.
  5. Защита от манипуляций: Система включает механизмы (sanity checks) для фильтрации клик-спама и искусственных трендов, например, путем анализа количества уникальных IP-адресов.

Практика

Best practices (это мы делаем)

  • Мониторинг трендов и быстрая реакция (Newsjacking): Необходимо отслеживать зарождающиеся тренды (Google Trends, социальные сети) и оперативно создавать контент. Скорость критична, так как система анализирует данные за recent time period (часы/дни).
  • Оптимизация под новостные вертикали (Google News/Blogs): Так как наличие News Results является обязательным условием валидации тренда, критически важно, чтобы контент быстро попадал в новостные индексы и классифицировался как актуальный.
  • Оптимизация сниппетов для высокого CTR: CTR используется для валидации качества и ранжирования свежих запросов. Необходимо создавать максимально привлекательные и релевантные сниппеты (Title, Description) для трендового контента, чтобы подтвердить его ценность для системы.
  • Использование актуальных форматов контента: Патент широко определяет News Results, включая блоги, микроблоги, видео и изображения. Использование этих форматов для освещения трендовых тем повышает шансы на идентификацию контента как новостного.

Worst practices (это делать не надо)

  • Медленная реакция на тренды: Создание контента по уже уходящим трендам неэффективно. Если пик поискового интереса прошел, система перестанет идентифицировать запрос как "свежий".
  • Создание поверхностного или кликбейтного контента: Низкое качество контента приведет к плохим поведенческим метрикам. Низкий CTR или плохое вовлечение приведут к тому, что система не валидирует связанный запрос как качественный.
  • Попытки искусственно манипулировать частотой запросов (Click Spam): Попытки накрутить поисковый спрос могут быть отфильтрованы. Патент упоминает механизмы защиты, например, анализ количества уникальных IP-адресов, с которых поступает запрос.

Стратегическое значение

Патент подтверждает стратегию Google на обеспечение максимальной актуальности выдачи (QDF). Он демонстрирует, как Google соединяет понимание трендов с качеством контента для улучшения навигации пользователя. Для SEO это означает, что стратегии, основанные на трендах, требуют комплексного подхода: скорость публикации, оптимизация под новостные индексы и генерация реального интереса пользователей (поисковый спрос и клики). Это подчеркивает важность синергии между SEO, PR и SMM.

Практические примеры

Сценарий: Реакция на внезапное событие (Спортивный матч)

  1. Событие: В ходе важного футбольного матча происходит неожиданное событие (например, спорный гол).
  2. Реакция пользователей: В логах поиска резко возрастает частота запросов "Название команды спорный гол". Система идентифицирует это как Fresh Query из-за отклонения от нормы.
  3. Действия SEO/Медиа: Спортивные новостные сайты и блоги мгновенно публикуют статьи и видео об инциденте.
  4. Валидация Google: Система проверяет выдачу по запросу "Название команды спорный гол". Она видит, что выдача состоит преимущественно из News results и пользователи активно кликают на них (высокий CTR). Запрос проходит фильтрацию и становится Candidate Query.
  5. Результат: Пользователь, который ищет общую информацию о матче (например, "результаты матча Название Команды"), увидит в блоке Related Searches свежую подсказку "Название команды спорный гол", ведущую на актуальный контент.

Вопросы и ответы

Как именно Google определяет, что запрос является "свежим"?

Система анализирует логи поиска за недавний период (от минут до дней) и использует три основных критерия: значительная скорость изменения частоты (резкий рост популярности), существенное отклонение от ожидаемой частоты, рассчитанной по историческим данным (например, в 3 раза выше стандартного отклонения), или простое превышение порогового количества запросов за период.

Насколько важны новостные результаты для попадания в свежие подсказки?

Они критически важны. Согласно патенту (Claim 1), наличие порогового количества News results в выдаче является обязательным условием валидации трендового запроса. Это позволяет Google убедиться, что тренд связан с реальными событиями, а не является случайным всплеском или спамом.

Используется ли CTR для генерации и ранжирования этих подсказок?

Да, CTR (и количество кликов) используется на двух этапах. Во-первых, как фильтр качества (Relevance data) на этапе генерации кандидатов: если у трендового запроса низкий CTR, он отбрасывается. Во-вторых, CTR используется как один из факторов ранжирования финального списка подсказок, наряду с количеством новостных результатов и степенью свежести.

Как этот патент связан с Google Trends?

Патент описывает базовые механизмы, которые лежат в основе работы Google Trends. Система идентификации Fresh queries на основе анализа частот и отклонений напрямую соотносится с тем, как Google Trends выявляет популярные запросы. Патент также упоминает Trend Logs как один из источников данных.

Можно ли манипулировать этими свежими подсказками?

Манипулировать сложно из-за многоуровневой защиты. Попытки искусственно создать тренд (Click Spam) фильтруются с помощью "sanity checks" (например, проверка количества уникальных IP). Кроме того, необходимо обеспечить наличие качественных News results и высокий CTR по этим результатам, что труднодостижимо без реального интереса пользователей.

Влияет ли этот механизм на органическое ранжирование?

Патент не описывает влияние на ранжирование основного органического поиска (синих ссылок). Он фокусируется на генерации блока связанных запросов (Related Searches). Однако он подтверждает, что Google активно отслеживает свежесть и поведенческие сигналы, что косвенно связано с алгоритмами ранжирования типа QDF.

Какие источники данных использует Google для поиска трендов?

Основным источником являются логи поиска из различных вертикалей: Web Search Logs, News Search Logs, Blog Search Logs, Image Search Logs, Video Search Logs и Trend Logs. Также упоминается возможность использования внешних источников, таких как микроблоги (например, Twitter/X) и сайты закладок.

Что такое "Refinement" (Уточнение запроса) в контексте этого патента?

Это ситуация, когда пользователь вводит один запрос, а затем в той же сессии вводит другой запрос для уточнения своих намерений. Система использует эти данные (Session-based data), чтобы определить связь между запросами. Свежий запрос может быть показан как подсказка, если он часто является уточнением исходного запроса пользователя.

Как использовать этот механизм в SERM (Управление репутацией)?

В SERM это важно для мониторинга негативных трендов. Если появляется негативный трендовый запрос, связанный с брендом, он может попасть в свежие подсказки. Понимая, что для этого требуется наличие News results, стратегия реагирования должна включать быстрое создание альтернативного (позитивного или нейтрального) новостного контента, чтобы повлиять на состав News results и CTR.

Включают ли "News results" только традиционные новостные сайты?

Нет. Патент дает широкое определение. Они включают не только новостные статьи, но и новые результаты из блогов, информацию из микроблогов, мини-блогов и сайтов закладок, а также новые изображения, видео и веб-страницы. Это подчеркивает важность широкого спектра актуального контента.

Похожие патенты

Как Google определяет тематику и интент запроса, анализируя контент уже ранжирующихся страниц в выдаче
Google использует метод классификации запросов, который анализирует не сам текст запроса, а контент (URL, заголовки, сниппеты) страниц, находящихся в топе выдачи по этому запросу. Сравнивая набор терминов из этих результатов с эталонными профилями разных тематик или типов контента (Новости, Видео, Картинки), система определяет интент пользователя и решает, какие вертикали поиска активировать.
  • US8756218B1
  • 2014-06-17
  • Семантика и интент

  • SERP

Как Google определяет "Связанные запросы", сравнивая различия в топе выдачи и сходства в нижних результатах
Google использует двухэтапный анализ для генерации блока "Связанные запросы" (Related Searches). Система ищет запросы, у которых ТОП выдачи сильно отличается от исходного запроса (чтобы показать новое), но результаты на низких позициях сильно пересекаются (чтобы сохранить тематическую связь). Это позволяет предлагать пользователю смежные темы, не повторяя уже увиденные результаты.
  • US9122727B1
  • 2015-09-01
  • Семантика и интент

  • SERP

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует анализ сессий и CTR для переписывания низкоэффективных запросов в высокоэффективные
Google анализирует поведение пользователей внутри поисковых сессий. Если пользователь быстро переходит от запроса с низким CTR (низкоэффективный) к запросу с высоким CTR (высокоэффективный), система связывает их как относящиеся к одному интенту. В дальнейшем, при получении низкоэффективного запроса, Google использует связанный высокоэффективный запрос для поиска и подмешивания более релевантного контента.
  • US8234265B1
  • 2012-07-31
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует клики пользователей для определения составных фраз (N-грамм) в запросах
Google анализирует, какие результаты поиска выбирают пользователи, чтобы понять, являются ли последовательные слова в запросе единой фразой (например, "Нью Йорк") или отдельными терминами. Если пользователи преимущественно кликают на результаты, содержащие эту последовательность как неразрывную фразу, система определяет ее как составную (Compound) и использует это знание для улучшения ранжирования и понимания запроса.
  • US8086599B1
  • 2011-12-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента
Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
  • US8412699B1
  • 2013-04-02
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

seohardcore