SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google кластеризует, фильтрует и ранжирует популярные запросы для сервисов типа Google Trends

QUERY RANKING BASED ON QUERY CLUSTERING AND CATEGORIZATION (Ранжирование запросов на основе кластеризации и категоризации запросов)
  • US8145623B1
  • Google LLC
  • 2009-05-01
  • 2012-03-27
  • Семантика и интент
  • SERP
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает систему Google для определения популярных и быстрорастущих запросов (например, для Google Trends). Чтобы избежать дублирования и повысить качество, система группирует похожие запросы в кластеры, выбирает лучший репрезентативный запрос и ранжирует темы. Ранжирование учитывает общую популярность темы, качество результатов поиска (используя CTR, PageRank, длительность кликов) и популярность категории.

Описание

Какую проблему решает

Патент решает проблему качества и точности при генерации списков самых популярных (Top Volume Queries) или быстрорастущих запросов (Top Rising Queries). Стандартные списки, основанные только на частотности, страдают от:

  • Избыточности (Redundancy): Разные формулировки одной темы (например, "sixth pay commission" и "6pc") занимают отдельные позиции, снижая разнообразие.
  • Фрагментации (Omission): Интерес к теме может быть высоким, но распределен по множеству синонимов, из-за чего тема не попадает в топ.
  • Низкого качества: Популярные запросы могут вести на некачественный или нерелевантный контент.

Изобретение призвано улучшить эти списки, делая их разнообразными и точно отражающими актуальные интересы пользователей.

Что запатентовано

Запатентована система для ранжирования поисковых запросов с целью выявления трендов. Система группирует семантически похожие запросы в кластеры, выбирает один репрезентативный запрос (Representative Query) для каждого кластера и категоризирует тему. Ранжирование этих тем (кластеров) основано не только на совокупном объеме запросов, но и активно корректируется метриками качества результатов поиска (Performance Score) и популярностью категории (Category Popularity Score).

Как это работает

Система работает следующим образом:

  • Сбор и Кластеризация: Отбираются популярные/растущие запросы. Они группируются в кластеры на основе схожести (например, по пересечению URL-адресов в результатах поиска).
  • Выбор Репрезентативного Запроса: Для кластера выбирается лучший запрос. Выбор основан на популярности, но с обязательной фильтрацией по качеству (Query Performance Score).
  • Фильтрация Качества: Оцениваются CTR, длительность кликов и PageRank результатов. Запросы, ведущие на низкокачественные (низкий CTR/PageRank) или сверхавторитетные, но не трендовые страницы (очень высокий PageRank), могут быть отклонены.
  • Категоризация: Кластеру присваивается тематическая категория.
  • Ранжирование Кластеров: Кластеры ранжируются по агрегированной популярности (Cluster Popularity Score), с поправкой на качество результатов и популярность категории.

Актуальность для SEO

Средняя. Патент описывает фундаментальные принципы работы сервисов типа Google Trends. Хотя конкретные алгоритмы (например, K-medoids, явное использование PageRank) могли эволюционировать к 2025 году в сторону более сложных ML-моделей, базовые концепции — кластеризация запросов по результатам, использование поведенческих метрик (CTR, duration) для оценки качества и категоризация — остаются критически важными для понимания того, как Google интерпретирует данные о трендах.

Важность для SEO

Влияние на SEO косвенное (4.5/10). Патент не описывает алгоритм ранжирования веб-страниц в основном поиске. Он описывает, как Google ранжирует сами *запросы* для аналитических сервисов. Однако он предоставляет ценное подтверждение использования метрик CTR, Click-through duration (длинные клики) и Click-through reversion rate (возвраты в выдачу) для оценки качества. Также он детально описывает кластеризацию запросов по общим результатам (URL), что важно для стратегий построения Topical Authority и анализа интентов.

Детальный разбор

Термины и определения

Category Popularity Score (Оценка популярности категории)
Метрика, отражающая общую популярность тематической категории (например, «Развлечения» популярнее, чем «Общество»). Используется для корректировки ранга кластера запросов.
Click-through duration (Продолжительность клика)
Время, которое пользователь проводит на целевой странице после клика. Длительное время (Long Click) сигнализирует об интересе и удовлетворенности пользователя.
Click-through rate (CTR)
Показатель кликабельности результатов поиска. Высокий CTR указывает на релевантность и привлекательность результатов.
Click-through reversion rate (Показатель возвратов)
Частота, с которой пользователи быстро возвращаются на страницу выдачи после клика (Short Click/Pogo-sticking). Высокий показатель сигнализирует о неудовлетворенности результатами.
Cluster Performance Score (Оценка производительности кластера)
Агрегированная метрика качества результатов поиска для кластера. Основана на Query Performance Scores или показателях репрезентативного запроса.
Cluster Popularity Score (Оценка популярности кластера)
Агрегированная метрика популярности всех запросов, входящих в кластер. Отражает общий интерес к теме.
Freshness indicator (Индикатор свежести)
Сигнал, указывающий на актуальность темы. Например, если много результатов приходит из часто обновляемого индекса (новостного индекса).
K-medoids algorithm (Алгоритм K-медоидов)
Алгоритм кластеризации, используемый для группировки запросов. Он минимизирует расстояние (метрику несхожести) между запросами в кластере и центром кластера (медоидом).
PageRank (PR)
В контексте патента используется как индикатор качества и авторитетности результатов. Слишком низкий PR указывает на низкое качество; слишком высокий PR может указывать на авторитетный, но не «трендовый» источник.
Query Performance Score (Оценка производительности запроса)
Метрика, оценивающая качество результатов поиска для данного запроса. Основана на PageRank, CTR, Click-through duration и Click-through reversion rate.
Representative Query (Репрезентативный запрос)
Один запрос, выбранный для представления всего кластера похожих запросов в финальном списке.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования запросов.

  1. Система выбирает множество поисковых запросов.
  2. Запросы группируются в кластеры. Группировка включает назначение запросов, определение центра кластера (cluster center) и оптимизацию структуры кластеров для минимизации агрегированной метрики несхожести между запросами и их центрами (описание алгоритма типа K-medoids).
  3. Для каждого кластера выбирается Representative Query.
  4. Каждый кластер ассоциируется с репрезентативной категорией.
  5. Каждому кластеру присваивается ранг. Ранжирование основано на Cluster Popularity Score И Category Popularity Score.
  6. Репрезентативные запросы представляются в порядке ранга их кластеров.

Claim 3 (Зависимый от 2): Уточняет выбор репрезентативного запроса.

Выбор основан на Query Popularity Score (Claim 2), но также и на Query Performance Score. Эта оценка рассчитывается на основе одного или нескольких показателей результатов поиска: PageRank, CTR, Click-through duration или Click-through reversion rate.

Claim 6 (Зависимый от 1): Уточняет механизм ранжирования кластеров.

Ранг кластера дополнительно корректируется на основе Cluster Performance Score. Эта оценка также рассчитывается на основе PageRank, CTR, Click-through duration или Click-through reversion rate результатов репрезентативного запроса.

Claims 9, 10, 11 (Зависимые от 1): Уточняют метрику несхожести для кластеризации.

Метрика несхожести (dissimilarity measure), используемая для оптимизации кластеров (Шаг 2), может быть основана на сравнении: (9) результирующих документов, (10) результирующих URL-адресов (result URLs) или (11) поисковых терминов запросов.

Где и как применяется

Описанная система (Query Ranking System) функционирует не в рамках основного конвейера ранжирования веб-страниц, а как отдельный аналитический процесс для генерации списков популярных запросов (например, для Google Trends).

INDEXING – Индексирование и извлечение признаков
Система использует данные из индекса (документы, URL) и связанные с ними метрики (например, PageRank, принадлежность к новостному индексу) для кластеризации, категоризации и оценки производительности.

QUNDERSTANDING – Понимание Запросов (Аналитический слой / Анализ Логов)
Весь процесс происходит на этом аналитическом уровне. Система анализирует агрегированные данные из Query Log (для популярности) и Click Log (для производительности: CTR, длительность кликов) для понимания трендов.

RANKING (Query Cluster Ranking)
Это не стандартный этап RANKING, а специфический процесс ранжирования самих кластеров запросов на основе популярности, производительности и категории.

  • Входные данные: Списки запросов, данные об объеме запросов (Query Log), данные о кликах (Click Log), результаты поиска (URL, сниппеты), метрики документов (PageRank).
  • Выходные данные: Отсортированный список репрезентативных запросов с устраненной избыточностью (Top Rising/Volume Queries).

На что влияет

  • Специфические запросы: Влияет на отображение трендовых тем. Система стремится выявить «свежие» и интересные темы. В патенте явно упоминается фильтрация запросов, которые ведут на «чрезмерно авторитетные источники» (например, запрос «Wikipedia»), так как они не считаются трендовыми.
  • Типы контента: Предпочтение отдается запросам, ведущим на свежий контент. Упоминается использование индикатора «свежести» (freshness indicator), например, если много результатов приходит из часто обновляемого индекса (например, новостного).

Когда применяется

  • Условия работы: Применяется при генерации списков Top Rising Queries или Top Volume Queries.
  • Триггеры активации: Запросы должны превысить определенный порог объема или скорости роста объема поиска.
  • Частота применения: Периодически (ежедневно, еженедельно) или в режиме, близком к реальному времени, для обновления данных о трендах.

Пошаговый алгоритм

Этап 1: Подготовка и Кластеризация

  1. Отбор запросов: Выбор множества поисковых запросов на основе их объема или скорости роста.
  2. Кластеризация запросов: Группировка отобранных запросов (например, с помощью K-medoids).
    1. Определение метрики несхожести (на основе пересечения result URLs, документов или схожести терминов).
    2. Итеративная оптимизация кластеров и центров кластеров для минимизации агрегированной метрики несхожести.

Этап 2: Выбор Репрезентативного Запроса и Фильтрация

Для каждого кластера:

  1. Предварительный выбор: Выбирается запрос с наивысшим Query Popularity Score.
  2. Расчет производительности: Расчет Query Performance Score для выбранного запроса на основе PageRank, CTR, Click-through duration и Click-through reversion rate его результатов.
  3. Фильтрация по качеству: Проверка на соответствие порогам. Запрос отклоняется, если его результаты слишком низкого качества (например, низкий CTR) ИЛИ если они слишком авторитетны (например, сверхвысокий PageRank).
  4. Итерация: Если запрос отклонен, проверяется следующий по популярности запрос в кластере до нахождения подходящего Representative Query.

Этап 3: Категоризация и Ранжирование

  1. Категоризация кластеров: Присвоение репрезентативной категории кластеру (на основе категорий входящих в него запросов).
  2. Ранжирование кластеров:
    1. Расчет Cluster Popularity Score (агрегация популярности всех запросов кластера).
    2. Расчет Cluster Performance Score.
    3. Получение Category Popularity Score.
    4. Присвоение финального ранга на основе комбинации этих трех оценок.
  3. Представление результатов: Вывод списка репрезентативных запросов в порядке ранга их кластеров. Может применяться ограничение на количество запросов в одной категории для разнообразия.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Ключевые):
    • Query Logs: Объем запросов и скорость их роста (для Popularity Score).
    • Click Logs: CTR, Click-through duration (длинные клики) и Click-through reversion rate (возвраты). Эти данные формируют основу Performance Score.
  • Ссылочные факторы:
    • PageRank результатов поиска: Используется для оценки качества и авторитетности (для Performance Score).
  • Технические/Контентные факторы:
    • Result URLs: URL-адреса результатов поиска используются как основа для кластеризации запросов.
    • Термины запросов, заголовки, сниппеты результатов: Могут использоваться для кластеризации и категоризации.
  • Временные факторы:
    • Freshness indicator: Свежесть результатов (например, из новостного индекса) используется для повышения Performance Score.

Какие метрики используются и как они считаются

  • Query/Cluster Popularity Score: Рассчитывается на основе данных об объеме запросов из Query Logs. Для кластера это агрегированное значение.
  • Query/Cluster Performance Score: Комбинированная оценка качества результатов. Учитывает:
    • PageRank (с порогом как снизу — фильтр качества, так и сверху — фильтр авторитетности).
    • CTR (чем выше, тем лучше).
    • Click-through duration (чем дольше, тем лучше).
    • Click-through reversion rate (чем ниже, тем лучше).
    • Freshness indicator (чем свежее, тем лучше).
  • Category Popularity Score: Может быть основана на общем объеме трафика, связанного с категорией.
  • Метрика несхожести (Dissimilarity Metric): Используется в алгоритме кластеризации для измерения расстояния между запросами.

Выводы

  1. Кластеризация по результатам, а не только по ключевым словам: Ключевой вывод — Google кластеризует запросы, которые текстуально различны, но ведут к схожему набору URL (result URLs). Система определяет тематическую связь на основе того, какой контент удовлетворяет эти запросы.
  2. Поведенческие метрики как фильтр качества: Патент явно подтверждает использование CTR, Click-through duration (длинные клики) и Click-through reversion rate (возвраты) для оценки качества результатов поиска. Запросы с плохими поведенческими метриками фильтруются.
  3. Концепция «Чрезмерной Авторитетности» для трендов: Важный аспект — фильтрация результатов со сверхвысоким PageRank. При поиске трендов система предпочитает свежий и актуальный контент, а не устоявшиеся авторитетные источники (например, главную страницу крупного сайта), которые могут быть менее релевантны текущему тренду.
  4. Популярность темы (кластера) важнее популярности отдельного запроса: Ранжирование основано на Cluster Popularity Score (агрегированный объем), что позволяет выявлять тренды, даже если ни один отдельный запрос не доминирует.
  5. Важность категоризации и разнообразия: Система корректирует ранжирование на основе популярности категории (Category Popularity Score) и может ограничивать количество запросов от одной категории для обеспечения разнообразия списка.

Практика

Best practices (это мы делаем)

Хотя патент не относится к основному ранжированию, он дает стратегические инсайты.

  • Ориентация на удовлетворенность пользователя (User Satisfaction): Необходимо оптимизировать сниппеты для повышения релевантного CTR и создавать контент, который удерживает пользователя (увеличивает Click-through duration) и предотвращает быстрый возврат в выдачу (снижает Click-through reversion rate). Патент подтверждает важность этих сигналов для оценки качества.
  • Построение Topical Authority через кластеризацию: Понимая, что Google кластеризует запросы по общим URL, следует создавать страницы, которые являются целевым назначением для целого кластера связанных интентов, а не только для одного ключевого слова. Анализируйте пересечение SERP для выявления кластеров.
  • Использование Google Trends для определения Representative Query: Сервисы типа Google Trends (вероятно, использующие эту технологию) показывают, какой именно запрос Google считает репрезентативным для трендовой темы. При создании контента под тренд следует ориентироваться на эту формулировку и связанный с ней кластер.
  • Оптимизация под свежие тренды (QDF): Для трендового контента важна свежесть и вовлеченность. Патент предполагает, что такой контент предпочтительнее старых авторитетных страниц при оценке трендов (фильтр по высокому PR, буст за Freshness).

Worst practices (это делать не надо)

  • Игнорирование поведенческих факторов (Clickbait): Создание контента, который генерирует клики, но не удовлетворяет интент (высокий Click-through reversion rate), негативно скажется на оценке качества (Performance Score).
  • Фокус только на объеме запросов без учета качества выдачи: Попытка оптимизации под высокочастотные запросы, если результаты по ним некачественные, неэффективна. Система фильтрует такие запросы при анализе трендов.
  • Оптимизация под каждую вариацию запроса: Создание отдельных страниц под незначительные вариации запроса неэффективно, так как система кластеризует их в одну тему.

Стратегическое значение

Патент демонстрирует сложный подход Google к анализу данных, подчеркивая стратегическую важность анализа поведения пользователей после клика (Post-Click Behavior) как меры качества. Он подтверждает фундаментальный сдвиг от анализа отдельных ключевых слов к пониманию тем (кластеров) и интентов. Для SEO это означает, что долгосрочная стратегия должна фокусироваться на создании контента, который не только привлекает клик, но и полностью удовлетворяет потребность пользователя.

Практические примеры

Сценарий: Оптимизация контента под кластер запросов

  1. Анализ: SEO-специалист исследует тему. Он видит два запроса: Запрос А ("лучшие кроссовки для бега") и Запрос Б ("топ беговых кроссовок").
  2. Проверка кластеризации (на основе патента): Специалист сравнивает SERP по обоим запросам. Если 8 из 10 топовых URL пересекаются, это подтверждает, что Google рассматривает их как один кластер (метод кластеризации по result URLs).
  3. Действие: Вместо создания двух отдельных статей создается одна комплексная страница, нацеленная на оба запроса и связанные с ними интенты.
  4. Оптимизация производительности: Контент структурируется для максимальной вовлеченности (длительные клики), чтобы обеспечить высокий Performance Score.
  5. Ожидаемый результат: Страница эффективно ранжируется по обоим запросам и всему кластеру, так как она лучше соответствует агрегированному интенту темы.

Вопросы и ответы

Описывает ли этот патент, как Google ранжирует сайты в основном поиске (SERP)?

Нет. Патент описывает систему для анализа и ранжирования самих поисковых запросов с целью выявления трендов (например, для Google Trends). Он не описывает алгоритмы, определяющие позицию вашего сайта в стандартной поисковой выдаче, но использует данные из основного поиска (PageRank, CTR) для оценки качества трендов.

Как Google определяет, что два разных запроса связаны и должны быть в одном кластере?

Патент описывает несколько методов. Ключевой метод — анализ пересечения результатов поиска (result URLs). Если два разных запроса возвращают значительное количество одинаковых URL в топе выдачи, система считает их связанными. Также может использоваться анализ схожести самих поисковых терминов.

Что такое Query Performance Score и почему это важно для SEO?

Это оценка качества результатов поиска по данному запросу. Она рассчитывается на основе PageRank, CTR, продолжительности кликов и частоты возвратов в выдачу. Это важно, так как подтверждает, что Google активно использует эти поведенческие метрики для оценки удовлетворенности пользователей качеством выдачи.

Патент упоминает фильтрацию запросов с очень высоким PageRank. Означает ли это, что высокий авторитет сайта — это плохо?

Не совсем. В контексте поиска быстрорастущих трендов система ищет свежие темы. Если запрос ведет на результаты со сверхвысоким PageRank (например, главную страницу Wikipedia), это может указывать на устоявшийся авторитетный источник, а не на новый тренд. Для трендового контента система предпочитает свежесть и вовлеченность, а не только статический авторитет.

Как используются CTR и продолжительность кликов (Click-through duration)?

Они используются как индикаторы качества и релевантности для расчета Query Performance Score. Высокий CTR и большая продолжительность клика (Long Click) повышают эту оценку. Быстрые возвраты в выдачу (Click-through reversion rate) понижают её. Запросы с неприемлемо низкой оценкой фильтруются.

Что такое Representative Query и как он выбирается?

Это один запрос, который представляет весь кластер похожих запросов. Сначала выбирается самый популярный запрос в кластере (Query Popularity Score). Затем он проверяется по Query Performance Score. Если качество результатов неудовлетворительное (слишком низкое или слишком авторитетное), выбирается следующий по популярности запрос, пока не будет найден подходящий.

Как SEO-специалист может использовать информацию о кластеризации запросов по URL?

Это понимание критически важно для построения Topical Authority и анализа интентов. Необходимо стремиться к тому, чтобы ваша страница стала целевым URL для целого кластера запросов. Это достигается путем анализа пересечения SERP и создания комплексного контента, отвечающего на различные вариации интента в рамках одной темы.

Что такое Category Popularity Score?

Это оценка общей популярности тематической категории (например, «Спорт», «Развлечения»). Система может повысить в ранге кластер запросов, если он относится к очень популярной категории, даже если его собственный объем запросов (Cluster Popularity Score) ниже, чем у конкурента из менее популярной категории.

Влияет ли свежесть контента на определение трендов?

Да, патент упоминает "freshness" как один из индикаторов качества. Если запрос возвращает много результатов из часто обновляемого индекса (например, новостного), это повышает вероятность того, что запрос связан с актуальной темой, что положительно влияет на его оценку как тренда.

Какова основная цель этого изобретения?

Основная цель — повысить качество, разнообразие и точность списков популярных и быстрорастущих запросов. Система стремится устранить избыточность, точнее измерять популярность реальных тем и гарантировать, что представленные тренды ведут на качественный и интересный контент.

Похожие патенты

Как Google оценивает качество новостных источников, кластеризует статьи и ранжирует новости на основе свежести, оригинальности и авторитетности
Детальный разбор основополагающего патента Google News. Система оценивает источники по скорости реакции на события, оригинальности контента и авторитетности (ссылки, просмотры). Новостные сюжеты (кластеры) ранжируются по свежести и качеству источников. Статьи внутри сюжета сортируются с использованием «Модифицированной оценки свежести», которая дает значительное преимущество авторитетным изданиям.
  • US7568148B1
  • 2009-07-28
  • Свежесть контента

  • EEAT и качество

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)
Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
  • US8065316B1
  • 2011-11-22
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google кластеризует новостные результаты для генерации блоков "Связанные темы" и "Категории"
Google анализирует результаты поиска по новостям и группирует статьи, освещающие одно и то же событие, в кластеры. Затем система извлекает общие ключевые слова из этих кластеров для формирования блока "Связанные темы" (Related Topics), помогая уточнить запрос. Одновременно определяется широкая категория новостей (например, "Спорт"), из которой предлагается дополнительный контент для расширения контекста.
  • US11194868B1
  • 2021-12-07
  • Семантика и интент

  • Свежесть контента

  • SERP

Как Google ранжирует документы, используя качество источника, свежесть, оригинальность и кластеризацию контента
Google оценивает документы, анализируя авторитетность и экспертизу источника публикации, свежесть контента и его оригинальность. Документы группируются в кластеры по темам (например, новостные сюжеты). Оценка кластера (например, разнообразие и важность источников внутри него) также влияет на ранжирование отдельных документов.
  • US8090717B1
  • 2012-01-03
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
  • US8041568B2
  • 2011-10-18
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
  • US20210125108A1
  • 2021-04-29
  • Поведенческие сигналы

  • SERP

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска
Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.
  • US20150006290A1
  • 2015-01-01
  • Поведенческие сигналы

  • Персонализация

  • Local SEO

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента
Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.
  • US8145636B1
  • 2012-03-27
  • Семантика и интент

  • Поведенческие сигналы

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации
Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.
  • US7565358B2
  • 2009-07-21
  • EEAT и качество

  • Ссылки

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов
Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.
  • US9436709B1
  • 2016-09-06
  • EEAT и качество

  • Поведенческие сигналы

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео
Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.
  • US8903812B1
  • 2014-12-02
  • Поведенческие сигналы

  • SERP

  • Антиспам

seohardcore