Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует данные подписок на оповещения (Google Alerts) для определения трендовых тем и повышения их в ранжировании Новостей

    GENERATION OF TOPICAL SUBJECTS FROM ALERT SEARCH TERMS (Генерация актуальных тем на основе поисковых терминов для оповещений)
    • US20140143657A1
    • Google LLC
    • 2014-05-22
    • 2005-09-28
    2005 SERP Патенты Google Поведенческие сигналы Свежесть контента

    Google анализирует, на какие темы пользователи массово подписываются в сервисах оповещений (например, Google Alerts) за определенный период времени. Эти трендовые темы (Topical Subjects) затем используются как сигнал для ранжирования: новостные статьи, соответствующие этим актуальным темам, могут получать повышение (boost) в поисковой выдаче, особенно в поиске по новостям.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу идентификации тем и событий, которые в настоящий момент вызывают повышенный интерес у сообщества пользователей («what’s interesting»). Он описывает механизм определения трендов, основываясь на активных действиях пользователей по подписке на оповещения. Это позволяет улучшить актуальность поисковой выдачи, особенно в новостном поиске, путем интеграции сигналов текущего интереса в ранжирование.

    Что запатентовано

    Запатентована система (Topical Subject Generator), которая анализирует агрегированные данные о регистрациях пользователей на оповещения (например, Google Alerts). Система идентифицирует поисковые термины (Alert Search Terms), на которые пользователи массово подписывались в течение определенного периода времени (час, день, неделя). Термины, превысившие порог популярности, определяются как Актуальные Темы (Topical Subjects) и используются для модификации ранжирования в поисковой системе.

    Как это работает

    Система работает следующим образом:

    • Сбор данных: Система оповещений (Alert Engine) собирает данные о новых подписках пользователей за определенный временной интервал.
    • Агрегация и анализ: Topical Subject Generator агрегирует поисковые термины из этих подписок и подсчитывает частоту их использования. Схожие термины могут быть объединены (нормализованы).
    • Идентификация трендов: Термины, частота использования которых превышает заданный порог, идентифицируются как Topical Subjects.
    • Применение в ранжировании: Поисковая система (в патенте особо выделяется News Search Engine) использует этот список актуальных тем как сигнал ранжирования. Документы (например, новостные статьи), соответствующие этим темам, получают повышение (boost) в выдаче.
    • Предложение тем: Актуальные темы также могут предлагаться пользователям в интерфейсе для подписки.

    Актуальность для SEO

    Высокая (концептуально). Идентификация трендов и актуального контента (концепция QDF — Query Deserves Freshness) остается критически важной задачей для Google, особенно в Google News и Top Stories. Хотя данный патент является продолжением заявки 2005 года и современные системы Google, вероятно, используют более разнообразные источники данных (помимо Google Alerts), базовый принцип использования явного пользовательского интереса для модификации ранжирования остается фундаментальным.

    Важность для SEO

    Патент имеет значительное влияние, особенно для новостных издателей и сайтов, освещающих актуальные события (News SEO). Он описывает конкретный механизм, посредством которого текущий интерес к теме может повысить видимость контента. Это подчеркивает критическую важность оперативного реагирования на тренды и создания контента по темам, которые быстро набирают популярность.

    Детальный разбор

    Термины и определения

    Alert Engine (Система оповещений)
    Сервис (например, Google Alerts), который позволяет пользователям регистрироваться для получения уведомлений о новых документах, соответствующих заданным поисковым терминам.
    Alert Search Terms (Поисковые термины оповещений)
    Ключевые слова или фразы, которые пользователи вводят при регистрации оповещения для описания интересующей их темы.
    Topical Subject Generator (Генератор актуальных тем)
    Компонент системы, который анализирует агрегированные Alert Search Terms за определенный период для выявления популярных тем.
    Topical Subject / Topical Alert (Актуальная тема / Актуальное оповещение)
    Тема, которая достигла определенного уровня популярности, измеряемого частотой новых подписок на оповещения по этой теме за определенный период.
    Predetermined Time Frame / Particular Period of Time (Предопределенный временной интервал)
    Период времени (например, час, день, неделя, месяц), за который анализируются новые регистрации оповещений для выявления трендов.
    Ranking Component (Компонент ранжирования)
    Часть поисковой системы, отвечающая за сортировку результатов поиска. Согласно патенту, он использует Topical Subjects для корректировки ранжирования.
    News Search Engine (Новостная поисковая система)
    Специализированная поисковая система (например, Google News). В патенте указана как основной пример применения изобретения.

    Ключевые утверждения (Анализ Claims)

    Данный документ является продолжением (Continuation) более ранней заявки. Пункты 1-29 отменены. Анализ сфокусирован на обновленных пунктах формулы (начиная с Claim 30), которые описывают использование данных об оповещениях для влияния на ранжирование.

    Claim 30 (Независимый пункт): Описывает метод определения трендовых тем и их использования в ранжировании.

    1. Система получает множество поисковых терминов от множества пользователей, когда они регистрируются для получения оповещений в течение определенного периода времени.
    2. Система идентифицирует те поисковые термины, которые были получены больше порогового количества раз (threshold number of times) за этот период.
    3. На основе этих частотных терминов система идентифицирует одну или несколько актуальных тем (topics / Topical Subjects).
    4. Система идентифицирует множество документов, соответствующих поисковому запросу, у которых есть первоначальное ранжирование.
    5. Система модифицирует ранжирование (modifying the ranking) по крайней мере одного документа из этого множества, если этот документ относится к идентифицированным актуальным темам.

    Claim 31 (Зависимый от 30): Уточняет механизм модификации.

    Модификация ранжирования включает в себя «повышение» (boosting) ранга документа, если он относится к актуальным темам. Это прямое указание на то, что трендовость является позитивным фактором ранжирования.

    Claim 32 (Зависимый от 30): Уточняет область применения.

    Система может являться новостной поисковой системой (news search engine), а обрабатываемые документы — новостными документами (news documents). Это подчеркивает основное применение изобретения в Google News.

    Claim 38 (Независимый пункт): Описывает систему (System Claim), реализующую метод, аналогичный Claim 30.

    Где и как применяется

    Изобретение охватывает сбор поведенческих данных, их обработку для извлечения признаков и применение этих признаков на этапе ранжирования.

    Сбор данных (Data Acquisition)
    Система Alert Engine собирает данные о поведении пользователей — на что они подписываются. Это сбор данных о действиях пользователей в экосистеме Google, а не стандартный краулинг веба.

    INDEXING – Индексирование и извлечение признаков (Feature Extraction)
    Topical Subject Generator обрабатывает собранные данные (в офлайн или близком к реальному времени режиме). Он анализирует агрегированные подписки за определенный период и извлекает важный признак — список Topical Subjects. Этот список сохраняется и становится доступным для систем ранжирования.

    RANKING – Ранжирование / RERANKING – Переранжирование
    Основное применение патента. Ranking Component поисковой системы (особенно News Search Engine) использует список Topical Subjects во время ранжирования результатов по запросу пользователя. Если документ соответствует одной из актуальных тем, его оценка ранжирования модифицируется (повышается).

    Входные данные:

    • Регистрации оповещений (Alert Search Terms, временные метки).
    • Период анализа (например, последние 24 часа).
    • (На этапе ранжирования) Поисковый запрос и список документов-кандидатов.

    Выходные данные:

    • Список Topical Subjects.
    • Модифицированные (повышенные) оценки ранжирования для документов, соответствующих этим темам.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на новостной контент (news documents). Также может влиять на свежие веб-документы и обсуждения (Groups), так как в патенте упоминается, что пользователи могут выбирать эти типы при регистрации оповещений.
    • Специфические запросы: Запросы, связанные с текущими событиями, трендами и внезапными новостями (breaking news). Тесная связь с концепцией QDF (Query Deserves Freshness).
    • Конкретные ниши или тематики: Любые динамичные ниши, где происходят быстрые изменения и возникает повышенный интерес (политика, развлечения, спорт, технологии, финансы).

    Когда применяется

    • Триггеры активации: Статус Topical Subject активируется, когда количество новых подписок на тему превышает определенный порог (threshold number of times) за заданный период.
    • Пороговые значения: Используются для фильтрации шума и выделения действительно значимых всплесков интереса.
    • Временные рамки: Анализ может проводиться периодически (ежечасно, ежедневно) для обновления списка актуальных тем. В патенте упоминаются интервалы в час, день, неделю, месяц.

    Пошаговый алгоритм

    Процесс А: Генерация актуальных тем (Topical Subject Generation)

    1. Сбор данных: Получение списка всех Alert Search Terms, зарегистрированных за предопределенный период времени (например, за последний день).
    2. Агрегация: Группировка уникальных поисковых терминов и подсчет количества регистраций для каждого.
    3. Нормализация (Опционально): Идентификация и объединение схожих поисковых терминов (например, с использованием техник сравнения строк, как в примере с «Rafik Hariri» и «Hariri» из патента) для консолидации данных о частоте.
    4. Фильтрация по порогу: Сравнение количества регистраций для каждого термина с предопределенным порогом популярности.
    5. Генерация списка: Формирование списка Topical Subjects из терминов, превысивших порог.

    Процесс Б: Применение актуальных тем в ранжировании

    1. Получение запроса и кандидатов: Поисковая система получает запрос и формирует первоначальный список релевантных документов.
    2. Получение актуальных тем: Ranking Component получает текущий список Topical Subjects.
    3. Оценка релевантности темам: Система определяет, связаны ли документы-кандидаты с одной или несколькими Topical Subjects.
    4. Модификация ранжирования (Boosting): Для документов, связанных с актуальными темами, применяется повышение их оценки ранжирования.
    5. Финальная сортировка: Документы сортируются на основе модифицированных оценок и предоставляются пользователю.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании данных о поведении пользователей в системе оповещений.

    • Поведенческие факторы: Основной источник данных – это действия пользователей по регистрации оповещений. Система анализирует, какие именно Alert Search Terms вводят пользователи и как часто. Это сигнал активного интереса к теме.
    • Временные факторы: Временные метки регистрации оповещений критически важны. Анализ выполняется только на данных за недавний период времени, что позволяет выявлять именно актуальные тренды.

    Какие метрики используются и как они считаются

    • Частота регистрации (Frequency Count / Number of Alerts): Основная метрика. Подсчитывается количество раз, когда уникальный поисковый термин был зарегистрирован пользователями за анализируемый период.
    • Пороговое значение популярности (Threshold value): Заданное значение частоты. Только термины, превысившие этот порог, считаются Topical Subjects.
    • Временной интервал (Predetermined time frame): Период, за который агрегируются данные (час, день, неделя, месяц).
    • Методы анализа текста: Для объединения схожих терминов используются техники сравнения строк (string comparison techniques).

    Выводы

    1. Google Alerts как сенсор трендов: Патент демонстрирует, как Google использует данные из вспомогательных сервисов (Google Alerts) в качестве «сенсорной сети» для обнаружения возникающих трендов и всплесков интереса к темам или сущностям.
    2. Активный интерес как сигнал ранжирования: В отличие от анализа объема поисковых запросов (пассивный интерес), анализ подписок (активный интерес) используется как прямой сигнал для модификации ранжирования.
    3. Явное подтверждение бустинга: В патенте (Claim 31) прямо указано, что документы, связанные с выявленными Topical Subjects, получают повышение (boosting) в ранжировании.
    4. Приоритет для Новостного поиска (QDF): Механизм имеет особое значение для News Search Engine (Claim 32) и является одним из способов реализации концепции QDF (Query Deserves Freshness). Это позволяет системе быстро реагировать на события, повышая в выдаче свежий новостной контент.
    5. Нормализация запросов: Система учитывает вариативность формулировок и применяет методы для объединения схожих запросов (string comparison techniques), чтобы точнее измерять тренды.

    Практика

    Best practices (это мы делаем)

    • Мониторинг трендов и скорость реакции (News SEO): Для новостных сайтов критически важно быстро создавать качественный контент по возникающим новостным поводам. Если тема становится трендом (Topical Subject), релевантный контент получит дополнительный бустинг в ранжировании (особенно в Google News и Top Stories). Скорость публикации является ключевым фактором.
    • Фокус на Breaking News: Быстрая публикация новостей о внезапных событиях может дать значительное преимущество, так как именно такие события вызывают всплеск подписок на оповещения и быстро становятся Topical Subjects.
    • Оптимизация под сущности (Entities): Пользователи часто подписываются на оповещения по именам людей, названиям компаний или конкретным событиям. Убедитесь, что ваш контент четко связан с этими сущностями (через заголовки, текст, разметку), чтобы система могла установить связь между вашим документом и Topical Subject.
    • Обеспечение быстрой индексации: Техническая оптимизация для максимально быстрого попадания новостей в индекс (XML Sitemaps для новостей, Indexing API) гарантирует, что контент будет проиндексирован в момент максимальной актуальности темы.

    Worst practices (это делать не надо)

    • Игнорирование актуальной повестки: Работа исключительно по плану «вечнозеленого» контента без учета текущих трендов приведет к упущению трафика по событийным запросам, где применяется бустинг актуальности.
    • Медленная публикация контента: Задержка в освещении актуальных событий означает, что пик интереса (и максимальный бустинг от системы) может быть пропущен, так как тема перестанет быть Topical Subject.
    • Попытки манипуляции системой оповещений: Искусственное создание большого количества подписок на оповещения с целью повлиять на ранжирование, скорее всего, будет неэффективным, учитывая способность Google выявлять неестественное поведение и спам.

    Стратегическое значение

    Патент подтверждает стратегическую важность актуальности и свежести контента (QDF) как фактора ранжирования, особенно в вертикалях, чувствительных к событиям. Он демонстрирует один из способов, которым Google может измерять эту актуальность, опираясь на явные действия пользователей. Для долгосрочной SEO-стратегии медиа-ресурсов это означает необходимость выстраивания процессов, позволяющих быстро и качественно освещать трендовые темы.

    Практические примеры

    Сценарий: Внезапная новость о слиянии компаний

    1. Событие: Объявлено о слиянии двух крупных технологических компаний (Компания А и Компания Б).
    2. Реакция пользователей: Журналисты и инвесторы массово начинают регистрировать оповещения в Google Alerts по терминам «Компания А слияние» и «Компания Б».
    3. Действие системы: Topical Subject Generator обнаруживает, что за последний час количество регистраций по этим терминам превысило порог. Эти термины помечаются как Topical Subjects.
    4. Влияние на поиск: News Search Engine использует Ranking Component, который видит список актуальных тем.
    5. Результат: Свежие новостные статьи, посвященные слиянию Компании А и Б, получают значительный бустинг и отображаются на более высоких позициях в новостной выдаче и блоках «Главные новости» (Top Stories), опережая менее актуальные материалы.

    Вопросы и ответы

    Как этот патент связан с алгоритмом QDF (Query Deserves Freshness)?

    Этот патент описывает один из конкретных механизмов для реализации QDF. Алгоритм QDF направлен на выявление запросов, требующих свежих результатов. Используя частоту подписок в Google Alerts как индикатор всплеска интереса, система может определить, что по данной теме требуется свежий контент, и активировать повышение (boosting) для актуальных документов по этой теме.

    Влияет ли этот механизм только на Google News?

    Патент явно указывает на News Search Engine как на основной пример применения (Claim 32). Однако в описании упоминается, что пользователи могут выбирать тип оповещений: «News», «Web», «Groups». Это предполагает, что выявленные актуальные темы могут использоваться и в основном веб-поиске, хотя наибольший эффект наблюдается в новостной выдаче и блоках Top Stories.

    Как SEO-специалист может оптимизировать сайт под этот алгоритм?

    Прямая оптимизация невозможна, так как нельзя манипулировать подписками пользователей. Однако можно адаптировать контент-стратегию. Ключевым фактором является скорость реакции на тренды. Необходимо быстро публиковать качественный контент по актуальным темам. Если система признает тему актуальной (Topical Subject), ваш своевременно опубликованный материал получит преимущество в ранжировании.

    Как система объединяет похожие запросы для оповещений?

    Патент предусматривает этот шаг (Act 606). Упоминается возможность комбинирования схожих терминов, например, «Rafik Hariri» и «Hariri» (пример из патента), используя стандартные техники сравнения строк (string comparison techniques). Это позволяет более точно оценить общий интерес к сущности или событию, даже если пользователи используют разные формулировки.

    Насколько быстро система определяет тренды?

    Это зависит от установленного временного интервала анализа (Predetermined Time Frame). В патенте упоминаются интервалы в час, день, неделю или месяц. Для оперативного реагирования на внезапные новости (Breaking News), вероятно, используются короткие интервалы (час или несколько часов).

    Что происходит, когда тема перестает быть актуальной?

    Механизм основан на анализе данных за недавний период времени. Если пользователи перестают массово подписываться на оповещения по теме, частота новых регистраций падает ниже порога. При следующем обновлении списка Topical Subject Generator исключит эту тему из списка актуальных, и бустинг в ранжировании для нее прекратится.

    Использует ли Google только Google Alerts для определения трендов?

    Патент описывает механизм на основе Alert Engine. Однако Google использует множество других сигналов для определения трендов, таких как всплески поисковых запросов (Google Trends) и частота публикаций в новостных источниках. Данные из Google Alerts являются одним из ценных источников, описывающих активный интерес пользователей.

    Насколько сильным является повышение (boost) для актуальных тем?

    Патент не указывает конкретных числовых значений или формул для расчета бустинга. Указано лишь, что документы могут получить повышение в их значениях ранжирования (Claim 31). Сила бустинга, вероятно, зависит от степени популярности темы (насколько превышен порог) и других факторов ранжирования.

    Может ли этот механизм помочь небольшим сайтам конкурировать с крупными новостными порталами?

    Да, потенциально может. Если небольшой сайт первым опубликует качественный материал по возникающему тренду, который система идентифицировала как Topical Subject, он может получить значительный бустинг. В контексте новостного поиска скорость и релевантность тренду могут временно перевесить общую авторитетность домена.

    Актуален ли этот патент, учитывая дату подачи первой заявки (2005 год)?

    Хотя оригинальная идея была подана в 2005 году, публикация 2014 года является ее продолжением с обновленной формулой изобретения (Claims 30+), которая явно связывает определение трендов с модификацией ранжирования. Фундаментальная идея использования данных о подписках для определения актуальности остается крайне релевантной для современных поисковых систем.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.