
Google разработал систему для ранжирования блогов, которая вычисляет независимую от запроса Оценку Качества (Quality Score). Эта оценка учитывает сигналы популярности (подписки, CTR), авторитетности (Pagerank, ссылки), а также выявляет спам-паттерны: автоматизированную частоту и размер постов, расположение рекламы и ссылочные схемы. Финальный рейтинг определяется комбинацией этой оценки качества и стандартной релевантности.
Патент решает проблему крайне неоднородного качества контента в блогосфере и борется со специфическими видами спама, такими как автоматическая генерация контента (спам-блоги или «сплоги»). Цель — улучшить результаты специализированного поиска по блогам (Blog Search Engine) путем выявления и понижения низкокачественных или спамных блог-документов и продвижения авторитетных ресурсов.
Запатентована система ранжирования для поиска по блогам, которая использует две ключевые оценки: Relevance Score (зависит от запроса) и Quality Score (не зависит от запроса). Суть изобретения заключается в методологии расчета Quality Score на основе сигналов, специфичных для блогов. Эти сигналы включают позитивные индикаторы (популярность, авторитетность) и негативные индикаторы (паттерны спама и автоматизации). Финальный Overall Score определяется комбинацией этих двух оценок.
Система работает в два этапа:
Quality Score (Офлайн/Индексация): Система анализирует блог-документ (блог или пост) для выявления позитивных и негативных индикаторов качества. Индикаторы взвешиваются и комбинируются для расчета Quality Score, который сохраняется в базе данных.Relevance Score (или IR score). Затем этот показатель корректируется с помощью предварительно рассчитанного Quality Score для получения Overall Score. Блоги с высоким качеством повышаются, а с низким — понижаются.Средняя. Патент подан в 2005 году, и многие специфические сигналы (Blogrolls, Feed readers/RSS-агрегаторы) устарели. Специализированный поиск по блогам Google был закрыт. Однако, заложенные принципы имеют фундаментальное значение. Методы выявления автоматизированного контента (по частоте и размеру постов), анализ ссылочных схем и влияния рекламы крайне актуальны в 2025 году, особенно в контексте борьбы с масштабируемым ИИ-контентом. Эти принципы эволюционировали в современные системы оценки качества.
Влияние на современные SEO-стратегии значительное (7/10). Хотя прямые тактики (например, оптимизация под RSS) неактуальны, патент раскрывает фундаментальные методы Google для выявления автоматизированного контента по поведенческим и структурным паттернам. Он подтверждает, что Google анализирует не только текст, но и мета-паттерны создания, распространения и монетизации контента для выявления спама.
Feed readers), позволяющие пользователям подписываться на фиды (например, RSS) блогов. Количество подписчиков используется как сигнал популярности.Quality Score и Relevance Score.Патент содержит несколько независимых пунктов (Claims 1, 5, 6, 7, 10, 18, 21), которые защищают общий механизм ранжирования, но отличаются конкретными индикаторами качества, используемыми для расчета Quality Score.
Общий механизм (Claims 1, 5, 6, 7, 10, 18, 21): Описывается метод ранжирования в Blog Search Engine.
блог-документ, релевантный запросу.Relevance Score (зависит от запроса).Quality Score (не зависит от запроса). Эта оценка основана на комбинации позитивных и/или негативных индикаторов качества, специфичных для блогов.Ranking Score (или Overall Score) путем объединения Relevance Score и Quality Score.Ranking Score.Ядром изобретения является использование независимой от запроса оценки качества для корректировки стандартной релевантности.
Специфические индикаторы, упомянутые в Claims: Различные пункты формулы защищают использование конкретных индикаторов для расчета Quality Score. Примеры:
quantity of ads) И наличие пользовательских тегов (tags that have been added by users).blog feed) блога и контента в самом посте блога (проверка на клоакинг/подмену контента).location of ads) И индикация дублирования контента в нескольких фидах блога.similar or identical length) – признак автоматизации.blogroll или метаданных с наличием рекламы непосредственно в контенте постов.Изобретение применяется в рамках специализированной поисковой системы по блогам и затрагивает этапы индексирования и ранжирования.
CRAWLING – Сканирование и Сбор данных
Система собирает контент блогов, их фиды (RSS/Atom), а также внешние данные: информацию от RSS-агрегаторов (количество подписчиков), данные о тегировании и данные о ссылках (для Pagerank и анализа блогголлов).
INDEXING – Индексирование и извлечение признаков
Основной этап расчета Quality Score (офлайн). Система анализирует собранные данные для вычисления индикаторов качества:
Pagerank, анализ распределения исходящих ссылок, учет входящих ссылок из блогголлов.Рассчитанный Quality Score сохраняется в индексе вместе с блог-документом.
RANKING – Ранжирование
На этом этапе для входящего запроса рассчитывается стандартный Relevance Score (IR Score).
RERANKING – Переранжирование
Система извлекает Quality Score из индекса и комбинирует его с Relevance Score для получения Overall Score. Происходит финальная сортировка результатов.
Blog Documents (блоги и посты) в рамках специализированного поиска по блогам.Расчет Quality Score применяется периодически на этапе индексирования или переиндексирования блога. Комбинирование Quality Score и Relevance Score применяется в реальном времени при обработке каждого поискового запроса в Blog Search Engine.
Процесс А: Расчет Quality Score (Индексирование/Офлайн)
subscriptions spam по IP).Blogrolls, качество этих блогроллов, Pagerank).Quality Score в базе данных в привязке к блог-документу.Процесс Б: Ранжирование (Обработка запроса/Онлайн)
Relevance Score (IR Score).Quality Score для найденных документов.Relevance Score и Quality Score. В примере патента используется сложение: Overall Score=Relevance Score+Quality Score.Overall Score и предоставление результатов пользователю.Система использует широкий спектр факторов, специфичных для блогосферы:
Pagerank блога или поста (новый пост может наследовать Pagerank блога).Blogrolls (количество и качество источников, high quality blogroll).Link distribution) — анализ концентрации ссылок на один внешний сайт.News/Feed aggregators.Implied popularity, CTR в результатах поиска).Tagging) пользователями.Frequency of new posts) — анализ паттернов (всплески или регулярные интервалы) для выявления автоматизации.Size of the posts) — анализ распределения длин постов для выявления автоматизации (много постов одинаковой длины). Структура страницы (для определения расположения рекламы).Presence of ads). Реклама в теле поста считается более негативным фактором, чем в метаданных или рядом с блогроллом.Quality Score и Relevance Score (в примере патента — простое сложение).Quality Score (независимый от запроса) и Relevance Score (зависимый от запроса). Качество источника может повысить или понизить финальный рейтинг.Pagerank, ссылки из авторитетных источников и поведенческие факторы (CTR).Feed) является важной частью оценки качества.Хотя специфические технологии (RSS, Blogrolls) устарели, патент подтверждает важность следующих фундаментальных стратегий, особенно в контексте ИИ-контента:
implied popularity) является позитивным индикатором качества.High Quality Blogrolls).Патент демонстрирует ранний подход Google к борьбе со спамом путем анализа не только содержания контента, но и мета-паттернов его создания и распространения. В контексте современного SEO и роста ИИ-контента, этот патент напоминает, что системы Google способны выявлять автоматизацию по косвенным признакам (частота, размер, структура), даже если сам текст выглядит качественно. Это подчеркивает важность естественного поведения сайта для долгосрочного успеха.
Сценарий: Выявление и пессимизация автоматизированного ИИ-контента
Size of posts: распределение длин постов слишком однородное (негативный индикатор).Frequency of new posts: интервалы публикаций предсказуемы (predictable intervals) (негативный индикатор).Quality Score, что приводит к деприоритизации в выдаче.Актуален ли этот патент в 2025 году, учитывая, что он фокусируется на блогах и RSS?
Прямая актуальность низкая, так как технологии RSS и Blogrolls устарели. Однако заложенные в нем принципы борьбы с автоматизированным контентом и оценки качества по мета-паттернам остаются фундаментальными. Методы, описанные для выявления спам-блогов, сегодня могут применяться для борьбы с ИИ-сгенерированным спамом.
Как патент предлагает выявлять автоматическую генерацию контента?
Патент описывает два ключевых метода, не связанных с анализом текста. Первый — анализ частоты публикаций: всплески активности или публикации через строго предсказуемые интервалы (например, каждые 10 минут). Второй — анализ размера постов: если большинство постов на сайте имеют одинаковую или очень похожую длину. Оба паттерна считаются признаком работы генератора.
Как эти методы выявления автоматизации применимы к ИИ-контенту сегодня?
Принципы крайне актуальны. Если ИИ используется для массовой генерации статей по одному шаблону (одинаковая длина и структура) и публикации по расписанию, поисковая система может выявить эти паттерны и классифицировать контент как низкокачественный. Важно вносить максимальное разнообразие в длину, структуру и частоту публикаций.
Как патент предлагает оценивать влияние рекламы на качество?
Патент рассматривает два аспекта: количество и расположение рекламы. Слишком много рекламы является негативным индикатором. Особенно негативно оценивается реклама, размещенная внутри основного контента поста, в отличие от рекламы в боковых колонках (метаданных или рядом с блогроллом). Это соответствует современным принципам Page Experience.
Что такое "implied popularity" (подразумеваемая популярность) и учитывается ли CTR?
Да, это метрика популярности, основанная на анализе кликстрима в результатах поиска. Если пользователи кликают на определенный блог чаще, чем на другие результаты по тем же запросам (высокий CTR), это считается позитивным индикатором качества и популярности данного блога. Это прямое указание на использование поведенческих факторов.
В чем разница между Quality Score и Relevance Score в этом патенте?
Relevance Score (IR Score) зависит от запроса и определяет текстовое соответствие документа ключевым словам. Quality Score не зависит от запроса и определяет общее качество, популярность и надежность блога на основе множества сигналов (ссылки, подписки, паттерны спама). Финальный рейтинг является их комбинацией (например, суммой).
Как система боролась со ссылочными схемами?
Система анализировала распределение исходящих ссылок (Link distribution). Если слишком высокий процент всех ссылок с блога указывал на один и тот же внешний сайт, это считалось негативным индикатором качества и признаком ссылочной схемы, созданной для манипуляции ранжированием.
Что такое "Content Mismatch" (Несоответствие контента)?
Это ситуация, когда контент в фиде (Feed) блога отличается от контента на самой странице блога. Это прием клоакинга: спамеры могли помещать оптимизированный контент в фид для ранжирования, а на странице показывать пользователю рекламу. Выявление такого несовпадения является сильным негативным сигналом.
Может ли новый пост наследовать авторитетность всего блога?
Да. Патент упоминает, что если для нового поста еще не рассчитан собственный Pagerank, он может наследовать Pagerank всего блога. Это позволяет новым постам с авторитетных ресурсов сразу получать преимущество в ранжировании, что соответствует современным принципам E-E-A-T.
Как Google боролся с накруткой популярности (Subscriptions Spam)?
Патент упоминает необходимость валидации подписок для борьбы со спамом, когда авторы искусственно завышают популярность своих блогов. Это достигается путем проверки уникальности пользователей или путем фильтрации по уникальным IP-адресам подписчиков. Google всегда ищет способы валидации сигналов против манипуляций.

EEAT и качество
Антиспам
Ссылки

Персонализация
Поведенческие сигналы
Антиспам

EEAT и качество
SERP
Поведенческие сигналы

Поведенческие сигналы

Ссылки
EEAT и качество
Свежесть контента

Поведенческие сигналы
Индексация
Техническое SEO

Поведенческие сигналы

SERP
Поведенческие сигналы
Персонализация

Ссылки
SERP
Индексация

Knowledge Graph
Поведенческие сигналы
Персонализация

Ссылки
SERP

Семантика и интент
Поведенческие сигналы
Knowledge Graph

SERP
Поведенческие сигналы
Семантика и интент

Knowledge Graph
Семантика и интент
EEAT и качество

SERP
Поведенческие сигналы
