
Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих ссылок (out-degree), качество входящих ссылок (Link-based score), возраст поста, его длину и расположение ссылок, чтобы гарантировать качество подмешиваемого контента.
Патент решает задачу предоставления пользователю доступа к редакторскому контенту (обзоры, мнения, дискуссии), который релевантен конкретному результату веб-поиска, непосредственно на странице SERP. Ключевой технической задачей является необходимость строгого контроля качества этого контента для борьбы со спам-блогами (splogs) — блогами, созданными для манипулирования link-based score и продвижения аффилированных сайтов.
Запатентована система для дополнения результатов веб-поиска релевантными и высококачественными постами из блогов. Суть изобретения заключается в многоступенчатом процессе фильтрации (офлайн и онлайн), который применяет строгие эвристики качества. Система идентифицирует посты, релевантные веб-результату (формулируя вторичный запрос на основе его контента), и оценивает их качество по ряду ссылочных, структурных и временных факторов.
Система работает в два основных этапа:
out-degree и высокие link-based scores входящих ссылок. Прошедшие фильтрацию посты отображаются вместе с соответствующим результатом веб-поиска.Средняя/Высокая. Хотя патент подан в 2006 году и конкретный UI может отличаться, принципы дополнения основной выдачи специализированным пользовательским контентом (например, блоки «Дискуссии и форумы» или Google Perspectives) остаются крайне актуальными. Механизмы фильтрации UGC и блогов по качеству, описанные в патенте, отражают фундаментальные подходы Google к борьбе со спамом и оценке авторитетности.
Патент имеет значительное влияние (6.5/10) на стратегии продвижения блогов, форумов и сайтов с UGC. Он детально описывает строгие критерии качества, которым должен соответствовать контент, чтобы попасть в основную поисковую выдачу из специализированных индексов. Понимание этих фильтров (особенно важность качества входящих ссылок, контроль исходящих ссылок и структура контента) критично для оптимизации такого типа ресурсов.
link-based score или показа рекламы.Патент фокусируется на двух основных механизмах фильтрации качества при интеграции блогов в веб-поиск.
Claim 1 (Независимый пункт): Описывает метод с фильтрацией по количеству исходящих ссылок (Out-degree).
second search query для поиска по блогам, включающий термины из результата поиска.out-degree поста.out-degree превышает пороговое значение (out-degree threshold).Ядро пункта — использование показателя out-degree как основного фильтра для отсева спама (сплогов) при подмешивании контента в SERP.
Claim 23 (Независимый пункт): Описывает метод с фильтрацией по качеству входящих ссылок (Link-based Score).
link-based score ниже порогового значения (link-based threshold).link-based score.Ядро пункта — использование авторитетности источников входящих ссылок как обязательного критерия доверия к блог-посту.
Зависимые пункты (Claims 2, 17, 22, 24-28): Детализируют дополнительные эвристики фильтрации:
Изобретение функционирует на нескольких уровнях поисковой архитектуры, объединяя процессы индексирования и метапоиска.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-подготовка данных:
Blog Post Repository.Link-based Scores (PageRank).splogs).out-degree, даты, расположение ссылок и т.д.).RANKING – Ранжирование
Генерируются стандартные результаты веб-поиска.
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Это основной этап применения патента (онлайн-процесс):
second search query и ищет релевантные посты в репозитории.link-based scores и т.д.).out-degree, link-based score, свежести, длине и т.д.).Процесс разделен на две части: офлайн-подготовка репозитория и онлайн-обработка запроса.
Процесс А: Офлайн-подготовка репозитория (Фильтрация и Хранение)
Blog Post Repository.Link-based scores входящих ссылок ниже порога – отклонить.Link-based scores входящих ссылок, длина поста, расположение исходящих ссылок, out-degree, дата создания.Процесс Б: Онлайн-обработка запроса (Идентификация и Отображение)
second search query (на основе терминов веб-результата) и поиск по подготовленному репозиторию.Out-degree поста мал.Link-based score.Система использует комбинацию ссылочных, структурных и временных факторов для оценки качества.
Link-based score).Out-degree). Расположение ссылки внутри текста. Цель ссылки (домен, тип медиа).Link-based Score (LBS): Метрика авторитетности (PageRank). Применяется к документам, ссылающимся на блог-пост. Упоминается шкала LBS0-LBS10.Out-degree: Количество исходящих ссылок из поста.splogs).Link-based score отфильтровываются.out-degree является сильным негативным сигналом и индикатором спама.second search query), а не с исходным запросом пользователя.Рекомендации направлены на оптимизацию блогов, форумов и UGC-площадок для повышения вероятности их появления в основной выдаче (например, в блоках типа «Дискуссии и форумы» или Perspectives).
Link-based score). Контент без качественных внешних ссылок имеет минимальные шансы пройти фильтры авторитетности.out-degree алгоритмически интерпретируется как спам.link-based score входящих ссылок и высокого out-degree.Патент подтверждает, что для интеграции контента из специализированных индексов (UGC) в основную выдачу Google использует четкие и измеримые эвристики качества, основанные на классических алгоритмах (PageRank/Link-based Score), структуре контента и ссылочном профиле. Хотя конкретные эвристики могли эволюционировать, фундаментальный подход, описанный здесь, остается актуальным и лежит в основе современных систем отображения дискуссий и форумов в SERP.
Сценарий: Оптимизация треда на форуме для появления в SERP (например, в блоке «Дискуссии и форумы»)
Задача: Добиться того, чтобы тред на форуме, обсуждающий обзор новой модели смартфона, появился в SERP рядом с официальным обзором на авторитетном сайте.
Что такое Link-based Score, упомянутый в патенте, и как он влияет на блоги и форумы?
Link-based Score — это метрика для измерения авторитетности документа в сети, аналог PageRank. В патенте он используется для оценки качества входящих ссылок на блог-пост или тред форума. Если на контент ссылаются документы с низким Link-based Score, он будет отфильтрован. Это подчеркивает критическую важность получения ссылок с авторитетных ресурсов для блогов и форумов.
Насколько важен параметр Out-degree и какие значения считаются высокими?
Out-degree (количество исходящих ссылок) критически важен как фильтр против спама (splogs). Патент приводит пример порога в 50 исходящих ссылок, но отмечает, что порог может настраиваться, в том числе с помощью машинного обучения. SEO-специалистам следует избегать любого неестественно большого количества исходящих ссылок в контенте, чтобы не попасть под этот фильтр.
Патент утверждает, что исходящие ссылки должны быть расположены близко к началу поста. Почему это важно для SEO?
Расположение ссылки в начале поста служит сигналом того, что эта ссылка является центральной темой обсуждения. Если система ищет блоги, комментирующие определенный веб-результат, она ожидает, что этот результат будет обсуждаться сразу, что подтверждается ранним размещением ссылки на него. Это подчеркивает важность размещения ключевых редакторских ссылок в начале контента.
Как система определяет, какие посты релевантны результату поиска?
Система не использует исходный запрос пользователя. Вместо этого она формулирует второй запрос (second search query) для поиска по репозиторию блогов, используя термины из конкретного результата веб-поиска. Это гарантирует, что найденный пост релевантен именно этому результату, а не запросу в целом.
В чем разница между офлайн и онлайн фильтрацией в этом патенте?
Офлайн-фильтрация происходит на этапе индексирования и очищает репозиторий от очевидного спама (например, посты без заголовков, без входящих ссылок). Онлайн-фильтрация применяется в реальном времени к уже найденным релевантным постам и использует более тонкие критерии, такие как свежесть, точное расположение ссылок и актуальные оценки качества.
Что такое "Splog" и как Google идентифицирует его согласно патенту?
Splog – это спам-блог, созданный для продвижения других сайтов и манипуляции рейтингами. Согласно патенту, Google идентифицирует их по нескольким признакам: чрезмерно большое количество исходящих ссылок (высокий out-degree), отсутствие или низкое качество входящих ссылок (низкий Link-based score), недостаточная длина контента, а также структурные аномалии, такие как отсутствие заголовка.
Насколько важна свежесть контента согласно этому патенту?
Свежесть является одним из ключевых фильтров, применяемых в реальном времени. Система проверяет, является ли пост недавним (recent). Порог может быть фиксированным (например, 10 дней) или динамическим. Для попадания в основную выдачу контент блога или форума должен быть актуальным.
Может ли новый форум или блог попасть в выдачу, если у него мало входящих ссылок?
Это крайне маловероятно в рамках описанной системы. Патент четко указывает, что отсутствие входящих ссылок или наличие входящих ссылок только с низким Link-based Score являются причинами для отклонения поста. Авторитетность является обязательным условием.
Как этот патент связан с современными блоками в выдаче, такими как «Дискуссии и форумы»?
Этот патент описывает базовую инфраструктуру и логику фильтрации, которая лежит в основе таких функций. Хотя конкретные UI-элементы и веса фильтров изменились, фундаментальный подход к отбору качественного пользовательского контента на основе авторитетности, структуры и ссылочного профиля остается актуальным.
Являются ли пороги фильтрации (например, для длины или out-degree) фиксированными?
Патент упоминает использование «предопределенных» порогов, но также отмечает возможность их настройки с помощью статистического анализа или методов машинного обучения (например, байесовских моделей) для оптимизации эффективности фильтрации. Это предполагает, что пороги могут быть динамическими или адаптироваться.

EEAT и качество
Антиспам
Индексация

Краулинг

EEAT и качество
Свежесть контента
Семантика и интент

Ссылки
Семантика и интент
Техническое SEO

SERP
Индексация
Краулинг

Поведенческие сигналы
Мультимедиа
Семантика и интент

EEAT и качество
Антиспам
SERP

Поведенческие сигналы
Антиспам
SERP

Семантика и интент
SERP
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
Ссылки

Knowledge Graph
Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
SERP
