
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
Патент решает проблему определения относительной важности и актуальности новостных сюжетов в реальном времени. Вместо того чтобы полагаться исключительно на традиционные сигналы (время публикации, авторитетность источника), система использует редакционные решения самих издателей как прямой сигнал ранжирования. Цель — использовать «знания, воплощенные в редакционном принятии решений» (knowledge embodied in the editorial decision-making) для определения важности новостей и более быстрого вывода в топ актуальных сюжетов.
Запатентована система ранжирования новостных статей, которая рассчитывает оценку важности статьи на основе ее Prominence (визуальной заметности) на одной или нескольких Hub Pages (главных страницах или страницах разделов новостных сайтов). Система анализирует визуальное расположение (relative presentation position) и оформление гиперссылки на статью, чтобы определить, насколько важной ее считает редактор Hub Page.
Ключевой механизм заключается в анализе рендеринга Hub Pages:
Hub Page, чтобы понять визуальную структуру отрендеренной страницы.Article Score). Статьи группируются по сюжетам, и группы также ранжируются (Group Score).Высокая. Принципы, изложенные в этом патенте, являются фундаментальными для работы агрегаторов новостей, таких как Google News и блока Top Stories. Использование сигналов от издателей для определения важности контента остается ключевым механизмом оценки актуальных новостей, хотя конкретные технические методы анализа страниц (рендеринг, интерпретация DOM/CSS) могли эволюционировать с момента подачи патента.
Патент имеет критическое значение (9/10) для SEO новостных сайтов и издателей. Он напрямую связывает дизайн, UX и верстку главных страниц и страниц рубрик с ранжированием контента в Google News и Top Stories. Если важная новость размещена на сайте незаметно (внизу, мелким шрифтом, без картинки), этот механизм присвоит ей низкий Prominence Score, что негативно скажется на ее видимости в поиске.
Hub Page. Определяется на основе позиции и оформления ссылки на Хаб-странице.Hub Page относительно местоположений других ссылок на той же странице после рендеринга.Reference Position Score и другие факторы оформления (шрифт, сниппет, изображение).Prominence Score, основанный исключительно на физическом расположении ссылки (Relative Presentation Position) на отрендеренной странице.Prominence Score и другие факторы (свежесть, качество источника, новизна контента (novelty)).News Article Group, рассчитываемая на основе Article Scores входящих в нее статей.Hub Page.Claim 1 (Независимый пункт): Описывает базовый метод ранжирования новостей.
Hub Pages (каждая должна иметь как минимум пороговое количество гиперссылок на новости).Reference Position Score. Эта оценка основана на Relative Presentation Position (визуальном местоположении) ссылки относительно других ссылок на той же странице.News Article Scores для статей, на которые ведут ссылки, используя полученные Reference Position Scores.Claim 3 (Зависимый от 2 и 1): Детализирует технический метод определения позиции.
Определение заметности (prominence) позиции отображения основано на анализе одного или нескольких из следующих источников: HTML-код, DOM или CSS (style sheet) Hub Page. Это подтверждает, что система анализирует страницу после рендеринга.
Claim 4 и 5 (Зависимые): Описывают группировку и ранжирование сюжетов.
Статьи группируются в News Article Groups. Определяется Group Score на основе News Article Scores статей в группе. Группы предоставляются в ответ на запрос, упорядоченные на основе их Group Scores.
Claim 6 и 7 (Зависимые): Описывают ранжирование внутри тематических категорий.
Reference Position Score может определяться на основе позиции ссылки относительно других ссылок, принадлежащих к той же тематической категории на Hub Page (например, ранжирование внутри блока "Бизнес").
Claim 9 (Зависимый): Уточняет учет порядка чтения.
Оценка основана на позиции и на "соглашении о порядке заметности гиперссылок" (hyperlink prominence ordering convention), используемом на странице (например, слева направо или справа налево в зависимости от языка).
Claim 10 (Зависимый от 1): Расширяет факторы, влияющие на оценку статьи.
News Article Score вычисляется с использованием не только позиции, но и одного или нескольких факторов: количества текста, представленного со ссылкой (сниппет), размеров шрифтов текста ссылки, форматирования текста ссылки или наличия изображения, связанного со ссылкой.
Изобретение применяется на нескольких этапах обработки новостного контента (Google News, Top Stories).
CRAWLING – Сканирование и Сбор данных
Система должна идентифицировать потенциальные Hub Pages (используя Sources repository) и часто их сканировать. Также проверяется актуальность (freshness) Хаб-страниц, игнорируя устаревшие (stale) страницы.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. При обработке Hub Page система выполняет:
rendered layout).Relative Presentation Position), размера шрифтов, наличия изображений, сниппетов.Reference Position Score и Prominence Score для каждой ссылки.News Article Groups (например, с использованием TF-IDF и косинусного сходства, как описано в патенте).RANKING – Ранжирование
Рассчитанные Article Scores (включающие Prominence Score) и Group Scores используются для ранжирования новостного контента в специализированных индексах.
Входные данные:
Hub Pages.Hub Pages.Hub Page (для определения порядка чтения).Выходные данные:
Prominence Scores и Reference Position Scores для новостных статей.News Article Groups) и их Group Scores.News Articles).Hub Page.stale) Hub Pages, которые не обновлялись в течение определенного периода (например, несколько часов).Этап 1: Подготовка и Сканирование
Hub Pages (вручную или автоматически).Hub Pages. Проверка на устаревание (если контент не изменился, страница может быть проигнорирована). Идентификация ссылок, ведущих на новостные статьи.Этап 2: Анализ Заметности (Prominence Analysis)
Relative Presentation Position), учитывая правила макета и языка (например, сверху вниз, слева направо). Включает анализ DOM-дерева для корректной интерпретации сложных макетов.Этап 3: Расчет Оценок и Ранжирование
Reference Position Score с оценками визуальных факторов.Prominence Scores (если на статью ссылаются несколько Hub Pages) и комбинация с другими факторами ранжирования (качество источника, свежесть и т.д.).Этап 4: Группировка
News Article Groups на основе схожести контента.Article Scores входящих в нее статей (например, среднее, медиана или масштабированная сумма).Система использует преимущественно структурные и технические данные, связанные с представлением контента на Hub Pages.
Hub Page (для фильтрации устаревших страниц); свежесть самой статьи.Hub Page для определения порядка чтения (слева направо или справа налево).Reference Position Score с оценками, полученными на основе визуальных факторов.Prominence Score и других сигналов. Пример формулы из патента: Prominence система анализирует отрендеренную страницу (используя DOM и CSS), а не просто парсит HTML сверху вниз. Это позволяет учитывать сложные макеты и визуальное оформление.Prominence Score включает не только позицию (Reference Position Score), но и размер шрифта, наличие изображений, сниппетов и форматирование. Визуальное выделение ссылки имеет значение.Что такое Hub Page в контексте этого патента?
Hub Page — это страница на новостном сайте, содержащая большое количество ссылок на отдельные новостные статьи. Классические примеры — это главная страница сайта (например, nytimes.com) или страница раздела (например, bbc.com/sports). Система использует эти страницы как источник данных о том, какие новости считаются важными в данный момент с точки зрения редакции.
Как именно Google измеряет визуальную заметность (Prominence)?
Prominence измеряется путем анализа отрендеренной страницы (DOM и CSS). Основной фактор — это позиция ссылки (Reference Position Score): чем выше и центральнее ссылка, тем выше оценка. Дополнительные факторы включают размер шрифта заголовка, наличие и размер изображения, наличие сниппета и форматирование текста (например, жирный шрифт).
Имеет ли значение разница в оценке между первой и второй новостью на главной странице?
Да, имеет критическое значение. Патент предлагает формулу расчета оценки с нелинейным затуханием (например, C1/power(order,C2)). Это означает, что первая позиция получает значительно более высокую оценку, чем вторая, и так далее. Разница между верхними позициями очень велика.
Как этот патент влияет на ранжирование в Google News и Top Stories?
Он описывает один из фундаментальных механизмов ранжирования для этих сервисов. Prominence Score, полученный с Hub Pages, напрямую влияет на то, какие статьи и новостные сюжеты (News Article Groups) будут показаны на верхних позициях. Это позволяет Google быстро реагировать на важные события, опираясь на мнение редакций СМИ.
Что делать, если у моего сайта сложный дизайн (например, сетка или колонки)?
Патент учитывает сложные макеты. Система анализирует DOM и CSS, чтобы понять визуальную структуру, включая горизонтальное расположение и блочную верстку. Обычно используется порядок сверху вниз, а затем слева направо (или наоборот, в зависимости от языка). Важно, чтобы дизайн четко выделял приоритетные новости визуально, и чтобы структура DOM была чистой и понятной для анализа.
Как оптимизировать структуру DOM для этого алгоритма?
Необходимо использовать чистую, семантичную верстку. Основные новостные блоки должны быть логично структурированы. Патент описывает анализ DOM-дерева для избежания ошибок, например, чтобы связанные статьи внутри одного блока не интерпретировались как отдельные важные новости. Валидный код и логичная иерархия элементов помогут системе корректно определить Reference Position Score.
Что произойдет, если моя главная страница редко обновляется?
Патент предусматривает механизм фильтрации «устаревших» (stale) Hub Pages. Если система при регулярном сканировании обнаруживает, что контент главной страницы не менялся в течение определенного времени (например, нескольких часов), эта страница может быть временно исключена из процесса оценки, что негативно скажется на ранжировании ваших статей.
Применяется ли этот механизм только к главной странице сайта?
Нет. Механизм применяется к любым страницам, которые система идентифицирует как Hub Pages. Это могут быть главные страницы, а также страницы ключевых рубрик (например, /sports, /business). Важно оптимизировать заметность статей на всех этих страницах.
Влияет ли скорость загрузки главной страницы на этот механизм?
Патент напрямую не упоминает скорость загрузки. Однако, если страница загружается слишком медленно или система не может её полностью отрендерить из-за таймаутов или ошибок ресурсов (CSS/JS), она не сможет корректно рассчитать Prominence Score. Поэтому быстрая и стабильная работа главной страницы косвенно необходима для работы этого механизма.
Влияет ли этот патент на сайты, которые не являются новостными?
Прямого влияния нет, так как патент сфокусирован на идентификации и ранжировании новостных статей (News Articles) и использовании новостных Hub Pages. Однако он дает общее понимание того, как Google может использовать анализ визуального представления (рендеринга) страницы для определения важности контента.

Мультимедиа
Семантика и интент
SERP

Свежесть контента
EEAT и качество

SERP
Ссылки
Структура сайта

Мультимедиа
SERP

Семантика и интент
Структура сайта
Техническое SEO

Поведенческие сигналы
Семантика и интент
SERP

Ссылки
EEAT и качество
Свежесть контента

Поведенческие сигналы
Персонализация
Семантика и интент

Ссылки
Индексация
Мультимедиа

Knowledge Graph
Свежесть контента
Семантика и интент

Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Индексация
Техническое SEO

Антиспам
SERP
Ссылки

Мультиязычность
Поведенческие сигналы
SERP
