
Google использует систему для оценки качества новостных источников на основе 13 различных метрик, включая объем публикаций, скорость освещения событий (Breaking News Score), оригинальность контента (Original Named Entities), размер штата, данные о трафике и репутацию. На основе этих метрик вычисляется "Рейтинг Источника" (Source Rank), который затем используется для повышения позиций статей от авторитетных изданий в новостном поиске.
Патент решает проблему неоднородного качества новостных источников в результатах поиска. При поиске новостей стандартные алгоритмы могут возвращать результаты как от авторитетных международных агентств (например, CNN или BBC), так и от небольших локальных или низкокачественных сайтов. Цель изобретения — разработать механизм для систематической оценки качества новостного источника и использования этой оценки для улучшения ранжирования новостных статей, отдавая предпочтение более качественным и авторитетным изданиям.
Запатентована система для вычисления оценки качества новостного источника (Source Rank) на основе группы разнообразных метрик (в патенте описано 13). Эти метрики оценивают журналистские ресурсы, объем и качество контента, скорость реакции на события и репутацию издания. Полученный Source Rank используется как фактор ранжирования для корректировки позиций отдельных статей, публикуемых этим источником в новостном поиске.
Система работает в два этапа:
Breaking News Score), количество оригинальной информации (Original Named Entities), размер штата, данные о трафике и мнения людей. Эти метрики комбинируются (например, взвешенной суммой) для получения итогового Source Rank.OLDSCORE). Затем она идентифицирует источник каждой статьи и корректирует ее оценку, используя предварительно вычисленный Source Rank. Итоговая оценка (NEWSCORE) является комбинацией исходной релевантности и качества источника.Высокая (для новостного поиска). Хотя патент подан в 2003 году, он описывает фундаментальные принципы оценки качества новостных изданий, которые лежат в основе работы Google News и блока Top Stories. Изобретатель Krishna Bharat является ключевой фигурой в развитии Google News. Принципы оценки авторитетности, оригинальности и журналистских стандартов, описанные здесь, являются прямыми предшественниками концепции E-E-A-T для новостного контента.
Критическое влияние (10/10) для издателей новостей (News Publishers). Этот патент фактически определяет, как Google пытается измерить журналистское качество и авторитетность издания. Понимание метрик, формирующих Source Rank, напрямую влияет на стратегию продвижения в Google News и Top Stories. Для общего веб-поиска влияние менее прямое, но принципы оценки авторитетности источников также важны.
Source Rank. Вычисляется как комбинация OLDSCORE и Source Rank.Патент фокусируется на двух основных аспектах: методе расчета качества источника и методе применения этой оценки для ранжирования.
Claim 1 (Независимый пункт): Описывает метод определения значения качества (quality value или Source Rank) для новостного источника.
amount of coverage), Breaking News Score, объем трафика, мнения людей, статистику циркуляции, размер штата, количество бюро, количество Original Named Entities, широту охвата, международное разнообразие трафика и стиль письма.importance metric value). Она рассчитывается путем определения для каждой статьи количества других недублирующихся статей на ту же тему, произведенных другими новостными источниками (Story Size), и суммирования этих значений для источника.Source Rank) на основе одной или нескольких определенных метрик.Claims 3-10 (Зависимые): Детализируют методы комбинирования нескольких метрик для получения Source Rank.
Claim 12 (Зависимый от 1): Детализирует расчет Breaking News Score.
Claim 13 (Зависимый от 12): Уточняет, что Breaking News Score может быть умножен на величину, пропорциональную размеру кластера статей (Story Size). Это повышает ценность скорости реакции для важных новостей.
Изобретение применяется в контексте специализированной поисковой системы по новостям (например, Google News) или компонента универсального поиска, отвечающего за новостной контент (Top Stories).
CRAWLING – Сканирование и Сбор данных
Система должна собирать новостные статьи и метаданные, критически важные для расчета метрик: текст статьи, точное время публикации, URL источника, авторство.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые процессы для поддержки системы (в офлайн или пакетном режиме):
Clusters) для определения Story Size и расчета Breaking News Score.Original Named Entities.Staff Size) по количеству уникальных журналистов.Source Rank происходит периодически, так как многие метрики требуют анализа данных за определенный период (например, неделю, месяц). Результаты сохраняются в базе данных.RANKING / RERANKING – Ранжирование и Переранжирование
Применение Source Rank происходит на этапе ранжирования или переранжирования новостных результатов в реальном времени.
OLDSCORE.Source Rank для корректировки OLDSCORE и получения NEWSCORE.NEWSCORE.Входные данные:
Выходные данные:
Source Rank для новостных источников.NEWSCORE) для отдельных статей.Source Rank происходит периодически (офлайн). Применение Source Rank происходит в реальном времени при каждом запросе.Source Rank.Процесс А: Расчет Рейтинга Источника (Source Rank) (Офлайн/Пакетный режим)
Story Size для каждой статьи путем анализа размера соответствующего кластера.Breaking News Score путем сравнения времени публикации статьи с временем первой публикации в кластере.Original Named Entities путем анализа сущностей, впервые введенных источником в кластер.Source Rank. Может использоваться взвешенная сумма, средний ранг или расчет на основе N лучших метрик источника.Source Rank в базе данных для последующего использования в реальном времени.Процесс Б: Применение Рейтинга Источника (Реальное время)
OLDSCORE).Source Rank для идентифицированного источника.NEWSCORE) путем комбинирования OLDSCORE и Source Rank. Например, с использованием формулы взвешенной суммы.NEWSCORE.Патент описывает использование широкого спектра данных для оценки качества источника:
Original Named Entities). Байлайны (Bylines) используются для оценки размера штата.Breaking News Score. URL используется для идентификации источника.Система рассчитывает Source Rank на основе комбинации следующих 13 метрик:
Story Size (размеров кластеров) для всех статей источника за период.Формула расчета NEWSCORE:
Итоговая оценка ранжирования рассчитывается как взвешенная сумма исходной оценки и рейтинга источника:
Пример значений, указанный в патенте: alpha=0.8, beta=0.2.
Source Rank) являются критически важными факторами ранжирования, которые модифицируют базовую релевантность статьи.Source Rank — это сложная метрика, агрегирующая 13 различных показателей, охватывающих ресурсы, производительность, качество контента и репутацию.Original Named Entities. Источники, которые первыми сообщают факты (имена, места), получают преимущество перед агрегаторами и рерайтерами.Breaking News Score) важна, но ее влияние дополнительно усиливается важностью события (Story Size). Быть первым в освещении крупного события дает значительный буст.Source Rank, даже если не все метрики доступны, используя только N лучших метрик для данного источника, что позволяет оценивать разные типы изданий.Рекомендации для издателей новостей (News Publishers):
Original Named Entities напрямую поощряет источники, которые добавляют новую информацию (имена, места, цитаты) в освещение события, а не просто переписывают чужие материалы.Breaking News Score рассчитывается на основе разницы во времени между публикациями в кластере.Staff Size может оцениваться по количеству уникальных имен журналистов. Это сигнализирует о ресурсах издания и поддерживает E-E-A-T.Average Length и Writing Style (грамматика, орфография) учитываются при расчете Source Rank.Breadth (широта охвата) поощряет издания с большим количеством разделов. Одновременно важно обеспечивать качественное освещение ключевых событий в своих нишах (Importance of Coverage).Human Opinion и Circulation Statistics показывают важность внешних сигналов авторитетности: трафик, награды (Пулитцеровская премия), узнаваемость бренда и доверие пользователей.Original Named Entities.Breaking News Score.Average Length.Source Rank через метрику Writing Style.Staff Size).Этот патент имеет фундаментальное значение для понимания работы Google News. Он подтверждает, что успех в новостном поиске зависит не только от SEO-оптимизации отдельных статей, но в первую очередь от стратегического развития издания как авторитетной новостной организации. Система направлена на алгоритмическое измерение журналистского качества. Для долгосрочной стратегии издатели должны фокусироваться на оригинальности, скорости, качестве контента и развитии бренда, что полностью соответствует современным требованиям E-E-A-T.
Сценарий: Освещение локального происшествия, ставшего федеральной новостью
Событие: Крупный пожар на химическом заводе.
Breaking News Score.Original Named Entities для Local Gazette.Staff Size, Average Length и Writing Style.Source Rank у National News в целом значительно выше из-за репутации, трафика и ресурсов. У Local Gazette Source Rank ниже, но он улучшается за счет высокой производительности по данному конкретному событию (Скорость и Оригинальность).NEWSCORE. Статья National News получает значительный буст за счет высокого Source Rank. Статья Local Gazette также ранжируется высоко за счет высокой релевантности (OLDSCORE) и неплохого Source Rank, усиленного недавними успехами. В зависимости от весов (alpha и beta), обе статьи могут оказаться в топе.Применяется ли этот патент только к Google News или также к основному поиску Google?
Патент явно описывает системы и методы для улучшения ранжирования "новостных статей" (News Articles) и упоминает "новостную поисковую систему" (news search engine). Основное применение — это Google News и блок "Top Stories" (Главные новости) в основном поиске. Для ранжирования обычных веб-страниц используются другие алгоритмы, хотя общие принципы оценки авторитетности источника могут пересекаться.
Что такое "Original Named Entities" и почему это важно?
Это одна из ключевых метрик для оценки оригинальности репортажа. Если источник публикует статью о событии и упоминает в ней именованные сущности (имена людей, названия организаций, места), которые не встречались в более ранних статьях других изданий на эту же тему, это считается индикатором того, что источник провел собственное расследование и добавил новую информацию. Это сильно повышает ценность источника в глазах системы.
Как рассчитывается "Breaking News Score"?
Система определяет время самой первой публикации о событии (начало кластера). Затем для каждой последующей статьи измеряется время задержки (T). Чем меньше T, тем выше оценка. Используется логарифмическая функция, например, log(N/T), где N — это порог, после которого новость не считается срочной (например, 3 часа). Также оценка может быть умножена на важность события (размер кластера).
Что важнее: скорость публикации или оригинальность контента?
Важны оба фактора, так как они являются отдельными метриками, формирующими Source Rank. Скорость (Breaking News Score) критична для срочных новостей, особенно для крупных событий. Оригинальность (Original Named Entities) критична для демонстрации журналистского качества и способности проводить расследования. Идеальная стратегия — быть быстрым и оригинальным.
Как Google определяет размер штата (Staff Size) новостного источника?
В патенте предлагается определять размер штата на основе количества уникальных имен журналистов, указанных в статьях источника (байлайнах) за определенный период. Это подчеркивает важность использования явных и последовательных байлайнов для всех авторов на сайте.
Влияет ли качество текста (грамматика, орфография) на ранжирование новостей?
Да, влияет. Патент включает метрику "Стиль письма" (Writing Style). Она рассчитывается с помощью автоматизированных тестов для измерения корректности орфографии, грамматики и уровня чтения. Высокое качество письма повышает Source Rank.
Учитывает ли система трафик сайта при оценке его качества?
Да, учитывается несколько метрик, связанных с трафиком. Во-первых, "Паттерны использования" (Usage Pattern) — это клики из новостного поиска на статьи источника. Во-вторых, "Статистика циркуляции" (Circulation Statistics) — это данные о трафике от внешних агентств или тираж печатной версии. В-третьих, "Международное разнообразие" — количество стран, откуда идет трафик.
Как этот патент связан с E-E-A-T?
Этот патент является ранней реализацией принципов E-E-A-T (Опыт, Экспертиза, Авторитетность, Надежность) применительно к новостному контенту. Метрики, описанные в патенте, направлены на алгоритмическое измерение Авторитетности (размер штата, награды, трафик), Надежности (стиль письма, оригинальность) и Экспертизы (широта охвата, важность освещения) новостной организации.
Может ли небольшой локальный сайт конкурировать с крупными федеральными изданиями?
Это сложно, так как многие метрики (размер штата, количество бюро, общий трафик, широта охвата) дают преимущество крупным изданиям. Однако небольшой сайт может конкурировать в своей нише за счет высокой скорости реакции на местные события (Breaking News Score) и предоставления уникальной локальной информации (Original Named Entities), недоступной крупным игрокам.
Что значит, что система может использовать только N лучших метрик?
Это механизм для обеспечения гибкости. Если для какого-то источника невозможно рассчитать все 13 метрик (например, нет данных о печатном тираже), или если источник силен только в нескольких аспектах, система может рассчитать Source Rank на основе, например, 5 самых сильных метрик этого источника. Это позволяет оценивать разнообразные типы новостных сайтов.

Свежесть контента
EEAT и качество

Ссылки
Антиспам
SERP

EEAT и качество
Свежесть контента
SERP

Ссылки
Поведенческие сигналы
Мультимедиа

EEAT и качество
Свежесть контента
Семантика и интент

Knowledge Graph
Семантика и интент
EEAT и качество

Свежесть контента
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
SERP
Семантика и интент

Knowledge Graph
Свежесть контента
Семантика и интент

Local SEO
Поведенческие сигналы

Семантика и интент
SERP
Персонализация

Мультиязычность
Поведенческие сигналы

Ссылки
Антиспам
SERP

Ссылки
Поведенческие сигналы
Антиспам
