SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google оценивает качество и авторитетность новостных источников для ранжирования в Google News

SYSTEMS AND METHODS FOR IMPROVING THE RANKING OF NEWS ARTICLES (Системы и методы для улучшения ранжирования новостных статей)
  • US7577655B2
  • Google LLC
  • 2003-09-16
  • 2009-08-18
  • EEAT и качество
  • SERP
  • Свежесть контента
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для оценки качества новостных источников на основе 13 различных метрик, включая объем публикаций, скорость освещения событий (Breaking News Score), оригинальность контента (Original Named Entities), размер штата, данные о трафике и репутацию. На основе этих метрик вычисляется "Рейтинг Источника" (Source Rank), который затем используется для повышения позиций статей от авторитетных изданий в новостном поиске.

Описание

Какую проблему решает

Патент решает проблему неоднородного качества новостных источников в результатах поиска. При поиске новостей стандартные алгоритмы могут возвращать результаты как от авторитетных международных агентств (например, CNN или BBC), так и от небольших локальных или низкокачественных сайтов. Цель изобретения — разработать механизм для систематической оценки качества новостного источника и использования этой оценки для улучшения ранжирования новостных статей, отдавая предпочтение более качественным и авторитетным изданиям.

Что запатентовано

Запатентована система для вычисления оценки качества новостного источника (Source Rank) на основе группы разнообразных метрик (в патенте описано 13). Эти метрики оценивают журналистские ресурсы, объем и качество контента, скорость реакции на события и репутацию издания. Полученный Source Rank используется как фактор ранжирования для корректировки позиций отдельных статей, публикуемых этим источником в новостном поиске.

Как это работает

Система работает в два этапа:

  1. Вычисление Рейтинга Источника (Source Rank) (Офлайн): Система периодически анализирует каждый новостной источник по группе метрик. Примеры метрик: количество статей за период, средняя длина статьи, скорость публикации после события (Breaking News Score), количество оригинальной информации (Original Named Entities), размер штата, данные о трафике и мнения людей. Эти метрики комбинируются (например, взвешенной суммой) для получения итогового Source Rank.
  2. Применение Рейтинга Источника (Реальное время): При получении поискового запроса система генерирует начальный список результатов (OLDSCORE). Затем она идентифицирует источник каждой статьи и корректирует ее оценку, используя предварительно вычисленный Source Rank. Итоговая оценка (NEWSCORE) является комбинацией исходной релевантности и качества источника.

Актуальность для SEO

Высокая (для новостного поиска). Хотя патент подан в 2003 году, он описывает фундаментальные принципы оценки качества новостных изданий, которые лежат в основе работы Google News и блока Top Stories. Изобретатель Krishna Bharat является ключевой фигурой в развитии Google News. Принципы оценки авторитетности, оригинальности и журналистских стандартов, описанные здесь, являются прямыми предшественниками концепции E-E-A-T для новостного контента.

Важность для SEO

Критическое влияние (10/10) для издателей новостей (News Publishers). Этот патент фактически определяет, как Google пытается измерить журналистское качество и авторитетность издания. Понимание метрик, формирующих Source Rank, напрямую влияет на стратегию продвижения в Google News и Top Stories. Для общего веб-поиска влияние менее прямое, но принципы оценки авторитетности источников также важны.

Детальный разбор

Термины и определения

Breaking News Score (Оценка срочных новостей)
Метрика, измеряющая способность источника публиковать статью вскоре после того, как произошло важное событие. Чем меньше времени прошло между событием и публикацией, тем выше оценка.
Cluster (Кластер)
Группа связанных новостных статей от разных источников, освещающих одно и то же событие или тему.
Metrics (Метрики)
Специфические атрибуты новостного источника, которые служат частичными индикаторами его качества (в патенте описано 13 метрик).
NEWSCORE (Новая оценка ранжирования)
Итоговая оценка ранжирования новостной статьи после применения Source Rank. Вычисляется как комбинация OLDSCORE и Source Rank.
OLDSCORE (Исходная оценка ранжирования)
Начальная оценка ранжирования статьи до учета качества источника.
Original Named Entities (Оригинальные именованные сущности)
Именованные сущности (люди, места, организации), которые источник вводит в рамках кластера статей, и которые не упоминались в более ранних статьях этого кластера. Служит индикатором оригинального репортажа.
Source Rank (Рейтинг Источника)
Итоговая числовая оценка качества, авторитетности и надежности новостного источника, рассчитанная на основе группы метрик.
Story Size (Размер истории/Важность события)
Мера важности новостного события. Определяется как количество других отдельных статей в системе, посвященных той же теме (размер кластера).

Ключевые утверждения (Анализ Claims)

Патент фокусируется на двух основных аспектах: методе расчета качества источника и методе применения этой оценки для ранжирования.

Claim 1 (Независимый пункт): Описывает метод определения значения качества (quality value или Source Rank) для новостного источника.

  1. Система определяет одну или несколько метрик для новостного источника из предопределенного списка. Список включает (но не ограничивается): объем статей, среднюю длину, объем освещения событий (amount of coverage), Breaking News Score, объем трафика, мнения людей, статистику циркуляции, размер штата, количество бюро, количество Original Named Entities, широту охвата, международное разнообразие трафика и стиль письма.
  2. Особо выделяется расчет метрики важности (importance metric value). Она рассчитывается путем определения для каждой статьи количества других недублирующихся статей на ту же тему, произведенных другими новостными источниками (Story Size), и суммирования этих значений для источника.
  3. Система генерирует значение качества (Source Rank) на основе одной или нескольких определенных метрик.
  4. Система использует это значение качества для ранжирования объекта (статьи), связанного с источником.

Claims 3-10 (Зависимые): Детализируют методы комбинирования нескольких метрик для получения Source Rank.

  • Метрики могут быть умножены на коэффициенты и суммированы (Claim 3).
  • Метрики могут быть нормализованы и суммированы (Claim 5).
  • Может быть рассчитано среднее значение метрик (Claim 7).
  • Может быть рассчитан процентиль относительно лучшего источника по каждой метрике (Claim 9).
  • Важно: Любой из этих методов может использовать только предопределенное количество лучших метрик (N) для данного источника (Claims 4, 6, 8, 10).

Claim 12 (Зависимый от 1): Детализирует расчет Breaking News Score.

  • Определяется время публикации статьи (T1) и время публикации самой первой статьи на эту тему в кластере (T2).
  • Вычисляется разница (T1-T2).
  • Разница сравнивается с пороговым значением.
  • Оценка присваивается на основе этого сравнения.

Claim 13 (Зависимый от 12): Уточняет, что Breaking News Score может быть умножен на величину, пропорциональную размеру кластера статей (Story Size). Это повышает ценность скорости реакции для важных новостей.

Где и как применяется

Изобретение применяется в контексте специализированной поисковой системы по новостям (например, Google News) или компонента универсального поиска, отвечающего за новостной контент (Top Stories).

CRAWLING – Сканирование и Сбор данных
Система должна собирать новостные статьи и метаданные, критически важные для расчета метрик: текст статьи, точное время публикации, URL источника, авторство.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые процессы для поддержки системы (в офлайн или пакетном режиме):

  • Кластеризация новостей: Статьи должны быть сгруппированы по событиям (Clusters) для определения Story Size и расчета Breaking News Score.
  • Извлечение сущностей (NER): Необходимо для идентификации Original Named Entities.
  • Идентификация авторов: Необходимо для оценки размера штата (Staff Size) по количеству уникальных журналистов.
  • Расчет метрик и Source Rank: Расчет 13 метрик и итогового Source Rank происходит периодически, так как многие метрики требуют анализа данных за определенный период (например, неделю, месяц). Результаты сохраняются в базе данных.

RANKING / RERANKING – Ранжирование и Переранжирование
Применение Source Rank происходит на этапе ранжирования или переранжирования новостных результатов в реальном времени.

  • Система получает начальный набор релевантных статей с оценками OLDSCORE.
  • Система использует предварительно рассчитанный Source Rank для корректировки OLDSCORE и получения NEWSCORE.
  • Происходит финальная сортировка по NEWSCORE.

Входные данные:

  • Поток новостных статей с метаданными.
  • Данные о кластеризации статей.
  • Логи использования (клики на статьи из поиска).
  • Внешние данные (статистика циркуляции, мнения людей, IP-адреса посетителей).

Выходные данные:

  • База данных с рассчитанными Source Rank для новостных источников.
  • Откорректированные оценки ранжирования (NEWSCORE) для отдельных статей.

На что влияет

  • Конкретные типы контента: Влияет исключительно на новостные статьи (News Articles).
  • Специфические запросы: Наибольшее влияние на запросы, связанные с текущими событиями, срочными новостями (breaking news) и темами, где важна авторитетность источника.
  • Конкретные ниши: Критически влияет на все новостные вертикали: политика, спорт, бизнес, развлечения и т.д.

Когда применяется

  • Условия применения: Алгоритм применяется при ранжировании результатов в ответ на запрос в новостной поисковой системе или при формировании новостных блоков в универсальном поиске.
  • Частота применения: Расчет Source Rank происходит периодически (офлайн). Применение Source Rank происходит в реальном времени при каждом запросе.
  • Триггеры активации: Активируется для любой статьи, источник которой имеет рассчитанный Source Rank.

Пошаговый алгоритм

Процесс А: Расчет Рейтинга Источника (Source Rank) (Офлайн/Пакетный режим)

  1. Инициализация: Выбор новостного источника для анализа и определение временного периода (например, 1 неделя).
  2. Сбор данных и Кластеризация: Агрегация всех статей, опубликованных источником за этот период. Группировка статей от всех источников в кластеры по событиям. Сбор внешних данных (трафик, репутация).
  3. Расчет метрик: Вычисление значений для группы метрик (13 описанных в патенте). Например:
    • Расчет Story Size для каждой статьи путем анализа размера соответствующего кластера.
    • Расчет Breaking News Score путем сравнения времени публикации статьи с временем первой публикации в кластере.
    • Расчет Original Named Entities путем анализа сущностей, впервые введенных источником в кластер.
  4. Нормализация и Взвешивание: Приведение метрик к единой шкале (например, от 0 до 1) или применение весовых коэффициентов.
  5. Комбинирование метрик: Агрегация взвешенных или нормализованных значений для получения итогового Source Rank. Может использоваться взвешенная сумма, средний ранг или расчет на основе N лучших метрик источника.
  6. Сохранение: Сохранение Source Rank в базе данных для последующего использования в реальном времени.

Процесс Б: Применение Рейтинга Источника (Реальное время)

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Генерация начального ранжирования: Система генерирует список релевантных новостных статей с исходными оценками ранжирования (OLDSCORE).
  3. Идентификация источников: Для каждой статьи в списке определяется ее новостной источник (например, по URL).
  4. Получение Source Rank: Система запрашивает из базы данных предварительно рассчитанный Source Rank для идентифицированного источника.
  5. Корректировка оценки: Вычисляется новая оценка ранжирования (NEWSCORE) путем комбинирования OLDSCORE и Source Rank. Например, с использованием формулы взвешенной суммы.
  6. Переранжирование: Список статей сортируется на основе NEWSCORE.
  7. Предоставление результатов: Откорректированный список предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент описывает использование широкого спектра данных для оценки качества источника:

  • Контентные факторы: Текст статей используется для измерения средней длины, оценки стиля письма (грамматика, орфография, уровень чтения), определения широты охвата (по темам) и извлечения именованных сущностей (Original Named Entities). Байлайны (Bylines) используются для оценки размера штата.
  • Технические факторы: Время публикации (Timestamps) критически важно для расчета Breaking News Score. URL используется для идентификации источника.
  • Ссылочные факторы: Упоминается возможность использования количества гиперссылок на новостной сайт как метрики. Также анализируются страны происхождения сайтов, ссылающихся на источник (для международной диверсификации).
  • Поведенческие факторы (Usage Pattern): Клики (usage) из новостной поисковой системы на статьи источника. Трафик нормализуется на количество показов.
  • Временные факторы: Возраст новостного источника может использоваться как мера доверия (Human Opinion).
  • Географические факторы: Количество новостных бюро (Bureaus). IP-адреса посетителей для определения количества стран, из которых идет трафик (International Diversity).
  • Внешние данные и Репутация (Human Opinion/Circulation): Статистика трафика от внешних агентств (Media Metrix, Nielsen Netratings). Статистика циркуляции печатных изданий. Результаты опросов пользователей. Внешние награды (например, Пулитцеровские премии). Оценки асессоров.

Какие метрики используются и как они считаются

Система рассчитывает Source Rank на основе комбинации следующих 13 метрик:

  1. Количество статей: Число недублирующихся статей (или оригинальных предложений), произведенных источником за период.
  2. Средняя длина статьи: Среднее количество слов или предложений в статье.
  3. Важность освещения (Importance of Coverage): Сумма Story Size (размеров кластеров) для всех статей источника за период.
  4. Breaking News Score: Оценка скорости реакции на события. Может рассчитываться по формулам, основанным на времени (T) от начала события до публикации: log(N1/T)log(N1/T) (где N1 - временной порог, например, 3 часа). Оценка может быть умножена на фактор важности события: (1+log(ClusterSize))(1+log(Cluster Size)).
  5. Паттерны использования (Usage Pattern): Нормализованный объем кликов из поисковой системы.
  6. Мнение людей (Human Opinion): Агрегация опросов, внешних наград (Пулитцер), возраста источника, оценок асессоров.
  7. Статистика циркуляции (Circulation Statistics): Данные внешнего трафика или тиража печатных версий.
  8. Размер штата (Staff Size): Количество уникальных журналистов (по байлайнам).
  9. Количество бюро (Bureaus): Количество представительств источника.
  10. Оригинальные именованные сущности (Original Named Entities): Среднее количество новых сущностей, которые источник добавляет в кластер.
  11. Широта охвата (Breadth): Количество тем или разделов, которые освещает источник.
  12. Международное разнообразие (International Diversity): Количество стран, из которых идет трафик или ссылки.
  13. Стиль письма (Writing Style): Автоматическая оценка орфографии, грамматики и уровня чтения.

Формула расчета NEWSCORE:

Итоговая оценка ранжирования рассчитывается как взвешенная сумма исходной оценки и рейтинга источника:

NEWSCORE(D)=alpha∗OLDSCORE(D)+beta∗SOURCERANK(SOURCE(D))NEWSCORE(D) = alpha * OLDSCORE(D) + beta * SOURCERANK(SOURCE(D))

Пример значений, указанный в патенте: alpha=0.8, beta=0.2.

Выводы

  1. Качество источника как ключевой фактор в новостях: Патент устанавливает, что для новостного контента авторитетность и качество источника (Source Rank) являются критически важными факторами ранжирования, которые модифицируют базовую релевантность статьи.
  2. Многофакторная оценка авторитетности: Google не полагается на один сигнал (например, ссылки или трафик) для определения качества новостного издания. Source Rank — это сложная метрика, агрегирующая 13 различных показателей, охватывающих ресурсы, производительность, качество контента и репутацию.
  3. Ценность оригинального репортажа (Original Reporting): Система явно измеряет и поощряет оригинальность через метрику Original Named Entities. Источники, которые первыми сообщают факты (имена, места), получают преимущество перед агрегаторами и рерайтерами.
  4. Скорость и Важность (Breaking News): Скорость публикации (Breaking News Score) важна, но ее влияние дополнительно усиливается важностью события (Story Size). Быть первым в освещении крупного события дает значительный буст.
  5. Измерение журналистских стандартов и ресурсов: Метрики, такие как размер штата, количество бюро, стиль письма и широта охвата, показывают попытку алгоритмически оценить ресурсы и профессионализм новостной организации.
  6. Гибкость оценки: Система может рассчитывать Source Rank, даже если не все метрики доступны, используя только N лучших метрик для данного источника, что позволяет оценивать разные типы изданий.

Практика

Best practices (это мы делаем)

Рекомендации для издателей новостей (News Publishers):

  • Фокус на оригинальном контенте (Original Reporting): Инвестируйте в репортажи, которые приносят новые факты. Метрика Original Named Entities напрямую поощряет источники, которые добавляют новую информацию (имена, места, цитаты) в освещение события, а не просто переписывают чужие материалы.
  • Оптимизация скорости публикации (Breaking News): Для важных событий скорость имеет значение. Необходимо обеспечить быструю публикацию и точные временные метки (timestamps), так как Breaking News Score рассчитывается на основе разницы во времени между публикациями в кластере.
  • Использование явных байлайнов (Bylines): Указывайте авторов статей. Метрика Staff Size может оцениваться по количеству уникальных имен журналистов. Это сигнализирует о ресурсах издания и поддерживает E-E-A-T.
  • Повышение качества контента: Пишите полные, грамотные материалы. Метрики Average Length и Writing Style (грамматика, орфография) учитываются при расчете Source Rank.
  • Расширение охвата и специализация: Метрика Breadth (широта охвата) поощряет издания с большим количеством разделов. Одновременно важно обеспечивать качественное освещение ключевых событий в своих нишах (Importance of Coverage).
  • Работа над репутацией и брендом: Метрики Human Opinion и Circulation Statistics показывают важность внешних сигналов авторитетности: трафик, награды (Пулитцеровская премия), узнаваемость бренда и доверие пользователей.

Worst practices (это делать не надо)

  • Агрегация и поверхностный рерайтинг: Создание контента исключительно путем переписывания сообщений других агентств без добавления новой информации приведет к низким показателям Original Named Entities.
  • Медленная реакция на события: Постоянное отставание в публикации срочных новостей приведет к низкому Breaking News Score.
  • "Тонкий" новостной контент: Публикация коротких заметок вместо полноценных статей негативно скажется на метрике Average Length.
  • Игнорирование качества текста: Низкое качество письма, ошибки и плохая грамматика могут быть алгоритмически оценены и понизить Source Rank через метрику Writing Style.
  • Анонимный контент: Отсутствие байлайнов может помешать системе оценить размер и качество штата (Staff Size).

Стратегическое значение

Этот патент имеет фундаментальное значение для понимания работы Google News. Он подтверждает, что успех в новостном поиске зависит не только от SEO-оптимизации отдельных статей, но в первую очередь от стратегического развития издания как авторитетной новостной организации. Система направлена на алгоритмическое измерение журналистского качества. Для долгосрочной стратегии издатели должны фокусироваться на оригинальности, скорости, качестве контента и развитии бренда, что полностью соответствует современным требованиям E-E-A-T.

Практические примеры

Сценарий: Освещение локального происшествия, ставшего федеральной новостью

Событие: Крупный пожар на химическом заводе.

  1. Скорость (Breaking News): Небольшая местная газета (Local Gazette) публикует первую заметку в 14:00. Крупное федеральное издание (National News) публикует новость в 14:15. Local Gazette получает более высокий Breaking News Score.
  2. Оригинальность (Original Named Entities): В 15:00 Local Gazette обновляет статью, добавляя имена местных чиновников и названия пострадавших компаний, которые еще не известны другим источникам. Это повышает метрику Original Named Entities для Local Gazette.
  3. Качество контента и Ресурсы: National News публикует развернутый материал с комментариями экспертов, инфографикой и высоким качеством текста. У National News выше метрики Staff Size, Average Length и Writing Style.
  4. Расчет Source Rank: Source Rank у National News в целом значительно выше из-за репутации, трафика и ресурсов. У Local Gazette Source Rank ниже, но он улучшается за счет высокой производительности по данному конкретному событию (Скорость и Оригинальность).
  5. Ранжирование: При запросе "пожар на химическом заводе" система рассчитывает NEWSCORE. Статья National News получает значительный буст за счет высокого Source Rank. Статья Local Gazette также ранжируется высоко за счет высокой релевантности (OLDSCORE) и неплохого Source Rank, усиленного недавними успехами. В зависимости от весов (alpha и beta), обе статьи могут оказаться в топе.

Вопросы и ответы

Применяется ли этот патент только к Google News или также к основному поиску Google?

Патент явно описывает системы и методы для улучшения ранжирования "новостных статей" (News Articles) и упоминает "новостную поисковую систему" (news search engine). Основное применение — это Google News и блок "Top Stories" (Главные новости) в основном поиске. Для ранжирования обычных веб-страниц используются другие алгоритмы, хотя общие принципы оценки авторитетности источника могут пересекаться.

Что такое "Original Named Entities" и почему это важно?

Это одна из ключевых метрик для оценки оригинальности репортажа. Если источник публикует статью о событии и упоминает в ней именованные сущности (имена людей, названия организаций, места), которые не встречались в более ранних статьях других изданий на эту же тему, это считается индикатором того, что источник провел собственное расследование и добавил новую информацию. Это сильно повышает ценность источника в глазах системы.

Как рассчитывается "Breaking News Score"?

Система определяет время самой первой публикации о событии (начало кластера). Затем для каждой последующей статьи измеряется время задержки (T). Чем меньше T, тем выше оценка. Используется логарифмическая функция, например, log(N/T), где N — это порог, после которого новость не считается срочной (например, 3 часа). Также оценка может быть умножена на важность события (размер кластера).

Что важнее: скорость публикации или оригинальность контента?

Важны оба фактора, так как они являются отдельными метриками, формирующими Source Rank. Скорость (Breaking News Score) критична для срочных новостей, особенно для крупных событий. Оригинальность (Original Named Entities) критична для демонстрации журналистского качества и способности проводить расследования. Идеальная стратегия — быть быстрым и оригинальным.

Как Google определяет размер штата (Staff Size) новостного источника?

В патенте предлагается определять размер штата на основе количества уникальных имен журналистов, указанных в статьях источника (байлайнах) за определенный период. Это подчеркивает важность использования явных и последовательных байлайнов для всех авторов на сайте.

Влияет ли качество текста (грамматика, орфография) на ранжирование новостей?

Да, влияет. Патент включает метрику "Стиль письма" (Writing Style). Она рассчитывается с помощью автоматизированных тестов для измерения корректности орфографии, грамматики и уровня чтения. Высокое качество письма повышает Source Rank.

Учитывает ли система трафик сайта при оценке его качества?

Да, учитывается несколько метрик, связанных с трафиком. Во-первых, "Паттерны использования" (Usage Pattern) — это клики из новостного поиска на статьи источника. Во-вторых, "Статистика циркуляции" (Circulation Statistics) — это данные о трафике от внешних агентств или тираж печатной версии. В-третьих, "Международное разнообразие" — количество стран, откуда идет трафик.

Как этот патент связан с E-E-A-T?

Этот патент является ранней реализацией принципов E-E-A-T (Опыт, Экспертиза, Авторитетность, Надежность) применительно к новостному контенту. Метрики, описанные в патенте, направлены на алгоритмическое измерение Авторитетности (размер штата, награды, трафик), Надежности (стиль письма, оригинальность) и Экспертизы (широта охвата, важность освещения) новостной организации.

Может ли небольшой локальный сайт конкурировать с крупными федеральными изданиями?

Это сложно, так как многие метрики (размер штата, количество бюро, общий трафик, широта охвата) дают преимущество крупным изданиям. Однако небольшой сайт может конкурировать в своей нише за счет высокой скорости реакции на местные события (Breaking News Score) и предоставления уникальной локальной информации (Original Named Entities), недоступной крупным игрокам.

Что значит, что система может использовать только N лучших метрик?

Это механизм для обеспечения гибкости. Если для какого-то источника невозможно рассчитать все 13 метрик (например, нет данных о печатном тираже), или если источник силен только в нескольких аспектах, система может рассчитать Source Rank на основе, например, 5 самых сильных метрик этого источника. Это позволяет оценивать разнообразные типы новостных сайтов.

Похожие патенты

Как Google оценивает качество новостных источников, кластеризует статьи и ранжирует новости на основе свежести, оригинальности и авторитетности
Детальный разбор основополагающего патента Google News. Система оценивает источники по скорости реакции на события, оригинальности контента и авторитетности (ссылки, просмотры). Новостные сюжеты (кластеры) ранжируются по свежести и качеству источников. Статьи внутри сюжета сортируются с использованием «Модифицированной оценки свежести», которая дает значительное преимущество авторитетным изданиям.
  • US7568148B1
  • 2009-07-28
  • Свежесть контента

  • EEAT и качество

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google определяет оригинальность контента для расчета Авторского Ранга (Author Rank) и влияния на ранжирование
Google использует систему для идентификации оригинального контента и повышения авторитета его создателей. Система разбивает документы на фрагменты (content pieces) и отслеживает их первое появление. Авторы (включая домены) ранжируются на основе количества созданного ими оригинального контента и частоты его копирования другими. Ранг автора затем используется для повышения в выдаче документов этого автора, особенно свежих публикаций.
  • US8983970B1
  • 2015-03-17
  • EEAT и качество

  • Свежесть контента

  • SERP

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google ранжирует документы, используя качество источника, свежесть, оригинальность и кластеризацию контента
Google оценивает документы, анализируя авторитетность и экспертизу источника публикации, свежесть контента и его оригинальность. Документы группируются в кластеры по темам (например, новостные сюжеты). Оценка кластера (например, разнообразие и важность источников внутри него) также влияет на ранжирование отдельных документов.
  • US8090717B1
  • 2012-01-03
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Популярные патенты

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента
Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
  • US8412699B1
  • 2013-04-02
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
  • US20150169576A1
  • 2015-06-18
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче
Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.
  • US9424360B2
  • 2016-08-23
  • Local SEO

  • Поведенческие сигналы

Как Google использует машинное обучение для прогнозирования желаемого типа контента (Web, Images, News) и формирования смешанной выдачи (Universal Search)
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
  • US7584177B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)
Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.
  • US9558233B1
  • 2017-01-31
  • Ссылки

  • Поведенческие сигналы

  • Антиспам

seohardcore