SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News

IDENTIFICATION AND RANKING OF NEWS STORIES OF INTEREST (Идентификация и ранжирование новостных сюжетов, представляющих интерес)
  • US8375073B1
  • Google LLC
  • 2007-11-12
  • 2013-02-12
  • EEAT и качество
  • SERP
  • Ссылки
  • Свежесть контента
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.

Описание

Какую проблему решает

Патент решает проблему определения относительной важности и актуальности новостных сюжетов в реальном времени. Вместо того чтобы полагаться исключительно на традиционные сигналы (время публикации, авторитетность источника), система использует редакционные решения самих издателей как прямой сигнал ранжирования. Цель — использовать «знания, воплощенные в редакционном принятии решений» (knowledge embodied in the editorial decision-making) для определения важности новостей и более быстрого вывода в топ актуальных сюжетов.

Что запатентовано

Запатентована система ранжирования новостных статей, которая рассчитывает оценку важности статьи на основе ее Prominence (визуальной заметности) на одной или нескольких Hub Pages (главных страницах или страницах разделов новостных сайтов). Система анализирует визуальное расположение (relative presentation position) и оформление гиперссылки на статью, чтобы определить, насколько важной ее считает редактор Hub Page.

Как это работает

Ключевой механизм заключается в анализе рендеринга Hub Pages:

  • Идентификация Hub Pages: Система определяет страницы, содержащие пороговое количество ссылок на новости (например, главная страница CNN).
  • Анализ рендеринга: Система анализирует HTML, DOM и CSS Hub Page, чтобы понять визуальную структуру отрендеренной страницы.
  • Определение Prominence: Оценивается заметность каждой ссылки. Учитывается ее позиция (вертикальная и горизонтальная), размер шрифта, форматирование, наличие и размер сниппета или изображения.
  • Расчет Reference Position Score: Ссылкам присваивается оценка на основе их порядка. Чем выше и заметнее ссылка, тем выше оценка.
  • Ранжирование и Группировка: Эти оценки используются для расчета общего скора статьи (Article Score). Статьи группируются по сюжетам, и группы также ранжируются (Group Score).

Актуальность для SEO

Высокая. Принципы, изложенные в этом патенте, являются фундаментальными для работы агрегаторов новостей, таких как Google News и блока Top Stories. Использование сигналов от издателей для определения важности контента остается ключевым механизмом оценки актуальных новостей, хотя конкретные технические методы анализа страниц (рендеринг, интерпретация DOM/CSS) могли эволюционировать с момента подачи патента.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO новостных сайтов и издателей. Он напрямую связывает дизайн, UX и верстку главных страниц и страниц рубрик с ранжированием контента в Google News и Top Stories. Если важная новость размещена на сайте незаметно (внизу, мелким шрифтом, без картинки), этот механизм присвоит ей низкий Prominence Score, что негативно скажется на ее видимости в поиске.

Детальный разбор

Термины и определения

Hub Page (Хаб-страница, Страница-агрегатор)
Веб-страница, содержащая множество ссылок на новостные статьи (превышающее определенный порог), которые не обязательно отсортированы по времени. Примеры: главная страница новостного сайта или страница тематического раздела (например, "Спорт").
Prominence (Заметность, Значимость)
Мера важности новостной статьи с точки зрения редактора Hub Page. Определяется на основе позиции и оформления ссылки на Хаб-странице.
Relative Presentation Position (Относительная позиция представления)
Визуальное местоположение ссылки на Hub Page относительно местоположений других ссылок на той же странице после рендеринга.
Prominence Score (Оценка заметности)
Метрика, определяющая визуальную важность ссылки. Включает Reference Position Score и другие факторы оформления (шрифт, сниппет, изображение).
Reference Position Score (Оценка позиции ссылки)
Компонент Prominence Score, основанный исключительно на физическом расположении ссылки (Relative Presentation Position) на отрендеренной странице.
News Article Score (Оценка статьи)
Общая оценка ранжирования новостной статьи, включающая Prominence Score и другие факторы (свежесть, качество источника, новизна контента (novelty)).
News Article Group (Группа новостных статей / Новостной сюжет)
Кластер новостных статей от разных издателей, посвященных одному и тому же событию или сюжету.
Group Score (Оценка группы)
Оценка ранжирования News Article Group, рассчитываемая на основе Article Scores входящих в нее статей.
DOM (Document Object Model) и CSS (Cascading Style Sheets)
Технологии, которые анализируются системой для понимания структуры и визуального представления (рендеринга) Hub Page.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод ранжирования новостей.

  1. Идентификация множества Hub Pages (каждая должна иметь как минимум пороговое количество гиперссылок на новости).
  2. Определение для каждой гиперссылки Reference Position Score. Эта оценка основана на Relative Presentation Position (визуальном местоположении) ссылки относительно других ссылок на той же странице.
  3. Вычисление News Article Scores для статей, на которые ведут ссылки, используя полученные Reference Position Scores.
  4. Предоставление данных, представляющих эти оценки.

Claim 3 (Зависимый от 2 и 1): Детализирует технический метод определения позиции.

Определение заметности (prominence) позиции отображения основано на анализе одного или нескольких из следующих источников: HTML-код, DOM или CSS (style sheet) Hub Page. Это подтверждает, что система анализирует страницу после рендеринга.

Claim 4 и 5 (Зависимые): Описывают группировку и ранжирование сюжетов.

Статьи группируются в News Article Groups. Определяется Group Score на основе News Article Scores статей в группе. Группы предоставляются в ответ на запрос, упорядоченные на основе их Group Scores.

Claim 6 и 7 (Зависимые): Описывают ранжирование внутри тематических категорий.

Reference Position Score может определяться на основе позиции ссылки относительно других ссылок, принадлежащих к той же тематической категории на Hub Page (например, ранжирование внутри блока "Бизнес").

Claim 9 (Зависимый): Уточняет учет порядка чтения.

Оценка основана на позиции и на "соглашении о порядке заметности гиперссылок" (hyperlink prominence ordering convention), используемом на странице (например, слева направо или справа налево в зависимости от языка).

Claim 10 (Зависимый от 1): Расширяет факторы, влияющие на оценку статьи.

News Article Score вычисляется с использованием не только позиции, но и одного или нескольких факторов: количества текста, представленного со ссылкой (сниппет), размеров шрифтов текста ссылки, форматирования текста ссылки или наличия изображения, связанного со ссылкой.

Где и как применяется

Изобретение применяется на нескольких этапах обработки новостного контента (Google News, Top Stories).

CRAWLING – Сканирование и Сбор данных
Система должна идентифицировать потенциальные Hub Pages (используя Sources repository) и часто их сканировать. Также проверяется актуальность (freshness) Хаб-страниц, игнорируя устаревшие (stale) страницы.

INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. При обработке Hub Page система выполняет:

  1. Рендеринг и Анализ структуры: Анализ HTML, DOM и CSS для определения визуального макета страницы (rendered layout).
  2. Извлечение признаков Prominence: Определение точных позиций ссылок (Relative Presentation Position), размера шрифтов, наличия изображений, сниппетов.
  3. Расчет оценок: Вычисление Reference Position Score и Prominence Score для каждой ссылки.
  4. Группировка: Кластеризация статей в News Article Groups (например, с использованием TF-IDF и косинусного сходства, как описано в патенте).

RANKING – Ранжирование
Рассчитанные Article Scores (включающие Prominence Score) и Group Scores используются для ранжирования новостного контента в специализированных индексах.

Входные данные:

  • Список идентифицированных Hub Pages.
  • HTML, DOM, CSS сканированных Hub Pages.
  • Текст новостных статей (для группировки).
  • Язык Hub Page (для определения порядка чтения).

Выходные данные:

  • Prominence Scores и Reference Position Scores для новостных статей.
  • Сгруппированные новостные сюжеты (News Article Groups) и их Group Scores.

На что влияет

  • Конкретные типы контента: Влияет исключительно на новостной контент (News Articles).
  • Специфические запросы: Влияет на запросы, связанные с актуальными событиями, где активируются Google News и блок Top Stories.
  • Конкретные ниши: Критическое влияние на все новостные вертикали (Политика, Спорт, Бизнес, YMYL и т.д.).
  • Языковые и географические ограничения: Применяется глобально, но учитывает языковые особенности макета (например, чтение справа налево или слева направо).

Когда применяется

  • Условия работы: Алгоритм применяется постоянно в процессе обработки новостного контента.
  • Триггеры активации: Обнаружение ссылки на новостную статью на странице, классифицированной как Hub Page.
  • Временные рамки и частота применения: Критически важна частота обновления. Патент упоминает фильтрацию "устаревших" (stale) Hub Pages, которые не обновлялись в течение определенного периода (например, несколько часов).

Пошаговый алгоритм

Этап 1: Подготовка и Сканирование

  1. Идентификация Hub Pages: Определение набора Hub Pages (вручную или автоматически).
  2. Сканирование и Валидация: Регулярное сканирование Hub Pages. Проверка на устаревание (если контент не изменился, страница может быть проигнорирована). Идентификация ссылок, ведущих на новостные статьи.

Этап 2: Анализ Заметности (Prominence Analysis)

  1. Рендеринг и Парсинг: Анализ HTML, DOM и CSS для определения визуального макета.
  2. Определение Порядка Ссылок: Упорядочивание ссылок на основе их визуальной позиции (Relative Presentation Position), учитывая правила макета и языка (например, сверху вниз, слева направо). Включает анализ DOM-дерева для корректной интерпретации сложных макетов.
  3. Извлечение Визуальных Факторов: Определение дополнительных факторов заметности: размер шрифта, форматирование, наличие и размер сниппета, наличие изображения.
  4. Определение Тематических Блоков: Идентификация рубрик на странице для расчета относительной заметности внутри категории (если применимо).

Этап 3: Расчет Оценок и Ранжирование

  1. Расчет Reference Position Score: Присвоение оценки на основе порядка. Патент предлагает формулу: Score=C1/power(reference_order,C2)Score = C1 / power(reference\_order, C2)Score=C1/power(reference_order,C2), где C1 и C2 – константы (например, 10 и 0.5), а reference_order – порядковый номер ссылки.
  2. Расчет Prominence Score: Комбинирование Reference Position Score с оценками визуальных факторов.
  3. Расчет Article Score: Агрегация Prominence Scores (если на статью ссылаются несколько Hub Pages) и комбинация с другими факторами ранжирования (качество источника, свежесть и т.д.).

Этап 4: Группировка

  1. Кластеризация: Группировка статей в News Article Groups на основе схожести контента.
  2. Расчет Group Score: Вычисление оценки группы на основе Article Scores входящих в нее статей (например, среднее, медиана или масштабированная сумма).

Какие данные и как использует

Данные на входе

Система использует преимущественно структурные и технические данные, связанные с представлением контента на Hub Pages.

  • Технические факторы: HTML-код, структура DOM, CSS. Эти данные используются для определения того, как страница будет выглядеть при рендеринге.
  • Структурные факторы: Относительное расположение элементов (вертикальное и горизонтальное позиционирование), иерархия элементов в DOM-дереве. Использование тегов (DIV, P, TR) для валидации новостных статей.
  • Контентные факторы (в контексте ссылки): Текст ссылки (анкор), наличие и длина сниппета или синопсиса новости рядом со ссылкой.
  • Мультимедиа факторы: Наличие изображения, связанного со ссылкой на новость.
  • Визуальные факторы (Presentation): Размер шрифта текста ссылки или заголовка, форматирование текста (например, жирный шрифт, курсив).
  • Временные факторы: Время обновления Hub Page (для фильтрации устаревших страниц); свежесть самой статьи.
  • Географические/Языковые факторы: Язык Hub Page для определения порядка чтения (слева направо или справа налево).

Какие метрики используются и как они считаются

  • Reference Position Score: Основная метрика, основанная на порядке отображения ссылки. Рассчитывается по формуле, которая обеспечивает нелинейное убывание оценки. Пример формулы из патента: C1/power(reference_order,C2)C1 / power(reference\_order, C2)C1/power(reference_order,C2).
  • Prominence Score: Агрегированная метрика заметности. Комбинирует Reference Position Score с оценками, полученными на основе визуальных факторов.
  • Article Score (S): Общая оценка статьи. Рассчитывается как линейная комбинация Prominence Score и других сигналов. Пример формулы из патента: S=αA+βB+δC+.

    Выводы

    1. Редакционное размещение как прямой сигнал ранжирования: Патент подтверждает, что Google использует визуальное размещение контента на авторитетных новостных сайтах как прямой сигнал ранжирования. Система полагается на то, что редакторы СМИ размещают наиболее важные новости на самых заметных позициях.
    2. Анализ рендеринга, а не только HTML: Для определения Prominence система анализирует отрендеренную страницу (используя DOM и CSS), а не просто парсит HTML сверху вниз. Это позволяет учитывать сложные макеты и визуальное оформление.
    3. Многофакторная оценка заметности: Prominence Score включает не только позицию (Reference Position Score), но и размер шрифта, наличие изображений, сниппетов и форматирование. Визуальное выделение ссылки имеет значение.
    4. Нелинейное затухание важности: Используемая формула расчета (C1

      Практика

      Best practices (это мы делаем)

      Рекомендации критичны для издателей, стремящихся к видимости в Google News и Top Stories.

      • Оптимизация дизайна Hub Pages (Главная страница и Рубрики): Размещайте самые важные и актуальные новости на наиболее заметных позициях — вверху страницы, ближе к центру. Дизайн должен четко отражать редакционные приоритеты.
      • Использование визуальных усилителей Prominence: Для ключевых новостей используйте более крупный шрифт заголовка, выделяющееся форматирование, качественные и заметные изображения, а также информативные сниппеты. Это напрямую увеличивает Prominence Score (Claim 10).
      • Обеспечение чистой и семантичной структуры DOM: Используйте чистую верстку и логичную иерархию элементов. Это поможет поисковой системе корректно проанализировать DOM-дерево и правильно определить порядок и важность новостных блоков.
      • Регулярное и частое обновление Hub Pages: Главная страница и страницы рубрик должны постоянно обновляться актуальным контентом, чтобы система не считала их "устаревшими" (stale) и учитывала их при расчете оценок.
      • Четкое выделение тематических блоков: Если на странице есть рубрики (например, "Спорт", "Политика"), они должны быть четко структурированы. Это позволяет Google рассчитывать Prominence как в целом по странице, так и внутри конкретной категории (Claim 6).

      Worst practices (это делать не надо)

      • Размещение важных новостей на слабых позициях: Публикация ключевых статей внизу страницы, в боковых колонках или в малозаметных блоках приведет к низкому Reference Position Score.
      • Одинаковое оформление всех новостей: Если все ссылки на новости имеют одинаковый размер шрифта, одинаковый формат и отсутствуют изображения, система будет полагаться только на позицию, и издатель теряет возможность дополнительно повлиять на Prominence Score через дизайн.
      • Перегруженная или запутанная верстка: Использование сложных макетов или невалидной структуры DOM, которая затрудняет рендеринг и анализ визуального расположения элементов, может привести к ошибкам интерпретации.
      • Редкие обновления главной страницы: Если главная страница обновляется редко, Google может классифицировать её как "stale" и перестать учитывать её сигналы значимости.

      Стратегическое значение

      Этот патент подчеркивает, что для новостного SEO дизайн и пользовательский опыт (UX) являются прямыми факторами ранжирования. Google фактически делегирует часть оценки важности контента самим редакторам авторитетных изданий. Стратегия должна включать тесное взаимодействие SEO-специалистов, редакторов и разработчиков для оптимизации Hub Pages. Визуальное представление контента на собственном сайте напрямую влияет на то, как Google оценит его важность для глобальной новостной повестки.

      Практические примеры

      Сценарий: Оптимизация главной страницы новостного сайта для повышения видимости ключевой статьи

      1. Ситуация: Опубликована важная эксклюзивная новость, но она размещена в стандартном блоке в середине главной страницы.
      2. Анализ (на основе патента): Текущее размещение дает низкий Reference Position Score. Стандартное оформление дает низкий общий Prominence Score.
      3. Действия по оптимизации:
        • Переместить ссылку на новость в главный верхний блок ("Главная новость").
        • Увеличить размер шрифта заголовка по сравнению со стандартными новостями.
        • Добавить крупное, релевантное изображение к ссылке.
        • Добавить расширенный сниппет (2-3 предложения).
      4. Ожидаемый результат: При следующем сканировании Hub Page система зафиксирует высокое расположение (Reference Order = 1) и наличие визуальных усилителей. Prominence Score статьи значительно возрастет, что повысит ее шансы на попадание в топ Google News и блок Top Stories.

      Вопросы и ответы

      Что такое Hub Page в контексте этого патента?

      Hub Page — это страница на новостном сайте, содержащая большое количество ссылок на отдельные новостные статьи. Классические примеры — это главная страница сайта (например, nytimes.com) или страница раздела (например, bbc.com/sports). Система использует эти страницы как источник данных о том, какие новости считаются важными в данный момент с точки зрения редакции.

      Как именно Google измеряет визуальную заметность (Prominence)?

      Prominence измеряется путем анализа отрендеренной страницы (DOM и CSS). Основной фактор — это позиция ссылки (Reference Position Score): чем выше и центральнее ссылка, тем выше оценка. Дополнительные факторы включают размер шрифта заголовка, наличие и размер изображения, наличие сниппета и форматирование текста (например, жирный шрифт).

      Имеет ли значение разница в оценке между первой и второй новостью на главной странице?

      Да, имеет критическое значение. Патент предлагает формулу расчета оценки с нелинейным затуханием (например, C1/power(order,C2)C1 / power(order, C2)C1/power(order,C2)). Это означает, что первая позиция получает значительно более высокую оценку, чем вторая, и так далее. Разница между верхними позициями очень велика.

      Как этот патент влияет на ранжирование в Google News и Top Stories?

      Он описывает один из фундаментальных механизмов ранжирования для этих сервисов. Prominence Score, полученный с Hub Pages, напрямую влияет на то, какие статьи и новостные сюжеты (News Article Groups) будут показаны на верхних позициях. Это позволяет Google быстро реагировать на важные события, опираясь на мнение редакций СМИ.

      Что делать, если у моего сайта сложный дизайн (например, сетка или колонки)?

      Патент учитывает сложные макеты. Система анализирует DOM и CSS, чтобы понять визуальную структуру, включая горизонтальное расположение и блочную верстку. Обычно используется порядок сверху вниз, а затем слева направо (или наоборот, в зависимости от языка). Важно, чтобы дизайн четко выделял приоритетные новости визуально, и чтобы структура DOM была чистой и понятной для анализа.

      Как оптимизировать структуру DOM для этого алгоритма?

      Необходимо использовать чистую, семантичную верстку. Основные новостные блоки должны быть логично структурированы. Патент описывает анализ DOM-дерева для избежания ошибок, например, чтобы связанные статьи внутри одного блока не интерпретировались как отдельные важные новости. Валидный код и логичная иерархия элементов помогут системе корректно определить Reference Position Score.

      Что произойдет, если моя главная страница редко обновляется?

      Патент предусматривает механизм фильтрации «устаревших» (stale) Hub Pages. Если система при регулярном сканировании обнаруживает, что контент главной страницы не менялся в течение определенного времени (например, нескольких часов), эта страница может быть временно исключена из процесса оценки, что негативно скажется на ранжировании ваших статей.

      Применяется ли этот механизм только к главной странице сайта?

      Нет. Механизм применяется к любым страницам, которые система идентифицирует как Hub Pages. Это могут быть главные страницы, а также страницы ключевых рубрик (например, /sports, /business). Важно оптимизировать заметность статей на всех этих страницах.

      Влияет ли скорость загрузки главной страницы на этот механизм?

      Патент напрямую не упоминает скорость загрузки. Однако, если страница загружается слишком медленно или система не может её полностью отрендерить из-за таймаутов или ошибок ресурсов (CSS/JS), она не сможет корректно рассчитать Prominence Score. Поэтому быстрая и стабильная работа главной страницы косвенно необходима для работы этого механизма.

      Влияет ли этот патент на сайты, которые не являются новостными?

      Прямого влияния нет, так как патент сфокусирован на идентификации и ранжировании новостных статей (News Articles) и использовании новостных Hub Pages. Однако он дает общее понимание того, как Google может использовать анализ визуального представления (рендеринга) страницы для определения важности контента.

      Похожие патенты

      Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
      Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
      • US8775436B1
      • 2014-07-08
      • Мультимедиа

      • Семантика и интент

      • SERP

      Как Google оценивает качество новостных источников, кластеризует статьи и ранжирует новости на основе свежести, оригинальности и авторитетности
      Детальный разбор основополагающего патента Google News. Система оценивает источники по скорости реакции на события, оригинальности контента и авторитетности (ссылки, просмотры). Новостные сюжеты (кластеры) ранжируются по свежести и качеству источников. Статьи внутри сюжета сортируются с использованием «Модифицированной оценки свежести», которая дает значительное преимущество авторитетным изданиям.
      • US7568148B1
      • 2009-07-28
      • Свежесть контента

      • EEAT и качество

      Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
      Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
      • US9053177B1
      • 2015-06-09
      • SERP

      • Ссылки

      • Структура сайта

      Как Google выбирает главное (репрезентативное) изображение страницы для показа в результатах поиска
      Google использует систему для автоматического выбора наилучшего изображения, представляющего содержание статьи или веб-страницы. Система анализирует все изображения на странице, оценивая их характеристики (размер, формат, расположение, контекст) и присваивая им оценку (Image Data Score). Цель – отличить содержательные фотографии от элементов дизайна или иконок. Изображение с наивысшей оценкой выбирается в качестве репрезентативного для показа в SERP, Новостях или Discover.
      • US7580568B1
      • 2009-08-25
      • Мультимедиа

      • SERP

      Как Google сегментирует веб-страницы на семантические блоки (хедер, футер, контент) с помощью анализа геометрии рендеринга
      Google использует механизм "псевдо-рендеринга" для анализа геометрической структуры веб-страницы и её разделения на семантически различные области (чанки), такие как основное содержимое, навигация, футер и реклама. Это позволяет системе определять важность контента и ссылок в зависимости от их расположения на странице.
      • US7913163B1
      • 2011-03-22
      • Семантика и интент

      • Структура сайта

      • Техническое SEO

      Популярные патенты

      Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
      Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
      • US10303684B1
      • 2019-05-28
      • Поведенческие сигналы

      • Семантика и интент

      • SERP

      Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
      Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
      • US8656266B2
      • 2014-02-18
      • Ссылки

      • EEAT и качество

      • Свежесть контента

      Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
      Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
      • US8131754B1
      • 2012-03-06
      • Поведенческие сигналы

      • Персонализация

      • Семантика и интент

      Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
      Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
      • US10318543B1
      • 2019-06-11
      • Ссылки

      • Индексация

      • Мультимедиа

      Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
      Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
      • US9235653B2
      • 2016-01-12
      • Knowledge Graph

      • Свежесть контента

      • Семантика и интент

      Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
      Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
      • US20210125108A1
      • 2021-04-29
      • Поведенческие сигналы

      • SERP

      Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
      Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
      • US8478773B1
      • 2013-07-02
      • Семантика и интент

      • Персонализация

      • Поведенческие сигналы

      Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
      Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
      • US9223897B1
      • 2015-12-29
      • Поведенческие сигналы

      • Индексация

      • Техническое SEO

      Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
      Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
      • US9465871B1
      • 2016-10-11
      • Антиспам

      • SERP

      • Ссылки

      Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
      Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
      • US9208231B1
      • 2015-12-08
      • Мультиязычность

      • Поведенческие сигналы

      • SERP

      seohardcore