SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные подписок на оповещения (Google Alerts) для определения трендовых тем и повышения их в ранжировании Новостей

GENERATION OF TOPICAL SUBJECTS FROM ALERT SEARCH TERMS (Генерация актуальных тем на основе поисковых терминов для оповещений)
  • US20140143657A1
  • Google LLC
  • 2014-01-24
  • 2014-05-22
  • Свежесть контента
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует, на какие темы пользователи массово подписываются в сервисах оповещений (например, Google Alerts) за определенный период времени. Эти трендовые темы (Topical Subjects) затем используются как сигнал для ранжирования: новостные статьи, соответствующие этим актуальным темам, могут получать повышение (boost) в поисковой выдаче, особенно в поиске по новостям.

Описание

Какую проблему решает

Патент решает задачу идентификации тем и событий, которые в настоящий момент вызывают повышенный интерес у сообщества пользователей («what's interesting»). Он описывает механизм определения трендов, основываясь на активных действиях пользователей по подписке на оповещения. Это позволяет улучшить актуальность поисковой выдачи, особенно в новостном поиске, путем интеграции сигналов текущего интереса в ранжирование.

Что запатентовано

Запатентована система (Topical Subject Generator), которая анализирует агрегированные данные о регистрациях пользователей на оповещения (например, Google Alerts). Система идентифицирует поисковые термины (Alert Search Terms), на которые пользователи массово подписывались в течение определенного периода времени (час, день, неделя). Термины, превысившие порог популярности, определяются как Актуальные Темы (Topical Subjects) и используются для модификации ранжирования в поисковой системе.

Как это работает

Система работает следующим образом:

  • Сбор данных: Система оповещений (Alert Engine) собирает данные о новых подписках пользователей за определенный временной интервал.
  • Агрегация и анализ: Topical Subject Generator агрегирует поисковые термины из этих подписок и подсчитывает частоту их использования. Схожие термины могут быть объединены (нормализованы).
  • Идентификация трендов: Термины, частота использования которых превышает заданный порог, идентифицируются как Topical Subjects.
  • Применение в ранжировании: Поисковая система (в патенте особо выделяется News Search Engine) использует этот список актуальных тем как сигнал ранжирования. Документы (например, новостные статьи), соответствующие этим темам, получают повышение (boost) в выдаче.
  • Предложение тем: Актуальные темы также могут предлагаться пользователям в интерфейсе для подписки.

Актуальность для SEO

Высокая (концептуально). Идентификация трендов и актуального контента (концепция QDF — Query Deserves Freshness) остается критически важной задачей для Google, особенно в Google News и Top Stories. Хотя данный патент является продолжением заявки 2005 года и современные системы Google, вероятно, используют более разнообразные источники данных (помимо Google Alerts), базовый принцип использования явного пользовательского интереса для модификации ранжирования остается фундаментальным.

Важность для SEO

Патент имеет значительное влияние, особенно для новостных издателей и сайтов, освещающих актуальные события (News SEO). Он описывает конкретный механизм, посредством которого текущий интерес к теме может повысить видимость контента. Это подчеркивает критическую важность оперативного реагирования на тренды и создания контента по темам, которые быстро набирают популярность.

Детальный разбор

Термины и определения

Alert Engine (Система оповещений)
Сервис (например, Google Alerts), который позволяет пользователям регистрироваться для получения уведомлений о новых документах, соответствующих заданным поисковым терминам.
Alert Search Terms (Поисковые термины оповещений)
Ключевые слова или фразы, которые пользователи вводят при регистрации оповещения для описания интересующей их темы.
Topical Subject Generator (Генератор актуальных тем)
Компонент системы, который анализирует агрегированные Alert Search Terms за определенный период для выявления популярных тем.
Topical Subject / Topical Alert (Актуальная тема / Актуальное оповещение)
Тема, которая достигла определенного уровня популярности, измеряемого частотой новых подписок на оповещения по этой теме за определенный период.
Predetermined Time Frame / Particular Period of Time (Предопределенный временной интервал)
Период времени (например, час, день, неделя, месяц), за который анализируются новые регистрации оповещений для выявления трендов.
Ranking Component (Компонент ранжирования)
Часть поисковой системы, отвечающая за сортировку результатов поиска. Согласно патенту, он использует Topical Subjects для корректировки ранжирования.
News Search Engine (Новостная поисковая система)
Специализированная поисковая система (например, Google News). В патенте указана как основной пример применения изобретения.

Ключевые утверждения (Анализ Claims)

Данный документ является продолжением (Continuation) более ранней заявки. Пункты 1-29 отменены. Анализ сфокусирован на обновленных пунктах формулы (начиная с Claim 30), которые описывают использование данных об оповещениях для влияния на ранжирование.

Claim 30 (Независимый пункт): Описывает метод определения трендовых тем и их использования в ранжировании.

  1. Система получает множество поисковых терминов от множества пользователей, когда они регистрируются для получения оповещений в течение определенного периода времени.
  2. Система идентифицирует те поисковые термины, которые были получены больше порогового количества раз (threshold number of times) за этот период.
  3. На основе этих частотных терминов система идентифицирует одну или несколько актуальных тем (topics / Topical Subjects).
  4. Система идентифицирует множество документов, соответствующих поисковому запросу, у которых есть первоначальное ранжирование.
  5. Система модифицирует ранжирование (modifying the ranking) по крайней мере одного документа из этого множества, если этот документ относится к идентифицированным актуальным темам.

Claim 31 (Зависимый от 30): Уточняет механизм модификации.

Модификация ранжирования включает в себя «повышение» (boosting) ранга документа, если он относится к актуальным темам. Это прямое указание на то, что трендовость является позитивным фактором ранжирования.

Claim 32 (Зависимый от 30): Уточняет область применения.

Система может являться новостной поисковой системой (news search engine), а обрабатываемые документы — новостными документами (news documents). Это подчеркивает основное применение изобретения в Google News.

Claim 38 (Независимый пункт): Описывает систему (System Claim), реализующую метод, аналогичный Claim 30.

Где и как применяется

Изобретение охватывает сбор поведенческих данных, их обработку для извлечения признаков и применение этих признаков на этапе ранжирования.

Сбор данных (Data Acquisition)
Система Alert Engine собирает данные о поведении пользователей — на что они подписываются. Это сбор данных о действиях пользователей в экосистеме Google, а не стандартный краулинг веба.

INDEXING – Индексирование и извлечение признаков (Feature Extraction)
Topical Subject Generator обрабатывает собранные данные (в офлайн или близком к реальному времени режиме). Он анализирует агрегированные подписки за определенный период и извлекает важный признак — список Topical Subjects. Этот список сохраняется и становится доступным для систем ранжирования.

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента. Ranking Component поисковой системы (особенно News Search Engine) использует список Topical Subjects во время ранжирования результатов по запросу пользователя. Если документ соответствует одной из актуальных тем, его оценка ранжирования модифицируется (повышается).

Входные данные:

  • Регистрации оповещений (Alert Search Terms, временные метки).
  • Период анализа (например, последние 24 часа).
  • (На этапе ранжирования) Поисковый запрос и список документов-кандидатов.

Выходные данные:

  • Список Topical Subjects.
  • Модифицированные (повышенные) оценки ранжирования для документов, соответствующих этим темам.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на новостной контент (news documents). Также может влиять на свежие веб-документы и обсуждения (Groups), так как в патенте упоминается, что пользователи могут выбирать эти типы при регистрации оповещений.
  • Специфические запросы: Запросы, связанные с текущими событиями, трендами и внезапными новостями (breaking news). Тесная связь с концепцией QDF (Query Deserves Freshness).
  • Конкретные ниши или тематики: Любые динамичные ниши, где происходят быстрые изменения и возникает повышенный интерес (политика, развлечения, спорт, технологии, финансы).

Когда применяется

  • Триггеры активации: Статус Topical Subject активируется, когда количество новых подписок на тему превышает определенный порог (threshold number of times) за заданный период.
  • Пороговые значения: Используются для фильтрации шума и выделения действительно значимых всплесков интереса.
  • Временные рамки: Анализ может проводиться периодически (ежечасно, ежедневно) для обновления списка актуальных тем. В патенте упоминаются интервалы в час, день, неделю, месяц.

Пошаговый алгоритм

Процесс А: Генерация актуальных тем (Topical Subject Generation)

  1. Сбор данных: Получение списка всех Alert Search Terms, зарегистрированных за предопределенный период времени (например, за последний день).
  2. Агрегация: Группировка уникальных поисковых терминов и подсчет количества регистраций для каждого.
  3. Нормализация (Опционально): Идентификация и объединение схожих поисковых терминов (например, с использованием техник сравнения строк, как в примере с «Rafik Hariri» и «Hariri» из патента) для консолидации данных о частоте.
  4. Фильтрация по порогу: Сравнение количества регистраций для каждого термина с предопределенным порогом популярности.
  5. Генерация списка: Формирование списка Topical Subjects из терминов, превысивших порог.

Процесс Б: Применение актуальных тем в ранжировании

  1. Получение запроса и кандидатов: Поисковая система получает запрос и формирует первоначальный список релевантных документов.
  2. Получение актуальных тем: Ranking Component получает текущий список Topical Subjects.
  3. Оценка релевантности темам: Система определяет, связаны ли документы-кандидаты с одной или несколькими Topical Subjects.
  4. Модификация ранжирования (Boosting): Для документов, связанных с актуальными темами, применяется повышение их оценки ранжирования.
  5. Финальная сортировка: Документы сортируются на основе модифицированных оценок и предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о поведении пользователей в системе оповещений.

  • Поведенческие факторы: Основной источник данных – это действия пользователей по регистрации оповещений. Система анализирует, какие именно Alert Search Terms вводят пользователи и как часто. Это сигнал активного интереса к теме.
  • Временные факторы: Временные метки регистрации оповещений критически важны. Анализ выполняется только на данных за недавний период времени, что позволяет выявлять именно актуальные тренды.

Какие метрики используются и как они считаются

  • Частота регистрации (Frequency Count / Number of Alerts): Основная метрика. Подсчитывается количество раз, когда уникальный поисковый термин был зарегистрирован пользователями за анализируемый период.
  • Пороговое значение популярности (Threshold value): Заданное значение частоты. Только термины, превысившие этот порог, считаются Topical Subjects.
  • Временной интервал (Predetermined time frame): Период, за который агрегируются данные (час, день, неделя, месяц).
  • Методы анализа текста: Для объединения схожих терминов используются техники сравнения строк (string comparison techniques).

Выводы

  1. Google Alerts как сенсор трендов: Патент демонстрирует, как Google использует данные из вспомогательных сервисов (Google Alerts) в качестве «сенсорной сети» для обнаружения возникающих трендов и всплесков интереса к темам или сущностям.
  2. Активный интерес как сигнал ранжирования: В отличие от анализа объема поисковых запросов (пассивный интерес), анализ подписок (активный интерес) используется как прямой сигнал для модификации ранжирования.
  3. Явное подтверждение бустинга: В патенте (Claim 31) прямо указано, что документы, связанные с выявленными Topical Subjects, получают повышение (boosting) в ранжировании.
  4. Приоритет для Новостного поиска (QDF): Механизм имеет особое значение для News Search Engine (Claim 32) и является одним из способов реализации концепции QDF (Query Deserves Freshness). Это позволяет системе быстро реагировать на события, повышая в выдаче свежий новостной контент.
  5. Нормализация запросов: Система учитывает вариативность формулировок и применяет методы для объединения схожих запросов (string comparison techniques), чтобы точнее измерять тренды.

Практика

Best practices (это мы делаем)

  • Мониторинг трендов и скорость реакции (News SEO): Для новостных сайтов критически важно быстро создавать качественный контент по возникающим новостным поводам. Если тема становится трендом (Topical Subject), релевантный контент получит дополнительный бустинг в ранжировании (особенно в Google News и Top Stories). Скорость публикации является ключевым фактором.
  • Фокус на Breaking News: Быстрая публикация новостей о внезапных событиях может дать значительное преимущество, так как именно такие события вызывают всплеск подписок на оповещения и быстро становятся Topical Subjects.
  • Оптимизация под сущности (Entities): Пользователи часто подписываются на оповещения по именам людей, названиям компаний или конкретным событиям. Убедитесь, что ваш контент четко связан с этими сущностями (через заголовки, текст, разметку), чтобы система могла установить связь между вашим документом и Topical Subject.
  • Обеспечение быстрой индексации: Техническая оптимизация для максимально быстрого попадания новостей в индекс (XML Sitemaps для новостей, Indexing API) гарантирует, что контент будет проиндексирован в момент максимальной актуальности темы.

Worst practices (это делать не надо)

  • Игнорирование актуальной повестки: Работа исключительно по плану "вечнозеленого" контента без учета текущих трендов приведет к упущению трафика по событийным запросам, где применяется бустинг актуальности.
  • Медленная публикация контента: Задержка в освещении актуальных событий означает, что пик интереса (и максимальный бустинг от системы) может быть пропущен, так как тема перестанет быть Topical Subject.
  • Попытки манипуляции системой оповещений: Искусственное создание большого количества подписок на оповещения с целью повлиять на ранжирование, скорее всего, будет неэффективным, учитывая способность Google выявлять неестественное поведение и спам.

Стратегическое значение

Патент подтверждает стратегическую важность актуальности и свежести контента (QDF) как фактора ранжирования, особенно в вертикалях, чувствительных к событиям. Он демонстрирует один из способов, которым Google может измерять эту актуальность, опираясь на явные действия пользователей. Для долгосрочной SEO-стратегии медиа-ресурсов это означает необходимость выстраивания процессов, позволяющих быстро и качественно освещать трендовые темы.

Практические примеры

Сценарий: Внезапная новость о слиянии компаний

  1. Событие: Объявлено о слиянии двух крупных технологических компаний (Компания А и Компания Б).
  2. Реакция пользователей: Журналисты и инвесторы массово начинают регистрировать оповещения в Google Alerts по терминам "Компания А слияние" и "Компания Б".
  3. Действие системы: Topical Subject Generator обнаруживает, что за последний час количество регистраций по этим терминам превысило порог. Эти термины помечаются как Topical Subjects.
  4. Влияние на поиск: News Search Engine использует Ranking Component, который видит список актуальных тем.
  5. Результат: Свежие новостные статьи, посвященные слиянию Компании А и Б, получают значительный бустинг и отображаются на более высоких позициях в новостной выдаче и блоках "Главные новости" (Top Stories), опережая менее актуальные материалы.

Вопросы и ответы

Как этот патент связан с алгоритмом QDF (Query Deserves Freshness)?

Этот патент описывает один из конкретных механизмов для реализации QDF. Алгоритм QDF направлен на выявление запросов, требующих свежих результатов. Используя частоту подписок в Google Alerts как индикатор всплеска интереса, система может определить, что по данной теме требуется свежий контент, и активировать повышение (boosting) для актуальных документов по этой теме.

Влияет ли этот механизм только на Google News?

Патент явно указывает на News Search Engine как на основной пример применения (Claim 32). Однако в описании упоминается, что пользователи могут выбирать тип оповещений: "News", "Web", "Groups". Это предполагает, что выявленные актуальные темы могут использоваться и в основном веб-поиске, хотя наибольший эффект наблюдается в новостной выдаче и блоках Top Stories.

Как SEO-специалист может оптимизировать сайт под этот алгоритм?

Прямая оптимизация невозможна, так как нельзя манипулировать подписками пользователей. Однако можно адаптировать контент-стратегию. Ключевым фактором является скорость реакции на тренды. Необходимо быстро публиковать качественный контент по актуальным темам. Если система признает тему актуальной (Topical Subject), ваш своевременно опубликованный материал получит преимущество в ранжировании.

Как система объединяет похожие запросы для оповещений?

Патент предусматривает этот шаг (Act 606). Упоминается возможность комбинирования схожих терминов, например, "Rafik Hariri" и "Hariri" (пример из патента), используя стандартные техники сравнения строк (string comparison techniques). Это позволяет более точно оценить общий интерес к сущности или событию, даже если пользователи используют разные формулировки.

Насколько быстро система определяет тренды?

Это зависит от установленного временного интервала анализа (Predetermined Time Frame). В патенте упоминаются интервалы в час, день, неделю или месяц. Для оперативного реагирования на внезапные новости (Breaking News), вероятно, используются короткие интервалы (час или несколько часов).

Что происходит, когда тема перестает быть актуальной?

Механизм основан на анализе данных за недавний период времени. Если пользователи перестают массово подписываться на оповещения по теме, частота новых регистраций падает ниже порога. При следующем обновлении списка Topical Subject Generator исключит эту тему из списка актуальных, и бустинг в ранжировании для нее прекратится.

Использует ли Google только Google Alerts для определения трендов?

Патент описывает механизм на основе Alert Engine. Однако Google использует множество других сигналов для определения трендов, таких как всплески поисковых запросов (Google Trends) и частота публикаций в новостных источниках. Данные из Google Alerts являются одним из ценных источников, описывающих активный интерес пользователей.

Насколько сильным является повышение (boost) для актуальных тем?

Патент не указывает конкретных числовых значений или формул для расчета бустинга. Указано лишь, что документы могут получить повышение в их значениях ранжирования (Claim 31). Сила бустинга, вероятно, зависит от степени популярности темы (насколько превышен порог) и других факторов ранжирования.

Может ли этот механизм помочь небольшим сайтам конкурировать с крупными новостными порталами?

Да, потенциально может. Если небольшой сайт первым опубликует качественный материал по возникающему тренду, который система идентифицировала как Topical Subject, он может получить значительный бустинг. В контексте новостного поиска скорость и релевантность тренду могут временно перевесить общую авторитетность домена.

Актуален ли этот патент, учитывая дату подачи первой заявки (2005 год)?

Хотя оригинальная идея была подана в 2005 году, публикация 2014 года является её продолжением с обновленной формулой изобретения (Claims 30+), которая явно связывает определение трендов с модификацией ранжирования. Фундаментальная идея использования данных о подписках для определения актуальности остается крайне релевантной для современных поисковых систем.

Похожие патенты

Как Google использует сигналы вовлеченности пользователей для ранжирования контента в системах без поискового запроса (например, Google Discover)
Патент описывает механизм генерации рекомендаций контента на основе того, что пользователь просматривает в данный момент, без ввода поискового запроса. Система анализирует текущий контент, находит связанные ресурсы и ранжирует их, основываясь преимущественно на метриках вовлеченности пользователей (трендовость, частота просмотров, совместные просмотры), а не только на текстовой релевантности.
  • US10152521B2
  • 2018-12-11
  • Поведенческие сигналы

  • Персонализация

Как Google позволяет пользователям настраивать ранжирование и отбор источников в агрегаторе новостей (Google News)
Патент Google, описывающий механизм персонализации новостного агрегатора (Google News). Система позволяет пользователям создавать постоянные новостные разделы на основе запросов и настраивать правила ранжирования внутри них: выбирать предпочтительные источники, блокировать нежелательные, повышать статьи по ключевым словам или авторам, а также управлять сортировкой по свежести или важности.
  • US8676837B2
  • 2014-03-18
  • Персонализация

  • Свежесть контента

Как Google использует агрегированные поведенческие данные для маркировки результатов поиска и подсказок индикаторами ожидаемых действий
Google анализирует агрегированные данные о том, что пользователи делают после клика по результату поиска или подсказке (например, покупка, сохранение, бронирование). Если определенное действие статистически значимо для конкретного результата, Google добавляет к нему визуальный индикатор (значок или бейдж), чтобы помочь другим пользователям понять вероятный исход клика.
  • US11132406B2
  • 2021-09-28
  • Поведенческие сигналы

  • SERP

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует сохраненные пользователями результаты (закладки в поиске) для оценки качества, персонализации и повышения рейтинга похожих документов
Google анализирует, какие результаты поиска пользователи явно сохраняют (добавляют в закладки). Эти действия интерпретируются как сильные сигналы качества и используются для повышения рейтинга популярных результатов. Ключевой механизм патента — персонализация выдачи путем повышения рейтинга документов, которые похожи (по структуре, ссылкам и контенту) на те, что пользователь сохранял ранее.
  • US8423541B1
  • 2013-04-16
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google в Autocomplete динамически выбирает между показом общих категорий и конкретных подсказок в зависимости от «завершенности запроса»
Google анализирует «меру завершенности запроса» (Measure of Query Completeness) по мере ввода текста пользователем. Если намерение неясно и существует много вариантов продолжения (низкая завершенность, высокая энтропия), система предлагает общие категории (например, «Регионы», «Бизнесы»). Если намерение становится ясным (высокая завершенность, низкая энтропия), система переключается на конкретные подсказки или сущности.
  • US9275147B2
  • 2016-03-01
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph
Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).
  • US9208229B2
  • 2015-12-08
  • Knowledge Graph

  • Ссылки

  • EEAT и качество

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса
Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.
  • US9454621B2
  • 2016-09-27
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

seohardcore