
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
Патент решает проблему определения истинной релевантности новостных документов конкретным объектам (сущностям, событиям, темам). Существующие поисковые системы часто возвращают результаты, которые лишь вскользь упоминают объект, но не посвящены ему. Например, статья о несчастном случае с участием человека, больного раком, может быть показана по запросу "рак", хотя основная тема статьи — несчастный случай, а не болезнь. Изобретение направлено на фильтрацию таких нерелевантных или второстепенных упоминаний для предоставления пользователю точной сводки новостей об интересующем его объекте.
Запатентована система и метод для измерения релевантности между кластерами новостных статей (News Collections) и объектами (Objects), которые в них упоминаются. Система использует многофакторную модель оценки релевантности, которая учитывает общую важность новостного кластера, уровень внешнего интереса к объекту и значимость объекта внутри этого кластера. Цель — идентифицировать новостные коллекции, которые действительно посвящены объекту, и использовать их для генерации хронологических сводок (Chronological Summary).
Система агрегирует новости и группирует их в коллекции по темам. Затем для каждой коллекции и упомянутых в ней объектов рассчитывается оценка релевантности, основанная на трех ключевых компонентах:
Pertinence of Events), связанных с объектом.На основе итоговой оценки релевантности система выбирает наиболее подходящие коллекции для генерации новостной сводки по запросу об объекте.
Высокая. Понимание сущностей (Entity Understanding) и генерация точных сводок по событиям (например, в Новостях Google или в Хронологиях в Knowledge Panels) являются ключевыми направлениями развития поиска. Описанные механизмы, особенно фильтрация по уместности событий и учет внешних сигналов интереса, критически важны для борьбы с кликбейтом и предоставления качественной информации о сущностях.
Патент имеет высокое значение (8/10), особенно для новостных сайтов (News SEO) и стратегий, ориентированных на сущности (Entity SEO). Он раскрывает конкретные механизмы, которые Google может использовать для определения того, является ли статья релевантной для определенной сущности или события. Понимание критериев "Значимости" (Significance) и "Уместности событий" (Pertinence of Events) позволяет оптимизировать контент так, чтобы он был правильно классифицирован как центральный для объекта, что критично для попадания в агрегаторы новостей и блоки, связанные с сущностями.
Claim 1 (Независимый пункт): Описывает основной метод определения релевантности новостной коллекции к объекту.
News Collections.Objects (объекты), описанные в этих коллекциях.Pertinence of Events), связанных с объектом.Claim 3 (Зависимый от 1): Детализирует механизм оценки уместности событий (Pertinence of Events).
Система обрабатывает коллекции для поиска событий, в которых участвуют объекты. Измерение релевантности включает определение того, являются ли эти события уместными (pertinent) на основе типа объекта (Object-type).
Claim 4 (Зависимый от 3): Дополнительно детализирует механизм оценки уместности.
Object-type).Claim 7 (Зависимый от 1): Расширяет факторы для расчета компонентов релевантности.
Overall Relevance также включает определение уровня пользовательского интереса к коллекции.Level of Interest также включает определение трендов для объекта в социальных сетях.Изобретение затрагивает несколько этапов поисковой архитектуры, преимущественно в контексте обработки новостного контента и информации о сущностях.
CRAWLING – Сканирование и Сбор данных
На этом этапе происходит агрегация новостных документов из различных источников (publishing engines).
INDEXING – Индексирование и извлечение признаков
Основная часть предварительной обработки:
News Collections на основе схожести контента.Objects) в коллекциях.Centrality объекта в тексте.Object-type).RANKING – Ранжирование (Офлайн или Nearline обработка)
Расчет сложных метрик релевантности происходит здесь, так как он требует анализа внешних данных и агрегации метрик:
Level of Interest) и пользовательском взаимодействии с коллекциями (для Overall Relevance).Pertinence of Events путем сравнения событий в коллекции со списками уместных событий для данного Object-type.Overall Relevance, Level of Interest и Significance для каждой пары (Объект, Коллекция). Результаты сохраняются (Relevance Data).QUNDERSTANDING / RANKING / METASEARCH (Real-time)
Применение результатов при запросе пользователя:
News Collections.News Summary Generator формирует хронологическую сводку или предлагает релевантные поисковые подсказки (Suggestive Search Module).Процесс А: Расчет релевантности (Офлайн/Nearline)
News Collections.Overall Relevance): Level of Interest) (для заданного периода): Significance): Centrality объекта в документах (упоминание в начале, частота в тексте).Pertinence of Events): Object-type).Overall Relevance, Level of Interest и Significance.Процесс Б: Генерация сводки (Real-time)
News Collections, связанных с Объектом, на основе предварительно рассчитанных оценок релевантности.Система использует широкий спектр данных, включая контентные, поведенческие и внешние сигналы.
Centrality, идентификации событий и определения Object-type).News Collections.Level of Interest.Object-types).Ключевая метрика патента — Relevance Score для пары (Объект, Коллекция). Она агрегирует три компонента:
Centrality объекта в тексте; Оценка Pertinence of Events).Оценка Pertinence of Events: Бинарная или числовая оценка, основанная на сравнении событий в коллекции с предопределенным списком уместных событий для данного Object-type.
Object-types) и предопределенные списки важных событий для этих типов, чтобы отфильтровать новости, где сущность не является главным героем. Новость должна сообщать о событии, которое "уместно" для данного типа сущности.Level of Interest). Это подчеркивает важность мониторинга трендов и создания контента, соответствующего текущему интересу аудитории.Overall Relevance учитывает количество источников, освещающих событие. Это говорит о том, что широкое освещение события разными источниками повышает его значимость в глазах системы.Centrality.Pertinent).Level of Interest.Significance напрямую зависит от частоты упоминания объекта в заголовках внутри новостной коллекции.News Collections, тем выше вероятность, что система будет считать ваш контент значимым для этих объектов.Centrality и Pertinence of Events предназначены для фильтрации такого контента.Centrality.Level of Interest в итоговую оценку релевантности.Патент подчеркивает важность перехода от оптимизации под ключевые слова к оптимизации под сущности и события (Entity-based SEO и Event-based SEO). Для новостных ресурсов стратегически важно не просто сообщать факты, но и правильно упаковывать их, делая акцент на центральных сущностях и их роли в событиях. Система демонстрирует сложный механизм оценки качества журналистики: способность выделять главное и отделять его от второстепенного. Долгосрочная стратегия должна фокусироваться на глубоком понимании интента аудитории, связанного с конкретными типами сущностей, и создании контента, который точно соответствует этим интентам.
Сценарий: Оптимизация статьи о новом лекарстве
Задача: Обеспечить высокую релевантность статьи для сущности "Препарат X" и сущности "Болезнь Y".
Что такое "News Collection" в контексте этого патента?
News Collection — это кластер новостных статей из разных источников, которые освещают одну и ту же тему или событие. Google автоматически группирует похожие статьи вместе. Этот патент описывает, как система оценивает релевантность всего этого кластера к конкретной сущности, упомянутой в нем.
Что важнее для релевантности: интерес к новости или интерес к сущности?
Оба компонента критичны, так как итоговая оценка релевантности агрегирует три фактора: Overall Relevance (важность самой новости/коллекции), Level of Interest (интерес к сущности в мире) и Significance (роль сущности в этой новости). Нельзя компенсировать низкую значимость сущности в статье высоким внешним интересом к ней, и наоборот.
Как система определяет "Центральность" (Centrality) сущности в статье?
Патент указывает, что Centrality определяется на основе того, где именно объект упоминается в документе. Упоминания в заголовке, аннотации (abstract), первых нескольких параграфах, а также повторяемость упоминания по всему тексту повышают оценку центральности.
Что такое "Уместность событий" (Pertinence of Events) и как это работает?
Это механизм для фильтрации мимолетных упоминаний. Система определяет тип сущности (например, "Политик") и сравнивает событие в новости со списком предопределенных важных событий для этого типа (например, "Выборы", "Законопроект"). Если новость о политике не связана с уместным событием (например, он просто посетил ресторан), ее значимость для сущности "Политик" будет снижена.
Откуда Google берет списки "уместных событий" для разных типов сущностей?
Патент упоминает, что эти списки предопределены. Они могут быть созданы вручную администраторами, извлечены из Базы Знаний (Knowledge Base) или энциклопедических источников, или сгенерированы с помощью машинного обучения (упоминается event learning and/or optimization) на основе анализа того, какие события пользователи считают важными для разных типов объектов.
Как влияют внешние сигналы (поиск, соцсети) на ранжирование моей новости?
Они влияют через компонент Level of Interest. Если в момент публикации вашей новости наблюдается высокий поисковый спрос и активность в социальных сетях по данной сущности или теме, это повышает общую оценку релевантности вашей статьи, при условии, что статья действительно посвящена этой сущности (высокая Significance).
Может ли этот патент объяснить, почему кликбейт-статьи с упоминанием знаменитостей плохо ранжируются?
Да. Если статья использует имя знаменитости в заголовке, но в тексте знаменитость упоминается вскользь (низкая Centrality) или событие не является важным для её типа (низкая Pertinence of Events), система присвоит этой статье низкую оценку Significance для данной знаменитости, и статья не будет показана в релевантных новостных сводках.
Как этот патент влияет на SEO для неновостных сайтов?
Хотя патент сфокусирован на новостях, описанные механизмы понимания сущностей и событий могут применяться шире. Понимание того, какие события Google считает важными для сущностей в вашей нише, и обеспечение центральности этих сущностей в вашем контенте помогает укрепить тематический авторитет и релевантность сайта в контексте Entity SEO.
Учитывает ли система авторитетность источника новости?
Патент напрямую не фокусируется на авторитетности источника как отдельном факторе, но он учитывает количество различных источников в News Collection при расчете Overall Relevance. Широкое освещение события разными (предположительно, качественными) источниками повышает важность коллекции.
Как использовать эти знания для попадания в Top Stories (Главные новости)?
Необходимо обеспечить высокую оценку по всем трем компонентам релевантности. Публикуйте оперативно, когда интерес к теме высок (Level of Interest). Убедитесь, что новость важна и потенциально будет освещена другими (Overall Relevance). Главное — сделайте ключевые сущности центральными в заголовке и тексте, освещая уместные для них события (Significance).

Свежесть контента
EEAT и качество

Персонализация
Свежесть контента
Knowledge Graph

Семантика и интент
Свежесть контента
SERP

Персонализация
Поведенческие сигналы
Свежесть контента

Knowledge Graph
Семантика и интент
EEAT и качество

SERP
Поведенческие сигналы

Local SEO
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
EEAT и качество
Индексация

Ссылки
Индексация
Техническое SEO

Мультимедиа
EEAT и качество
Семантика и интент

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Семантика и интент
SERP
Поведенческие сигналы
