
Google использует систему для обнаружения развивающихся событий (например, срочных новостей) путем мониторинга потоков данных в реальном времени (социальные сети) и поисковых запросов. Система моделирует распространение информации в виде графа и применяет специализированные модели машинного обучения (например, GCN, GAN) для оценки вероятности события и его релевантности для пользователя, позволяя предоставлять актуальную информацию до ее появления в традиционных источниках.
Патент решает проблему задержки в получении информации о развивающихся (developing events) или "живых" событиях традиционными поисковыми системами и базами знаний. Информация о срочных событиях (катастрофы, происшествия, стихийные собрания) часто сначала появляется в социальных сетях и в виде всплеска поисковых запросов от очевидцев, прежде чем ее публикуют официальные новостные агентства. Изобретение направлено на быстрое обнаружение таких событий и предоставление информации о них заинтересованным пользователям в реальном времени.
Запатентована система и метод для сбора информации о развивающихся событиях из множества потоков данных в реальном времени (live data streams) и поисковых запросов. Суть изобретения заключается в моделировании распространения информации (diffusion of information) через популяцию (например, пользователей социальных сетей) в виде структуры данных (например, направленного графа). Эта структура подается на вход модели машинного обучения (например, Graph Convolutional Network или Graph Attention Network), которая оценивает вероятность того, что событие действительно происходит, и прогнозирует его релевантность для конкретного пользователя.
Система работает следующим образом:
live data streams (например, посты в социальных сетях) и поисковые запросы.underlying network model), отражающую связи между источниками (узлы) и пути коммуникации (ребра). На ее основе строится направленный граф, показывающий, как информация о потенциальном событии распространяется во времени.embedding) подается на вход графовой нейронной сети (GNN, GCN, GAN). Модель обучается на исторических данных о подтвержденных событиях.user features).alternative query suggestions), если точный ответ еще не доступен.Высокая. Обнаружение срочных новостей и предоставление информации в реальном времени (Real-Time Search, QDF) является критически важной функцией поисковых систем. Использование сложных моделей машинного обучения, таких как графовые нейросети, для анализа социальных сигналов и паттернов распространения информации отражает современные тенденции в области Information Retrieval и NLP.
Патент имеет существенное значение (75/100), особенно для новостных сайтов, агрегаторов и создателей контента, ориентированных на освещение текущих событий. Он раскрывает механизм, с помощью которого Google может идентифицировать первоисточники и надежные источники информации в реальном времени, анализируя не только контент, но и паттерны его распространения в социальных сетях. Это подчеркивает важность скорости публикации, авторитетности источника в социальных медиа и стратегий распространения контента для быстрого попадания в выдачу по "горячим" запросам.
diffusion of information поверх underlying network model. Показывает поток информации между узлами во времени.embeddings графов.Claim 1 (Независимый пункт): Описывает основной метод обнаружения событий.
live data streams.diffusion of information через популяцию.likelihood) возникновения developing event.verified past event).Claim 3 (Независимый пункт): Описывает метод оценки релевантности события для конкретного пользователя с использованием двухступенчатой ML-модели.
live data streams.diffusion of information.embedding.embedding И предпочтений/интересов конкретного пользователя ко второй ML-модели для генерации прогнозируемой меры релевантности (predicted measure of relevancy) события для этого пользователя.Claim 4 (Независимый пункт): Аналогичен базовому процессу Claim 1, но с уточнением типа ML-модели.
Claim 5 (Независимый пункт): Аналогичен базовому процессу Claim 1, но с уточнением источника выводимой информации.
corpus of queries), отправленных в поисковые системы и связанных с этим событием.Изобретение охватывает несколько этапов поисковой архитектуры, фокусируясь на сборе данных в реальном времени и понимании запросов для предоставления свежей информации.
CRAWLING – Сканирование и Сбор данных
Система активно собирает данные не из традиционного веба, а из live data streams (социальные сети A, B) и потока поисковых запросов (через Query Monitor). Это механизм сбора данных в реальном времени.
INDEXING – Индексирование и извлечение признаков
Полученные данные обрабатываются для построения структур: Underlying Network Model (моделирование связей между источниками) и Directed Graph (моделирование распространения конкретной информации). Также на этом этапе (или офлайн) происходит обучение графовых ML-моделей на исторических данных.
QUNDERSTANDING – Понимание Запросов
Query Monitor анализирует входящие запросы для обнаружения кластеров семантически связанных запросов, которые могут указывать на developing event. Также система использует запросы других пользователей как источник информации для генерации alternative query suggestions (Claim 5).
RANKING / RERANKING – Ранжирование и Переранжирование
Хотя патент не фокусируется на ранжировании традиционных веб-результатов, он описывает механизм оценки актуальности и релевантности обнаруженного события для пользователя. Если событие признано релевантным (Claim 3), информация о нем предоставляется пользователю, что можно рассматривать как форму ранжирования свежего контента или ответа ассистента.
Входные данные:
Live data streams).Underlying Network Model).user features, preferences or interests).Выходные данные:
likelihood of occurrence).measure of relevancy).Alternative query suggestions.developing event. Это может быть вызвано всплеском семантически связанных постов в социальных сетях или кластером похожих поисковых запросов.Процесс А: Обнаружение события и оценка вероятности (на основе Claim 1, 4)
live data streams и/или поисковых запросов.Underlying Network Model, отражающей связи между источниками, участвующими в обсуждении.Directed Graph), которая моделирует diffusion of information о потенциальном событии через эту популяцию во времени.likelihood) возникновения developing event.Процесс Б: Оценка релевантности для пользователя (на основе Claim 3)
embedding.embedding графа И признаков пользователя ко второй ML-модели.Процесс В: Использование поисковых запросов (на основе Claim 5, 6)
alternative query suggestions на основе запросов других пользователей для предоставления пользователю дополнительной информации или уточнения интента.live data streams (посты в социальных сетях). Текст поисковых запросов.diffusion of information во времени.Underlying Network Model.user features), предпочтения, интересы, демография. Используются для оценки релевантности события для конкретного пользователя.embedding графа и признаков пользователя.Likelihood of Occurrence и Measure of Relevancy, при превышении которых система инициирует вывод информации.
Или совместная вероятность:
GNN, GCN, GAN. Обучение происходит на исторических данных (verified past events) с использованием методов вроде градиентного спуска и обратного распространения ошибки для минимизации функции потерь (loss function).diffusion of information). Паттерн распространения моделируется в виде графа и анализируется с помощью сложных ML-моделей (GNN/GCN/GAN).Likelihood of Occurrence), и оценку того, интересно ли оно конкретному пользователю (Measure of Relevancy). Для оценки релевантности может использоваться двухступенчатая модель: первая создает embedding графа, вторая использует его вместе с признаками пользователя.alternative query suggestions. Это позволяет предоставить хоть какую-то информацию в условиях ее дефицита.live data streams (социальных сетей) для обнаружения событий быстрее традиционных новостных агентств.Рекомендации сфокусированы на стратегиях для издателей новостей и создателей контента в реальном времени.
live data streams, активное и быстрое распространение новостей через официальные социальные каналы критически важно. Необходимо стимулировать распространение информации пользователями (репосты).Underlying Network Model). Патент указывает, что ML-модели учатся определять надежность узлов. Авторитетные аккаунты с большим количеством связей и историей достоверных публикаций будут иметь больший вес в графе.corpus of queries). Быстрое создание контента, отвечающего на эти конкретные вопросы, повышает релевантность.diffusion of information.live data streams, система может не обнаружить ее достаточно быстро.Патент подтверждает стратегическую важность интеграции SEO и SMM для работы с трендами и новостями. Для Google важно не просто найти контент, но и верифицировать его в реальном времени. Верификация происходит через анализ паттернов распространения информации и авторитетность участвующих узлов. Это означает, что для доминирования в Real-Time Search необходимо быть не только быстрым, но и иметь сильную, авторитетную сеть дистрибуции контента в социальных медиа. Использование графовых нейросетей для этих задач указывает на высокий уровень сложности алгоритмов, используемых Google для оценки свежего контента.
Сценарий: Освещение локального происшествия новостным порталом
Directed Graph. Поскольку информация исходит от авторитетного новостного аккаунта (надежный узел) и быстро распространяется органически, графовая нейросеть (GCN/GAN) присваивает событию высокую Likelihood of Occurrence.Что такое "развивающееся событие" (developing event) в контексте этого патента?
Это событие, которое происходит в данный момент (например, стихийное бедствие, происшествие, срочная новость), информация о котором только начинает распространяться. Ключевая характеристика – эта информация часто еще недоступна в традиционных новостных источниках или в индексе поисковой системы, но активно обсуждается в социальных сетях или ищется пользователями.
Как система моделирует распространение информации?
Система использует двухуровневую модель. Сначала строится базовая сетевая модель (Underlying Network Model), которая отражает связи между источниками (кто на кого подписан). Затем поверх нее строится направленный граф (Directed Graph), который показывает, как конкретная информация о событии передавалась от одного источника к другому с течением времени.
Почему используются именно графовые нейросети (GNN, GCN, GAN)?
Традиционные модели машинного обучения плохо справляются с анализом сложных взаимосвязей в социальных сетях. Графовые нейросети специально разработаны для обработки данных, представленных в виде графов. Они позволяют анализировать паттерны распространения информации, учитывать структуру сети и определять влияние (авторитетность) отдельных узлов (источников).
Как система определяет, надежен ли источник информации?
Патент утверждает, что графовая нейросеть обучается определять надежность отдельных источников в процессе тренировки на исторических данных о подтвержденных событиях. Если источник в прошлом часто публиковал достоверную информацию, которая подтверждалась, модель присвоит его узлу в графе больший вес. Источники слухов или недостоверной информации будут пессимизироваться.
Что означает, что система использует поисковые запросы как источник информации?
Если событие только произошло и в индексе нет релевантных результатов, система анализирует, что ищут другие пользователи, связанные с этим событием (corpus of queries). Например, если пользователь ищет "пожар в соборе", а другие ищут "какие реликвии спасены при пожаре в соборе", система может предложить первый пользователю альтернативный запрос о реликвиях, тем самым предоставляя ему дополнительную информацию.
Какое значение этот патент имеет для небольших новостных сайтов?
Он подчеркивает, что скорость и активное распространение в социальных сетях критически важны для попадания в выдачу по горячим темам. Даже небольшой сайт может конкурировать, если он является первоисточником и его контент активно распространяется органически. Важно строить авторитетность не только сайта, но и связанных с ним социальных аккаунтов.
Влияет ли этот патент на ранжирование обычных (не новостных) сайтов?
Напрямую – нет. Патент сфокусирован исключительно на обнаружении и предоставлении информации о developing events в реальном времени. Для "вечнозеленого" контента или коммерческих запросов механизмы ранжирования остаются прежними, хотя общие принципы оценки авторитетности источников могут пересекаться.
Как система определяет, что событие интересно конкретному пользователю?
Для этого используется отдельный механизм (описанный в Claim 3). Система создает векторное представление (embedding) графа распространения информации и подает его вместе с признаками пользователя (интересы, местоположение, демография) на вход второй ML-модели. Эта модель прогнозирует меру релевантности (Measure of Relevancy) события для пользователя.
Может ли система использоваться для автоматического оповещения экстренных служб?
Да, в патенте упоминается такая возможность. Если вероятность события (Likelihood of Occurrence) превышает определенный высокий порог, система может автоматически инициировать оповещение служб быстрого реагирования (например, пожарных или полиции), предоставляя им детали о событии.
Что важнее для быстрого попадания в поиск по горячей теме: оптимизация текста или активность в социальных сетях?
В контексте этого патента, активность в социальных сетях и паттерн распространения информации имеют первостепенное значение для обнаружения события. Система анализирует live data streams. Оптимизация текста важна для релевантности, но если информация не распространяется через социальные каналы, она может быть не обнаружена достаточно быстро.

Knowledge Graph
Свежесть контента
Семантика и интент

SERP
Свежесть контента
Персонализация

Knowledge Graph
Свежесть контента
Семантика и интент

Семантика и интент

Knowledge Graph
Семантика и интент

SERP
Поведенческие сигналы

Ссылки
SERP

Мультимедиа
Поведенческие сигналы
SERP

Ссылки
Антиспам
Краулинг

Индексация
Ссылки
SERP

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Индексация
Поведенческие сигналы

Поведенческие сигналы
Индексация
SERP

Поведенческие сигналы
Семантика и интент
Антиспам
