SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google создает временные Графы Знаний для освещения срочных новостей и событий в реальном времени

DEVELOPING EVENT-SPECIFIC PROVISIONAL KNOWLEDGE GRAPHS (Разработка временных графов знаний для конкретных событий)
  • US11256992B2
  • Google LLC
  • 2019-06-25
  • 2022-02-22
  • Knowledge Graph
  • Свежесть контента
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для мониторинга «live data streams» (социальные сети, поисковые запросы) для обнаружения «developing events» (срочные новости, происшествия). Для этих событий система создает «Event-Specific Provisional Knowledge Graph» – временный слой поверх основного Графа Знаний, который содержит самую свежую, хотя и потенциально непроверенную информацию. Это позволяет Поиску и Ассистенту быстро предоставлять ответы о событиях, происходящих прямо сейчас.

Описание

Какую проблему решает

Патент решает проблему задержки обновления основного General-Purpose Knowledge Graph (Графа Знаний общего назначения) во время быстро развивающихся событий (developing events), таких как стихийные бедствия, спортивные матчи или протесты. Традиционные источники и процессы верификации фактов слишком медленны для поиска в реальном времени. Информация часто появляется сначала в live data streams (живых потоках данных, например, социальных сетях). Изобретение позволяет системе агрегировать, структурировать и предоставлять эту информацию почти в реальном времени, до того как она будет проверена и добавлена в основной Граф Знаний.

Что запатентовано

Запатентована система для обнаружения развивающихся событий и динамического создания Event-Specific Provisional Knowledge Graph (Временного Графа Знаний для конкретного события). Этот временный (или «эфемерный») граф строится поверх основного Графа Знаний. Он использует существующие сущности, но добавляет новые узлы (например, узел для самого события) и связи, полученные из живых потоков данных, для организации непроверенной информации в реальном времени.

Как это работает

Система работает в несколько этапов:

  • Мониторинг и Обнаружение: Анализируются live data streams и поисковые запросы. Событие обнаруживается при выявлении кластеров семантически связанных постов или запросов.
  • Сбор и Обработка данных: Релевантные потоки (текст, изображения, видео) анализируются с использованием NLP для извлечения тем, идентификации сущностей и дедупликации информации.
  • Создание Временного Графа (PKG): Формируется Event-Specific Provisional Knowledge Graph. Он привязывается к существующим сущностям из основного графа, но добавляет новые узлы и связи, отражающие текущую ситуацию.
  • Классификация события: Определяется тип события (например, «пожар», «матч») с помощью шаблонов (Event Type Templates) или ML-моделей.
  • Предоставление информации: Система запрашивает PKG для ответов на вопросы пользователей (если основной граф не содержит информации) или для проактивной отправки уведомлений (push) заинтересованным пользователям («подписчикам»).

Актуальность для SEO

Высокая. Обработка информации в реальном времени (Real-Time Search) и обеспечение максимальной свежести (QDF - Query Deserves Freshness) являются критически важными функциями поиска. Способность быстро структурировать информацию из социальных сетей и других живых источников для заполнения пробелов в Графе Знаний полностью соответствует текущим трендам развития Google.

Важность для SEO

Влияние на SEO значительно (8/10), особенно для новостных издателей, сайтов, освещающих мероприятия, и стратегий, связанных с трендами. Патент показывает, что Google может использовать live data streams (включая социальные сети) как прямой источник знаний во время срочных событий. Это подчеркивает критическую важность скорости публикации, четкой идентификации сущностей и активности в социальных сетях для достижения видимости в поиске по горячим темам.

Детальный разбор

Термины и определения

Developing Event (Развивающееся событие)
Срочное событие, происходящее в реальном времени (например, стихийное бедствие, спортивный матч, протест), информация о котором появляется в живых потоках данных быстрее, чем в традиционных источниках.
Event-Specific Provisional Knowledge Graph (PKG) (Временный Граф Знаний для конкретного события)
Временная («provisional» или «ephemeral») структура данных, создаваемая для конкретного developing event. Она строится поверх основного графа знаний, но содержит новую, потенциально непроверенную информацию, ноды и связи, которых еще нет в основном графе.
Event Subscribers (Подписчики события)
Пользователи, которые выразили интерес к событию (например, задав о нем вопрос) или интересуются определенным типом событий, и которые могут получать проактивные обновления (push-уведомления).
Event Type Template (Шаблон типа события)
Структура данных, связанная с определенным типом события (например, «пожар», «спортивный матч»). Содержит слоты для ожидаемых данных (например, для пожара: «огонь», «пожарные машины»). Используется для классификации события.
General-Purpose Knowledge Graph (KG) (Граф Знаний общего назначения)
Основная база знаний Google, содержащая верифицированные факты о сущностях (ноды) и их взаимосвязях (связи).
Live Data Stream (Живой поток данных)
Источник информации, обновляемый в реальном времени. Включает посты в социальных сетях, видео-трансляции, поисковые запросы.
Live Stream Monitor (Монитор живых потоков)
Компонент системы, отвечающий за анализ live data streams для обнаружения новых событий и извлечения информации.
Query Monitor (Монитор запросов)
Компонент системы, анализирующий входящие поисковые запросы и кластеризующий семантически связанные запросы для обнаружения developing events.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обнаружения событий и создания временного графа.

  1. Система анализирует два или более live data streams.
  2. На основе анализа система впервые обнаруживает (newly detecting) развивающееся событие И идентифицирует связанные с ним сущности (которые уже существуют в General-Purpose Knowledge Graph).
  3. В ответ на обнаружение события система создает Event-Specific Provisional Knowledge Graph (PKG).
  4. PKG разделяет узлы сущностей с основным графом, но добавляет новые узлы и связи, отсутствующие в основном графе. Ключевое уточнение: один из новых узлов создается для представления самого впервые обнаруженного события.
  5. После создания система запрашивает PKG для получения новой информации о событии.
  6. Система инициирует отображение этой новой информации на устройствах.

Claim 2 (Зависимый от 1): Уточняет триггер анализа.

Анализ живых потоков может быть инициирован получением пользовательского запроса о событии до того, как система его официально обнаружила. На основе этого запроса система анализирует больший набор живых потоков.

Claim 4 и 5 (Зависимые): Уточняют альтернативный триггер.

Система может инициировать анализ живых потоков в ответ на то, что основной General-Purpose Knowledge Graph не содержит информации, релевантной пользовательскому запросу.

Claim 7 (Зависимый от 1): Включает определение типа события.

Система определяет тип (event type) развивающегося события на основе анализа живых потоков.

Claim 8 (Зависимый от 7): Описывает механизм проактивных уведомлений.

  1. Система определяет, что пользователь заинтересован в получении информации о событиях данного типа.
  2. На этом основании система проактивно отправляет (pushing) данные с новой информацией на устройство пользователя.
  3. Это приводит к отображению информации без явного запроса пользователя на обновление.

Claim 10 (Зависимый от 7): Описывает метод определения типа события.

Определение типа события включает сопоставление структуры PKG (новых узлов/связей) с Шаблоном типа события (Event Type Template).

Где и как применяется

Изобретение затрагивает практически все этапы поиска для обработки информации в реальном времени.

CRAWLING – Сканирование и Сбор данных
Система активно сканирует (crawls) и анализирует live data streams (например, социальные сети) через компонент Live Stream Monitor и Crawler/Parser.

INDEXING – Индексирование и извлечение признаков
Происходит быстрое индексирование в реальном времени. Данные из потоков обрабатываются через конвейер (pipeline), включающий NLP для извлечения тем (Topic Extraction) и идентификации сущностей (Entity Identification/Linking), а также обработку изображений/видео. Результатом является не обновление основного индекса, а создание временной структуры — Event-Specific Provisional Knowledge Graph (PKG). Это позволяет обойти медленные процессы проверки фактов.

QUNDERSTANDING – Понимание Запросов
Query Monitor анализирует поток запросов в реальном времени. Кластеризация семантически похожих запросов может служить триггером для обнаружения нового события. Система также распознает запросы, относящиеся к уже обнаруженным событиям.

RANKING / METASEARCH – Ранжирование / Метапоиск
При обработке запроса о событии система может определить, что основной KG не имеет ответа (Claim 4). В этом случае система обращается к PKG для получения самой свежей информации. Также система использует PKG для проактивной отправки (push) обновлений подписчикам.

Входные данные:

  • Live data streams (текст, изображения, видео, аудио из социальных сетей).
  • Поток поисковых запросов пользователей.
  • Данные из General-Purpose Knowledge Graph (для идентификации существующих сущностей).
  • Геолокационные (GPS) и временные метки потоков и запросов.

Выходные данные:

  • Созданный и обновляемый Event-Specific Provisional Knowledge Graph.
  • Ответы на запросы о событиях в реальном времени (через Поиск или Ассистент).
  • Проактивные уведомления (текстовые или голосовые) для подписчиков.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на QDF-запросы (Query Deserves Freshness) и запросы о последних новостях, трендах и текущих событиях.
  • Конкретные типы контента: Новостные статьи, посты в блогах (особенно Live Blogs), контент в социальных сетях, видео и изображения с места событий.
  • Конкретные ниши или тематики: Новости, спорт, развлечения (концерты), чрезвычайные ситуации, политика (митинги, протесты). Может затрагивать YMYL-тематики, связанные с безопасностью.

Когда применяется

Алгоритм активируется при обнаружении developing event.

  • Триггеры активации:
    • Аномалии в потоках данных: Обнаружение кластера семантически связанных постов в live data streams, особенно от пользователей, находящихся географически близко.
    • Аномалии в запросах: Всплеск семантически связанных поисковых запросов (обнаруженный Query Monitor).
    • Невозможность ответа: Когда пользователь задает вопрос о потенциальном событии, а основной General-Purpose Knowledge Graph не может предоставить ответ (Claim 4).
    • Сигналы от доверенных источников: Мониторинг живых потоков от доверенных организаций (например, служб экстренного реагирования, репортеров).

Пошаговый алгоритм

Этап 1: Обнаружение события (Detection)

  1. Мониторинг потоков: Система непрерывно анализирует поисковые запросы (через Query Monitor) и живые потоки данных (через Live Stream Monitor).
  2. Кластеризация: Система ищет кластеры семантически, темпорально и географически близких сигналов (запросов или постов).
  3. Триггер: Если обнаружен значительный кластер и/или основной КГ не содержит информации, система детектирует новое развивающееся событие.

Этап 2: Создание и Наполнение Временного Графа (Construction)

  1. Сбор релевантных данных: Crawler/Parser собирает данные из идентифицированных релевантных живых потоков.
  2. Обработка конвейера (Pipeline Processing):
    • Текст парсится. Изображения/видео анализируются (Image/Video Sub-pipeline) для распознавания объектов/текста (OCR). Аудио транскрибируется.
    • Применяются NLP-модели для извлечения тем (Topic Extraction, например, PLSA, LDA) и идентификации сущностей (Entity Identification/Linking).
  3. Построение графа (PKG Construction): Provisional Knowledge Graph Manager создает PKG.
    • Создается новый узел для самого события (Claim 1).
    • Идентифицированные сущности связываются с существующими узлами в основном КГ.
    • Создаются новые связи между событием и сущностями на основе извлеченной информации.
  4. Классификация события (Event Type Classification): Структура PKG сравнивается с Event Type Templates или обрабатываются ML-моделью для определения типа события (например, «пожар»).
  5. Дедупликация и обновление: Новая информация дедуплицируется (Deduplicator) и используется для обновления PKG.

Этап 3: Использование и Распространение (Utilization)

  1. Обработка запросов: При поступлении запроса о событии система запрашивает PKG.
  2. Идентификация подписчиков: Система определяет пользователей, заинтересованных в событии или типе события (Event Subscribers).
  3. Генерация ответов и Суммаризация: NLP-модель (Sentence Summarization) генерирует сводку новой информации в естественном языке.
  4. Доставка информации: Новая информация отправляется пользователям через Notification Streamer (визуально) или TTS Streamer (аудио), возможно, проактивно (push).

Какие данные и как использует

Данные на входе

Система агрегирует данные из множества источников в реальном времени.

  • Контентные факторы (из Live Data Streams): Текстовое содержание постов в социальных сетях, комментарии.
  • Мультимедиа факторы: Изображения, видео и аудио, публикуемые в потоках данных. Они обрабатываются для распознавания объектов, текста (OCR) и речи.
  • Временные факторы: Временные метки постов и запросов. Критически важны для определения актуальности и последовательности событий.
  • Географические факторы: Местоположение (например, GPS-координаты) устройств, используемых для публикации постов или отправки запросов. Используются для определения местоположения события и релевантности источников.
  • Пользовательские факторы (Источники): Надежность и авторитетность источника потока данных. Патент упоминает, что потоки от служб экстренного реагирования, репортеров или правительственных организаций могут считаться более надежными.
  • Поведенческие факторы (Запросы): Поисковые запросы пользователей. Анализируется их семантика, частота и локация для обнаружения событий.

Какие метрики используются и как они считаются

Патент не приводит конкретных формул, но описывает следующие методы и концепции:

  • Кластеризация и Семантическая близость: Используется для обнаружения событий. Вероятно, основано на генерации эмбеддингов (embeddings) текстового контента и определении их близости в латентном пространстве.
  • NLP (Обработка естественного языка):
    • Извлечение тем (Topic Extraction): Упоминаются статистические модели, такие как PLSA (Probabilistic Latent Semantic Analysis) или LDA (Latent Dirichlet Allocation), для анализа контента потоков.
    • Идентификация сущностей (Entity Identification/Linking): Используется для распознавания упоминаний сущностей и их связывания с Графом Знаний.
  • Шаблоны типов событий (Event Type Templates): Используются для классификации событий путем сопоставления извлеченных данных со слотами в шаблоне (например, шаблон «спорт» ищет данные о «счете», «игроках»).
  • Машинное обучение (для классификации событий): Упоминаются ML-модели (например, нейронные сети, SVM, графовые нейронные сети), обученные классифицировать типы событий на основе структуры PKG или извлеченных признаков.
  • Дедупликация: Методы для определения того, является ли информация новой или повторением (репостом) существующей информации.

Выводы

  1. Временные Графы Знаний (PKG) для реального времени: Google активно использует временные структуры данных (Provisional Knowledge Graphs) для агрегации информации о срочных событиях. Это позволяет системе реагировать быстро, не дожидаясь верификации данных для основного Графа Знаний. Скорость приоритетнее точности на ранних этапах события.
  2. Live Data Streams как первоисточники знаний: Социальные сети, поисковые запросы и другие живые потоки рассматриваются как первичные источники информации во время developing events.
  3. Автоматическое обнаружение событий через кластеризацию: Система обнаруживает новые события путем анализа аномалий и кластеризации семантически, географически и темпорально близких сигналов из запросов и социальных сетей.
  4. Важность классификации событий (Event Type): Быстрое определение типа события (например, спорт, пожар) критически важно. Оно используется для структурирования информации (с помощью Event Type Templates) и для определения заинтересованной аудитории (подписчиков).
  5. Переход к проактивному поиску (Push vs Pull): Патент описывает механизм проактивной доставки информации (push-уведомления) пользователям, которые интересовались событием или типом события, что является частью стратегии перехода от реактивного поиска к проактивной помощи (например, Google Assistant, Discover).
  6. Мультимодальный анализ: Система не ограничивается текстом, а включает специализированные конвейеры для анализа изображений и видео из живых потоков для понимания контекста события.

Практика

Best practices (это мы делаем)

  • Скорость реакции (для новостных сайтов и издателей): Критически важно публиковать информацию максимально быстро во время срочных событий. Система предназначена для захвата самой свежей информации из live data streams.
  • Активное использование Live-форматов и Социальных сетей: Используйте форматы, которые система интерпретирует как live data streams – официальные аккаунты в социальных сетях (Twitter/X), Live Blogs на сайте. Эти источники могут быть напрямую использованы для наполнения PKG.
  • Четкая идентификация сущностей: При освещении событий необходимо четко и недвусмысленно указывать ключевые сущности (Кто, Что, Где). Это помогает системе (Entity Identification/Linking) правильно связать информацию с нодами в Графе Знаний и корректно построить PKG.
  • Использование мультимедиа в реальном времени: Поскольку патент описывает конвейеры для обработки изображений и видео, использование релевантных, уникальных медиафайлов с места событий может повысить ценность вашего потока данных для системы.
  • Развитие сущностей и авторитетности (E-E-A-T): Работайте над тем, чтобы ваша организация и авторы были четко представлены в основном Графе Знаний. Патент предполагает, что надежным и авторитетным источникам может отдаваться приоритет при формировании PKG.

Worst practices (это делать не надо)

  • Медленное освещение событий: Задержка в публикации информации о developing events приведет к тому, что PKG будет сформирован на основе данных из социальных сетей или более быстрых конкурентов.
  • Неоднозначное упоминание сущностей: Использование местоимений или жаргона без четкого указания сущностей затрудняет для системы понимание того, о ком или о чем идет речь.
  • Игнорирование социальных сетей: Рассматривать социальные сети только как канал дистрибуции, а не как источник данных для Google. Отсутствие активности во время живых событий снижает шансы на попадание в PKG.
  • Публикация недостоверной информации (Фейки): Хотя PKG содержит непроверенную информацию, система учитывает надежность источников. Систематическая публикация фейков может привести к снижению доверия к источнику и его игнорированию системой Live Stream Monitor.

Стратегическое значение

Патент подтверждает стратегию Google по интеграции данных из социальных сетей и других источников реального времени непосредственно в поисковые продукты для обеспечения максимальной свежести (QDF). Для SEO-специалистов это означает, что оптимизация под срочные события требует не только работы с сайтом, но и стратегического подхода к управлению live data streams. Видимость по горячим темам зависит от способности быть быстрым, точным и авторитетным источником информации в реальном времени.

Практические примеры

Сценарий: Освещение спортивного матча в реальном времени

  1. Действие: Спортивный новостной сайт ведет текстовую трансляцию матча в формате Live Blog и параллельно публикует обновления в официальном Twitter-аккаунте.
  2. Как делать: Каждое обновление должно четко идентифицировать сущности. Вместо «Он забил гол!» использовать «Игрок [Имя Фамилия] (Команда А) забил гол команде (Команда Б) на [Минута] минуте. Счет [X-Y]». Использовать релевантные изображения и короткие видео моментов.
  3. Ожидаемый результат: Google обнаруживает developing event (матч). Информация из Twitter и Live Blog используется для наполнения Provisional Knowledge Graph. При запросах пользователей о счете или ключевых моментах матча, Google использует эту информацию для отображения в реальном времени (например, в спортивных блоках выдачи или через Ассистента).

Сценарий: Чрезвычайное происшествие в городе (Локальное SEO)

  1. Действие: Местный новостной портал первым узнает о крупном пожаре.
  2. Как делать: Немедленно опубликовать короткую новость и начать активное освещение в социальных сетях с указанием точного адреса или района (сущность-локация), времени начала и известных фактов (например, «Пожарные машины прибыли»). Использовать геотеги в постах.
  3. Ожидаемый результат: Google обнаруживает всплеск запросов и постов о пожаре, используя геолокационные данные. Система создает PKG, используя данные портала как один из первых источников. Портал получает высокую видимость по локальным запросам, связанным с пожаром, а пользователи поблизости могут получать проактивные уведомления.

Вопросы и ответы

Что такое «Временный Граф Знаний» (Provisional Knowledge Graph) и чем он отличается от основного?

Event-Specific Provisional Knowledge Graph (PKG) — это временная база знаний, которую Google создает для освещения событий в реальном времени (срочные новости, спорт). Основное отличие в том, что PKG наполняется быстро из Live Data Streams (например, социальных сетей) и может содержать непроверенную информацию. Основной Граф Знаний обновляется медленнее и содержит верифицированные факты. PKG действует как промежуточный слой для немедленного реагирования.

Какие источники данных используются для наполнения Временного Графа Знаний?

Основными источниками являются Live Data Streams. Это включает посты в различных социальных сетях (текст, изображения, видео), а также анализ потоков поисковых запросов пользователей. Система также может отслеживать потоки от доверенных организаций, таких как службы быстрого реагирования или новостные агентства.

Как система обнаруживает новое событие?

Событие обнаруживается путем анализа аномалий и кластеров активности. Это может быть всплеск семантически похожих поисковых запросов или большое количество постов в социальных сетях на одну тему, особенно если они опубликованы примерно в одно время и из одной географической области.

Означает ли это, что посты в социальных сетях напрямую влияют на результаты поиска?

Да, в контексте развивающихся событий. Патент описывает, как данные из социальных сетей используются для наполнения PKG, который затем используется для ответа на запросы пользователей. Если ваш пост в социальной сети будет распознан как релевантный и своевременный источник информации о событии, он может повлиять на данные, которые Google предоставляет пользователям в реальном времени.

Как Google проверяет достоверность информации из социальных сетей для PKG?

Патент фокусируется на скорости сбора, а не на глубокой верификации. PKG по определению содержит потенциально непроверенную информацию. Однако система использует дедупликацию (проверяет, повторяется ли информация в разных источниках) и оценивает надежность источников (например, официальные аккаунты имеют больший вес, чем случайные пользователи).

Как это влияет на SEO для новостных сайтов?

Это имеет критическое значение. Для видимости по срочным новостям (QDF) скорость публикации становится первостепенной. Новостные сайты должны активно использовать форматы Live Blog и социальные сети. Если Google сформирует PKG на основе данных из Twitter, сайт, опубликовавший новость с задержкой, может упустить значительную часть трафика.

Что такое «Event Type Template» и как он используется?

Это шаблон, описывающий ожидаемую структуру информации для разных типов событий. Например, шаблон «Пожар» ожидает данные о локации, дыме, пожарных машинах. Шаблон «Спорт» ожидает данные о счете, командах. Система использует эти шаблоны, чтобы классифицировать событие и понять, какую информацию нужно искать в потоках данных.

Как этот патент влияет на стратегию работы с сущностями (Entity SEO)?

Он значительно повышает ее важность. PKG строится путем связывания нового события с сущностями, уже существующими в основном графе. Если ваша организация, бренд или ключевые лица не распознаются как сущности, Google будет сложнее корректно связать вас с развивающимся событием, даже если вы его освещаете.

Использует ли Google изображения и видео для понимания событий?

Да. В патенте описан отдельный конвейер (Image/Video Sub-pipeline) для обработки мультимедийного контента из живых потоков. Система может использовать распознавание объектов, лиц и текста (OCR) на изображениях и видео для извлечения дополнительной информации о событии.

Что означает «проактивная отправка обновлений» (Push) в этом патенте?

Это означает, что система может отправлять пользователям push-уведомления (текстовые или голосовые через Ассистента) о новых developments в событии без прямого запроса пользователя. Это происходит, если пользователь ранее интересовался этим событием (стал «подписчиком») или если он интересуется данным типом событий. Это механизм проактивного поиска.

Похожие патенты

Как Google использует графовые нейросети для обнаружения развивающихся событий через анализ социальных сетей и поисковых запросов
Google использует систему для обнаружения развивающихся событий (например, срочных новостей) путем мониторинга потоков данных в реальном времени (социальные сети) и поисковых запросов. Система моделирует распространение информации в виде графа и применяет специализированные модели машинного обучения (например, GCN, GAN) для оценки вероятности события и его релевантности для пользователя, позволяя предоставлять актуальную информацию до ее появления в традиционных источниках.
  • US11366812B2
  • 2022-06-21
  • Свежесть контента

  • Семантика и интент

  • Персонализация

Как Google встраивает ленту социальных обсуждений в реальном времени прямо в результаты поиска по трендовым запросам
Google использует механизм для идентификации трендовых запросов ("active keywords"), связанных с текущими событиями. Если пользователь ищет по такому запросу, система отбирает релевантные посты из социальных сетей, созданные во время события, и отображает их в виде специальной встроенной ленты ("discussion stream") прямо на странице результатов поиска, отделяя их от более старых социальных постов.
  • US9984155B2
  • 2018-05-29
  • SERP

  • Свежесть контента

  • Персонализация

Как Google создает агрегированные блоки событий (Integrated Event View), объединяя факты, новости и фильтруя социальные сети
Google использует систему для идентификации событий (спорт, концерты) в запросах и генерации «Интегрированного представления события» (Integrated Event View). Эта система агрегирует фактические данные, результаты веб-поиска и контент из социальных сетей. Ключевой особенностью является фильтрация социальных сообщений с использованием семантического сходства (например, LSA) и геолокации для обеспечения релевантности.
  • US20110302153A1
  • 2011-12-08
  • Семантика и интент

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

Как Google автоматически генерирует и выполняет поисковые запросы на основе того, что пользователь смотрит или слушает
Google патентует систему проактивного поиска для "второго экрана". Анализируя исторические данные, система определяет, что пользователи ищут во время просмотра контента (фильма, матча). Когда новый пользователь смотрит этот контент, система распознает его (например, по звуку) и автоматически выполняет релевантные запросы в нужный момент, показывая свежие результаты без ручного ввода.
  • US10545954B2
  • 2020-01-28
  • Свежесть контента

  • Семантика и интент

  • Мультимедиа

Популярные патенты

Как Google проактивно уведомляет пользователей об изменении цен или доступности товаров на основе их предполагаемого намерения покупки
Google анализирует действия пользователя (поисковые запросы, посещения сайтов), чтобы выявить намерение в отношении сущностей (например, продуктов или авиабилетов). Если намерение сильное и происходит значительное изменение (падение цены или изменение доступности), Google проактивно отправляет уведомление со ссылками для завершения действия (например, покупки).
  • US20180357238A1
  • 2018-12-13
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента
Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.
  • US9098511B1
  • 2015-08-04
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

seohardcore