Knowledge Graph

Google использует графовую модель для расширения знаний о сущностях (Instances). Система строит граф, связывающий сущности, их классы (Classes) и атрибуты (Attributes). С помощью алгоритма случайного блуждания (Random Walks) система вычисляет …
Google использует метод автоматического обнаружения парафраз (фраз с одинаковым значением) путем анализа индекса, связывающего информационные элементы (даты, имена, концепции) с фрагментами предложений из веба. Если разные фрагменты описывают один и …
Google анализирует названия и категории бизнесов в конкретном географическом регионе. Если определенная часть названия (например, "Joe's") постоянно ассоциируется с одной категорией (например, "Plumber"), система создает локальную связь. Это позволяет расширять …
Патент Google, описывающий систему автоматического выбора лучшего репрезентативного изображения для сущности (человека, логотипа, продукта). Система кластеризует визуально похожие изображения, чтобы найти самые популярные версии в сети. Затем она рассчитывает «Headshot …
Анализ патента Google, описывающего два ключевых механизма: автоматическое расширение Графа Знаний путем анализа текста и ответы на вопросы на естественном языке. Система использует машинное обучение для определения надежных путей (связей) …
Google использует систему для идентификации и обработки цитат, приписываемых сущностям. Система применяет разные критерии в зависимости от источника: для общих цитат важна частота упоминаний и консенсус, а для новостных — …
Патент Google, описывающий методы автоматического создания и проверки контактных данных (телефон, адрес, email) для сущностей (людей, организаций). Система анализирует различные источники, агрегирует разрозненные данные и использует частоту совместного упоминания (co-occurrence) …
Анализ патента (IBM), описывающего механизм устранения неоднозначности сущностей (люди, места, организации). Система использует контекстные описания и метрику «Inverse Network Size» (INS) для оценки уникальности этих описаний в реальном мире, а …
Google использует механизм для обнаружения разных версий одного и того же документа (например, научной статьи в разных репозиториях). Система создает «кандидатные идентификаторы» из метаданных (автор, название, дата), нормализует их и …
Патент описывает, как платформа (например, YouTube) анализирует социальные данные (комментарии, а также поисковые запросы и просмотры пользователей до и после видео) вокруг пользовательского контента (UGVC), чтобы идентифицировать связанный официальный контент …
Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам …
Патент Google, раскрывающий, как система анализирует поведение пользователей (поисковые запросы и последующие клики) для понимания того, как люди интуитивно классифицируют бизнесы. На основе этих данных Google строит динамические иерархические деревья …
Google использует механизм для понимания фактов и связей, описанных в свободном (неструктурированном) тексте. Система анализирует слова, окружающие сущность («Контекстное Облако»), и сравнивает этот контекст с тем, как эти слова используются …
Google использует этот механизм для ответа на неоднозначные фактические запросы. Система генерирует несколько возможных интерпретаций запроса и ответы из Knowledge Graph. Затем она проверяет, какая интерпретация доминирует в аннотациях (идентифицированных …
Патент Google описывает систему ранжирования, учитывающую уровень доверия к сущностям (экспертам, организациям), которые аннотируют или классифицируют контент с помощью «меток» (labels). Система вычисляет «Рейтинг Доверия» (Trust Rank) для этих сущностей …
Google использует механизм для определения людей, наиболее релевантных поисковому запросу. Система анализирует контекст вокруг имен в документах, используя «термины классификации» (например, должности, локации, email), чтобы сгруппировать упоминания и различить людей …
Патент Google описывает систему извлечения фактов (Subject, Attribute, Object) из неструктурированного текста для пополнения Базы Знаний. Система генерирует паттерны на основе синтаксического разбора (dependency parses) и оценивает их надежность с …
Google использует сложную иерархическую вероятностную модель для понимания семантики текста. Система обучается на огромных массивах данных (например, поисковых сессиях), чтобы автоматически выявлять «концепции» (кластеры семантически связанных слов и фраз). Это …
Google анализирует последовательность запросов пользователя в рамках одной сессии. Если текущий запрос неоднозначен или содержит отсылки (например, местоимения), система пытается связать его с предыдущими запросами. Затем она генерирует и оценивает …
Google использует систему для определения наиболее актуальных связанных сущностей при ответе на запрос. Система анализирует Граф Знаний, чтобы найти связанные сущности, а затем ранжирует их на основе оценок Свежести (насколько …