Knowledge Graph

Google использует результаты веб-поиска для идентификации сущностей (например, медицинских состояний), соответствующих атрибутам (например, симптомам), указанным в запросе. Система генерирует и анализирует результаты для комбинированных запросов (атрибуты + имя сущности), чтобы …
Анализ патента IBM (1999 г.), описывающего трехэтапную систему для определения тематически связанных терминов. Система анализирует совместную встречаемость терминов в метаданных гиперссылок (анкорах и окружающем тексте) по всему корпусу документов. Затем …
Google анализирует неструктурированный контент (веб-страницы, статьи), чтобы найти людей, которые часто упоминаются вместе (co-occurrence). На основе частоты и контекста этих упоминаний система вычисляет метрику связи (relationship metric) и предлагает пользователям …
Патент описывает архитектуру Google для создания и использования Репозитория Фактов. Система извлекает факты из интернета, связывает их с объектами (сущностями), очищает и нормализует данные. В ответ на запрос система находит …
Google использует систему для автоматического извлечения неструктурированных «уникальных фактов» о сущностях из веб-документов. Система идентифицирует источники по внешним сигналам (триггерным фразам), кластеризует схожие утверждения для валидации, отфильтровывает общеизвестные данные и …
Патент Google, описывающий систему автоматического извлечения и проверки фактов для ответов на вопросы и наполнения базы знаний (Knowledge Graph). Система генерирует гипотетические ответы, проверяет их достоверность по количеству подтверждающих источников …
Google использует механизм сбора и обработки обратной связи для повышения точности кластеризации результатов в поиске по людям. Если система ошибочно связывает ресурсы (например, профили в соцсетях) с конкретным человеком, пользователи …
Google применяет механизм для валидации синонимов с помощью структурированных географических данных. Если система определяет, что два термина являются разными, но связанными географическими объектами (например, соседними городами), они помечаются как «коррелирующие …
Google использует этот механизм для ответов на запросы, требующие списка элементов (например, «города в Калифорнии»). Система извлекает потенциальные списки из неструктурированных веб-документов, анализирует их взаимосвязи и совпадения в виде графа …
Google использует механизм для определения наиболее важных свойств (фактов) о сущности в контексте ее типа. Система анализирует частоту совместного упоминания (co-occurrence) сущности и связанных с ней сущностей в интернете (Related …
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или ее классе. …
Google использует систему для динамического извлечения фактов из веб-индекса. Когда поступает фактический запрос, система определяет ожидаемый тип ответа (например, дата, число, имя), анализирует топовые результаты поиска и извлекает соответствующие фразы. …
Google использует многоэтапную систему для проверки фактов, извлеченных из интернета. Чтобы факт попал в базу знаний, он должен быть подтвержден несколькими независимыми источниками. Система оценивает распространенность атрибута и достоверность значения, …
Google использует инфраструктурное решение для мгновенного расчета сложных метрик схожести (например, Personalized PageRank) в огромных графах связей (например, Документы и Запросы). Система заранее разбивает граф на тематические категории и создает …
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые …
Google описывает механизм для точной идентификации авторов контента. Система (например, плагин браузера) отслеживает отправку контента через веб-формы (CMS, комментарии), фиксирует личность пользователя и отправленный текст. Затем Google проверяет, появился ли …
Google использует систему для ранжирования сущностей, извлеченных из Knowledge Graph. Система рассчитывает четыре ключевые метрики: связанность, значимость типа, вклад и награды. Затем она применяет весовые коэффициенты, которые адаптируются в зависимости …
Патент Google, описывающий специализированный язык запросов для поиска в «Хранилище фактов» (Fact Repository), основе Knowledge Graph. Система позволяет выполнять точные запросы к полуструктурированным данным (пары Атрибут-Значение), используя специальные операторы для …
Патент описывает систему (техническую основу Google Authorship), позволяющую авторам связывать контент со своей верифицированной личностью с помощью цифрового "значка" (например, rel="author"). Система сохраняет "отпечаток" (хэш) контента, гарантируя, что он не …
Google использует многоэтапный процесс для определения связей между компаниями (сущностями). Система анализирует совместные упоминания (co-occurrence) в новостях и на веб-страницах, оценивая авторитетность источников (включая Pagerank) и контекст. Затем эти связи …