Google улучшает понимание сущностей (Instances) путем анализа того, как пользователи их ищут. Патент описывает метод ранжирования категорий (Classes) для сущности, основанный на частоте их совместного упоминания в логах поисковых запросов. …
Knowledge Graph
Google группирует ресурсы, относящиеся к одной сущности (человек, продукт, книга), в кластеры. Патент описывает двухуровневую систему ранжирования: сначала ресурсы ранжируются внутри кластера на основе их общего качества (Quality Score) и …
Google использует автоматизированную систему для обнаружения социальных профилей (Facebook, Twitter и т.д.), связанных с бизнес-сущностями. Система сканирует официальные сайты компаний на наличие ссылок, используя списки ключевых слов и форматов URL. …
Google собирает и анализирует историю исправлений, которые пользователи вносят в фактические данные (например, характеристики продуктов или биографические данные). Система классифицирует эти исправления по типу (например, было ли исправление подтверждено ссылкой …
Google использует процесс "согласования графов" для автоматического расширения Knowledge Graph. Система извлекает факты о потенциально новых сущностях из множества веб-документов, а затем проверяет их достоверность путем перекрестной сверки (corroboration). Если …
Google использует механизм для анализа HTML и не-HTML документов (PDF, Word и т.д.) с целью автоматического обнаружения упоминаний и цитат (статьи, компании, продукты). Система определяет контекстуально релевантный анкорный текст, ищет …
Анализ патента, лежащего в основе программы Google Authorship. Описываются методы верификации авторства путем создания цикла ссылок между статьей и профилем автора (используя атрибуты, такие как rel="author" и rel="contributor-to") или путем …
Google использует систему для поддержания внутренней согласованности своего репозитория фактов (Knowledge Graph). Система выполняет две ключевые задачи: во-первых, она фильтрует и удаляет факты, соответствующие нежелательным критериям, что может привести к …
Google использует модель оценки для различения именованных сущностей с одинаковыми названиями (например, «Ягуар» как животное или автомобиль). Система анализирует контекст запроса и сравнивает его со статьями о сущностях в базе …
Google использует систему для объяснения, почему две сущности (например, компании) похожи. Вместо очевидных связей (например, «оба являются ресторанами»), система анализирует все общие черты, отфильтровывает слишком частые и слишком редкие, и …
Google использует механизм для корректировки общих рейтингов сущностей (товаров, услуг, компаний) на основе индивидуальных предпочтений пользователя. Система анализирует текстовые отзывы, чтобы выявить характеристики сущности (например, «цена», «скорость обслуживания») и определить …
Google патентует метод улучшения поиска за счет расширения сущностей в запросах и контенте с помощью Knowledge Graph. Система использует курируемые связи (предикаты) для выявления неявной релевантности. Также вводится «дескриптор релевантности» …
Google использует итеративный процесс (бутстрэппинг) для распознавания сущностей в документах. Система начинает с известных фактов о сущности, находит документы, которые, вероятно, ссылаются на нее, анализирует эти документы для уточнения модели …
Google использует системы для двустороннего связывания запросов и сущностей. Алгоритмы анализируют релевантность документов запросу и значимость сущности внутри этих документов, чтобы определить главную (Primary) и второстепенные (Secondary) сущности для запроса. …
Google использует систему для определения того, какие сущности (люди, места, объекты) подразумеваются в поисковом запросе. Система анализирует, насколько релевантны топовые документы запросу и насколько центральное место в этих документах занимает …
Патент описывает механизм, который Google использует для консолидации фактов, извлеченных из интернета. Система анализирует разрозненные данные (объекты), сравнивает их на предмет сходств (например, общие редкие факты) и конфликтов (например, разные …
Google анализирует логи запросов, чтобы понять, какую информацию пользователи чаще всего ищут о конкретных сущностях (например, «высота» для здания или «альбомы» для музыканта). Система комбинирует данные по конкретной сущности с …
Патент описывает фундаментальный процесс управления данными для идентификации дублирующихся записей об одной и той же сущности. Система использует хеширование для поиска совпадений в полях данных, а затем применяет сложную логику …
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для …
Google использует механизм для определения локального интента запроса, анализируя не сам запрос, а кластер связанных запросов. Система проверяет, какая доля запросов в кластере вызывает срабатывание локальных функций поиска (например, локальной …