Knowledge Graph

Патент Google описывает механизм хранения личной информации пользователя, полученной из его утверждений (например, "Я съел банан"), в виде структурированных кортежей (tuples). Система объединяет эти персональные данные с информацией из Knowledge …
Google использует двухэтапный процесс для автоматического создания базы данных достопримечательностей из больших коллекций изображений. Сначала изображения группируются по географической близости (гео-кластеризация), а затем внутри этих групп они кластеризуются по визуальному …
Система Google для автоматической контекстуализации запросов во время просмотра мультимедиа. Google индексирует сущности (людей, объекты) и точное время их появления в контенте. Когда пользователь задает расплывчатый вопрос (например, «Кто это?»), …
Google анализирует текст (например, электронные письма) для идентификации медиа-сущностей (фильмов, книг, музыки). Система автоматически отображает связанный контент, ссылки для покупки и персонализированную информацию, включая активность социальных связей пользователя. Это демонстрирует …
Google использует механизм машинного обучения для решения проблемы несогласованности данных в фидах мерчантов. Система анализирует пары товарных предложений с одинаковыми идентификаторами (GTIN, MPN), но разными названиями брендов. Путем расчета метрик …
Google использует систему обработки структурированных фидов данных (например, от ритейлеров или стриминговых сервисов) для точного сопоставления их инвентаря с конкретными сущностями в Knowledge Graph. Это позволяет генерировать пары «сущность-действие» (например, …
Google использует систему для преобразования неструктурированного контента веб-страниц в структурированные данные. Система обучается на примерах, размеченных вручную, для создания обобщенных структурных шаблонов (Template Trees), учитывающих повторяющиеся или опциональные элементы. Затем …
Google использует систему для отображения прямых трансляций (Live Events) в результатах поиска. Система предварительно фильтрует трансляции, рассчитывая Quality Score на основе авторитетности организатора (Organizer Score), популярности связанных сущностей (Entity Score) …
Google использует контекстные слова в запросе (например, профессию, местоположение) для исправления ошибок в написании имен сущностей (людей, брендов, мест). Система создает индекс ассоциаций между сущностями и их контекстом на основе …
Патент Google, описывающий инфраструктурные оптимизации для распределенных вычислений (MapReduce), позволяющие анализировать огромные графы (миллиарды узлов) значительно быстрее. Он раскрывает методы повышения эффективности алгоритмов, которые ищут кластеры (связанные компоненты) в графах, …
Google использует механизм для определения связанности между локальными бизнесами (POI), выходя за рамки простых категорий. Система анализирует специфические характеристики бизнеса («Known For Terms» или KFT), извлеченные из отзывов, веб-страниц и …
Патент описывает инфраструктуру (Google Base, предшественник Merchant Center) для приема структурированных данных от поставщиков. Система автоматически определяет популярные пользовательские атрибуты и продвигает их в стандартную схему (Core Attributes). Полнота данных …
Анализ фундаментального патента Google по геокодированию. Система рассматривает адреса как «документы» и применяет методы информационного поиска, игнорируя порядок слов. Ранжирование основано на важности объекта (Feature Rank) и динамическом факторе затухания …
Патент Google описывает метод идентификации субстантивных дубликатов (например, товаров, видео или сущностей в разных форматах) исключительно путем сравнения их метаданных. Система нормализует данные, вычисляет взвешенную оценку сходства с учетом важности …
Патент описывает, как цифровой ассистент интерпретирует неоднозначные голосовые команды (например, "Поехали туда" или "В тот, что слева"), ссылающиеся на объекты, видимые на экране навигационного приложения. Система получает визуальный контекст из …
Google использует автоматизированную систему для наполнения детских интерфейсов безопасным и интересным контентом. Система определяет темы, интересующие детей, через Knowledge Graph и внешние источники, рассчитывает «Оценку детской близости» (Children's Affinity Score) …
Google использует систему для оценки важности географических объектов (городов, дорог, зданий) на основе их физических и географических атрибутов, таких как размер, плотность населения, экономическая активность и связность транспортных сетей. Эти …
Google анализирует личные данные пользователя (история поиска, email, социальная активность) для построения Персонального Графа Знаний. Этот граф структурирует сущности и связи, значимые для пользователя. Сила связей динамически обновляется: усиливается при …
Google анализирует видеоконтент для выявления сущностей (терминов, концепций), которые пользователи, вероятно, захотят найти в поиске. Система использует ML, обученное на реальных поисковых запросах, возникающих во время просмотра видео. Когда сущность …
Google использует автоматизированный процесс для категоризации веб-сайтов в иерархическую таксономию. Система анализирует контент для выявления семантических кластеров (групп совместно встречающихся терминов), сопоставляет их с концепциями и определяет наиболее подходящую категорию. …