Семантика и интент

Патент описывает систему для определения семантического контекста текста (веб-страниц, запросов и истории пользователя). Она разделяет информацию на тематические Домены и вычисляет контекстный вектор (Macro-Context) на основе использования уникальной терминологии. Это …
Патент описывает механизм, который Google использует для консолидации фактов, извлеченных из интернета. Система анализирует разрозненные данные (объекты), сравнивает их на предмет сходств (например, общие редкие факты) и конфликтов (например, разные …
Google использует графовую модель Маркова (Markov Model) для кластеризации поисковых подсказок. Система анализирует, какие запросы пользователи вводят в рамках одной сессии (session co-occurrence) и на какие документы они кликают (click-through …
Google использует алгоритмы для анализа информации о контенте (например, книгах, фильмах, сериалах) из множества источников. Система создает записи, кластеризует их для выявления серий, определяет канонические названия серий и отдельных произведений, …
Google анализирует логи запросов, чтобы понять, какую информацию пользователи чаще всего ищут о конкретных сущностях (например, «высота» для здания или «альбомы» для музыканта). Система комбинирует данные по конкретной сущности с …
Google использует систему интерактивных подсказок (Autocomplete), которая предлагает как завершение запроса, так и прямые URL-адреса по мере ввода пользователем префикса. Система заранее создает индекс, анализируя популярные сайты и связывая префиксы …
Патент описывает фундаментальный процесс управления данными для идентификации дублирующихся записей об одной и той же сущности. Система использует хеширование для поиска совпадений в полях данных, а затем применяет сложную логику …
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы …
Google использует механизм разрешения неоднозначности в последовательных голосовых запросах. Если пользователь использует местоимение (например, «он», «оно»), которое может относиться к разным сущностям из предыдущего диалога, Google генерирует несколько вариантов запроса …
Google анализирует исторические данные поиска, чтобы выявить запросы, сделанные пользователями, находящимися далеко от интересующей их локации (поведение на этапе планирования). Этот анализ позволяет понять, какие темы, услуги и достопримечательности актуальны …
Google использует систему для валидации контента, сгенерированного большими языковыми моделями (LLM). Система разбивает ответ LLM на отдельные утверждения, ищет подтверждающую или опровергающую информацию в поисковом индексе и использует специальные модели …
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для …
Google использует механизм для определения локального интента запроса, анализируя не сам запрос, а кластер связанных запросов. Система проверяет, какая доля запросов в кластере вызывает срабатывание локальных функций поиска (например, локальной …
Google использует результаты веб-поиска для идентификации сущностей (например, медицинских состояний), соответствующих атрибутам (например, симптомам), указанным в запросе. Система генерирует и анализирует результаты для комбинированных запросов (атрибуты + имя сущности), чтобы …
Google анализирует частоту запросов и удовлетворенность пользователей (низкий процент уточнений, долгое время клика), чтобы выявить "Known Highly-Ranked Queries" (KHRQ). Система перенаправляет пользователей с менее успешных или неоднозначных запросов (Nearby Queries) …
Google использует архитектуру нейронных сетей Encoder-Decoder для оценки того, насколько хорошо фрагмент текста отвечает на вопрос. Система включает отдельный компонент — Matching Vector Neural Network — который генерирует оценку качества …
Google анализирует исторические данные поиска и действия пользователей (например, клики на построение маршрута), чтобы понять, когда термин в запросе (например, «забегаловка») является синонимом формальной категории бизнеса (например, «ресторан»). Система использует …
Патент описывает технологию Google Autocomplete (Suggest). Система предсказывает финальный запрос на основе частично введенного текста, используя словари, составленные из популярных запросов сообщества. Предсказания ранжируются по популярности и персонализируются с учетом …
Анализ патента IBM (1999 г.), описывающего трехэтапную систему для определения тематически связанных терминов. Система анализирует совместную встречаемость терминов в метаданных гиперссылок (анкорах и окружающем тексте) по всему корпусу документов. Затем …
Google анализирует неструктурированный контент (веб-страницы, статьи), чтобы найти людей, которые часто упоминаются вместе (co-occurrence). На основе частоты и контекста этих упоминаний система вычисляет метрику связи (relationship metric) и предлагает пользователям …