Семантика и интент

Google использует модель идентификации вакансий для преодоления ограничений поиска по ключевым словам в сфере трудоустройства. Система обучается на основе таксономии профессий, генерируя векторы для вакансий с использованием специализированных весовых коэффициентов …
Google применяет технологию разрешения кореференции для определения того, какие именные группы (например, имена, описания и местоимения) относятся к одной и той же сущности. Система обучает специализированные векторные представления (эмбеддинги), интегрируя …
Патент раскрывает механизмы, которые Google использует для понимания сложных запросов на естественном языке, включающих сущности и их отношения. Система переводит неоднозначные формулировки в точные структурированные запросы (например, SQL), анализируя все …
Google может определять, какую ТВ-программу или потоковое видео смотрит пользователь, сопоставляя его поисковые запросы с контентом, доступным в его локации в это же время. Если корреляция найдена, система модифицирует исходный …
Google идентифицирует «параллельные ресурсы» — высококачественные переводы или оригинальный контент на ту же тему на разных языках. Когда мультиязычный пользователь выполняет поиск, система определяет его предпочтительный язык и повышает в …
Система для обработки неоднозначных запросов путем идентификации различных значений (концепций) запроса и представления их в виде отдельных вкладок (Tabs). Внутри каждой вкладки похожие результаты группируются в "стеки" (Stacks) для уменьшения …
Google использует систему для распознавания запросов, связанных с медиа (фильмы, сериалы). Если запрос идентифицирован как медийный, система автоматически расширяет его, добавляя семантически связанные термины (например, похожие шоу, актеров, жанры), найденные …
Google классифицирует синонимы по степени надежности. Если синоним считается ненадежным или узкоконтекстным (Phrase-Restricted Substitute Term), он должен появиться в документе рядом с теми же соседними словами, что и в исходном …
Google анализирует контент страниц, ранжирующихся в топе по исходному запросу, чтобы понять его контекст. На основе этого контекста система находит похожие запросы из своей базы данных. Затем она фильтрует эти …
Google патентует метод улучшения ранжирования для сложных запросов. Вместо оценки одного лучшего пассажа система находит несколько релевантных предложений по всему документу, объединяет их в «извлекающую сводку» (Extractive Summary) и переранжирует …
Google использует данные окружающей среды (фоновый звук, изображения), чтобы понять контекст неоднозначных голосовых запросов. Если пользователь спрашивает "Кто это поет?", система анализирует фоновую музыку, идентифицирует песню и внутренне переформулирует запрос …
Google использует вероятностную генеративную модель для выявления концепций (кластеров связанных слов) в тексте. Этот патент описывает механизм автоматического улучшения этой модели путем слияния слишком похожих кластеров (например, «шутки про Джорджа …
Google использует механизм для определения порядка различных вертикалей (например, Музыка, Приложения, Книги) в смешанной выдаче. Чтобы избежать искажений из-за неравномерной популярности вертикалей, система анализирует результаты стандартного Веб-поиска (WWW-based corpus) по …
Google использует систему для дополнения прямых ответов контекстной информацией. Когда пользователь ищет факт о сущности (например, рост Барака Обамы), система не только предоставляет факт (6'1"), но и определяет его место …
Google использует систему для автоматического поиска и ассоциации запросов с релевантными страницами (например, для рекламы). Ключевой механизм — это сравнение двух векторов: "Вектора Намерения" (интент запроса во всем вебе) и …
Google использует итеративный алгоритм для анализа исторических логов запросов, чтобы вычислить «независимую от запроса оценку» (Query-Independent Score) для каждого слова или фразы. Эта оценка показывает, насколько вероятно сегмент является самостоятельным …
Google использует классификатор машинного обучения для идентификации "лонгридов" (In-Depth Articles), анализируя не длину или тематику, а стиль написания. Система использует глубокий NLP-анализ для извлечения лингвистических признаков, таких как структура предложений …
Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию …
Google использует этот механизм для разрешения неоднозначности запросов. Система генерирует несколько возможных интерпретаций (интентов) запроса и создает уточненные запросы для каждой из них. Затем она сравнивает, насколько результаты выдачи по …
Google использует модель глубокого обучения для анализа изображений, которая не только извлекает визуальные признаки (дескрипторы), но и оценивает их важность с помощью механизма внимания. Это позволяет системе фокусироваться на самых …