Google автоматизирует создание наборов "эталонных запросов" (ground truth) для категоризации пользовательского интента, используя большие языковые модели (LLM). Система генерирует разнообразные запросы, представляющие интерес к определенной категории (например, услуге), а затем …
2024
Анализ заявки на патент (Google является одним из заявителей), описывающей гибридную систему машинного обучения (SSRL) для улучшения рассуждений в Графе Знаний (KGR). Система сочетает Supervised Learning (SL) для обеспечения широкого …
Google использует Большие Языковые Модели (LLM) для автоматической генерации синтетических обучающих данных (Задачи, Запросы и Пассажи). Эти данные применяются для обучения универсальных моделей эмбеддингов методом "Instruction Tuning". Это позволяет поисковым …
Google обучает Большие Языковые Модели (LLM) для предсказания семантических обобщений («generalizations») публичных поисковых запросов. Эти обобщения преобразуются в «токены поиска» (retrieval tokens), которыми аннотируются запросы в базе данных. Это позволяет …
Google патентует метод «IR Adapter» для улучшения работы больших языковых моделей (LLM) в поиске без их полного переобучения. Этот метод позволяет адаптировать фиксированные или закрытые (black-box) LLM, модифицируя их выходные …
Google патентует архитектуру нейронного поиска (Contextualized Token Retriever или XTR), которая обеспечивает высокую точность за счет анализа взаимодействий на уровне отдельных токенов (как в моделях типа ColBERT), но радикально снижает …