Яндекс патентует метод улучшения обучения NLP-моделей (включая те, что используются в поиске). Метод модифицирует стандартный алгоритм токенизации (BPE), вводя элемент случайности (Dropout). Вместо одного фиксированного способа разделения слова на части …
Патенты Яндекс
Яндекс патентует метод для автоматического отбора наиболее ценных признаков (Feature Selection) при обучении моделей машинного обучения. Система итеративно оценивает каждый фактор не только по его индивидуальной силе, но и по …
Яндекс патентует метод обучения ML-моделей для рекомендательных систем, направленный на повышение эффективности и предотвращение переобучения. Система разделяет признаки на пользовательские (User-specific), вычисляемые в реальном времени, и общие (User-nonspecific), которые рассчитываются …
Яндекс патентует метод уточнения намерения пользователя в диалоговых системах (например, Алиса). Система учитывает не только текущий запрос, но и предыдущий, анализируя вероятность связи запроса с конкретным намерением и вероятность смены …
Яндекс патентует метод обучения чат-ботов, основанный на подходе Retrieval-Augmented Generation (RAG). Система использует модель семантического подобия для поиска факта, релевантного диалогу. Затем генеративная модель (LLM) обучается формировать ответ на основе …
Яндекс использует систему динамической оценки и фильтрации асессоров для повышения качества обучающих данных. Система не полагается на простое большинство голосов, а взвешивает ответы по текущему показателю качества (скиллу) асессора. Определив …
Яндекс патентует метод повышения качества краудсорсинговой разметки данных (например, оценки релевантности SERP). Система автоматически выбирает минимальный набор прошлых задач, которые максимально покрывают весь спектр возможных оценок. Эти эталонные примеры показывают …
Яндекс патентует метод повышения эффективности обучения алгоритмов коллаборативной фильтрации (например, в Яндекс.Дзен). Вместо случайной инициализации матриц при факторизации (ALS), система использует предварительно рассчитанные векторы контента (эмбеддинги, такие как word2vec или …
Яндекс патентует метод повышения эффективности краудсорсинговых задач (например, оценки качества поиска). Система одновременно отправляет задачу человеку-асессору и алгоритму машинного обучения (MLA). На основе их ответов и исторических оценок качества (Quality …
Патент описывает систему Яндекса для повышения качества данных, собираемых через краудсорсинг (например, Толока). Система использует два ML-алгоритма: первый устраняет субъективные искажения в оценках асессоров, а второй автоматически выбирает оптимальный набор …
Яндекс использует гибридную систему для выполнения задач оценки (например, классификации контента или оценки релевантности). Система одновременно запрашивает результат у человека-асессора и у алгоритма машинного обучения (MLA). На основе совпадения ответов …
Яндекс патентует функцию браузера, которая активируется, когда пользователь собирается покинуть страницу (например, кликает в адресную строку). Система анализирует только URL и заголовок (Title) текущей страницы, ищет совпадения в базах структурированных …
Яндекс патентует метод создания обучающих данных (Ground Truth) для ML-алгоритмов ранжирования. Вместо поиска «единственно верной» оценки релевантности система вычисляет распределение вероятных оценок, учитывая уровень экспертизы асессоров, их личные тенденции (Bias) …
Яндекс патентует метод повышения качества обучения ранжирующих моделей за счет обработки «зашумленных» (неточных или предвзятых) оценок релевантности. Система анализирует надежность и строгость каждого асессора или краудсорсера (например, из Толоки). Затем …
Яндекс патентует механизм гарантированного показа рекламы бренда в ответ на навигационный запрос, ведущий на сайт этого бренда. Система идентифицирует навигационный интент пользователя и искусственно завышает прогнозируемый CTR (Click-Through Rate) рекламного …
Патент Яндекса описывает механизм ранжирования для рекомендательных систем (например, Дзен). Система учитывает не только релевантность контента пользователю (Relevancy Parameter), но и обязательства платформы по минимальному количеству показов для авторов (Completion …
Яндекс патентует метод повышения качества данных, собираемых через краудсорсинг (например, Толока) для обучения ML-алгоритмов (включая ранжирование и Proxima). Система динамически корректирует оценки качества асессоров на основе взвешенного консенсуса, а не …
Яндекс патентует метод исправления опечаток в запросах, которые система видит впервые (проблема «холодного старта»). Если для нового запроса нет истории, система находит похожий редкий запрос в логах («приближенный запрос») и …
Яндекс патентует метод организации структурированных данных (например, объявлений) в иерархическое дерево для оптимизации поиска. Каждый уровень дерева соответствует атрибуту (например, Марка, Модель, Год). Листья дерева хранят агрегированную статистику (минимальная/максимальная цена, …
Яндекс патентует метод для интерпретации последовательных голосовых команд. Чтобы понять, уточняет ли пользователь предыдущий запрос или задает новый, система выполняет два фоновых "псевдопоиска": один по комбинации запросов, другой только по …