Яндекс патентует метод повышения качества данных, собираемых через краудсорсинг (например, Толока) для обучения ML-алгоритмов (включая ранжирование и Proxima). Система динамически корректирует оценки качества асессоров на основе взвешенного консенсуса, а не …
2022
Яндекс патентует метод для систем рекомендаций (например, Яндекс.Дзен), гарантирующий рекламодателям достижение целей продвижения (например, X действий за Y времени). Система рассчитывает вероятность взаимодействия каждого пользователя с контентом, используя векторные представления. …
Яндекс патентует метод для показа результатов поиска (SERP) офлайн. На устройство загружается база популярных запросов. Для экономии памяти элементы SERP (заголовки, URL, сниппеты) дедуплицируются и хранятся один раз, а выдача …
Яндекс патентует метод повышения надежности и качества машинного обучения (в частности, CatBoost). Для борьбы с переобучением (overfitting) система намеренно вводит случайный шум в данные во время тренировки модели при оценке …
Яндекс патентует метод оптимизации производительности Progressive Web Applications (PWA). Система определяет общие статические элементы (шаблоны, скрипты), используемые на нескольких страницах (например, с общим префиксом URL), и сохраняет их в локальном …
Яндекс патентует метод повышения качества данных для обучения ML-алгоритмов (например, ранжирования или Proxima). Система анализирует историческую эффективность асессоров и динамически формирует оптимальные группы для задач. Цель — максимизировать «метрику согласованности» …
Патент Яндекса (от авторов CatBoost) описывает инфраструктурный метод обучения ML-моделей. Чтобы предотвратить переобучение (overfitting) и утечку целевой переменной (target leakage), обучающие примеры упорядочиваются. Признаки (текстовые или векторные) для каждого примера …
Яндекс патентует метод для эффективной и статистически надежной оценки новых факторов ранжирования (features) или новых обучающих данных (training samples). Вместо полной перетренировки модели, система оценивает влияние нового фактора на ошибку …
Яндекс патентует математический метод обучения алгоритмов ранжирования (например, CatBoost). Метод решает проблему оптимизации сложных метрик качества (NDCG, ERR), которые обычно не поддаются стандартным методам. Это достигается путем добавления искусственного шума …
Яндекс патентует инфраструктурный метод для обеспечения точности работы рекомендательных систем (например, Дзен) во время обновления моделей машинного обучения. Чтобы избежать ошибок при расчете релевантности, система гарантирует, что эмбеддинг пользователя и …
Патент описывает технический метод подготовки данных для обучения алгоритмов машинного обучения (например, CatBoost). Система упорядочивает обучающие примеры и генерирует признаки для каждого примера, используя информацию только из предшествующих данных. Это …
Патент Яндекса, описывающий сложный механизм аукциона для рекламных слотов (например, в Яндекс.Директ). Система использует итеративные раунды отбора с ограниченным и меняющимся составом участников. Ключевая особенность — алгоритм итеративной корректировки индивидуальных …
Патент описывает инфраструктурное решение для рекомендательных систем Яндекса. Он решает проблему рассинхронизации данных при обновлении векторных представлений (эмбеддингов) пользователей и контента. Система использует комбинацию распределенных и нераспределенных хранилищ с механизмом …