2023

Яндекс патентует систему автоматического контроля качества поиска. Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей, и анализирует посты пользователей (например, скриншоты выдачи с комментариями об ошибках). Обнаруженные ошибки …
Яндекс патентует инфраструктурный метод оптимизации хранения и поиска документов. Система обучает нейросеть генерировать семантические векторы (эмбеддинги) так, чтобы их близость отражала релевантность. Документы с похожими векторами группируются в кластеры (шарды). …
Яндекс патентует метод повышения точности и эффективности сбора размеченных данных из краудсорсинговых сред, где качество и личность асессоров неизвестны (например, CAPTCHA). Система использует инкрементальную разметку: она запрашивает ответы до тех …
Яндекс патентует метод повышения качества данных, собираемых через краудсорсинг (например, Толока). Для задач с текстовыми ответами система конвертирует ответы в векторы, кластеризует их и использует оценки надежности (Quality Scores) асессоров …
Яндекс патентует систему контроля качества данных для электронных платформ. Система группирует идентичные товары от разных продавцов и отслеживает взаимодействие пользователей (например, клики). Если изменение характеристики (например, цены) вызывает аномальный всплеск …
Яндекс патентует метод повышения качества краудсорсинговой разметки данных (например, оценки релевантности SERP). Система автоматически выбирает минимальный набор прошлых задач, которые максимально покрывают весь спектр возможных оценок. Эти эталонные примеры показывают …
Яндекс патентует метод для персонализации товарных рекомендаций на e-commerce платформе. Система сначала определяет товары, которые часто покупают вместе (оценка взаимной популярности). Затем она ранжирует эти товары для конкретного пользователя, используя …
Яндекс патентует механизм для повышения точности распознавания интента в голосовых ассистентах (например, Алиса). Система использует несколько специализированных моделей (Сценариев), обученных на разных данных (например, такси, музыка, умный дом). При получении …
Патент описывает инфраструктурное решение Яндекса для рекомендательных систем (таких как Дзен). Система решает проблему согласованности версий пользовательских и контентных эмбеддингов во время обновления моделей. Для этого используется гибридное хранилище: эмбеддинги …
Яндекс патентует метод ранжирования задач для исполнителей (асессоров) на своей краудсорсинговой платформе (например, Яндекс.Задания). Система использует ML для балансировки между предпочтениями асессора (вероятность выбора задачи) и его навыками (вероятность точного …
Яндекс патентует метод обучения ML-модели для предсказания вероятности того, что пользователь увидит рекламное объявление (Visibility Score). Поскольку факт просмотра сложно зафиксировать, система использует данные о взаимодействиях (кликах или наведении курсора) …
Яндекс патентует инфраструктурный метод для управления обновлениями моделей машинного обучения в рекомендательных системах (например, Дзен). Метод решает проблему согласованности версий векторных представлений (эмбеддингов) пользователей и элементов контента. Система использует гибридное …
Это инфраструктурный патент Яндекса, описывающий метод оптимизации вычислительных ресурсов (CPU/GPU) при обработке нейросетями (включая Трансформеры и BERT) пакетов данных разной длины. Система минимизирует «пустые» вычисления (padding), интеллектуально группируя запросы схожей …
Яндекс патентует алгоритм для повышения эффективности работы своих нейросетей (таких как BERT, Трансформеры и т.д.) на аппаратном уровне (CPU/GPU). Поскольку нейросети обрабатывают запросы разной длины, а аппаратное обеспечение требует группировки …
Яндекс оптимизирует выполнение моделей глубокого обучения (используемых в поиске, переводе и т.д.) путем эффективного пакетирования входных данных (например, запросов или текстов документов). Поскольку входные данные имеют переменную длину и должны …