Яндекс патентует метод улучшения поисковых подсказок (саджеста) для сериального контента. Система статистически вычисляет порог просмотра («Heart Beat»), после которого эпизод считается досмотренным, даже если пользователь не дошел до конца файла. …
Патенты Яндекс
Яндекс использует систему для ускорения идентификации почти дубликатов (near-duplicates) видео во время индексации. Вместо медленного сравнения содержания каждого видеофайла система сначала проверяет схожесть их продолжительности. Допустимая разница (variance parameter) динамически …
Яндекс патентует метод повышения качества данных для обучения ML-алгоритмов (например, ранжирования или Proxima). Система анализирует историческую эффективность асессоров и динамически формирует оптимальные группы для задач. Цель — максимизировать «метрику согласованности» …
Яндекс патентует систему персонализированных рекомендаций мобильных приложений. Система анализирует контекст пользователя (местоположение, время, данные сенсоров, историю поиска, используемые приложения) и характеристики приложений (категории, отзывы). На основе совпадения контекста и характеристик …
Яндекс патентует метод эффективного использования памяти в древовидных моделях ранжирования (например, CatBoost). Вместо выделения огромных массивов памяти для категориальных признаков с большим числом значений (URL, запросы, ключевые слова), система хеширует …
Яндекс патентует механизм для повышения точности распознавания интента в голосовых ассистентах (например, Алиса). Система использует несколько специализированных моделей (Сценариев), обученных на разных данных (например, такси, музыка, умный дом). При получении …
Яндекс патентует метод генерации текстовых подсказок (autocomplete) с учетом приложения, в котором пользователь вводит текст. Система создает векторные представления для введенного текста и для названия приложения (например, Карты или Мессенджер). …
Яндекс патентует метод повышения эффективности обучения алгоритмов рекомендаций контента (Collaborative Filtering). Вместо случайной инициализации система использует предварительно рассчитанные векторы контента (эмбеддинги). Это обеспечивает "теплый старт" для алгоритма факторизации (ALS), ускоряя …
Яндекс патентует метод обучения ML-моделей для рекомендательных систем (например, Дзен), решающий проблемы переобучения и вычислительной нагрузки. Система разделяет признаки на общие (User-nonspecific), которые рассчитываются офлайн и хранятся в «Снапшотах», и …
Яндекс патентует метод повышения качества и согласованности данных, получаемых от краудсорсинговых работников (асессоров). Система автоматически подбирает минимальный набор эталонных примеров из прошлых задач (например, оценки SERP). Эти примеры служат "анкорями" …
Яндекс патентует метод предобработки текста перед подачей в алгоритмы машинного обучения (например, YATI). Вместо стандартного разделения слов на фиксированные части (токены), система вносит элемент случайности, исключая некоторые возможные слияния токенов. …
Яндекс патентует метод для автоматического контроля качества ML-моделей ранжирования. Система ищет рассогласования, сравнивая входные данные модели (Векторы Свойств) и выходные данные (Оценки Релевантности) для пар документов. Если наблюдается аномалия (например, …
Яндекс патентует специфический математический метод для обучения моделей на основе Деревьев Принятия Решений (например, CatBoost/MatrixNet). Изобретение описывает функцию потерь (метрику точности), которая использует нелинейное логарифмическое взвешивание (log(N+1)) размера листа дерева. …
Патент Яндекса (от авторов CatBoost) описывает инфраструктурный метод обучения ML-моделей. Чтобы предотвратить переобучение (overfitting) и утечку целевой переменной (target leakage), обучающие примеры упорядочиваются. Признаки (текстовые или векторные) для каждого примера …
Яндекс патентует метод изменения интерфейса поисковой выдачи. Вместо того чтобы заменять SERP выбранным сайтом, система реорганизует выдачу (например, перемещает ее в левую колонку) и отображает выбранный сайт рядом (в правой …
Яндекс патентует статистический метод (линеаризацию) для улучшения оценки результатов A/B тестирования. Метод преобразует сложные метрики-отношения (например, CTR или клики на сессию) в линейную форму. Это повышает чувствительность оценки, позволяя быстрее …
Яндекс патентует метод оптимизации обучения систем рекомендаций (например, Дзен). Вместо случайной инициализации при матричном разложении (ALS), система использует заранее рассчитанные векторы (эмбеддинги) контента. Это обеспечивает «теплый старт», ускоряет сходимость алгоритма …
Яндекс патентует метод оптимизации рекламных кампаний в рекомендательных системах (например, Дзен). Система рассчитывает вероятность взаимодействия каждого пользователя с контентом, прогнозирует размер доступной аудитории и определяет минимальный порог вероятности. Реклама показывается …
Яндекс патентует метод для рекомендательных систем (например, Дзен), гарантирующий достижение заданных показателей продвижения (SLA). Система рассчитывает вероятность взаимодействия для каждого пользователя, прогнозирует общий трафик и определяет минимальный порог вероятности. Контент …
Яндекс патентует новый интерфейс для поисковых подсказок (саджеста). Вместо статического списка, подсказки представлены в виде прокручиваемой "карусели" или "колеса", которое пользователь перемещает относительно поля ввода. Это упрощает выбор и формирование …