Яндекс патентует метод улучшения ранжирования, который анализирует, насколько семантически похожи друг на друга документы, уже отобранные в качестве кандидатов. Система вычисляет «базисный вектор» (смысловой центр выдачи) и использует близость каждого …
Ранжирование
Яндекс патентует метод интеграции блоков с похожими запросами (Suggests) непосредственно в основную выдачу. Чтобы ранжировать эти блоки наравне с обычными результатами, система рассчитывает метрику «Related Long Click». Она оценивает вероятность …
Яндекс патентует метод повышения эффективности и скорости поиска (семантическое шардирование). Система использует нейронную сеть (MLA/Dual-Encoder) для генерации семантических векторов документов и запросов, где близость векторов отражает релевантность. Документы кластеризуются на …
Яндекс патентует метод ранжирования свежего контента (например, картинок или видео) в 2D-сетке, по которому еще нет статистики. Система рассчитывает «Оценку Полезности» нового элемента, анализируя клики по нему (позитивный сигнал, Win) …
Яндекс использует трехуровневую систему машинного обучения для оптимизации смешивания (блендинга) вертикальных результатов (Колдунщиков) и органической выдачи. Система независимо прогнозирует CTR Колдунщика («Win») и CTR следующего за ним результата («Loss»). Третья …
Яндекс использует этот метод для формирования лент рекомендаций (например, в Дзене). Система анализирует, как часто и насколько высоко конкретная единица контента ранжируется моделью машинного обучения в ответ на тысячи различных …
Яндекс патентует метод кластеризации связанных изображений (например, с одной страницы или визуально похожих) в единый блок на странице результатов поиска (SERP). Позиция всей группы определяется рангом наилучшего изображения внутри нее. …
Яндекс патентует метод создания системы рекомендаций (например, Дзен). Система анализирует миллионы прошлых поисковых запросов и определяет, какие материалы из пула контента наиболее релевантны наибольшему количеству этих запросов. Материалы, которые чаще …
Яндекс патентует метод обучения ранжирующих моделей (например, CatBoost), позволяющий напрямую оптимизировать сложные метрики качества (NDCG, ERR), которые обычно не поддаются стандартным методам градиентного бустинга. Для этого в процессе обучения в …
Яндекс патентует способ эффективной обработки разнотипных данных (числовых и категориальных) для использования в древовидных моделях машинного обучения (вероятно, CatBoost). Система преобразует эти данные в единый хэшированный комплексный вектор. Это позволяет …
Яндекс использует метод двойного ранжирования для генерации поисковых подсказок на основе изображений. Система формирует два списка: один оптимизирован по частоте (популярности), а второй — по «скрытому параметру интереса» (высокой релевантности, …
Яндекс патентует метод генерации визуальных подсказок (image-based suggestions). Система использует два параллельных ранжирования: одно основано на частотности (популярности) запросов, а второе — на «скрытом интересе» (высокая релевантность независимо от частоты). …
Яндекс патентует метод для повышения чувствительности A/B тестирования при оценке изменений в поиске. Вместо анализа средних значений поведенческих метрик, система анализирует тренды вовлеченности пользователей во времени. Для этого используются дискретные …
Патент описывает ключевые механизмы алгоритма CatBoost, используемого Яндексом для ранжирования. Он раскрывает, как система преобразует категориальные признаки (например, регион, тип сайта, URL) в числовые значения. Для предотвращения переобучения используется метод …
Яндекс патентует метод оптимизации выбора признаков (факторов) для обучения ML-моделей (например, формулы ранжирования). Система использует Условную Взаимную Информацию (CMI) для оценки взаимодействия факторов. Цель — выбрать набор, который совместно дает …
Патент Яндекса, описывающий фундаментальную технику для обучения надежных моделей машинного обучения (в частности, CatBoost) путем предотвращения переобучения. Метод включает последовательную обработку обучающих данных и вычисление признаков (текстовых или векторных) с …
Яндекс патентует механизм ранжирования для рекомендательных систем (например, Яндекс.Дзен). Система балансирует показ персонализированного контента с необходимостью обеспечить гарантированное минимальное число показов для авторов платформы («нативный контент»). Для этого в ранжировании …
Яндекс патентует метод генерации лент рекомендаций (например, для Дзена). Система анализирует множество прошлых запросов пользователей и для каждого запроса формирует список релевантных материалов. Затем она агрегирует, как часто и на …
Яндекс подал заявку на патент нового метода обучения моделей на основе деревьев решений (таких как CatBoost) под названием Stochastic Gradient Langevin Boosting (SGLB). Этот метод позволяет эффективнее оптимизировать сложные (невыпуклые) …
Яндекс патентует метод для автоматического отбора наиболее ценных признаков (Feature Selection) при обучении моделей машинного обучения. Система итеративно оценивает каждый фактор не только по его индивидуальной силе, но и по …