Яндекс патентует механизм, который сравнивает фактическое качество сайта (Raw Quality Score), основанное на согласованности поведенческих метрик и лояльности пользователей, с эталонным качеством (Reference Score), ожидаемым для его уровня трафика. При …
Холодный старт
Яндекс патентует метод обогащения ранжирования за счет использования похожих прошлых запросов. Система определяет схожесть запросов двумя способами: на основе пересечения результатов и поведенческих данных (для известных запросов) или на основе …
Яндекс патентует метод генерации (импутации) значений факторов ранжирования для пары запрос-документ, когда данные отсутствуют (проблема «холодного старта»). Если для текущего запроса у документа нет значения признака (например, поведенческих данных), система …
Яндекс патентует метод для решения проблемы нехватки данных при ранжировании (проблема «холодного старта»). Если у документа отсутствует значение для важного признака (например, поведенческих данных) по текущему запросу, система находит похожие …
Яндекс патентует метод для систем рекомендаций (например, Дзен), позволяющий прогнозировать, как пользователи будут взаимодействовать с новым контентом, анализируя только его текст. Система обучает модель (Transfer Learning MLA) находить связь между …
Яндекс использует систему для оптимизации графиков сканирования, прогнозируя как долгосрочную популярность нового URL, так и скорость угасания этой популярности (краткосрочный интерес). Рассчитывая «Параметр выгоды от сканирования» на основе этих прогнозов, …
Яндекс патентует метод оптимизации очереди сканирования. Система прогнозирует не только общую будущую популярность новой страницы, но и то, как быстро эта популярность будет снижаться. Используя машинное обучение, обученное на исторических …
Яндекс патентует метод ранжирования «свежего» контента (Non-Native Items), по которому еще нет статистики, в 2D-выдаче (например, Яндекс Картинки). Система предсказывает «Оценку Полезности» (Usefulness Score), анализируя, как пользователи взаимодействуют с элементом …
Яндекс патентует метод создания общего многомерного пространства (эмбеддинга), объединяющего данные о поведении пользователей с характеристиками разнородного контента (текста и изображений). Система анализирует прошлую активность пользователя, векторизует ее, а затем совмещает …
Яндекс использует машинное обучение для оптимизации очереди сканирования. Система прогнозирует будущую долгосрочную популярность новой страницы и скорость угасания этой популярности, анализируя исторические данные похожих URL-структур (паттернов). На основе этого рассчитывается …
Этот патент описывает ключевые механизмы алгоритма CatBoost, ядра машинного обучения Яндекса. Он раскрывает, как система эффективно преобразует категориальные (нечисловые) факторы ранжирования, такие как регион, тип сайта или URL, в числовые …
Яндекс разрабатывает систему для глубокого понимания контента (текста и изображений) путем анализа того, как пользователи взаимодействуют с ним. Система создает единое векторное пространство (User Item Space), где поведенческие паттерны (в …
Яндекс использует Transfer Learning для решения проблемы «холодного старта» в рекомендательных системах (например, Дзен). Когда у нового контента мало взаимодействий, система не может применить коллаборативную фильтрацию. Патент описывает, как Яндекс …
Яндекс патентует метод улучшения ранжирования, который анализирует, насколько семантически похожи друг на друга документы, уже отобранные в качестве кандидатов. Система вычисляет «базисный вектор» (смысловой центр выдачи) и использует близость каждого …
Яндекс использует многоуровневый подход для рекомендательных систем (Дзен). Он включает офлайн-квалификацию источников на основе их трафика и частоты обновлений (Source Suitability). В онлайн-режиме система работает в два этапа: сначала выбирает …
Яндекс патентует метод ранжирования свежего контента (например, картинок или видео) в 2D-сетке, по которому еще нет статистики. Система рассчитывает «Оценку Полезности» нового элемента, анализируя клики по нему (позитивный сигнал, Win) …
Яндекс использует этот метод для формирования лент рекомендаций (например, в Дзене). Система анализирует, как часто и насколько высоко конкретная единица контента ранжируется моделью машинного обучения в ответ на тысячи различных …
Яндекс патентует метод повышения качества обучающих данных (Training Data) для алгоритмов машинного обучения (MLA), генерируемых через краудсорсинг. Система решает проблему «холодного старта», прогнозируя эффективность асессора для нового типа задач на …
Патент Яндекса описывает систему ранжирования задач на краудсорсинговой платформе (например, Толока) для асессоров. Система балансирует между предпочтениями асессоров и необходимостью получить точные ответы, особенно для новых или непопулярных задач. Это …
Яндекс патентует метод исправления опечаток для запросов, которые система видит впервые («холодный старт»). Поскольку истории по новому запросу нет, система находит известный редкий запрос, максимально похожий по написанию, и использует …