Яндекс использует многоуровневый подход для рекомендательных систем (Дзен). Он включает офлайн-квалификацию источников на основе их трафика и частоты обновлений (Source Suitability). В онлайн-режиме система работает в два этапа: сначала выбирает …
2019
Яндекс патентует метод автоматического создания обучающих выборок для систем компьютерного зрения без ручной разметки. Система анализирует логи поиска по картинкам и поведение пользователей (CTR). Запросы кластеризуются либо по текстовой близости, …
Яндекс патентует метод ранжирования свежего контента (например, картинок или видео) в 2D-сетке, по которому еще нет статистики. Система рассчитывает «Оценку Полезности» нового элемента, анализируя клики по нему (позитивный сигнал, Win) …
Яндекс патентует метод генерации обучающих данных для ML-алгоритмов (например, ранжирования или Proxima). Система отказывается от поиска единой «истинной метки» релевантности, признавая субъективность оценок. Вместо этого рассчитывается «Консенсусное распределение меток», учитывающее …
Яндекс патентует метод автоматического реферирования контента (текст, аудио, видео). Система сегментирует контент, оценивает «полезность» (Utility) каждого фрагмента и определяет смысловые зависимости (Linkage) между ними. В резюме (например, сниппет) включаются не …
Яндекс патентует метод для улучшения понимания запросов в диалоговых системах (IPA), таких как голосовые помощники. Система решает проблему неоднозначных последующих запросов (например, «А в Лондоне?» после вопроса о погоде). Текущий …
Яндекс патентует метод улучшения поисковых подсказок (Autocomplete) с помощью машинного обучения (MLA). Система учится отличать термины, которые просто часто встречаются вместе (парная сочетаемость), от терминов, которые формируют осмысленный запрос в …
Яндекс патентует механизм, который изменяет визуальное расположение результатов поиска в зависимости от устройства или приложения пользователя (например, десктоп или мобильное приложение). Система предсказывает, в каком порядке пользователи будут взаимодействовать с …
Яндекс патентует метод ускорения поиска по картинке (CBIR). Вместо индексации отдельных «визуальных слов» (Bag-of-Words), система использует «Составной параметр визуальных признаков» (VFCP). VFCP объединяет несколько визуальных слов и информацию об их …
Яндекс патентует метод исправления опечаток для запросов, которые система видит впервые. Поскольку статистики для нового запроса нет, система находит похожий по написанию и также редкий запрос в истории (запрос-прокси). Исторические …
Яндекс патентует метод решения проблемы «холодного старта» в рекомендательных системах (например, Дзен). Когда данных для персонализации нового пользователя недостаточно, система анализирует главные страницы доверенных ресурсов. Она предсказывает популярность контента исключительно …
Патент описывает метод обучения моделей машинного обучения (Ordered Boosting), лежащий в основе алгоритма CatBoost. Для предотвращения «утечки данных» и переобучения, система упорядочивает обучающие данные и при расчете качества прогноза использует …
Яндекс патентует метод для повышения чувствительности A/B тестирования при оценке изменений в поиске. Вместо анализа средних значений поведенческих метрик, система анализирует тренды вовлеченности пользователей во времени. Для этого используются дискретные …
Яндекс патентует статистический метод для повышения чувствительности A/B тестирования изменений в поиске. Вместо сравнения средних значений поведенческих метрик (например, Dwell Time), система анализирует полное распределение этих метрик. Это позволяет обнаруживать …
Яндекс патентует метод улучшения качества поисковых подсказок (автодополнения). Система обучается на истории запросов, разбивая их на части (n-граммы). Вместо того чтобы просто смотреть, как часто одно слово следует за другим …
Патент описывает клиентский алгоритм Яндекс.Карт для отрисовки меток организаций (POI). Система определяет визуальный стиль метки (детальный или упрощенный) на основе ранга организации, масштаба карты и плотности окружающих объектов. Алгоритм предотвращает …
Яндекс патентует механизм для управления контекстом в последовательном голосовом поиске. Система определяет, является ли вторая голосовая команда уточнением первой или новым поиском. Для этого сравнивается качество («относительный вес») выдачи по …
Яндекс патентует унифицированную систему для исправления ошибок ввода (опечаток и неправильной раскладки). Ключевая особенность — метод автоматического создания «реалистичных» ошибок на основе частотности слов и физического расположения клавиш. Эти данные …
Яндекс патентует метод выявления вредоносных сайтов путем анализа логов браузера и поисковой статистики. Система ищет сайты, которые автоматически открываются подозрительными программами при запуске браузера (неорганический трафик), но при этом имеют …
Яндекс патентует метод генерации лент рекомендаций (например, для Дзена). Система анализирует множество прошлых запросов пользователей и для каждого запроса формирует список релевантных материалов. Затем она агрегирует, как часто и на …