Патенты Яндекс

Яндекс патентует метод эффективного обновления поискового индекса, разделенного на части (шарды). Система классифицирует документы как «активные» (используемые в поиске) и «неактивные» (невостребованные). При обновлении приоритетно выбираются и перестраиваются те части …
Яндекс использует комбинированную систему фильтрации для контроля поисковых подсказок (Autocomplete). Система определяет, является ли вводимый термин «потенциально запрещенным». В зависимости от типа термина применяется либо логика «черного списка» (запрещать только …
Яндекс патентует метод повышения точности данных, получаемых от асессоров (например, в Толоке). Система идентифицирует «скрытые смещающие признаки» в задачах (например, позиция документа на экране, шрифт, дизайн), которые влияют на выбор …
Яндекс патентует метод создания общего многомерного пространства (эмбеддинга), объединяющего разнородные данные: тексты, изображения и историю активности пользователей. Это позволяет системе находить связи между разными типами контента на основе поведения (например, …
Яндекс патентует метод ранжирования задач на краудсорсинговых платформах (например, Толока). Система использует ограниченную оптимизацию: она максимизирует вероятность корректного выполнения задачи (удовлетворенность заказчика), сохраняя при этом удовлетворенность асессора на приемлемом уровне. …
Яндекс патентует инфраструктурный метод оптимизации хранения и поиска документов. Система обучает нейросеть генерировать семантические векторы (эмбеддинги) так, чтобы их близость отражала релевантность. Документы с похожими векторами группируются в кластеры (шарды). …
Яндекс патентует метод предобработки текста BPE-Dropout для обучения NLP-моделей. Вместо стандартной детерминированной токенизации (BPE), система случайным образом пропускает некоторые шаги объединения символов в токены во время обучения. Это создает разные …
Яндекс патентует клиентский метод управления отображением точек интереса (POI) на картах. Система определяет правила отрисовки: топовые результаты получают визуально значимые, детализированные метки, а остальные — упрощенные. При перемещении карты система …
Яндекс патентует метод решения проблемы «холодного старта» в рекомендательных системах (например, Дзен). Когда данных для персонализации нового пользователя недостаточно, система анализирует главные страницы доверенных ресурсов. Она предсказывает популярность контента исключительно …
Патент описывает метод обучения моделей машинного обучения (Ordered Boosting), лежащий в основе алгоритма CatBoost. Для предотвращения «утечки данных» и переобучения, система упорядочивает обучающие данные и при расчете качества прогноза использует …
Яндекс патентует метод улучшения поисковых подсказок (саджеста) путем учета контекста немедленно предшествующего поиска. Ключевая особенность в том, что клиентское устройство (например, браузер) автоматически извлекает предыдущий запрос (например, из URL текущей …
Яндекс использует механизм для контроля содержания поисковых подсказок (Autocomplete). Если пользователь вводит слово из списка "потенциально запрещенных" (например, названия наркотиков, оскорбления), система применяет логику черных или белых списков для генерации …
Яндекс патентует механизм создания динамического контекстного меню («Browser Contextual Assistant»). Когда пользователь выделяет текст или объект на странице, система отправляет его как запрос в различные поисковые вертикали (Карты, Картинки, Веб). …
Яндекс патентует метод для повышения чувствительности A/B тестирования при оценке изменений в поиске. Вместо анализа средних значений поведенческих метрик, система анализирует тренды вовлеченности пользователей во времени. Для этого используются дискретные …
Яндекс патентует метод встраивания текста в метаданные медиафайлов (изображений, видео, аудио) непосредственно в момент создания или редактирования контента. Если система «знает» текст (например, пользователь ввел аннотацию или система извлекла текст …
Яндекс патентует метод повышения точности и эффективности сбора размеченных данных из краудсорсинговых сред, где качество и личность асессоров неизвестны (например, CAPTCHA). Система использует инкрементальную разметку: она запрашивает ответы до тех …
Яндекс патентует систему для контроля качества работы исполнителей на краудсорсинговых платформах (например, асессоров). Вместо использования только статических оценок качества, система обучает модель машинного обучения (MLA) предсказывать вероятность ошибки для конкретного …
Яндекс патентует метод повышения качества данных, собираемых через краудсорсинг (например, Толока). Для задач с текстовыми ответами система конвертирует ответы в векторы, кластеризует их и использует оценки надежности (Quality Scores) асессоров …
Яндекс патентует статистический метод для повышения чувствительности A/B тестирования изменений в поиске. Вместо сравнения средних значений поведенческих метрик (например, Dwell Time), система анализирует полное распределение этих метрик. Это позволяет обнаруживать …
Яндекс патентует высокочувствительный метод для A/B тестирования, который анализирует полное распределение поведенческих метрик (например, времени на сайте), а не только их средние значения. Это позволяет Яндексу выявлять даже незначительные, но …