Яндекс патентует метод глубокого анализа голосовых запросов для ассистентов (например, Алиса). Система учитывает не только распознанный текст (ЧТО сказано), но и акустические характеристики речи, такие как тон, темп и громкость …
Интент пользователя
Яндекс патентует метод создания интерактивных карточек объектов на SERP. Система распознает разные аспекты (компоненты) объекта, например, «Биография» и «Фильмография». Она добавляет интерактивные фильтры (исполнительные элементы), позволяющие пользователю уточнить интент и …
Яндекс использует машинное обучение для анализа новостных статей и прогнозирования вероятности того, что пользователь захочет найти дополнительную информацию об упомянутых сущностях (людях, местах, событиях). Система анализирует исторические данные о поведении …
Яндекс патентует метод повышения разнообразия поисковых подсказок и связанных запросов. Система генерирует кандидатов и использует специальную модель (например, DSSM), чтобы предсказать, приведут ли два разных запроса к одинаковым результатам поиска …
Яндекс патентует систему для новостных агрегаторов, которая анализирует текст статьи и предсказывает вероятность того, что пользователь захочет найти дополнительную информацию об упомянутых объектах (людях, местах). Система обучается на исторических данных …
Яндекс использует метод для разрешения лексической неоднозначности (Word Sense Disambiguation). Система анализирует грамматическую структуру вокруг многозначного слова (омонима) и ищет однозначное слово, используемое в аналогичной структуре. Затем грамматическая роль (например, …
Яндекс патентует метод разрешения лексической многозначности (Word Sense Disambiguation), не требующий размеченных вручную корпусов. Система находит многозначное слово (омоним) и анализирует его грамматический контекст. Затем она ищет однозначное слово в …
Яндекс патентует метод фильтрации и дедупликации поисковых подсказок и связанных запросов. Система определяет схожесть двух запросов-кандидатов на основе степени пересечения их результатов поиска (SERP Similarity). Если две подсказки ведут на …
Яндекс патентует метод для улучшения понимания запросов в диалоговых системах (IPA), таких как голосовые помощники. Система решает проблему неоднозначных последующих запросов (например, «А в Лондоне?» после вопроса о погоде). Текущий …
Яндекс патентует метод улучшения поисковых подсказок (Autocomplete) с помощью машинного обучения (MLA). Система учится отличать термины, которые просто часто встречаются вместе (парная сочетаемость), от терминов, которые формируют осмысленный запрос в …
Яндекс патентует метод эффективной обработки синонимов в запросах, избегая «комбинаторного взрыва». Система использует двухэтапный процесс: нормализация (приведение слов к базовой форме/лексеме) и обобщение (замена лексем на самый популярный «основной синоним»). …
Яндекс патентует метод исправления опечаток для запросов, которые система видит впервые. Поскольку статистики для нового запроса нет, система находит похожий по написанию и также редкий запрос в истории (запрос-прокси). Исторические …
Патент описывает два метода генерации отрицательных обучающих примеров для моделей ранжирования. Яндекс строит граф связей между запросами и документами на основе поведения пользователей. Документы, находящиеся далеко в графе от исходного …
Яндекс патентует метод кластеризации поисковых подсказок (саджеста). Система анализирует исторические данные о том, в какие вертикали (например, Картинки или Видео) пользователи переходили после ввода определенных запросов. Если связь сильная, подсказка …
Яндекс патентует метод кластеризации поисковых подсказок (саджеста). Система анализирует, насколько подсказка релевантна определенному вертикальному поиску (например, Картинкам или Видео), основываясь на прошлом поведении пользователей. Если связь сильная, подсказки группируются под …
Яндекс патентует метод эффективного обучения системы исправления опечаток без ручной разметки данных. Система автоматически генерирует «реалистичные» и «нереалистичные» опечатки, анализируя частотность символов в логах запросов и физическое расположение клавиш. Затем …
Яндекс патентует систему для улучшения пользовательского опыта в новостных агрегаторах (например, Яндекс.Новости или Дзен). Система анализирует текст статьи и предсказывает вероятность того, что пользователь захочет искать дополнительную информацию об упомянутой …
Яндекс патентует метод предобработки текста BPE-Dropout для обучения NLP-моделей. Вместо стандартной детерминированной токенизации (BPE), система случайным образом пропускает некоторые шаги объединения символов в токены во время обучения. Это создает разные …
Яндекс патентует метод улучшения поисковых подсказок (саджеста) путем учета контекста немедленно предшествующего поиска. Ключевая особенность в том, что клиентское устройство (например, браузер) автоматически извлекает предыдущий запрос (например, из URL текущей …
Яндекс использует механизм для контроля содержания поисковых подсказок (Autocomplete). Если пользователь вводит слово из списка "потенциально запрещенных" (например, названия наркотиков, оскорбления), система применяет логику черных или белых списков для генерации …