Яндекс патентует методы генерации высококачественных негативных примеров для обучения алгоритмов ранжирования. Вместо случайных нерелевантных документов система использует графы поведения пользователей и анализ позиций в выдаче для поиска «сложных негативов» — …
2021
Яндекс патентует метод, который вводит контекст самой поисковой выдачи как фактор ранжирования. Система рассчитывает векторную близость (D2D proximity) между документами, попавшими в топ. Измеряется, насколько документ похож на "средний" документ …
Яндекс патентует метод улучшения ранжирования, который анализирует, насколько семантически похожи друг на друга документы, уже отобранные в качестве кандидатов. Система вычисляет «базисный вектор» (смысловой центр выдачи) и использует близость каждого …
Яндекс использует метод повышения точности распознавания речи (ASR), интегрируя глубокую персонализацию. Система анализирует не только акустику голоса, но и учитывает профиль интересов пользователя, историю поиска и браузера, возраст и пол. …
Яндекс патентует метод повышения эффективности и скорости поиска (семантическое шардирование). Система использует нейронную сеть (MLA/Dual-Encoder) для генерации семантических векторов документов и запросов, где близость векторов отражает релевантность. Документы кластеризуются на …
Яндекс патентует механизм для предотвращения появления нерелевантных результатов в топе выдачи, когда пользователь применяет сортировку (например, по цене в E-commerce). Система использует машинное обучение для предсказания, ухудшит ли конкретный объект …
Яндекс патентует метод "Learning to Select with Order" (LSO) для решения проблемы потери релевантности, когда пользователи сортируют результаты поиска по вторичному признаку (например, цене или дате). Вместо простого переупорядочивания система …
Яндекс патентует систему генерации интерактивных карточек объектов (Object Cards) в поисковой выдаче. Система определяет сущность в запросе, идентифицирует различные домены, к которым она относится (например, актриса и филантроп), и связанных …
Яндекс использует алгоритм для кластеризации документов (например, новостных статей), освещающих одну тему. Система рассчитывает «Обобщенную Метрику», основанную на том, насколько документы дополняют друг друга (Первая Метрика) и насколько они «разбавляют» …
Яндекс патентует метод повышения качества данных, используемых для обучения алгоритмов ранжирования (включая Proxima). Система анализирует оценки, полученные от краудсорсинговых асессоров (например, в Толоке), и выявляет когнитивные искажения, вызванные нерелевантными факторами …
Яндекс патентует метод обучения ранжирующих моделей (например, CatBoost), позволяющий напрямую оптимизировать сложные метрики качества (NDCG, ERR), которые обычно не поддаются стандартным методам градиентного бустинга. Для этого в процессе обучения в …
Яндекс патентует систему для новостных агрегаторов, которая анализирует текст статьи и предсказывает вероятность того, что пользователь захочет найти дополнительную информацию об упомянутых объектах (людях, местах). Система обучается на исторических данных …
Яндекс патентует математический метод для оценки результатов A/B тестов. Метод "линеаризации" преобразует сложные поведенческие метрики-отношения (например, клики на запрос) в более простую линейную форму. Это позволяет быстрее, точнее и с …
Яндекс использует машинное обучение для прогнозирования того, насколько интересной будет рекомендуемая статья пользователю (уровень уверенности). В зависимости от этого уровня уверенности система динамически выбирает, как именно отобразить рекомендацию в браузере …
Яндекс патентует гибридный метод оценки контента, объединяющий мнения людей-экспертов (асессоров) и алгоритмов машинного обучения (MLA). Система использует Байесовский подход для расчета уровня достоверности результата, учитывая историческую надежность каждого источника. Это …
Яндекс патентует метод автоматического улучшения своих классификаторов (например, SafeSearch). Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей. Если пользователи массово делятся результатом поиска как примером ошибки (например, шок-контент …
Яндекс использует алгоритм для группировки похожих документов (например, в Яндекс.Новостях), который оценивает качество кластера по двум метрикам: Когезия (насколько документы внутри похожи друг на друга) и Фокус (насколько тема сконцентрирована …
Яндекс патентует клиентский метод управления отображением точек интереса (POI) на картах. Система определяет правила отрисовки: топовые результаты получают визуально значимые, детализированные метки, а остальные — упрощенные. При перемещении карты система …
Яндекс патентует систему для контроля качества работы исполнителей на краудсорсинговых платформах (например, асессоров). Вместо использования только статических оценок качества, система обучает модель машинного обучения (MLA) предсказывать вероятность ошибки для конкретного …
Яндекс патентует метод создания профиля пользователя исключительно на основе истории его браузера (URL). Система анализирует, какие домены пользователь посещал в рамках одной сессии, и использует алгоритмы типа word2vec для определения …