Яндекс патентует механизм для систем рекомендаций (например, Дзен), который определяет оптимальное соотношение (пропорции) различных типов контента (видео, статьи, картинки) для конкретного пользователя. Система сравнивает поведение пользователя (CTR, время просмотра) с …
2020
Яндекс патентует метод ранжирования «свежего» контента (Non-Native Items), по которому еще нет статистики, в 2D-выдаче (например, Яндекс Картинки). Система предсказывает «Оценку Полезности» (Usefulness Score), анализируя, как пользователи взаимодействуют с элементом …
Яндекс патентует метод создания общего многомерного пространства (эмбеддинга), объединяющего данные о поведении пользователей с характеристиками разнородного контента (текста и изображений). Система анализирует прошлую активность пользователя, векторизует ее, а затем совмещает …
Яндекс использует трехуровневую систему машинного обучения для оптимизации позиций вертикальных результатов (колдунщиков) в SERP. Отдельные модели независимо предсказывают вероятность клика по колдунщику ("Win") и по следующему за ним результату ("Loss"). …
Яндекс использует машинное обучение для оптимизации очереди сканирования. Система прогнозирует будущую долгосрочную популярность новой страницы и скорость угасания этой популярности, анализируя исторические данные похожих URL-структур (паттернов). На основе этого рассчитывается …
Яндекс патентует механизм для повышения качества рекомендаций (например, в Дзен) путем выявления и пессимизации кликбейта. Система сравнивает популярность источника контента внутри рекомендательной платформы с его популярностью в интернете в целом. …
Яндекс патентует метод оценки изменений в поиске через A/B тесты. Система объединяет метрики, показывающие направление изменений (хорошо/плохо, например, DAU), с метриками, чувствительными к малым изменениям (например, CTR). Это позволяет Яндексу …
Яндекс патентует метод улучшения распознавания речи (ASR), критически важный для голосового поиска и ассистентов (например, Алисы). Система использует многоступенчатое ранжирование гипотез, учитывая не только лингвистический контекст, но и акустические характеристики …
Яндекс использует историю браузера пользователя для определения его интересов и социально-демографических характеристик (возраст, пол, доход). Система анализирует посещенные URL, разбивает их на сессии, преобразует домены в векторы (используя модель типа …
Яндекс патентует метод глубокого анализа голосовых запросов для ассистентов (например, Алиса). Система учитывает не только распознанный текст (ЧТО сказано), но и акустические характеристики речи, такие как тон, темп и громкость …
Яндекс патентует метод автоматического выбора «срочных новостей» для отправки Push-уведомлений. Система рассчитывает «Оценку Значимости» новости, комбинируя два ключевых фактора: авторитетность источника (определяемую по объему его трафика, измеренного через сервисы Яндекса) …
Яндекс использует систему приоритизации (Triage Server) для управления индексацией. Сразу после сканирования страницы система предсказывает ее будущую полезность как «свежего» результата (Importance Score) на основе доступных разреженных данных. Если оценка …
Яндекс патентует метод оптимизации хранения и поиска документов (Semantic Sharding). Система использует машинное обучение (нейросеть) для генерации векторов документов и запросов так, чтобы их близость отражала релевантность. Документы с похожими …
Яндекс использует машинное обучение для анализа новостных статей и прогнозирования вероятности того, что пользователь захочет найти дополнительную информацию об упомянутых сущностях (людях, местах, событиях). Система анализирует исторические данные о поведении …
Яндекс патентует метод клиентской отрисовки объектов (POI) на картах, который определяет финальную видимость результатов локального поиска. Система использует ранг объекта и уровень масштабирования для назначения визуального стиля метки. Алгоритм разрешает …
Яндекс патентует метод исправления опечаток для запросов, которые система видит впервые («холодный старт»). Поскольку истории по новому запросу нет, система находит известный редкий запрос, максимально похожий по написанию, и использует …
Яндекс использует систему для определения оптимального соотношения типов контента (видео, статьи, изображения) в ленте рекомендаций для конкретного пользователя. Система сравнивает, насколько активно пользователь взаимодействует с определенным типом контента (CTR или …
Яндекс патентует метод автоматического улучшения классификаторов контента (например, фильтров SafeSearch). Если пользователи массово делятся примерами ошибок поиска (например, шокирующий контент в безопасном режиме), система обнаруживает связанный с этим всплеск трафика …
Яндекс патентует систему оптимизации рекламной выдачи. Система в реальном времени перебирает различные шаблоны (стенсилы) размещения рекламы, наполняет их наиболее ценными объявлениями (на основе ставок, CTR, релевантности) и выбирает тот шаблон, …
Яндекс патентует метод эффективного обучения системы исправления опечаток без ручной разметки данных. Система автоматически генерирует «реалистичные» и «нереалистичные» опечатки, анализируя частотность символов в логах запросов и физическое расположение клавиш. Затем …