2022

Яндекс использует механизм для корректировки оценки качества сайта, сравнивая ее с эталонным значением, ожидаемым для сайтов с аналогичным объемом трафика или уровнем лояльности. Если сайт показывает аномально высокие метрики качества …
Патент раскрывает ядро алгоритма CatBoost — основного метода машинного обучения Яндекса для ранжирования. Он описывает, как система преобразует категориальные признаки (например, URL, домен, регион) в числовые значения. Чтобы избежать переобучения …
Яндекс патентует систему автоматического создания «мета-признаков» для улучшения ранжирования. Эти признаки рассчитываются не изолированно для документа, а в контексте всей поисковой выдачи (SERP). Например, система оценивает значение фактора (скажем, CTR) …
Яндекс патентует метод персонализации отображения точек интереса (POI) на картах. Система анализирует историю взаимодействия пользователя со всеми сервисами Яндекса (Поиск, Такси, Еда, Музыка и т.д.), чтобы понять его предпочтения. POI …
Яндекс патентует метод обучения ранжирования (Learning to Rank) через анализ поведения пользователей в выдаче или ленте. Система определяет «Последний просмотренный элемент», с которым пользователь взаимодействовал перед уходом. Выбранные элементы получают …
Яндекс патентует систему для защиты от «флешмобов» и накрутки оценок (review bombing). Система анализирует аномальные всплески оценок и сравнивает историю браузера пользователей, оставивших эти оценки. Это позволяет выявить внешний веб-ресурс …
Яндекс патентует метод для рекомендательных систем (например, Дзен), который решает проблему смешивания разных поведенческих сигналов. Вместо использования одной модели для анализа всех взаимодействий (клики, время чтения, лайки), система применяет отдельные, …
Яндекс патентует метод учета визуального представления элементов на SERP (размер сниппета, позиция, расстояние от топа) при обучении ранжирования. Система корректирует оценку полезности элемента, учитывая, как его размер мог повлиять на …
Яндекс патентует метод борьбы с фальсификацией рейтингов организаций (например, в Картах или Поиске). Система строит граф связей между организациями на основе того, какие пользователи оценивали их одновременно. Выявляя плотные группы …
Яндекс патентует метод ранжирования и смешивания (Blending), который учитывает визуальный размер (высоту) и позицию элемента на странице выдачи для расчета его «оценки полезности». Система обучается предсказывать, насколько полезным будет элемент …
Яндекс патентует метод оценки важности новостных событий для push-уведомлений. Важность рассчитывается как произведение авторитетности источника (Source Weight), определяемой по его реальному трафику (логи браузеров, Метрика, клики из поиска), и свежести …
Яндекс патентует метод "Виртуального Ансамбля" для оценки уверенности моделей градиентного бустинга (например, CatBoost) в своих прогнозах. Вместо обучения нескольких моделей, система использует разные срезы (подпоследовательности деревьев) одной обученной модели и …
Яндекс патентует метод для быстрого расчета признаков релевантности, основанных на совместном вхождении и близости (proximity) слов запроса в документе. Система заранее сохраняет в индексе данные о позициях отдельных слов (запросо-независимые …
Яндекс патентует двухэтапную систему для персонализации рекомендаций товаров (например, в Яндекс.Маркете). Система сначала определяет товары, которые часто покупают вместе (на основе истории всех пользователей), а затем агрессивно переранжирует эти товары …
Яндекс патентует метод борьбы с накруткой поведенческих факторов (ПФ). Система анализирует историю посещений и строит граф связей между сайтами. Если пользователи массово посещают группу сайтов, которые не связаны ни тематически, …
Яндекс патентует систему для выравнивания качества сайта и объема его трафика. Система рассчитывает «Сырую оценку качества» на основе поведенческих метрик и сравнивает ее с «Эталонной оценкой», ожидаемой для данного уровня …
Яндекс патентует механизм обратной связи для корректировки ранжирования на основе соотношения качества сайта и объема его трафика. Система рассчитывает «Необработанную оценку качества» и сравнивает ее с эталонной кривой, показывающей ожидаемое …
Яндекс патентует эффективный метод расчета сложных текстовых факторов (близость слов запроса друг к другу, их совместное наличие в URL/заголовке) в момент выполнения поиска. Система использует предварительно сохраненные в индексе данные …
Яндекс патентует метод для систем рекомендаций (например, Дзен), позволяющий прогнозировать, как пользователи будут взаимодействовать с новым контентом, анализируя только его текст. Система обучает модель (Transfer Learning MLA) находить связь между …
Яндекс патентует метод повышения качества ранжирования за счет расчета сложных текстовых факторов в реальном времени. Система использует предварительно сохраненные данные о позициях отдельных слов (query-independent) для динамического вычисления факторов совместной …