Яндекс патентует метод оптимизации точности систем бинарной классификации (например, спам/не спам, качественный/некачественный). Система использует "вложенные метрики" (например, Клики и Длинные клики) и итеративно подбирает оптимальные пороги срабатывания для каждой метрики. …
Поведенческие факторы
Яндекс патентует метод обнаружения искусственных (аномальных) посещений сайтов, направленных на манипуляцию ранжированием. Система строит граф посещений и ищет группы сайтов, которые посещаются одними и теми же пользователями, но при этом …
Яндекс патентует метод борьбы с накруткой поведенческих факторов (ПФ). Система анализирует историю посещений и строит граф связей между сайтами. Если пользователи массово посещают группу сайтов, которые не связаны ни тематически, …
Яндекс патентует систему для выравнивания качества сайта и объема его трафика. Система рассчитывает «Сырую оценку качества» на основе поведенческих метрик и сравнивает ее с «Эталонной оценкой», ожидаемой для данного уровня …
Яндекс патентует метод борьбы с накруткой поведенческих факторов (ПФ). Система строит граф посещений сайтов и ищет группы сайтов, которые посещаются одними и теми же пользователями, но не имеют естественной связи …
Яндекс патентует механизм обратной связи для корректировки ранжирования на основе соотношения качества сайта и объема его трафика. Система рассчитывает «Необработанную оценку качества» и сравнивает ее с эталонной кривой, показывающей ожидаемое …
Яндекс патентует метод обогащения инвертированного индекса данными о кликах. Если пользователи кликают на документ, в котором отсутствует одно из слов запроса (найденный по «правилу кворума»), система добавляет «клик-постинг» для этого …
Яндекс патентует механизм корректировки ранжирования, который использует базу данных исторических пар «запрос-документ» и их показателей полезности (например, CTR или оценки асессоров). Если текущая пара «запрос-документ» похожа на историческую пару с …
Яндекс патентует метод создания «Аннотированного Поискового Индекса». Система анализирует исторические поисковые сессии: если пользователь перешел на страницу, которая не содержит слов из исходного запроса, но провел на ней много времени …
Яндекс патентует механизм, который сравнивает фактическое качество сайта (Raw Quality Score), основанное на согласованности поведенческих метрик и лояльности пользователей, с эталонным качеством (Reference Score), ожидаемым для его уровня трафика. При …
Яндекс патентует метод для решения проблемы нехватки данных при ранжировании (проблема «холодного старта»). Если у документа отсутствует значение для важного признака (например, поведенческих данных) по текущему запросу, система находит похожие …
Яндекс патентует метод генерации (импутации) значений факторов ранжирования для пары запрос-документ, когда данные отсутствуют (проблема «холодного старта»). Если для текущего запроса у документа нет значения признака (например, поведенческих данных), система …
Яндекс патентует метод защиты от скоординированных манипуляций рейтингами («флешмобов» или ревью-бомбинга). Система обнаруживает аномальные всплески оценок и анализирует историю посещений пользователей, оставивших эти оценки. Сравнивая поведение «аномальной» группы с контрольной, …
Яндекс патентует алгоритм Freshness Browsing Rank (FBR), который динамически оценивает авторитетность страниц на основе истории просмотров пользователей. FBR учитывает дату создания контента и недавнюю активность посещений. Ключевой особенностью является механизм …
Яндекс использует историю поиска пользователя для персонализации агрегированной выдачи (блендинга). Система анализирует предпочтения пользователя между веб-сайтами и вертикальными сервисами (картинки, видео) на основе прошлых кликов и Dwell Time. Рассчитываются персональные …
Яндекс патентует метод защиты целостности рейтингов (например, на Маркете, Картах или Кинопоиске) от «флешмобов», вызванных внешними событиями (например, вирусным обзором блогера). Система обнаруживает аномальные всплески оценок, анализирует историю посещений пользователей, …
Яндекс патентует метод динамического определения и отображения уточнений запроса (SSQRs) на SERP. Система анализирует историю успешных («значимых») запросов и группирует их по схожести последующего поведения пользователей (клики по одним и …
Яндекс патентует метод ускорения A/B тестов. Система использует машинное обучение (Gradient Boosting) для прогнозирования будущего поведения пользователей на основе данных, собранных в начале эксперимента. Это позволяет быстрее оценить долгосрочный эффект …
Яндекс патентует метод для повышения точности оценки изменений в поиске (например, новых алгоритмов ранжирования). Система объединяет два типа метрик: интерпретируемые (показывающие направление изменения – лучше/хуже, например DAU) и чувствительные (показывающие …
Яндекс патентует гибридный метод для систем рекомендаций (таких как Яндекс.Дзен), который балансирует скорость и релевантность. Система заранее (офлайн) определяет набор общепопулярного контента. В момент запроса (онлайн) она быстро находит персонально …