Яндекс патентует метод выявления аномального трафика (накрутки ПФ) путем анализа истории посещений пользователей. Система строит граф, связывающий сайты, которые часто посещаются одними и теми же пользователями. Если группа сайтов сильно …
2021
Яндекс патентует метод обогащения ранжирования за счет использования похожих прошлых запросов. Система определяет схожесть запросов на основе пересечения результатов и поведенческих данных (для известных запросов) или на основе текстовой близости …
Яндекс патентует метод борьбы с фродом в рейтингах организаций (например, на Картах). Система строит граф связей между организациями на основе общих пользователей, которые их оценили. Алгоритм ищет плотные кластеры (клики), …
Яндекс патентует метод улучшения ранжирования в условиях нехватки данных. Если для пары «запрос-документ» отсутствует значение важного признака (например, CTR), система находит прошлые похожие запросы, по которым этот документ уже показывался …
Яндекс патентует метод персонализации отображения организаций (POI) на Картах. Система агрегирует данные о действиях пользователя в разных сервисах Яндекса (Почта, Такси, Навигатор, Браузер) для понимания его интересов. Используя машинное обучение …
Яндекс патентует метод защиты краудсорсинговых данных (отзывов, рейтингов) от внешних манипуляций, таких как «рейды» или накрутки. При обнаружении аномального всплеска оценок система анализирует историю посещений пользователей, оставивших эти оценки. Сравнивая …
Яндекс патентует метод борьбы с фейковыми отзывами путем анализа истории посещений пользователя. Система ищет в истории браузера URL-адреса, соответствующие страницам подтверждения транзакций (например, "Thank you page"). Для этого используются векторные …
Яндекс использует сессии, в которых пользователь переформулирует свой запрос, для автоматического создания негативных обучающих примеров. Если пользователь вводит новый запрос (Q2) сразу после предыдущего (Q1), система помечает результаты из первой …
Яндекс патентует метод автоматического создания высококачественных «негативных примеров» для обучения своих алгоритмов ранжирования. Система анализирует сессии, где пользователь уточняет свой запрос. Если пользователь переформулировал Запрос 1 в Запрос 2, система …
Яндекс патентует метод оптимизации поискового индекса в условиях ограниченных ресурсов. Система оценивает прогнозируемую или фактическую полезность документа (на основе поведения пользователей) и его размер. Используя модифицированный алгоритм LambdaMART, Яндекс ранжирует …
Яндекс патентует метод генерации высококачественных обучающих данных для алгоритмов машинного обучения (MLA), определяющих схожесть запросов по тексту. Система находит пары запросов, которые текстуально очень похожи (например, отличаются одним словом), но …
Яндекс патентует метод создания единого векторного пространства (User Item Space), объединяющего данные о поведении пользователей, текстовый контент и изображения. Система обучается понимать связь между разными типами контента (кросс-модальное отображение) на …
Яндекс патентует механизм борьбы с кликбейтом в рекомендательных системах (например, Дзен). Система сравнивает популярность источника контента внутри платформы с его популярностью в интернете в целом. Если источник аномально популярен внутри …
Яндекс патентует систему для быстрого вывода трендовых запросов в поисковые подсказки (саджест). Система решает проблему, когда новые популярные запросы проигрывают исторически частотным. Для этого Яндекс идентифицирует свежие запросы двумя способами: …
Яндекс патентует метод обнаружения искусственных (аномальных) посещений сайтов, направленных на манипуляцию ранжированием. Система строит граф посещений и ищет группы сайтов, которые посещаются одними и теми же пользователями, но при этом …
Яндекс патентует метод борьбы с накруткой поведенческих факторов (ПФ). Система строит граф посещений сайтов и ищет группы сайтов, которые посещаются одними и теми же пользователями, но не имеют естественной связи …
Яндекс патентует механизм корректировки ранжирования, который использует базу данных исторических пар «запрос-документ» и их показателей полезности (например, CTR или оценки асессоров). Если текущая пара «запрос-документ» похожа на историческую пару с …
Яндекс патентует метод борьбы с манипуляциями рейтингами организаций (например, в Картах или Поиске). Система строит граф связей между организациями на основе общих пользователей, которые их оценивали. Алгоритм ищет плотные группы …
Яндекс патентует метод защиты от скоординированных манипуляций рейтингами («флешмобов» или ревью-бомбинга). Система обнаруживает аномальные всплески оценок и анализирует историю посещений пользователей, оставивших эти оценки. Сравнивая поведение «аномальной» группы с контрольной, …
Яндекс патентует метод защиты целостности рейтингов (например, на Маркете, Картах или Кинопоиске) от «флешмобов», вызванных внешними событиями (например, вирусным обзором блогера). Система обнаруживает аномальные всплески оценок, анализирует историю посещений пользователей, …