Антиспам

Яндекс патентует метод защиты целостности рейтингов (например, на Маркете, Картах или Кинопоиске) от «флешмобов», вызванных внешними событиями (например, вирусным обзором блогера). Система обнаруживает аномальные всплески оценок, анализирует историю посещений пользователей, …
Яндекс патентует антифрод-механизм, нацеленный на потенциально мошеннические коммерческие ресурсы. Система намеренно повышает, а затем понижает позиции сайта в выдаче в разные промежутки времени, используя случайные значения. Цель — создать резкие …
Яндекс патентует метод борьбы с мошенничеством путем манипулирования ранжированием подозрительных коммерческих сайтов. Система периодически повышает и понижает эти сайты в выдаче, используя случайные значения. Цель — создать сильные колебания трафика …
Яндекс использует систему для временного повышения и понижения позиций определенных сайтов (часто коммерческих, не являющихся высококачественными или высокотрафиковыми). Цель — создать максимальную разницу в трафике между этими периодами. Это позволяет …
Яндекс патентует метод выявления вредоносных или нежелательных сайтов путем анализа логов браузера и истории поиска. Система отслеживает подозрительные автоматические открытия сайтов (не инициированные пользователем) и сравнивает их частоту с популярностью …
Яндекс патентует систему для борьбы с накруткой отзывов. Система строит граф связей между организациями на основе общих рецензентов. Если группа организаций тесно связана (образует «клику») и распределение их оценок аномально …
Яндекс патентует метод для точной настройки порогов срабатывания в системах бинарной классификации (например, Спам/Не спам, Качественный/Некачественный), которые используют «вложенные метрики». Вложенные метрики основаны на взаимосвязанных событиях, таких как «Клики» и …
Яндекс применяет систему фильтрации поисковых подсказок (Autocomplete) для удаления нежелательного контента. Если введенный запрос определяется как «потенциально запрещенный», система использует одну из двух логик: блокировку только специфических негативных продолжений (Черный …
Яндекс патентует метод выявления вредоносных сайтов путем анализа несоответствия между подозрительным автоматизированным трафиком и органической популярностью в поиске. Система анализирует логи браузеров, выявляя автоматические запуски сайтов неизвестными программами («первый запуск»). …
Яндекс патентует метод автоматического улучшения своих классификаторов (например, SafeSearch). Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей. Если пользователи массово делятся результатом поиска как примером ошибки (например, шок-контент …
Яндекс патентует систему автоматического контроля качества поиска. Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей, и анализирует посты пользователей (например, скриншоты выдачи с комментариями об ошибках). Обнаруженные ошибки …
Яндекс использует комбинированную систему фильтрации для контроля поисковых подсказок (Autocomplete). Система определяет, является ли вводимый термин «потенциально запрещенным». В зависимости от типа термина применяется либо логика «черного списка» (запрещать только …
Патент описывает метод обучения моделей машинного обучения (Ordered Boosting), лежащий в основе алгоритма CatBoost. Для предотвращения «утечки данных» и переобучения, система упорядочивает обучающие данные и при расчете качества прогноза использует …
Яндекс использует механизм для контроля содержания поисковых подсказок (Autocomplete). Если пользователь вводит слово из списка "потенциально запрещенных" (например, названия наркотиков, оскорбления), система применяет логику черных или белых списков для генерации …
Яндекс патентует двухэтапный метод идентификации аудиодорожек. Система создает короткие и длинные аудио-отпечатки (Chromaprints). Сначала выполняется быстрый поиск кандидатов по коротким отпечаткам с использованием специального индекса (Pruning Index). Затем проводится детальная …
Яндекс патентует метод для оптимизации порогов срабатывания в системах бинарной классификации (например, спам/не спам, релевантный/нерелевантный), которые используют несколько «вложенных» метрик одновременно. Метод позволяет итеративно подобрать оптимальную комбинацию порогов для всех …
Патент описывает ключевые механизмы алгоритма CatBoost, используемого Яндексом для ранжирования. Он раскрывает, как система преобразует категориальные признаки (например, регион, тип сайта, URL) в числовые значения. Для предотвращения переобучения используется метод …
Патент Яндекса, описывающий фундаментальную технику для обучения надежных моделей машинного обучения (в частности, CatBoost) путем предотвращения переобучения. Метод включает последовательную обработку обучающих данных и вычисление признаков (текстовых или векторных) с …
Яндекс патентует метод выявления вредоносных сайтов путем анализа логов браузера и поисковой статистики. Система ищет сайты, которые автоматически открываются подозрительными программами при запуске браузера (неорганический трафик), но при этом имеют …
Яндекс патентует систему для фильтрации поисковых подсказок (Автокомплит) с целью блокировки оскорбительного или нелегального контента. Система использует контекстную логику с двумя режимами: для одних слов подсказки разрешены по умолчанию и …