Analisis Performa Teknik Resampling untuk Mengatasi Ketidakseimbangan Data Latih pada Model Deteksi Intrusi Jaringan
Abstract
Pesatnya perkembangan koneksi jaringan menyebabkan peningkatan aktivitas pada lalu
lintas jaringan. Lonjakan tersebut menimbulkan tantangan baru di dunia maya sehingga rentan
terhadap serangan siber. Untuk mengatasi tantangan ini, para peneliti telah beralih ke teknik
cerdas seperti machine learning untuk meningkatkan kualitas deteksi serangan pada lalu lintas
jaringan. Namun, muncul fenomena yang dikenal sebagai ketidakseimbangan data. Salah satu
penyebab terjadinya fenomena ini adalah distribusi kelas yang tidak merata, di mana dalam
kasus deteksi intrusi jaringan terjadi ketidakseimbangan antarkelas serangan, yang membuat
performa klasifikasi dari model machine learning menjadi kurang optimal. Untuk mengatasi
ketidakseimbangan kelas pada data, dapat digunakan teknik resampling. Terdapat berbagai
teknik resampling yang dapat digunakan, sehingga diperlukan analisis terhadap teknik
resampling yang digunakan. Pada penelitian ini, digunakan berbagai teknik resampling seperti
ADASYN, Borderline SMOTE, Random Oversampling, Random Undersampling, SMOTE,
SMOTE-Tomek, SVM-SMOTE, dan Tomek Links. Penelitian ini menggunakan dataset
UNSW-NB15 untuk melatih dan menguji beberapa macam model Network Intrusion
Detection, di antaranya adalah model dengan algoritma Decision Tree, Random Forest,
Gradient Boosting, XGBoost, dan 1D-CNN. Berdasarkan hasil analisis yang telah dilakukan,
ditemukan bahwa penerapan teknik resampling terbukti memengaruhi performa dari model
machine learning dan deep learning. Performa terbaik didapatkan dari penerapan teknik Tomek
Links pada model 1D-CNN dengan skor akurasi 75.27%, skor presisi 87.58%, dan F1-score
76.22%. Sementara itu, skor recall terbaik didapatkan dari model 1D-CNN tanpa resampling,
yaitu dengan skor recall sebesar 67.57%. Hasil penelitian ini diharapkan dapat memberikan
pengetahuan yang dapat membantu peneliti dan engineer untuk mengetahui kelebihan dan
kekurangan teknik resampling yang akan digunakan dalam pengembangan model deteksi jenis
serangan pada lalu lintas jaringan.
Collections
- Informatics Engineering [2154]