Klasifikasi Perkembangan Kanker Serviks menggunakan Support Vector Mechine (SVM) dengan SMOTE dan ADASYN (Studi Kasus : Perkembangan Kanker Serviks Pada Data GSE63514)
Abstract
Berdasarkan data tahun 2012 yang bersumber dari International Agency for
Research on Cancer salah satu jenis kanker yang paling banyak diderita perempuan
adalah kanker serviks. Setiap tahun sekitar setengah juta perempuan di seluruh
dunia didiagnosis menderita kanker serviks. Kanker serviks adalah kanker ganas
yang dimulai di leher rahim dengan pertumbuhan sel yang tidak teratur, dan sel
tersebut dapat menyerang organ biologis lainnya, baik dengan tumbuh langsung di
jaringan yang berdekatan atau dengan berpindah ke sel lain. Seiring dengan
kemajuan teknologi, dikembangkanlah bidang pengetahuan baru yaitu
Bioinformatika. Penerapan Bioinformatika adalah penggunaan metode komputasi,
matematika dan statistik untuk membantu memecahkan masalah biologis melalui
analisis data ekspresi gen. Penelitian ini menggunakan data klasifikasi Ekspresi
Gen perkembangan kanker serviks dengan kode series GSE63514. Dalam
penelitian ini dilakukan analisis klasifikasi dengan metode SVM. Data yang
digunakan terdapat ketidakseimbangan kelas data, untuk mengatasi permasalahan
tersebut dilakukan resampling dengan oversampling Synthetic Minority
Oversampling Technique (SMOTE) dan Adaptive Synthetic (ADASYN). Penelitian
ini menggunakan analisis klasifikasi metode SVM dengan 4 kernel yaitu kernel
linear, kernel polynomial, kernel sigmoid dan kernel RBF. Untuk mendapatkan
nilai akurasi terbaik dilakukanlah perbandingan antara nilai akurasi dari klasifikasi
SVM data tidak seimbang, SVM dengan oversampling SMOTE dan SVM dengan
oversampling ADASYN. Dari penelitian ini didapatkan akurasi tertinggi sebesar
92.31% yang merupakan nilai akurasi dari analisis klasifikasi menggunakan kernel
linier pada data yang tidak seimbang. Sedangkan klasifikasi SVM dengan SMOTE
memiliki peforma yang baik, dimana SVM dengan SMOTE memiliki nilai
sensitivitas yang tenggi sebesar 91.67% dan spesifisitas sebesar 95.83%. Dalam
penelitian ini juga dilakukan prediksi dengan membangkitkan data random dari
data set ekspresi gen perkembangan kanker serviks GSE63514, prediksi dilakukan
dengan kernel linier. Gen yang memilik nilai yang paling besar adalah gen
X1558501_at yaitu dengan bobot sebesar 0.023275656.
Collections
- Statistics [900]