Implementasi Metode Support Vector Machine dan Naïve Bayes pada Data Ekspresi Gen Microarray (Studi Kasus: Klasifikasi Data Ekspresi Gen Induced Sputum Pada Pasien Penderita Penyakit Asma GSE76262)
Abstract
Asma adalah penyakit yang terjadi karena adanya penyempitan saluran udara
karena infeksi atau peradangan. dikematian tahunan di seluruh dunia akibat asma
diperkirakan mencapai 250.000 jiwa, karena hal tersebut perlu dilakukan tindakan
pemeriksaan untuk pasien penderita penyakit asma dengan mengambil cairan lendir
pekat atau dahak pada penderita asma dengan menggunakan teknik yaitu induced
sputum atau penginduksian dahak. Teknik induksi sputum bertujuan untuk
mendapatkan sputum yang memadai dari saluran napas bawah. Pada penelitian ini
penginduksian sputum dilakukan pada pasien penderita asma kategori berat
(severe), sedang (moderate), dan healthy control. Digunakan cabang ilmu
bioinformatika dalam menganalisis permasalahan ini. Pada penelitian ini dilakukan
analisis klasifikasi pada data microarray hasil dari ekspresi gen pada pasien
penderita penyakit asma yang dilakukan penginduksian sputum dengan kode series
GSE76262. Digunakan metode SVM dan Naïve Bayes untuk melakukan klasifikasi
pada dataset yang digunakan. Diperoleh nilai akurasi untuk masing-masing metode
tersebut, dimana dengan metode SVM diperoleh nilai akurasi 78.57%, dan untuk
metode naïve bayes didaptkan nilai akurasi sebesar 71.43%. Dilakukan penanganan
imbalanced data dengan SMOTE, dan dianalisis kembali menggunakan metode
yang sama, sehingga diperoleh hasil klasifikasi berupa nilai akurasi untuk SVM
dengan SMOTE sebesar 98.25, dan untuk metode naïve bayes dengan SMOТЕ
sebesar 68.42%. Diketahui bahwa metode SVM dengan SMOTE merupakan
metode yang paling baik dalam mengklasifikasikan data ekspresi gen pada pasien
asma. Selain itu juga diperoleh nilai AUC dari metode terbaik yaitu SVM dengan
SMOTE, diperoleh nilai AUC sebesar 99.13%, nilai tersebut termasuk dalam
kategori excellent classifier atau metode tersebut merupakan metode yang sangat
baik dan akurat dalam melakukan klasifikasi.
Collections
- Statistics [1223]
