Implementasi Metode SVM, MLP dan XGBoost pada Data Ekspresi Gen (Studi Kasus: Klasifikasi Data Ekspresi Gen Skeletal Muscle NGT, IGT dan Diabetes Melitus Tipe-2 GSE18732)
Abstract
Diabetes Melitus (DM) adalah penyakit yang berlangsung lama atau kronis yang ditandai dengan naiknya kadar gula (glucose) pada darah yang tinggi. Diabetes melitus diklasifikasikan menjadi diabetes melitus tipe 1 (DM tipe 1), diabetes melitus tipe 2 (DMT2), dan diabetes melitus yang terjadi pada saat kehamilan. Menurut organisasi kesehatan dunia World Health Organization (WHO), pada tahun 2000 terdapat 171 juta orang menderita diabetes melitus dan diprediksi akan mengalami peningkatan 2 kali lipat menjadi 366 juta jiwa pada tahun 2030. Berdasarkan data dari IDF 95% dari total penderita diabetes melitus merupakan penderita diabetes melitus tipe 2 (DMT2). Diabetes melitus tipe 2 merupakan penyakit metabolik dengan karakteristik hiperglikemia yang terjadi karena kelainan sekresi insulin, kerja insulin atau kedua-duanya. Berbeda dengan diabetes melitus tipe 1 yang disebabkan karena kerusakan pankreas sehingga tidak dapat cukup memproduksi insulin, penderita diabetes melitus tipe 2 biasanya disebabkan karena pola makan yang tidak sehat dan jarang berolahraga, sedangkan diabetes melitus tipe 1 biasanya menyerang anak-anak dikarenakan kelainan genetik sejak lahir. Seiring majunya perkembangan tekhnologi, kini telah berkembang suatu bidang ilmu baru yaitu bioinformatika. Salah satu implementasi dari bioinformatika adalah digunakannya metode-metode komputasi, matematika, dan statistika dalam membantu menyelesaikan permasalahan-permasalahan biologi melalu analisis data ekspresi gen. Pada penelitian ini dilakukan analisis klasifikasi pada data microarray hasil dari ekspresi gen pada sampel diabetes melitus tipe 2, Impaired Glucose Tolerance (IGT), dan sampel dengan kadar gula darah normal (NGT) dengan kode series GSE18732. Pada penelitian ini digunakan metode klasifikasi Support Vector Machine (SVM), Arsitektur Multilayer Perceptron (MLP), dan Xtreme Gradient Boosting (XGBoost) untuk menganalisis data tersebut. Hasil dari analisis yang dilakukan, didapatkan bahwa metode klasifikasi Support Vector Machine dengan menggunakan kernel Linear mampu mendapatkan nilai akurasi terbesar yaitu sebesar 91,30%. Sedangkan arsitektur Multilayer Perceptron dengan satu hidden layer dan 100 hidden node mampu mendapatkan nilai akurasi sebesar 78,26% dan metode klasifikasi terakhir Xtreme Gradient Boosting mampu mendapatkan nilai akurasi sebesar 71,39%.
Collections
- Statistics [854]