Implementasi Metode Support Vector Machine Dan Random Forest Pada Data Ekspresi Gen Microarray (Studi Kasus : Novel Mutation Target Distinct Subgrups of Medulloblastoma in America)
Abstract
Medulloblastoma adalah kanker otak kecil yang tumbuh cepat pada bagian
belakang otak. Antara 250 hingga 500 anak-anak didiagnosis dengan
medulloblastoma setiap tahunnya. Lebih dari 70% terjadi pada anak-anak umur
dibawah 10 tahun. Kemungkinan perkembangan medulloblastoma berkurang
seiring bertambahnya usia. Medulloblastoma diklasifikasikan sebagai tumor
Grade IV yang mana tumor ini ganas dan tumbuh cepat. Ada empat subgrup yang
telah diidentifikasi, yaitu WNT, SHH, Group 3 dan Group 4. Subgrup WNT ini
sering menempati fourth ventricle (ruang yang berisi cairan di tengah fosssa
posterior), subgrup SHH terutama terletak di tubuh otak kecil dan sering terlihat
lateralisasi ke sisi organ, jika terdapat sinyal SHH tidak terkendali maka akan
menyebabkan kanker, untuk group 3 terletak di fourth ventricle dan saat
didiagnosa sudah menyebar ke area lain dari otak (metastasik), dan group 4 ini
mirip dengan group 3 dan WNT letaknya tetapi tidak metastasik dan lebih
agresif. Untuk mengetahui subgrup ini dapat menggunakan informasi biologis
dari pasien yaitu dengan menggunakan data ekspresi gen microarray, dimana
datanya berukuran sangat besar, menggunakan teknik klasifikasi data mining.
Metode klasifikasi yang akan digunakan untuk pemecahan masalah
medulloblastoma ini adalah Support Vector Machine (SVM) dan Random
Forest. Berdasarkan penelitian diperoleh nilai akurasi klasifikasi dari metode
SVM dengan kernel linear, polynomial dan sigmoid masing-masing adalah
90.92%,77.27%, dan 86.36%. akurasi dengan menggunakan metode Random
Forest adalah sebesar 90.92%. Nilai AUC SVM dan Random Forest yaitu
0.9754 atau 97.54%, dan dikategorikan sebagai excellent classification. Oleh
karena itu, dengan melihat hasil dari kedua metode sama dan dengan faktor
penyebab medulloblastoma masih sangat minim maka peneliti
merekomendasikan untuk menggunakan kedua metode yaitu SVM dan Random
Forest dalam klasifikasi data subgrup medulloblastoma.
Collections
- Statistics [899]