Analisis Pengaruh Metode Reduksi Dimensi Independent Principal Component Analysis (IPCA) pada Klasifikasi Data Ekspresi Gen Menggunakan Support Vector Machine (SVM) dan Naive Bayes Classifier (NBC) (Studi Kasus: Data Ekspresi Gen Kanker Payudara (GSE43837), Kanker Pankreas (GSE16515) dan Acute Myocardial Infarction (GSE48060))
Abstract
Teknologi microarray memungkinkan untuk mengamati beribu-ribu ekspresi
gen dalam waktu bersamaan. Namun data microarray memiliki dimensi yang
sangat besar yang akan berpengaruh terhadap performansi klasifikasi. Untuk
menyelesaikan masalah tersebut, maka digunakan Independent Principal
Component Analysis (IPCA) sebagai metode reduksi dimensi dan Support
Vector Machine (SVM) dan Naive Bayes Classifier (NBC) sebagai metode
klasifikasi. Data yang digunakan adalah data ekspresi gen dari kanker payudara,
kanker pankreas dan Acute Myocardial Infarction (AMI). Tujuan yang ingin
dicapai adalah untuk mengetahui pengaruh metode reduksi dimensi IPCA
terhadap klasifikasi data ekspresi gen menggunakan SVM dan NBC.
Berdasarkan hasil reduksi dimensi terhadap data ekspresi gen, dapat
disimpulkan bahwa 10 IPC pertama dapat menjelaskan lebih dari 60% dari total
variansi yang dapat mewakili sebagian besar set data asal. Hasil klasifikasi
SVM dan NBC berdasarkan jumlah fitur IPC dari ketiga set data memperoleh
rata-rata nilai akurasi sebesar 87,78% dan nilai AUC rata-rata sebesar 84,62%
yang menunjukkan bahwa model klasifikasi yang diperoleh merupakan
classifier yang baik (good claissifier).
Kata Kunci: Microarray, Kanker, Reduksi Dimensi, IPCA, Klasifikasi, SVM,
NBC
Collections
- Statistics [899]