Implementasi Metode Support Vector Machine dan Discriminant Analysis pada Data Bioinformatika (Studi Kasus: Klasifikasi data Ekspresi Gen Esophageal Squamous cell Carcinoma Patients dengan kode series GSE161533)
Abstract
Kerongkongan atau yang biasa dikenal dengan nama esofagus adalah bagian
dari sistem pencernaan manusia. Tenggorokan atau esofagus ini berfungsi sebagai
saluran penghubung antara tenggorokan dan lambung yang bertugas untuk
menghantarkan makanan atau minuman yang masuk dari mulut menuju ke lambung.
Walaupun peran kerongkongan ini sangat penting didalam proses pencernaan, organ
ini juga memiliki resiko terkena berbagai macam penyakit seperti penyakit refluks
asam (GERD), radang esofagus (esophagitis), penyempitan esofagus (stenosis),
bahkan penyakit yang paling serius menginfeksi saluran pencernaan ini adalah kanker
esofagus. Kanker kerongkongan atau esofagus ini terbagi menjadi 2, yaitu kanker
karsinoma sel skuamosa dan kanker adenokarsinoma. Kanker ini bisa terjadi ketika sel
yang berada di dalam kerongkongan tersebut mengalami pertumbuhan yang awalnya
normal menjadi sel ganas dengan pertumbuhan yang tidak terkontrol sehingga akan
membentuk suatu tumor yang ganas di dalam tenggorokan. Di Indonesia jumlah kasus
kanker esofagus ini sekitar 1.327 jiwa jumlah kasus baru dengan tingkat kematian
1.283 jiwa. Tingkat kematian tertinggi yang diakibatkan dari kanker esofagus ini
terdapat di China, yakni sekitar 15 juta per tahun. Seiring berkembangnya teknologi
pada masa sekarang ini telah ditemukan ilmu baru yaitu Bioinformatika.
Bioinformatika ini bisa digunakan untuk menyelesaikan masalah biologis
menggunakan analisis data ekspresi gen. Pada masa sekarang ini juga sudah sangat
banyak penelitian yang menggunakan sistem klasifikasi untuk melakukan diagnosis
medis. Salah satu metode dari klasifikasi yang digunakan untuk penelitian ini adalah
metode Support Vector Machine (SVM) dan Discriminant Analysis. Pada penelitian
ini dilakukan analisis klasifikasi pada data microarray dengan sampel gen Esophageal
Squamous cell Carcinoma Patients yang dibentuk menjadi 3 kategori yaitu Normal Tissue (NT), Paratumor Tissue (PT) dan Tumor Tissue (TS). Hasil yang diperoleh dari
analisis yang dilakukan, didapatkan bahwa metode klasifikasi Support Vector Machine
(SVM) pada model kernel Linear mendapatkan nilai akurasi terbaik yaitu sebesar
76.47% dengan nilai AUC yang diperoleh adalah sebesar 87.78%, sedangkan pada
metode Discriminant Analysis tingkat akurasi yang diperoleh yaitu sebesar 64.78%.
Sehingga dapat disimpulkan bahwa hasil klasifikasi yang menggunakan metode
Support Vector Machine dengan model kernel linear merupakan suatu model
klasifikasi yang akurat untuk digunakan dalam proses mengklasifikasi.
Collections
- Statistics [1223]
