Analisis Klasifikasi Data Ekspresi Gen GSE199135 menggunakan SVM (Support Vector Machine) dan Cart (Classification And Regression Tree) (Studi Kasus : Relevansi Klinis dari Reaktivitas Estrogen Pasien Kanker Payudara di RS Hokkaido)
Abstract
Kanker payudara adalah penyakit tidak menular yang menyerang wanita.
Beberapa faktor penyebabnya adalah pemecahan sel dan saluran ke jaringan
pendukung payudara. Kementerian Kesehatan (Kemenkes) menyatakan, angka
kanker payudara di Indonesia mencapai 42 orang per 100 ribu penduduk. Pasien
kanker payudara dengan keadaan premenopause biasanya memiliki prognosis yang
lebih buruk kurang terwaikili dalam uji klinis dibandingkan dengan wanita
postmenopause, dalam hal ini berpengaruh pada pengobatan terapi yang sesuai.
Seiring dengan perkembangan teknologi telah memunculkan kajian ilmu.
Bioinformatika berperan dalam bidang informasi klinis, identifikasi mutasi gen-gen
penyebab penyakit, terapi gen, dan pengobatan individual sesuai profil genetik
pasien. Pada penelitian ini dilakukan analisis klasifikasi pada sampel dengan
keadaan pre dan post menopause pada data ekspresi gen dengan series GSE199135,
dan menggunakan metode klasifikasi Support vector machine (SVM) dan CART.
Metode klasifikasi Support vector machine (SVM) dengan kernel linear mampu
mengklasifikasikan data dengan nilai akurasi tertinggi yaitu sebesar 86.95%.
Sedangkan, untuk metode klasifikasi CART mampu mengklasifikasikan dengan
nilai akurasi tertinggi 86.60%. Dilakukan penanganan imbalanced data
menggunakan Synthetic Minority Over-Sampling Technique (SMOTE), sehingga
diperoleh nilai akurasi untuk klasifikasi SVM dengan SMOTE sebesar 96.67% dan
nilai akurasi untuk klasifikasi CART dengan SMOTE sebesar 79.30%. Diperoleh
nilai AUC sebesar 96.4%. Sehingga, disimpulkan bahwa metode SVM dengan
SMOTE merupakan metode yang paling baik.
Collections
- Statistics [1223]
