| dc.description.abstract | Kanker payudara memiliki heterogenitas molekuler yang tinggi sehingga
menyebabkan perbedaan respons pasien terhadap kemoterapi neoadjuvant. Oleh
karena itu, diperlukan metode klasifikasi yang akurat berbasis data ekspresi gen.
Penelitian ini bertujuan untuk mengimplementasikan metode Light Gradient
Boosting Machine (LightGBM) dalam mengklasifikasikan subtipe kanker payudara
menggunakan data microarray GSE231629.
Data yang digunakan merupakan data sekunder dari National Center for
Biotechnology Information (NCBI) dengan 109 sampel pasien kanker payudara
wanita berstatus ER-positif dan HER2-normal. Tahapan analisis meliputi pre-
processing menggunakan metode Robust Multi-array Average (RMA), filtering
gen, feature selection hingga diperoleh 40 gen terpilih, penanganan data tidak
seimbang menggunakan SMOTE, serta klasifikasi menggunakan LightGBM.
Evaluasi model dilakukan menggunakan confusion matrix dan ROC-AUC.
Hasil penelitian menunjukkan bahwa model LightGBM menghasilkan akurasi
sebesar 38,1% dengan nilai AUC keseluruhan 0,707. Nilai AUC tertinggi diperoleh
pada subtipe Basal-like sebesar 0,907. Selain itu, LightGBM mampu
mengidentifikasi gen penting seperti LMNA, RHBDL2, dan MKX yang
berkontribusi dalam proses klasifikasi. Hasil ini menunjukkan bahwa LightGBM
memiliki potensi dalam analisis data ekspresi gen kanker payudara. | en_US |