Prediksi Risiko Penyakit Jantung Menggunakan Random Forest dengan Pendekatan Interpretabilitas Shap (Shapley Additive Explanations) (Studi Kasus : Pasien di Rumah Sakit Zheen, Erbil, Irak periode Januari 2019 – Mei 2019)
Abstract
Penyakit jantung merupakan salah satu penyebab utama kematian di dunia,
termasuk di Indonesia. Serangan jantung dapat terjadi secara tiba-tiba, sering kali
tanpa gejala yang jelas, sehingga kewaspadaan dini sangat diperlukan. Penelitian
ini bertujuan untuk mengembangkan model prediksi risiko penyakit jantung
menggunakan algoritma Random Forest (RF) berdasarkan data medis pasien.
Dataset yang digunakan mencakup variabel seperti usia, jenis kelamin, detak
jantung, tekanan darah sistolik, tekanan darah diastolik, kadar gula darah, CK-MB,
dan troponin. Data diperoleh dari Rumah Sakit Zheen, Erbil, Irak, periode Januari
2019 hingga Mei 2019 dari website Mendeley Data. Model RF dibangun dengan
hyperparameter optimal dan dievaluasi menggunakan metrik F1-score untuk
mengukur akurasi prediksi. Selain itu, interpretabilitas model dilakukan
menggunakan teknik SHAP untuk memahami kontribusi variabel terhadap risiko
penyakit jantung. Hasil menunjukkan bahwa model RF pada data SMOTE
memberikan performa terbaik dengan F1-score sebesar 99,69% pada pelatihan,
99,28% pada validasi, dan 99,39% pada pengujian. Peningkatan ini menunjukkan
kemampuan model dalam mengenali pola dari data minoritas dan menghasilkan
prediksi yang lebih seimbang. Nilai ini menunjukkan bahwa model sangat akurat
dan seimbang dalam melakukan prediksi. Selain itu, fitur Troponin, CK-MB, dan
Usia terbukti memberikan pengaruh paling besar dalam menentukan risiko
penyakit jantung, sementara fitur lain seperti tekanan darah, detak jantung, kadar
gula darah, dan jenis kelamin memiliki kontribusi yang lebih kecil terhadap hasil
prediksi.
Collections
- Statistics [1223]
