Pembuatan Model Klasifikasi Teks Dengan BERT dan GRU untuk Pengkodean ICD-10 Diagnosis Utama Penyakit pada Proses Klaim BPJS di RSUP Persahabatan
Abstract
Peran rumah sakit tidak hanya pada pelayanan kesehatan, tetapi juga sebagai tulang
punggung sistem kesehatan dunia. Kemampuan rumah sakit untuk tetap berkelanjutan secara
finansial sangat terkait dengan kemampuannya mengelola klaim asuransi. Pembayaran
klaim asuransi BPJS didasarkan pada pengelompokan diagnosis penyakit dan prosedur, dan
ini sangat dipengaruhi oleh hasil dari kodefikasi (koding). Ketepatan koding ini, akan
menentukan pengelompokan penagihan.
Aspek teknis yang menjadi fokus penelitian ini adalah pada penanganan kegiatan
kodefikasi oleh tim rekam medis. Dari sudut pandang sains data, hal ini merupakan
implementasi dari teknik klasifikasi teks. Sehingga dapat diangkat rumusan masalah yaitu,
bagaimana membangun model untuk melakukan kodefikasi teks diagnosis kedalam kode
ICD-10. Model memfokuskan pada 8 kelas teks (label) urutan teratas, yaitu kelompok yang
diidentifikasi memiliki performa klasifikasi diatas 50% pada eksperimen awalan yang
melibatkan 24 kelas. Sedangkan kelas dengan performa dibawah 50% secara sengaja diberi
kode baru sebagai NN. Metode yang dipilih untuk klasifikasi teks ini, adalah dengan
menggunakan arsitektur BERT dan BiGRU yang dikenal sangat efektif untuk pengolahan
data sequensial. Lapisan awal dari arsitektur ini berupa BERT untuk memperoleh vektor
word embedding yang kontekstual. Diatasnya ditambahkan lapisan BiGRU mengektraksi
fitur sepanjang teks dan dapat dikelompokkan sesuai labelnya.
Model yang dikembangkan menunjukkan performa yang baik, precision 82,18%,
dan recall 81,59%, F1-score 82,66%, dan akurasi 81,92%, yang menandakan efektivitasnya
dalam mengklasifikasikan teks diagnosis. Namun, beberapa hasil masih dipengaruhi oleh
ketidakseimbangan kelas, label yang tidak konsisten, serta tumpang tindih fitur pada kelas
gabungan. Temuan ini menekankan pentingnya peningkatan kualitas data, serta membuka
potensi eksplorasi lanjutan untuk lebih meningkatkan performa model.
Collections
- Master of Informatics [361]
