Pengembangan Model Named Entity Recognition Untuk Pengenalan Entitas Pada Data Obat Indonesia
Abstract
Dalam beberapa tahun terakhir Named Entity Recognition (NER) menjadi teknik penting
dalam pengolahan ekstraksi informasi pada berbagai macam domain. Penelitian NER
dengan pendekatan deep learning menjadi state-of-the-art saat ini dan semakin terus
dikembangkan. Di bawah domain medis, penelitian ini bertujuan untuk mengekstrak entitas
produk obat, kandungan obat, dan komposisi obat yang digunakan sebagai kategori untuk
mengklasifikasikan entitas yang diekstraksi. Kontribusi utama penelitian ini terletak pada
pengembangan arsitektur model NER dan evaluasi model. Penelitian ini menggunakan data
obat indonesia sebagai objek penelitian dan metode yang digunakan adalah Convolutional
Neural Network–Bidirectional Gated Recurrent Unit (CNN-BiGRU). Pada arsitektur model,
CNN digunakan untuk mengektraksi fitur karakter pada tiap kata dan BiGRU digunakan
untuk menangkap informasi secara dua arah dengan tujuan mendapatkan konteks kata yang
lebih baik sehingga klasifikasi entitas lebih optimal. Pada proses pelatihan model dilakukan
dengan delapan hyperparameter berbeda untuk mendapatkan model terbaik. Berdasarkan
hasil pengujian, hasil akurasi terbaik didapatkan pada model dengan pengaturan
hyperparameter yaitu CNN kernel size adalah 7, CNN filter adalah 50, CNN layer adalah 1,
GRU unit adalah 200 dan GRU layer adalah 1. Dengan hasil akurasi yang didapatkan pada
F1-Score sebesar 87%. Pada hasil perbandingan menunjukkan bahwa model CNN-BiGRU
memiliki nilai training loss dan validation loss yang lebih rendah dibandingkan model CNNBiLSTM.
Pada training time menunjukkan proses pelatihan pada model CNN-BiGRU
memiliki training time lebih cepat dibandingkan model CNN-BiLSTM.