Pemodelan Named Entity Recognition Pada Artikel Wisata Dengan Metode Bidirectional Long Short-Term Memory Dan Conditional Random Fields
Abstract
Pada proses perencanaan perjalanan wisata, calon wisatawan umumnya melakukan
pencarian destinasi wisata terlebih dahulu. Pencarian tersebut kerap kali dilakukan melalui
internet dengan bantuan mesin pencari, salah satu caranya adalah dengan membaca artikel yang
tersedia. Proses menemukan informasi yang relevan pada artikel-artikel tersebut adakalanya
membutuhkan waktu yang tidak sedikit karena harus membaca satu per satu artikel.
Named Entity Recognition (NER) dapat digunakan untuk mendeteksi entitas tertentu pada
suatu teks yang akan membantu pengguna untuk menemukan informasi yang diinginkan.
Tujuan penelitian ini adalah membuat pemodelan NER yang akan membantu dalam
pendeteksian tempat wisata di suatu artikel. Artikel yang digunakan adalah artikel berbahasa
Inggris dari internet. Terdapat 92 artikel yang sudah dikumpulkan dan dipecah menjadi
183.507 token kata. Token-token tersebut selanjutnya diberi label sesuai jenisnya masing-
masing. Tempat wisata akan digolongkan menjadi heritage, natural, dan purpose. Token selain
tempat wisata akan diberi label O (outside).
Penelitian ini menggunakan StratifiedKFold untuk membagi dataset, serta ekstraksi fitur
menggunakan word embedding dengan teknik Word2Vec, dan gabungan metode Bidirectional
Long Short-Term Memory (BiLSTM) dan Conditional Random Fields (CRF) pada
pemodelannya. Berdasarkan hasil yang diperoleh, model yang dihasilkan mampu mendeteksi
beberapa entitas tempat wisata, namun dalam pendeteksiannya masih ditemukan banyak
kesalahan. Dari beberapa skenario model yang diuji, rata-rata F1-Score tertinggi yang
dihasilkan sebesar 75,25%.
Collections
- Informatics Engineering [2170]