Named Entity Recognition Pada Resep Makanan Dengan Metode Bidirectional Long Short-Term Memory Dan Bidirectional Encoders Representations From Transformers
Abstract
Dalam kehidupan kita sehari-hari makanan merupkan hal yang sangat penting.
Resep Masakan merupakan panduan bagi seseorang dalam mengolah bahan makanan
menjadi hidangan yang dapat disajikan. Namun sebagian orang menanggap bagian
bahan dalam resep masakan tidak penting. Informasi bahan resep masakan sendiri
dapat membantu orang dalam beberapa skenario seperti estimasi biaya dalam belanja
dan estimasi nutrisi dalam makanan.
Named Entity Recognition (NER) dapat digunakan untuk menemukan informasi
penting yang diinginkan dengan lebih mudah dengan mendeteksi entitas pada suatu
teks. Tujuan penelitian ini adalah membuat model NER untuk membantu
mengidentifikasi entitas pada resep masakan dan mengetahui performa model yang
dibangun. Terdapat 3999 resep masakan yang didapatkan dari website Kaggle. Resep
yang terkumpul akan dipecah menjadi 196.696 token kata. Kemudian token- token
tersebut akan dilabeli sesuai dengan kategorinya, yaitu nama bahan makanan, bumbu
masakan dan alat. Selain kategori yang sudah disebutkan, maka token akan diberi label
O (outside).
Untuk mencapai tujuan penelitian, peneliti menggunakan lima langkah penelitian,
yaitu mengumpulkan dataset, preprocessing, ekstraksi fitur dengan word embedding
berupa Word2Vec, pemodelan NER, evaluasi dan deteksi entitas serta menggunakan
metode Bidirectional Long Short-Term Memory (BiLSTM) dan Bidirectional Encoder
Representaions from Transformers (BERT) pada pemodelannya. Dari hasil yang telah
diperoleh, model yang dihasilkan mampu memprediksi entitas dengan baik, yaitu
menghasilkan 77,9% untuk model BiLSTM dan 99,4% untuk model BERT. Namun,
masih ditemukan beberapa kesalahan dalam mendeteksi entitas, seperti misalnya
model masih salah dalam mengidentifikasi entitas yang harusnya dilabeli bahan tetapi
justru dilabeli bumbu. Dari skenario-skenario model yang telah diuji, diperoleh model
BERT yang memiliki rata-rata F1-Score tertinggi sebesar 94,4%, dibandingkan model
BiLSTM yang memiliki rata-rata F1-Score tertinggi sebesar 77,9%.
Collections
- Informatics Engineering [2148]