Klasifikasi Pertanyaan dari Direct Message dan Komentar Instagram Statistika UII berdasarkan Latent Dirichlet Allocation menggunakan Support Vector Machine
Abstract
Saat ini interaksi antara pengguna dan akun media sosial semakin penting
dalam lingkungan digital. Di prodi statistika UII akun Instagram menjadi salah satu
alat komunikasi dengan menerima pertanyaan-pertanyaan melalui Direct Message
(DM) dan komentar yang membutuhkan respon cepat dan tepat. Penggunaan
Instagram juga sebagai alat promosi dengan memiliki pertanyaan dari DM maupun
komentar yang antusias terhadap Prodi Statistika yang penting untuk digali
informasinya. Pertanyaan-pertanyaan yang terkumpul kemudian dijadikan sebagai
bahan tahapan insisasi pembuatan chatbot. Oleh karena itu, penelitian ini
menggunakan pendekatan LDA untuk mengidentifikasi topik-topik yang umum
muncul dalam pertanyaan-pertanyaan yang masuk. Metode ini memungkinkan
pengelompokan pertanyaan berdasarkan distribusi kata-kata yang muncul dalam
teks. Selanjutnya, SVM digunakan untuk membangun model klasifikasi yang dapat
membedakan kategori berdasarkan hasil dari pemodelan topik LDA yaitu PMB,
Akademik, Biaya, dan Grup Maba. Dari data pertanyaan yang didapatkan sebanyak
530 pertanyaan. Setelah mendapatkan hasil olah data menggunakan LDA,
diperoleh 5 topik salah satunya yaitu Program Magister di Statistika. Kemudian
pada klasifikasi, evaluasi didapat dari confusion matrix menunjukkan bahwa model
bekerja cukup baik yang didukung dari hasil perhitungan nilai accuracy sebesar
87,7%, precision sebesar 88%, recall sebesar 88%, dan F1-score sebesar 87%.
Untuk pengujian 20 pertanyaan baru diperoleh hasil menjawab tepat sebanyak 19
pertanyaan sesuai kategori.
Collections
- Statistics [904]