Topic Modelling pada Sentimen terhadap Headline Berita Online Berbahasa Indonesia
Abstract
Media massa online adalah sumber informasi tercepat dan selalu menyajikan berita yang
bersifat up-to-date. Sebuah model dapat memberikan pemetaan yang membantu dalam
memilah informasi dengan lebih tepat. Pada penelitian ini, penulis menerapkan topic
modelling terhadap hasil sentiment analysis pada headline berita online berbahasa Indonesia.
Sumber data pada penelitian ini diperoleh dari media massa online berbahasa Indonesia.
Data yang terkumpul dianalisis sentimennya dengan menggunakan metode Long Short-term
Memory (LSTM), sehingga diperoleh tajuk-tajuk berita dengan sentimen positif, negatif, dan
netral. Klasifikasi yang diperoleh dari hasil proses sentimen analisis tersebut dilanjutkan
dengan proses pemodelan topik menggunakan metode Latent Dirichlet Allocation (LDA)
dan divisualisasikan dalam bentuk wordcloud dan intertopic distance map (pyLDAVis)
untuk mengetahui jarak antar topik dan keterkaitan satu topik dengan topik lainnya. Proses
analisis sentimen menghasilkan model dengan berbagai tingkat akurasi dan semua model
mengalami overfitted karena akurasi validasi lebih kecil dari akurasi pelatihan. Dengan
mempertimbangkan nilai overfitting yang kecil dan prosentase akurasi diatas 70% diketahui
model dengan nilai akurasi yang dipilih adalah model dengan nilai training accuracy
76.64%, validation accuracy 70.36%, dan overfitted 6.28%. Kecilnya akurasi yang diperoleh
pada model LSTM menyebabkan terjadinya bias pada hasil Topic Modelling. Dari sisi
prototyping, model yang dihasilkan dalam penelitian ini berhasil diimplementasikan dalam
sebuah prototype aplikasi berbasis web yang mampu melakukan proses pemodelan topik
pada hasil analisis sentimen terhadap headline berita Online berbahasa Indonesia.