Identifikasi Konten Negatif Pada Twitter Dengan Deep Learning
Abstract
Media sosial telah menjadi media komunikasi antara satu pengguna dengan
pengguna lainnya, salah satunya Twitter. Namun, tidak semua orang yang
menggunakan Twitter dengan benar dan bijak. Banyak orang Indonesia yang
menulis kata-kata berbau SARA (suku, agama, ras, dan antargolongan), atau
mengeluarkan kalimat yang tidak pantas dan menyinggung seperti menulis nama
binatang, alat kelamin, dan lain-lain. Oleh karena itu, perlu dikenali dengan
melihat konteks kalimat secara keseluruhan. Pada penelitian ini peneliti, akan
melakukan klasifikasi menggunakan metode CNN dan LSTM dengan ekstraksi
fitur TF-IDF. TF-IDF digunakan untuk merubah sweet berbentuk teks yang akan
ditampilkan ke dalam bentuk vector, sedangkan metode CNN dan LSTM
digunakan untuk mendapatkan model terbaik untuk klasifikasi tweet schingga
dapat mengidentifikasi tweet kedalam tiga buah kategori yaitu netral (tidak
mengandung konten negatif), kata kasar, dan konten pornografi. Berdasarkan hasil
penelitian yang dilakukan, diperoleh bahwa metode CNN dan LSTM memiliki
performa klasifikasi yang baik karena dari evaluasi epoch yang digunakan
menghasilkan tingkat akurasi sebesar 100%, hal ini dapat dilihat pada epoch ke
97-100 dan hasil confission matrix dengan rata-rata precision untuk kelas netral
sebesar 0.99, recall sebesar 0.99, dan f1-score sebesar 0.99.
Collections
- Informatics Engineering [2170]