Identifikasi Konten Negatif Pada Twitter Dengan Deep Learning

ANGGARA CHANDRA DWINATA

View/Open

17523030.pdf (9.024Mb)

Date

2023-01-04

Author

ANGGARA CHANDRA DWINATA

Metadata

Show full item record

Abstract

Media sosial telah menjadi media komunikasi antara satu pengguna dengan pengguna lainnya, salah satunya Twitter. Namun, tidak semua orang yang menggunakan Twitter dengan benar dan bijak. Banyak orang Indonesia yang menulis kata-kata berbau SARA (suku, agama, ras, dan antargolongan), atau mengeluarkan kalimat yang tidak pantas dan menyinggung seperti menulis nama binatang, alat kelamin, dan lain-lain. Oleh karena itu, perlu dikenali dengan melihat konteks kalimat secara keseluruhan. Pada penelitian ini peneliti, akan melakukan klasifikasi menggunakan metode CNN dan LSTM dengan ekstraksi fitur TF-IDF. TF-IDF digunakan untuk merubah sweet berbentuk teks yang akan ditampilkan ke dalam bentuk vector, sedangkan metode CNN dan LSTM digunakan untuk mendapatkan model terbaik untuk klasifikasi tweet schingga dapat mengidentifikasi tweet kedalam tiga buah kategori yaitu netral (tidak mengandung konten negatif), kata kasar, dan konten pornografi. Berdasarkan hasil penelitian yang dilakukan, diperoleh bahwa metode CNN dan LSTM memiliki performa klasifikasi yang baik karena dari evaluasi epoch yang digunakan menghasilkan tingkat akurasi sebesar 100%, hal ini dapat dilihat pada epoch ke 97-100 dan hasil confission matrix dengan rata-rata precision untuk kelas netral sebesar 0.99, recall sebesar 0.99, dan f1-score sebesar 0.99.

URI

https://dspace.uii.ac.id/handle/123456789/42556

Collections

Informatics Engineering [2542]