dc.description.abstract | Instagram merupakan salah satu platform media sosial yang paling banyak
digunakan karena menyediakan platform bagi pengguna untuk bertukar konten
dalam bentuk gambar dan video. Meskipun media sosial dikembangkan dengan
tujuan untuk memberikan kemudahan hidup manusia dan hal-hal baik lainnya,
namun tidak dapat dipungkiri bahwa setiap perubahan yang terjadi pada manusia
juga mempunyai sisi negatif. Melalui jejaring media sosial, ujaran kebencian paling
mungkin terjadi. Pengguna sosial media seringkali tidak menyadari bahwa komentar
mereka dapat mengandung hate speech yang dapat ditindak secara hukum. Oleh
karena itu, penelitian ini dibuat untuk membentuk sebuah model yang mampu
memprediksi sebuah komentar apakah memiliki ciri-ciri komentar hate speech atau
tidak. Metode yang digunakan adalah Natural Language Processing (NLP)
menggunakan algoritma Klasifikasi random forest dengan seleksi fitur chi square.
Diperoleh data sebanyak 4916 komentar yang kemudian dibagi menjadi dua kategori
yaitu kelas hate speech dan kelas bukan hate speech. Data diolah melalui proses text
preprocessing, pembobotan kata tf-idf, seleksi 276 fitur yang memiliki hubungan
signifikan dengan kategori kelas, serta klasifikasi menggunakan algoritma random
forest dengan hyperparameter grid search tuning. Data komentar dibagi dengan
proporsi 80% untuk data train dan 20% untuk data test. Diperoleh nilai akurasi
tertinggi mencapai 0.820121 dengan nilai precision sebesar 0.853462, nilai recall
sebesar 0.809346, dan nilai f1-score sebesar 0.830819. Model random forest di
deploy ke dalam web app menggunakan streamlit. Kemudian membuat dan deploy
model random forest menggunakan streamlit. | en_US |