Analisis Klasifikasi Komentar Hate Speech pada Media Sosial Instagram Menggunakan Algoritma Random Forest dengan Seleksi Fitur Chi Square

Ismail, Amalia Rachmadana

dc.contributor.author	Ismail, Amalia Rachmadana
dc.date.accessioned	2024-03-01T02:23:56Z
dc.date.available	2024-03-01T02:23:56Z
dc.date.issued	2023
dc.identifier.uri	dspace.uii.ac.id/123456789/47852
dc.description.abstract	Instagram merupakan salah satu platform media sosial yang paling banyak digunakan karena menyediakan platform bagi pengguna untuk bertukar konten dalam bentuk gambar dan video. Meskipun media sosial dikembangkan dengan tujuan untuk memberikan kemudahan hidup manusia dan hal-hal baik lainnya, namun tidak dapat dipungkiri bahwa setiap perubahan yang terjadi pada manusia juga mempunyai sisi negatif. Melalui jejaring media sosial, ujaran kebencian paling mungkin terjadi. Pengguna sosial media seringkali tidak menyadari bahwa komentar mereka dapat mengandung hate speech yang dapat ditindak secara hukum. Oleh karena itu, penelitian ini dibuat untuk membentuk sebuah model yang mampu memprediksi sebuah komentar apakah memiliki ciri-ciri komentar hate speech atau tidak. Metode yang digunakan adalah Natural Language Processing (NLP) menggunakan algoritma Klasifikasi random forest dengan seleksi fitur chi square. Diperoleh data sebanyak 4916 komentar yang kemudian dibagi menjadi dua kategori yaitu kelas hate speech dan kelas bukan hate speech. Data diolah melalui proses text preprocessing, pembobotan kata tf-idf, seleksi 276 fitur yang memiliki hubungan signifikan dengan kategori kelas, serta klasifikasi menggunakan algoritma random forest dengan hyperparameter grid search tuning. Data komentar dibagi dengan proporsi 80% untuk data train dan 20% untuk data test. Diperoleh nilai akurasi tertinggi mencapai 0.820121 dengan nilai precision sebesar 0.853462, nilai recall sebesar 0.809346, dan nilai f1-score sebesar 0.830819. Model random forest di deploy ke dalam web app menggunakan streamlit. Kemudian membuat dan deploy model random forest menggunakan streamlit.	en_US
dc.publisher	Universitas Islam Indonesia	en_US
dc.subject	chi square	en_US
dc.subject	gridsearch	en_US
dc.subject	hate speech	en_US
dc.title	Analisis Klasifikasi Komentar Hate Speech pada Media Sosial Instagram Menggunakan Algoritma Random Forest dengan Seleksi Fitur Chi Square	en_US
dc.type	Thesis	en_US
dc.Identifier.NIM	19611103
dc.Identifier.NIM	19611103

Files in this item

Name:: 19611103.pdf
Size:: 12.94Kb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Statistics [969]

Show simple item record