• Login
    View Item 
    •   DSpace Home
    • Students & Alumnae
    • Undergraduate Thesis
    • Faculty of Mathematics and Natural Sciences
    • Statistics
    • View Item
    •   DSpace Home
    • Students & Alumnae
    • Undergraduate Thesis
    • Faculty of Mathematics and Natural Sciences
    • Statistics
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Analisis Klasifikasi Komentar Hate Speech pada Media Sosial Instagram Menggunakan Algoritma Random Forest dengan Seleksi Fitur Chi Square

    Thumbnail
    View/Open
    19611103.pdf (12.94Kb)
    Date
    2023
    Author
    Ismail, Amalia Rachmadana
    Metadata
    Show full item record
    Abstract
    Instagram merupakan salah satu platform media sosial yang paling banyak digunakan karena menyediakan platform bagi pengguna untuk bertukar konten dalam bentuk gambar dan video. Meskipun media sosial dikembangkan dengan tujuan untuk memberikan kemudahan hidup manusia dan hal-hal baik lainnya, namun tidak dapat dipungkiri bahwa setiap perubahan yang terjadi pada manusia juga mempunyai sisi negatif. Melalui jejaring media sosial, ujaran kebencian paling mungkin terjadi. Pengguna sosial media seringkali tidak menyadari bahwa komentar mereka dapat mengandung hate speech yang dapat ditindak secara hukum. Oleh karena itu, penelitian ini dibuat untuk membentuk sebuah model yang mampu memprediksi sebuah komentar apakah memiliki ciri-ciri komentar hate speech atau tidak. Metode yang digunakan adalah Natural Language Processing (NLP) menggunakan algoritma Klasifikasi random forest dengan seleksi fitur chi square. Diperoleh data sebanyak 4916 komentar yang kemudian dibagi menjadi dua kategori yaitu kelas hate speech dan kelas bukan hate speech. Data diolah melalui proses text preprocessing, pembobotan kata tf-idf, seleksi 276 fitur yang memiliki hubungan signifikan dengan kategori kelas, serta klasifikasi menggunakan algoritma random forest dengan hyperparameter grid search tuning. Data komentar dibagi dengan proporsi 80% untuk data train dan 20% untuk data test. Diperoleh nilai akurasi tertinggi mencapai 0.820121 dengan nilai precision sebesar 0.853462, nilai recall sebesar 0.809346, dan nilai f1-score sebesar 0.830819. Model random forest di deploy ke dalam web app menggunakan streamlit. Kemudian membuat dan deploy model random forest menggunakan streamlit.
    URI
    dspace.uii.ac.id/123456789/47852
    Collections
    • Statistics [1220]

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV