• Login
    View Item 
    •   DSpace Home
    • Students & Alumnae
    • Undergraduate Thesis
    • Faculty of Mathematics and Natural Sciences
    • Statistics
    • View Item
    •   DSpace Home
    • Students & Alumnae
    • Undergraduate Thesis
    • Faculty of Mathematics and Natural Sciences
    • Statistics
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Klasifikasi Komentar Cyberharassment di Media Sosial Menggunakan Random Forest (Studi Kasus : Komentar Media Sosial TikTok dan Youtube)

    Thumbnail
    View/Open
    18611098.pdf (2.844Mb)
    Date
    2022
    Author
    Nabilah, Puspita Putri
    Metadata
    Show full item record
    Abstract
    Di era saat ini, media sosial telah memberikan manfaat bagi penggunanya. Berdasarkan data yang dirilis oleh internetworldstats, pengguna internet Indonesia mencapai 212.35 juta jiwa pada Maret 2021 dan angka itu terus meningkat. Perkembangan internet dan bertambahnya pengguna media sosial berkaitan erat dengan perkembangan tuntutan akan kebebasan berpendapat di media sosial. Semua orang baik individu maupun organisasi mampu menyampaikan dan mengekspresikan apapun ke media sosial. Semakin tingginya pengguna internet dan diikuti dengan semakin mudahnya untuk mengekspresikan pendapat di media sosial mendukung terjadinya peningkatan kasus Kekerasan Berbasis Gender Online (KBGO). Salah satu bentuk KBGO yang sering terjadi di media sosial adalah cyber harassment. Pelecehan online (cyber harassment) adalah pengiriman teks untuk menyakiti atau menakuti atau mengancam atau menggangu. Oleh karena itu, dilakukan penelitian untuk mengklasifikasikan komentar ke dalam cyberharassment atau no cyberharassment menggunakan Natural Language Processing (NLP) dan metode yang digunakan untuk melakukan klasifikasi adalah random forest. Penggunaan random forest karena mampu menghasilkan error yang lebih rendah, memberikan hasil yang bagus dalam klasifikasi, dapat mengatasi data training dalam jumlah sangat besar secara efisien, dan metode yang efektif untuk mengestimasi missing data. Dari model yang didapatkan dibangun website sebagai user interface model. Data yang dikumpulkan berupa komentar dari media sosial tiktok dan youtube sebanyak 3303 komentar yang dikategorikan menjadi cyberharassment dan no cyberharassment. Kemudian diterapkan metode SMOTE untuk mengatasi imbalanced data sehingga data menjadi 3604 komentar. Pembentukan model menggunakan random forest dengan optimalisasi parameter menggunakan GridSearch hyperparameter tuning mendapatkan hasil accuracy 0.96, precision 0.98, recall 0.96, dan f1-score 0.96.
    URI
    dspace.uii.ac.id/123456789/52746
    Collections
    • Statistics [1251]

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV