Klasifikasi Komentar Cyberharassment di Media Sosial Menggunakan Random Forest (Studi Kasus : Komentar Media Sosial TikTok dan Youtube)
Abstract
Di era saat ini, media sosial telah memberikan manfaat bagi penggunanya.
Berdasarkan data yang dirilis oleh internetworldstats, pengguna internet Indonesia
mencapai 212.35 juta jiwa pada Maret 2021 dan angka itu terus meningkat.
Perkembangan internet dan bertambahnya pengguna media sosial berkaitan erat
dengan perkembangan tuntutan akan kebebasan berpendapat di media sosial.
Semua orang baik individu maupun organisasi mampu menyampaikan dan
mengekspresikan apapun ke media sosial. Semakin tingginya pengguna internet
dan diikuti dengan semakin mudahnya untuk mengekspresikan pendapat di media
sosial mendukung terjadinya peningkatan kasus Kekerasan Berbasis Gender Online
(KBGO). Salah satu bentuk KBGO yang sering terjadi di media sosial adalah cyber
harassment. Pelecehan online (cyber harassment) adalah pengiriman teks untuk
menyakiti atau menakuti atau mengancam atau menggangu. Oleh karena itu,
dilakukan penelitian untuk mengklasifikasikan komentar ke dalam
cyberharassment atau no cyberharassment menggunakan Natural Language
Processing (NLP) dan metode yang digunakan untuk melakukan klasifikasi adalah
random forest. Penggunaan random forest karena mampu menghasilkan error yang
lebih rendah, memberikan hasil yang bagus dalam klasifikasi, dapat mengatasi data
training dalam jumlah sangat besar secara efisien, dan metode yang efektif untuk
mengestimasi missing data. Dari model yang didapatkan dibangun website sebagai
user interface model. Data yang dikumpulkan berupa komentar dari media sosial
tiktok dan youtube sebanyak 3303 komentar yang dikategorikan menjadi
cyberharassment dan no cyberharassment. Kemudian diterapkan metode SMOTE
untuk mengatasi imbalanced data sehingga data menjadi 3604 komentar.
Pembentukan model menggunakan random forest dengan optimalisasi parameter
menggunakan GridSearch hyperparameter tuning mendapatkan hasil accuracy
0.96, precision 0.98, recall 0.96, dan f1-score 0.96.
Collections
- Statistics [1251]
