Pengelompokkan Komentar Pada Media Sosial Instagram Menggunakan Metode K-Means Clustering Untuk Identifikasi Awal Cyberbullying
Abstract
Media sosial selain memberikan dampak positif pada masyarakat juga memiliki dampak
negatif. Berdasarkan statistic, 95 persen dari pengguna internet di Indonesia menggunakan
internet untuk mengakses jejaring sosial. Secara khusus untuk kalangan muda, Instgram
lebih banyak digunakan dibandingkan dengan media sosialnya lainnya seperti Twitter dan
Facebook. Dalam hal kasus cyberbullying, kasus yang sering terjadi adalah melalui media
sosial twitter dan Instagram. Terdapat sejumlah metode yang umumnya digunakan untuk
analisis terhadap kasus cyberbullying seperti SVM (Support Vector Machine), NBC (Naïve
Bayes Classifier), C45, K-Nearest Neighbours. Penerapan terhadap sejumlah metode
tersebut umumnya di implementasikan pada media social twitter. Sementara pengguna usia
muda saat ini lebih banyak menggunakan media social Instagram dibandingkan dengan
twitter. Untuk itu penelitian memberikan focus pada analisis cyberbullying pada Instagram
melalui penerapamn algoritma K-Mean Clustering. Algoritma ini digunakan untuk
mengelompokkan tindakan cyberbullying yang terdapat pada komentar. Dataset yang
digunakan pada penelitian ini diambil dari tahun 2019 sampai 2021 dengan jumlah 650
record, terdapat 1827 kata dan sudah memiliki label. Penelitian ini telah berhasil
mengelompokkan data yang diuji, dengan nilai threshold 0,5. Hasil penelitian yang didapat
untuk pengelompokkan kata yang mengandung bullying pada Instagram menghasikan
tingkat accuracy paling tinggi yaitu sebesar 67,38%, nilai precision 76,70%, dan nilai recall
67,48%. Data ini menunjukkan bahwa algoritma k- means dapat mengelompokkan komentar
menjadi dua cluster, yaitu cluster bullying dan non-bullying.