Deteksi Surel Spam Dan Non-Spam Bahasa Indonesia Menggunakan Metode Naïve Bayes
Abstract
Penggunaan surel yang mudah saat ini sering dimanfaatkan banyak orang sehingga
menimbulkan dampak positif maupun negatif. Surel negatif biasa disebut dengan surel spam
yang berisi berupa iklan, penipuan, virus dan malware yang berpotensi untuk merugikan orang
lain. Masalah tersebut memerlukan penanganan untuk mengatasinya. Penelitian ini bertujuan
untuk membuat sebuah model klasifikasi surel spam dan non spam berbahasa Indonesia
menggunakan algoritma Naïve Bayes. Dalam pembuatan model klasifikasi menggunakan data
training sebanyak 80% atau 493 surel dari 617 surel yang didapat pada penelitian ini.
Berdasarkan hasil penelitian yang telah dilakukan, ditemukan bahwa algoritma Naïve Bayes
menggunakan fitur N-gram telah berhasil melakukan klasifikasi sangat baik dengan nilai
akurasi 87% hingga 95%, nilai precision 80% hingga 93% dan recall 93% hingga 100%. Model
terbaik dalam mengklasifikasikan surel ditemukan menggunakan 2-gram dengan nilai akurasi
tertinggi yaitu 95%.
Collections
- Informatics Engineering [2148]