Perbandingan Naïve Bayes dan Logistic Regression dalam Sentiment Analysis pada Review Marketplace menggunakan Rating- Based Labeling
Abstract
Penelitian ini berfokus pada analisis sentimen di Google Play Store, platform untuk
mengunduh aplikasi Android dan memberikan ulasan. Analisis sentimen penting untuk
memahami respons pengguna terhadap aplikasi, terutama di marketplace. Dalam penelitian
ini, dua algoritma machine learning, yaitu Naïve Bayes dan Logistic Regression,
digunakan untuk mengklasifikasikan ulasan pengguna. Naïve Bayes dan Logistic
Regression sering digunakan untuk klasifikasi sentimen karena keunggulan simplicitas,
efisiensi komputasi, dan kemampuan memberikan interpretasi dan estimasi probabilitas
prediksi yang baik. Penilaian rating aplikasi digunakan sebagai referensi untuk
menentukan sentimen dari setiap komentar. Dataset dibagi menjadi dua kondisi:
menggunakan 2 label (positif & negatif) dan 3 label (positif, netral, & negatif). Hasil
pengujian menunjukkan bahwa performa tertinggi diperoleh dengan menggunakan Logistic
Regression pada dataset Shopee dengan 2 label. Akurasinya mencapai 84,58%, presisinya
84,66%, dan recallnya 84,63%. Selain itu, waktu proses tercepat terjadi saat menguji
dataset Lazada 2 label dengan Naïve Bayes, hanya memerlukan 0,038 detik. Secara
keseluruhan, penelitian ini menunjukkan bahwa dataset dengan 2 label cenderung
menghasilkan tingkat akurasi yang lebih tinggi dibandingkan dengan dataset 3 label.