Implementasi Smote Untuk Mengatasi Imbalanced Data Pada Analisis Sentimen Review Restoran Dengan Membandingkan Metode Lexicon Based Dan Naive Bayes (Studi Kasus : Data Ulasan Google Tentang Restoran Mie Gacoan Cabang Kotabaru, Yogyakarta Tahun 2021)
Abstract
Indonesia mengalami perkembangan pesat dalam dunia bisnis kuliner,
sehingga banyak orang membuka restoran dengan berbagai menu menarik. Salah
satu restoran yang sedang banyak diminati pelanggan karena harganya murah dan
menyediakan mie pedas dengan berbagai level yaitu restoran mie Gacoan
khususnya cabang Kotabaru, Yogyakarta. Akibat terlalu banyak peminatnya,
restoran tersebut sering mengalami antrian yang membludak, sehingga pernah
terjadi kesalahpahaman terkait pesanan antara karyawan dengan pelanggan yang
merupakan ojek online sampai mengakibatkan penggerudukan. Untuk mengetahui
pendapat masyarakat terhadap penilaian restoran tersebut, dapat dilihat dari ulasan
Google. Penilaian pada ulasan Google berpengaruh kuat pada masyarakat dalam
menentukan restoran mana yang lebih baik. Penelitian ini dilakukan untuk
mengklasifikasikan sentimen masyarakat terhadap restoran mie Gacoan apakah
termasuk dalam kategori positif, netral, atau negatif dengan membandingkan
metode Lexicon Based dengan Naive Bayes. Data yang digunakan adalah ulasan
Google yang diambil dari bulan Januari hingga Desember 2021 sebanyak 835
ulasan. Hasil akurasi dari klasifikasi Lexicon Based (73%) lebih tinggi
dibandingkan dengan Naive Bayes (57%). Hasil analisis sentimen menunjukkan
bahwa ulasan didominasi oleh sentimen positif, sehingga banyak customer tetap
menyukai restoran tersebut, walaupun pernah terjadi keributan pada restoran
tersebut. Tetapi tingginya kelas positif mengakibatkan imbalanced data untuk kelas
lainnya sehingga perlu dilakukan penyeimbangan data dengan metode SMOTE.
Hasil penelitian menunjukkan klasifikasi dengan metode Naive Bayes yang sudah
diseimbangkan datanya (75%) lebih tinggi akurasinya dibandingkan Lexicon Based
(43%), sehingga pada kasus ini, metode SMOTE lebih cocok diaplikasikan untuk
metode Naive Bayes karena dapat meningkatkan akurasi atau kinerja klasifikasi.
Collections
- Statistics [900]