IMPLEMENTASI TEKNIK WEB SCRAPING DAN KLASIFIKASI SENTIMEN MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER DAN ASOSIASI TEKS (Studi Kasus : Data Ulasan Penumpang Maskapai Penerbangan Garuda Indonesia Pada Situs TripAdvisor)
Abstract
Meningkatnya kebutuhan akan informasi mendorong manusia untuk mengembangkan teknologi-teknologi baru agar pengolahan data dan informasi dapat dilakukan dengan mudah dan cepat. Di dunia sekarang ini, hampir semua data yang dibutuhkan sudah tersedia di internet, satu-satunya hal yang membatasi untuk menggunakannya adalah kemampuan untuk mengaksesnya. Web scraping merupakan salah satu solusi yang dapat dilakukan untuk memperoleh data atau informasi dari sebuah situs atau website. Penelitian ini menggunakan teknik web scraping untuk memperoleh data ulasan maskapai penerbangan Garuda Indonesia dari situs TripAdvisor. Data yang diperoleh dari situs TripAdvisor selanjutnya dilakukan pelabelan dan dianalisis dengan menggunakan metode Naïve Bayes Classifier (NBC) untuk mengklasifikasikan ulasan berdasarkan kategori sentimen positif dan negatif. Dari hasil pelabelan yang telah dilakukan kemudian akan dilihat asosiasi teks pada setiap kelas sentimen untuk menemukan sebuah fakta dan informasi yang dianggap penting dan dapat berguna untuk pengambilan keputusan. Hasil pelabelan kelas sentimen pada data ulasan didapatkan bahwa dari total 1143 ulasan, jumlah ulasan positif adalah sebanyak 976 ulasan, dan ulasan negatif adalah sebanyak 167 ulasan. Dari data tersebut selanjutnya dibuat perbandingan data latih dan data uji sebesar 80% : 20% dan diperoleh hasil klasifikasi sentimen dari data uji tersebut dengan menggunakan model Naïve Bayes Classifier (NBC) diperoleh tingkat akurasi sebesar 82,02%, artinya dari 228 data ulasan yang diujikan, terdapat 187 ulasan yang benar pengklasifikasiannya. Selanjutnya, pada proses asosiasi teks diperoleh informasi bahwa penumpang maskapai Garuda Indonesia mayoritas membicarakan mengenai service, staff, food, dan check-in karena selalu muncul baik pada kelas sentimen positif maupun negatif. Secara umum metode asosiasi teks yang digunakan menunjukkan hasil ekstraksi informasi pada kelas positif diantaranya terkait service, food, seat, time, staff, entertainment, check-in, dan cabin. Sedangkan pada kelas negatif yang sering dikeluhkan diantaranya service, staff, seat, food, hour, check-in, luggage, dan boarding.
Collections
- Statistics [900]