Analisis Sentimen Performa Tim Nasional Sepak Bola Indonesia Era Kepemimpinan Shin Tae-yong pada X Menggunakan Algoritma Naive Bayes
Abstract
Sepak bola merupakan salah satu olahraga paling populer di Indonesia dan juga di dunia.
Masyarakat Indonesia cukup menggandrungi olahraga tersebut, bisa dilihat dari hasil penelitian
yang dilakukan oleh Nielsen Sport, sebanyak 77% penduduk Indonesia memiliki minat dan
ketertarikan terhadap dunia sepakbola. Selain itu menurut The Global Digital Football
Benchmark, diantara 200 klub terpopuler di dunia, 6 klub sepakbola di Indonesia sudah masuk
dalam deretan tersebut, hal ini menandakan bahwa olahraga ini sudah sangat melekat dengan
masyarakat Indonesia.
Sementara itu, salah satu media sosial yang cukup populer saat ini adalah X. X adalah salah
satu media komunikasi yang diminati oleh masyarakat di dunia. Hal ini dapat dilihat dari
peningkatan pengguna X yang tercatat di seluruh dunia.
Penelitian ini nantinya akan dilakukan analisis sentimen Timnas Indonesia pada
Kualifikasi Piala Asia U 23 dan Piala Asia U 23 berkaitan dengan performa bermain dan juga
kepelatihan Shin Tae Yong untuk mengklasifikasikan tweet opini dan komentar Masyarakat
yang diperoleh dari data tweet yang dikumpulkan dari platform X. Data tersebut akan diolah
menggunakan algoritma Naive Bayes, yaitu salah satu metode klasifikasi probabilitas yang
sederhana, pada metode ini dilakukan perhitungan probabilitas dengan cara melakukan
penjumlahan terhadap frekuensi dan kombinasi nilai dari dataset dan menghasilkan tweet yang
telah diklasifikasikan menjadi positif atau negatif. Pada tahap sebelum analisis dilakukan
beberapa langkah diantaranya cleaning, steamming, case folding, remove stopword, dan
tokenization guna untuk meningkatkan nilai akurasi pada tahap analisis sentimen. Total data
yang terkumpul pada penelitian kali ini adalah sebanyak, 4113 data, yaitu pada masa kualifikasi
dan masa piala asia. Pada proses visualisasi data dilakukan proses pembuatan word cloud guna
melihat kata apa saja yang sering digunakan pada data set yang dikumpulkan, beberapa kata
yang sering muncul diantanya adalah, Indonesia, Piala, Pemain, dan Menang. Penggunaan
metode naive bayes menghasilkan akurasi model sebesar 90.34 %, memperoleh tingkat akurasi
testing sebesar 87.96% dengan perbandingan data latih 90% dan data uji sebesar 10%.
Collections
- Informatics Engineering [2510]
