Klasifikasi Sentimen, Topik, Dan Detail Topik Dari Ulasan Kai Access Menggunakan Multilayer Perceptron (Mlp) Dan Bidirectional Long Short Term Memory (Bilstm)
Abstract
Penulis melakukan kegiatan magang sebagai Data Scientist di PT Kereta Api Indonesia
(Persero) atau sering disebut PT KAI, salah satu Badan Usaha Milik Negara (BUMN) yang
bergerak di bidang transportasi yaitu kereta api. Beberapa segmen usaha yang dilakukan KAI
adalah angkutan penumpang, angkutan barang, pendukung angkutan kereta api, pendapatan
non angkutan, dan subsidi pemerintah. Kantor pusat PT KAI bertempat di Bandung. Sebagai
Data Scientist Intern di PT KAI, penulis ditugaskan untuk mengerjakan dua proyek yang
berkaitan dengan pengolahan data dengan masing-masing proyek menggunakan data yang
berbeda.
Proyek KAI Access, proyek yang menggunakan data ulasan aplikasi KAI Access (aplikasi
penjualan tiket kereta api daring miliki PT KAI), dipilih untuk dikaji lebih lanjut dalam laporan
tugas akhir ini. Hasil akhir dari proyek ini adalah prototype yang sudah menggunakan model
Machine Learning sehingga dapat mengklasifikasikan data ulasan KAI Access secara otomatis
ke dalam beberapa label yaitu sentimen, topik, dan detail topik. Prototype klasifikasi ini dapat
mengklasifikasikan data ulasan terkait KAI Access yang ditulis oleh pengguna secara langsung
dalam jumlah besar. Selain itu, dashboard visualisasi hasil analisis data ulasan KAI Access
juga dibuat sebagai hasil akhir dari proyek ini. Pada pembuatan model Machine Learning,
proyek ini menggunakan Natural Language Processing (NLP) dengan metode Deep Learning.
Klasifikasi multi-label multi-class ini dibuat dengan tiga model yang berbeda sesuai dengan
label yang diklasifikasikan. Penyusunan model dilakukan menggunakan algoritma Multi-Layer
Perceptron (MLP) dan Bidirectional Long Short Term Memory (BiLSTM). Proyek berhasil
diselesaikan sesuai dengan produk hasil akhir yang diminta yaitu dashboard klasifikasi yang
menggunakan model Machine Learning dengan akurasi masing – masing model sentimen,
topik, dan detail topik sebesar 87,35%, 79,10%, dan 64,85% serta visualisasi dashboard yang
lengkap dan mudah dipahami.
Banyak pengalaman yang didapatkan selama enam bulan menjalankan kegiatan magang di
PT KAI, banyak hal-hal yang baru dilakukan pertama kali oleh penulis dari kegiatan magang
ini. Pengalaman pertama bekerja di kantor, berkoordinasi dengan pegawai kantor, beradaptasi
dengan lingkungan kerja di kantor, menggunakan dataset internal perusahaan, juga
mempelajari tools baru saat pengerjaan proyek. Dari pengalaman-pengalaman tersebut, penulis
bisa mengembangkan soft skill dan juga hard skill sehingga dapat menjadi lebih baik lagi.
Collections
- Informatics Engineering [2148]