Studi Komparasi Model Klasifikasi Berbasis Pembelajaran Mesin Untuk Sistem Rekomendasi Pemilihan Program Studi Sarjana
Abstract
Pemilihan program studi jenjang sarjana menjadi salah satu tantangan bagi calon
mahasiswa, yaitu siswa tingkat akhir Sekolah Menengah Atas (SMA) dan sederajat.
Keputusan fase tersebut dapat berimbas tidak hanya pada kelancaran studi namun juga
terhadap jalur karir setamat studi. Adanya pandemi Covid-19 dan pembatasan yang
dilakukan pemerintah Indonesia menjadikan tantangan tersebut menjadi semakin sulit dan
menuntut pihak perguruan tinggi bertindak lebih inovatif untuk menjangkau calon
mahasiswanya. Salah satu inovasi yang dapat dilakukan adalah inisiasi sistem rekomendasi
program studi sarjana. Sistem tersebut dapat membantu calon mahasiswa untuk
mengetahui program studi yang cocok dengan karakteristik mereka. Sistem rekomendasi
serupa telah banyak ditemukan di penelitian sebelumnya, akan tetapi kebanyakan masih
menggunakan model berbasis aturan (rule-based) dan fuzy. Masih belum banyak
ditemukan sistem rekomendasi yang mengimplementasikan model berbasis pembelajaran
mesin (machine learning). Penelitian ini bertujuan untuk mengeksplorasi implementasi
sains data khususnya terkait model machine learning pada sistem rekomendasi program
studi. Implementasi tersebut diwujudkan dalam bentuk model klastering dan model
klasifikasi. Model klastering digunakan untuk menyeleksi kelompok mahasiswa yang akan
digunakan sebagai data latih pada sistem sedangkan model klasifikasi digunakan sebagai
model yang memberikan hasil rekomendasi kepada pengguna. Studi komparasi penelitian
akan melibatkan beberapa model klastering (KMeans, Agglomerative, Birch dan
DBSCAN), model klasifikasi dengan pendekatan single-stages dan multi-stages, metode
(multinomial logictic regressions, random forest dan support vector machine), dan skema
preparasi dataset (dengan atau tanpa label berbasis IPK). Penelitian ini menemukan bahwa
model KMeans merupakan model klastering untuk digunakan sebagai alat bantu seleksi
kelompok mahasiswa, sedangkan model terbaik pada sistem rekomendasi adalah model
klasifikasi dengan pendekatan single-stage dan metode random forest.