dc.description.abstract | Penggunaan suara dalam data science telah banyak dilakukan pada beberapa penelitian
seperti mendeteksi suara hewan, ataupun objek tertentu. Penelitian tentang emosi manusia
sedang gencar sekali, salah satunya adalah mendeteksi emosi manusia melalui suara. Dewasa
ini pendeteksian emosi tidak hanya digunakan untuk riset di bidang akademik seperti psikologi,
neuroscience, psikiater, ilmu kognitif dan lainya. Tetapi juga diaplikasikan secara praktis
seperti call centre, gaming industry, bidang medis, dan lainnya. Deteksi emosi bisa dilakukan
melalui dua cara yaitu, melalui wajah serta melalui suara. Dalam mendeteksi emosi
menggunakan wajah, Face Landmark yang dibutuhkan berpengaruh untuk menghasilkan
akurasi yang bagus. Namun, ketika menggunakan suara, amplitudo dari suara tersebut yang
berpengaruh dalam menghasilan akurasi yang bagus. Pada penelitian kali ini, peneliti
menggunakan suara sebagai media dalam mendeteksi suara. JL Corpus dataset beserta
RAVDESS dataset digunakan sebagai dataset dari program yang dibuat untuk mendeteksi
emosi melalui suara. Dataset hanya berisi suara yang sudah dilabeli, label yang diberikan
menunjukkan emosi dari suara tersebut. Emosi yang menjadi label adalah netral, tenang, sedih,
marah, senang, takut, jijik, dan terkejut. Untuk mengekstraksi fitur dari suara tersebut perlu
bantuan dari Mel Frequency Cepstrum Coefficents (MFCCs). Metode klasifikasi yang
digunakan adalah dua metode yang ada dalam Machine Learning, yaitu Convolutional Neural
Network (CNN) dan Support Vector Machine (SVM). Metode klasifikasi CNN memiliki
kinerja yang fleksibel. Metode CNN dapat dikatakan fleksibel karena metode CNN memiliki
kemampuan menggeneralisir yang lebih baik saat menggunakan jumlah data yang sama. Waktu
yang dibutuhkan untuk mendeteksi satu suara saat menggunakan metode SVM selalu lebih
sedikit ketika dibandingkan dengan metode CNN. | en_US |