Penandaan Bahasa Indonesia-Inggris dari Data Code-Switching dan Code-Mixing dengan Metode MNN dan Context Capture
Abstract
Media sosial telah memberikan dampak yang cukup signifikan dalam perkembangan
sebuah bahasa dewasa ini. Percakapan menggunakan multibahasa merupakan hal yang sangat
sering kita temui di berbagai media sosial, bahkan di berbagai macam platform yang berada
pada internet. Pengguna seringkali beralih dari satu bahasa ke bahasa yang lain, mencampurkan
berbagai macam bahasa ke dalam sebuah kalimat secara sadar maupun tidak sadar. Fenomena
ini dikenal dengan istilah code-mixing dan code-switching. Dengan adanya fenomena tersebut,
maka menjadi tugas yang sulit untuk melakukan identifikasi pada kalimat tersebut. Oleh karena
itu, pada penelitian ini dilakukan proses identifikasi bahasa pada data code-mixing dan codeswitching.
Pada penelitian ini, penulis melakukan pelatihan model dengan menggunakan
algoritma MNN (CNN dan LSTM) dan Bi-LSTM-CRF. MNN digunakan untuk melakukan
pelatihan model pada level kata, yang memperoleh hasil akurasi sebesar 95.2% dan 81.59%
nilai f1 score untuk Bi-LSTM-CRF yang digunakan untuk melakukan pelatihan model pada
level kalimat.
Collections
- Informatics Engineering [2177]