Implementasi Deep Learning untuk Mengubah Kalimat Tidak Sopan Menjadi Sopan
Abstract
Menurut survei yang dilakukan oleh Microsoft pada tahun 2020, Indonesia menjadi negara
dengan kesopanan digital paling buruk di Asia Pasifik. Hal tersebut dibuktikan dengan naiknya
angka Digital Civility Index delapan poin dari tahun 2019 menjadi 76 poin. Hal tersebut
mendorong penelitian ini untuk membangun model deep learning yang dapat mengubah
kalimat tidak sopan menjadi sopan dengan strategi mempertahankan bentuk formal pada setiap
katanya. Tujuan dari penelitian ini adalah membantu masyarakat Indonesia untuk tetap dapat
berkomunikasi dengan sopan di dunia digital sehingga diharapkan dapat menjaga
keharmonisan pada saat berkomunikasi dan memperbaiki citra masyarakat Indonesia di dunia
digital. Metode yang digunakan penelitian ini adalah Tag and Generate Approach; model
tagger untuk menggantikan token tag pada kata yang terdapat di kalimat tidak sopan dan model
generator untuk menggantikan token tag tersebut dengan kata yang sesuai sehingga menjadi
kalimat yang sopan. Sebelum melakukan pelatihan model tagger, setiap n-gram (penelitian ini
menggunakan jangkauan unigram sampai bigram) dilakukan penghitungan rasio rerata tf-idf
untuk mengetahui peringkat persentil dan relevansi n-gram pada masing-masing gaya teks.
Dapat disimpulkan bahwa kata "mengapa" dan "kalo" menduduki peringkat persentil unigram
tertinggi, sedangkan kata "bagaimana ini" dan "ya min" mendapatkan peringkat persentil
tertinggi bigram pada masing-masing gaya teks. Hasil akhir evaluasi model mencapai nilai
tertinggi pada BLEU 1 dengan nilai 0.605 dan disusul oleh METEOR sebesar 0.573.
Sedangkan, untuk metrik BLEU 2, BLEU 3, dan BLEU 4 masih tertinggal jauh dibandingkan
kedua metrik tersebut (BLEU 1 dan METEOR) dengan nilai masing-masing 0.475, 0.385, dan
0.318.
Collections
- Informatics Engineering [2510]
