Perbandingan Metode Peter Norvig, Lstm, dan N- Gram untuk Spell Correction Bahasa Indonesia
Abstract
Kesalahan penulisan telah menjadi sebuah fenomena yang dianggap lumrah yang terjadi
di era kemajuan teknologi saat ini, dimana kualitas akurasi data sering kali mengalami variasi
yang signifikan. Oleh karena itu, diperlukan suatu bentuk pengolahan data yang lebih cermat
dan hati-hati guna memastikan integritas serta ketepatan informasi yang disajikan. Keakuratan
penulisan menjadi aspek yang sangat krusial, terutama ketika berbicara dalam konteks
akademis di mana setiap kata dan frasa merepresentasikan arti atau maksud yang ingin
disampaikan. Dalam upaya mereduksi kesalahan penulisan, terdapat salah satu implementasi
Natural Language Processing (NLP) yaitu spell correction. Berbagai pendekatan dapat
diambil dalam konteks ini, termasuk memanfaatkan metode yang telah dikembangkan oleh
Peter Norvig, yang sering kali melibatkan penggunaan statistik dan probabilitas untuk
menangani kesalahan penulisan. Selain itu, teknik deep learning seperti Long Short-Term
Memory (LSTM) juga menjadi pilihan yang menjanjikan dalam mengenali pola kesalahan dan
meresponnya dengan tepat. Namun, tidak hanya itu, konsep N-gram juga dapat
diimplementasikan sebagai alat bantu dalam spell correction ini. Penggunaan fitur spell
correction dalam penelitian ini bukan hanya sekadar untuk mengidentifikasi kesalahan
penulisan semata, namun juga memberikan sugesti pembenaran kata yang salah tulis.
Penelitian ini bertujuan untuk memberikan rekomendasi metode bagi peneliti di bidang NLP.
Akurasi yang didapat untuk metode Peter Norvig ini menghasilkan 73% akurasi tertinggi
dengan kecepatan waktu latih sebesar 31 detik, diikuti dengan N-gram 79% dengan kecepatan
waktu latih sebesar 32 detik, dan LSTM (Long Short Term Memory) dengan akurasi 90,8%
dengan kecepatan waktu latih sebesar 3 detik 451 milidetik
Collections
- Informatics Engineering [2548]
