Automatic Text Summarization Berita Bahasindonesia Menggunakan Metode Attentional Encoder Decoder
Abstract
Automatic text summarization (ATS) adalah salah satu bidang pada kecerdasan buatan
untuk otomatisasi tugas peringkasan data teks. ATS semakin banyak dibutuhkan seiring
bertambah cepatnya peredaran informasi. peringkasan abstraktif menjadi tujuan utama dalam
pengembangam program model ATS. model deep learning attentional encoder decoder umum
digunakan untuk tugas ATS abstraktif. Beberapa penelitian berhasil meningkatkan performa
model dengan penerapan metode terbaru seperti, pointer-generator, bidirectional, dan word
embedding. Penelitian pada Bahasa Indonesia sudah ada dilakukan, namun belum menerapkan
metode-metode terbaru yang disebutkan sebelumnya. Untuk itu akan dibangun model
attentional encoder decoder ATS berita bahasa indonesia, yang menerapkan metode yang
disebutkan sebelumnya. Hasil penelitian menemukan bahwa penggunaan metode pointergenerator
mempercepat pengurangan loss pada proses pelatihan. Analisis nilai ROUGE
mendapatkan bahwa model 2 yang hanya menerapkan bidirectional memiliki hasil terbaik,
dengan nilai ROUGE-1 0.154, ROUGE-2 0.018 dan ROUGE-L 0.148. Hal tersebut
membuktikan bahwa performa loss tidak berbanding lurus dengan nilai ROUGE. Pada analisa
manual hasil ringkasan didapatkan bahwa sesuai dengan evaluasi ROUGE, model 2 berhasil
mengambil inti dari dokumen input. Repetisi kalimat masih menjadi masalah yang mengurangi
kohesifnya hasil ringkasan. Masih diperlukan eksplorasi hyperparameter lebih lanjut untuk
menemukan performa paling maksimal dari varian model. Penggunaan metode lain seperti
coverage juga disarankan untuk mengatasi repetisi kata.
Collections
- Informatics Engineering [2148]