dc.description.abstract | Identifikasi Akurasi Suara pada Audio Forensic dengan Metode Itakura Saito
Distance dan Backpropagation Neural Network
Audio merupakan salah satu barang bukti digital yang digunakan dalam cybercrime.
Seringkali bahwa bukti audio ini membawa peran krusial untuk mengungkapkan adanya
kasus kejahatan sehingga diperlukan proses analisis audio forensic. Audio tersebut berisi
rekaman suara seseorang yang memiliki karakter dengan pengucapan kosakata yang
berbeda-beda, pengucapan yang tidak jelas, dan memiliki banyak noise. Jika terjadi kasus
tindakan kriminal dan ditemukan barang bukti audio berupa rekaman suara yang terduga
sebagai pelaku, maka perlu adanya proses analisis untuk mencari kebenaran rekaman suara
yang ditemukan identik dengan rekaman suara pelaku. Perlu adanya penanganan yang sesuai
Standart Operational Procedure (SOP) audio forensic. Tahapan dalam melakukan audio
forensic pada Digital Forensic Analyst Team Pusat Laboratorium Forensik (DFAT
PUSLABFOR) terdiri dari 4 tahapan yakni Acquisition, Audio Enhancement, Decoding, dan
Voice Recognition.
Dalam penelitian ini akan dibahas mengenai analisis audio menggunakan metode
speech processing yaitu Itakura Saito Distance dan metode jaringan syaraf tiruan yaitu
Backpropagation Neural Network dengan tujuan memperkuat hasil akurasi identik suatu
barang bukti rekaman suara. Jika metode ini dikaloborasikan akan memperkuat tingkat
akurasi dan argument yang diperoleh dari proses analisa, khususnya dalam penanganan
audio forensic. Akurasi itu sendiri diukur dari nilai kedekatan frekuensi atau spectrum antara
rekaman suara asli dengan rekaman suara pembanding. Nilai presentase tinggi akurasi dari
metode Itakura Saito Distance masih menjadi perdebatan. Asumsi tersebut disampaikan
oleh seorang saksi ahli dalam kasus tindak pidana korupsi di Indonesia tentang barang bukti
rekaman suara, dimana metode ini banyak digunakan dalam rekayasa audio yaitu
background musik ataupun konser, tetapi tidak mengarah untuk membandingkan dua suara.
Pengujian dilakukan pada 4 rekaman suara asli (unknown) dan 4 rekaman suara
pembanding (known) menggunakan lebih dari 20 kosakata dengan proses pertama
menganalisa metode Itakura Saito Distance. Analisa menggunakan batas panjang waktu
(frame) sebesar 100000 dari keseluruhan panjang waktu dari setiap suara itu sendiri. Hasil
dari metode tersebut merupakan nilai formant yang selanjutnya dianalisa kembali dengan metode Backpropagation Neural Network menggunakan ketepatan parameter yang
dimasukkan. Penggabungan dari metode tersebut menunjukan akurasi tertinggi yang identik
lebih dari 95%. | en_US |