Identifikasi Jenis File pada Artefak Digital Menggunakan  Algoritma Machine Learning

Fawzan, Ihsan

View/Open

21917030.pdf (2.377Mb)

Date

2024

Author

Fawzan, Ihsan

Metadata

Show full item record

Abstract

Sebanyak 8.831 kasus terkait kejahatan siber terjadi di Indonesia pada tahun 2022. Kejahatan terbanyak yaitu adanya manipulasi data otentik yang salah satu caranya adalah merusak barang bukti digital, sehingga akan menyulitkan ahli forensik untuk melakukan analisis terhadap artefak digital tersebut. Berdasarkan permasalahan yang telah terjadi maka penulis menemukan permasalahan yang akan diteliti yaitu bagaimana mengidentifikasi jenis file yang tidak terdefinisi pada artefak digital menggunakan Machine learning. Penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan jenis file yang tidak terdefinisi pada artefak digital menggunakan machine learning sehingga dapat diketahui jenis file apa yang akan dianalisis. Metode penelitian yang penulis gunakan yaitu metode penelitian analisis deskriptif. Analisis deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul dengan cara disusun, diolah, dan dianalisis untuk memberikan gambaran mengenai masalah yang ada. Ada beberapa cara untuk mengidentifikasi jenis file di antaranya adalah identifikasi secara content-based yang melakukan kalkulasi statistik terhadap isi dari file yang corrupt atau tidak terdefinisi dengan bantuan machine learning. Dataset NapierOne dipisahkan berdasarkan jenis file sehingga saat melakukan ekstraksi fitur jenis file tersebut dapat di klasifikasikan. Byte frequency distribution adalah persamaan aritmatika yang berurusan dengan byte yang berada di kisaran 0x00 dan 0xFF dan dihitung jumlah kemunculannya. Byte frequency distribution digunakan untuk melakukan kalkulasi dan ekstraksi fitur yang menghasilkan 256 fitur dari sebuah file. K-Nearest Neighbor adalah suatu jenis algoritma supervised Machine learning yang digunakan untuk klasifikasi data ke kelas paling mirip pada dataset. Berdasarkan dataset yang telah dikumpulkan dan dikategorikan sesuai jenis file, maka dilakukan ekstraksi fitur menggunakan Byte frequency distribution. Fitur tersebut kemudian digunakan sebagai masukan ke dalam algoritma K-Nearest Neighbor sehingga di kelompokan berdasarkan jenis file yang terdefinisi. K-Nearest Neighbor menghasilkan sebuah model yang dapat digunakan untuk melakukan prediksi terhadap sebuah file yang tidak terdefinisi berdasarkan fitur-fitur yang ada pada file tersebut sehingga dapat diketahui jenis filenya berdasarkan fitur yang ada.

URI

dspace.uii.ac.id/123456789/52477

Collections

Master of Informatics [368]