| dc.description.abstract | Sebanyak 8.831 kasus terkait kejahatan siber terjadi di Indonesia pada tahun 2022.
Kejahatan terbanyak yaitu adanya manipulasi data otentik yang salah satu caranya adalah
merusak barang bukti digital, sehingga akan menyulitkan ahli forensik untuk melakukan
analisis terhadap artefak digital tersebut. Berdasarkan permasalahan yang telah terjadi
maka penulis menemukan permasalahan yang akan diteliti yaitu bagaimana
mengidentifikasi jenis file yang tidak terdefinisi pada artefak digital menggunakan
Machine learning. Penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan
jenis file yang tidak terdefinisi pada artefak digital menggunakan machine learning
sehingga dapat diketahui jenis file apa yang akan dianalisis. Metode penelitian yang
penulis gunakan yaitu metode penelitian analisis deskriptif. Analisis deskriptif adalah
statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau
menggambarkan data yang telah terkumpul dengan cara disusun, diolah, dan dianalisis
untuk memberikan gambaran mengenai masalah yang ada. Ada beberapa cara untuk
mengidentifikasi jenis file di antaranya adalah identifikasi secara content-based yang
melakukan kalkulasi statistik terhadap isi dari file yang corrupt atau tidak terdefinisi
dengan bantuan machine learning. Dataset NapierOne dipisahkan berdasarkan jenis file
sehingga saat melakukan ekstraksi fitur jenis file tersebut dapat di klasifikasikan. Byte
frequency distribution adalah persamaan aritmatika yang berurusan dengan byte yang
berada di kisaran 0x00 dan 0xFF dan dihitung jumlah kemunculannya. Byte frequency
distribution digunakan untuk melakukan kalkulasi dan ekstraksi fitur yang menghasilkan
256 fitur dari sebuah file. K-Nearest Neighbor adalah suatu jenis algoritma supervised
Machine learning yang digunakan untuk klasifikasi data ke kelas paling mirip pada
dataset. Berdasarkan dataset yang telah dikumpulkan dan dikategorikan sesuai jenis file,
maka dilakukan ekstraksi fitur menggunakan Byte frequency distribution. Fitur tersebut
kemudian digunakan sebagai masukan ke dalam algoritma K-Nearest Neighbor sehingga di
kelompokan berdasarkan jenis file yang terdefinisi. K-Nearest Neighbor menghasilkan
sebuah model yang dapat digunakan untuk melakukan prediksi terhadap sebuah file yang
tidak terdefinisi berdasarkan fitur-fitur yang ada pada file tersebut sehingga dapat diketahui
jenis filenya berdasarkan fitur yang ada. | en_US |