Identifikasi Jenis File pada Artefak Digital Menggunakan  Algoritma Machine Learning

Fawzan, Ihsan

dc.contributor.author	Fawzan, Ihsan
dc.date.accessioned	2024-10-16T03:03:53Z
dc.date.available	2024-10-16T03:03:53Z
dc.date.issued	2024
dc.identifier.uri	dspace.uii.ac.id/123456789/52477
dc.description.abstract	Sebanyak 8.831 kasus terkait kejahatan siber terjadi di Indonesia pada tahun 2022. Kejahatan terbanyak yaitu adanya manipulasi data otentik yang salah satu caranya adalah merusak barang bukti digital, sehingga akan menyulitkan ahli forensik untuk melakukan analisis terhadap artefak digital tersebut. Berdasarkan permasalahan yang telah terjadi maka penulis menemukan permasalahan yang akan diteliti yaitu bagaimana mengidentifikasi jenis file yang tidak terdefinisi pada artefak digital menggunakan Machine learning. Penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan jenis file yang tidak terdefinisi pada artefak digital menggunakan machine learning sehingga dapat diketahui jenis file apa yang akan dianalisis. Metode penelitian yang penulis gunakan yaitu metode penelitian analisis deskriptif. Analisis deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul dengan cara disusun, diolah, dan dianalisis untuk memberikan gambaran mengenai masalah yang ada. Ada beberapa cara untuk mengidentifikasi jenis file di antaranya adalah identifikasi secara content-based yang melakukan kalkulasi statistik terhadap isi dari file yang corrupt atau tidak terdefinisi dengan bantuan machine learning. Dataset NapierOne dipisahkan berdasarkan jenis file sehingga saat melakukan ekstraksi fitur jenis file tersebut dapat di klasifikasikan. Byte frequency distribution adalah persamaan aritmatika yang berurusan dengan byte yang berada di kisaran 0x00 dan 0xFF dan dihitung jumlah kemunculannya. Byte frequency distribution digunakan untuk melakukan kalkulasi dan ekstraksi fitur yang menghasilkan 256 fitur dari sebuah file. K-Nearest Neighbor adalah suatu jenis algoritma supervised Machine learning yang digunakan untuk klasifikasi data ke kelas paling mirip pada dataset. Berdasarkan dataset yang telah dikumpulkan dan dikategorikan sesuai jenis file, maka dilakukan ekstraksi fitur menggunakan Byte frequency distribution. Fitur tersebut kemudian digunakan sebagai masukan ke dalam algoritma K-Nearest Neighbor sehingga di kelompokan berdasarkan jenis file yang terdefinisi. K-Nearest Neighbor menghasilkan sebuah model yang dapat digunakan untuk melakukan prediksi terhadap sebuah file yang tidak terdefinisi berdasarkan fitur-fitur yang ada pada file tersebut sehingga dapat diketahui jenis filenya berdasarkan fitur yang ada.	en_US
dc.publisher	Universitas Islam Indonesia	en_US
dc.subject	Digital Forensik	en_US
dc.subject	File Type Identification	en_US
dc.subject	K-nearest Neighbor	en_US
dc.subject	Machine Learning	en_US
dc.title	Identifikasi Jenis File pada Artefak Digital Menggunakan Algoritma Machine Learning	en_US
dc.type	Thesis	en_US
dc.Identifier.NIM	21917030

Files in this item

Name:: 21917030.pdf
Size:: 2.377Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Master of Informatics [368]

Show simple item record