• Login
    View Item 
    •   DSpace Home
    • Students & Alumnae
    • Thesis
    • Master of Informatics
    • View Item
    •   DSpace Home
    • Students & Alumnae
    • Thesis
    • Master of Informatics
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Identifikasi Jenis File pada Artefak Digital Menggunakan Algoritma Machine Learning

    Thumbnail
    View/Open
    21917030.pdf (2.377Mb)
    Date
    2024
    Author
    Fawzan, Ihsan
    Metadata
    Show full item record
    Abstract
    Sebanyak 8.831 kasus terkait kejahatan siber terjadi di Indonesia pada tahun 2022. Kejahatan terbanyak yaitu adanya manipulasi data otentik yang salah satu caranya adalah merusak barang bukti digital, sehingga akan menyulitkan ahli forensik untuk melakukan analisis terhadap artefak digital tersebut. Berdasarkan permasalahan yang telah terjadi maka penulis menemukan permasalahan yang akan diteliti yaitu bagaimana mengidentifikasi jenis file yang tidak terdefinisi pada artefak digital menggunakan Machine learning. Penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan jenis file yang tidak terdefinisi pada artefak digital menggunakan machine learning sehingga dapat diketahui jenis file apa yang akan dianalisis. Metode penelitian yang penulis gunakan yaitu metode penelitian analisis deskriptif. Analisis deskriptif adalah statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul dengan cara disusun, diolah, dan dianalisis untuk memberikan gambaran mengenai masalah yang ada. Ada beberapa cara untuk mengidentifikasi jenis file di antaranya adalah identifikasi secara content-based yang melakukan kalkulasi statistik terhadap isi dari file yang corrupt atau tidak terdefinisi dengan bantuan machine learning. Dataset NapierOne dipisahkan berdasarkan jenis file sehingga saat melakukan ekstraksi fitur jenis file tersebut dapat di klasifikasikan. Byte frequency distribution adalah persamaan aritmatika yang berurusan dengan byte yang berada di kisaran 0x00 dan 0xFF dan dihitung jumlah kemunculannya. Byte frequency distribution digunakan untuk melakukan kalkulasi dan ekstraksi fitur yang menghasilkan 256 fitur dari sebuah file. K-Nearest Neighbor adalah suatu jenis algoritma supervised Machine learning yang digunakan untuk klasifikasi data ke kelas paling mirip pada dataset. Berdasarkan dataset yang telah dikumpulkan dan dikategorikan sesuai jenis file, maka dilakukan ekstraksi fitur menggunakan Byte frequency distribution. Fitur tersebut kemudian digunakan sebagai masukan ke dalam algoritma K-Nearest Neighbor sehingga di kelompokan berdasarkan jenis file yang terdefinisi. K-Nearest Neighbor menghasilkan sebuah model yang dapat digunakan untuk melakukan prediksi terhadap sebuah file yang tidak terdefinisi berdasarkan fitur-fitur yang ada pada file tersebut sehingga dapat diketahui jenis filenya berdasarkan fitur yang ada.
    URI
    dspace.uii.ac.id/123456789/52477
    Collections
    • Master of Informatics [368]

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV