• Login
    View Item 
    •   DSpace Home
    • Students & Alumnae
    • Undergraduate Thesis
    • Faculty of Mathematics and Natural Sciences
    • Statistics
    • View Item
    •   DSpace Home
    • Students & Alumnae
    • Undergraduate Thesis
    • Faculty of Mathematics and Natural Sciences
    • Statistics
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    IMPLEMENTASI TEKNIK WEB SCRAPING DAN KLASIFIKASI SENTIMEN MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER DAN ASOSIASI TEKS (Studi Kasus : Data Ulasan Penumpang Maskapai Penerbangan Garuda Indonesia Pada Situs TripAdvisor)

    Thumbnail
    View/Open
    13611217 Muhammad Mulajati.pdf (8.288Mb)
    Date
    2017
    Author
    Muhammad Mulajati
    Metadata
    Show full item record
    Abstract
    Meningkatnya kebutuhan akan informasi mendorong manusia untuk mengembangkan teknologi-teknologi baru agar pengolahan data dan informasi dapat dilakukan dengan mudah dan cepat. Di dunia sekarang ini, hampir semua data yang dibutuhkan sudah tersedia di internet, satu-satunya hal yang membatasi untuk menggunakannya adalah kemampuan untuk mengaksesnya. Web scraping merupakan salah satu solusi yang dapat dilakukan untuk memperoleh data atau informasi dari sebuah situs atau website. Penelitian ini menggunakan teknik web scraping untuk memperoleh data ulasan maskapai penerbangan Garuda Indonesia dari situs TripAdvisor. Data yang diperoleh dari situs TripAdvisor selanjutnya dilakukan pelabelan dan dianalisis dengan menggunakan metode Naïve Bayes Classifier (NBC) untuk mengklasifikasikan ulasan berdasarkan kategori sentimen positif dan negatif. Dari hasil pelabelan yang telah dilakukan kemudian akan dilihat asosiasi teks pada setiap kelas sentimen untuk menemukan sebuah fakta dan informasi yang dianggap penting dan dapat berguna untuk pengambilan keputusan. Hasil pelabelan kelas sentimen pada data ulasan didapatkan bahwa dari total 1143 ulasan, jumlah ulasan positif adalah sebanyak 976 ulasan, dan ulasan negatif adalah sebanyak 167 ulasan. Dari data tersebut selanjutnya dibuat perbandingan data latih dan data uji sebesar 80% : 20% dan diperoleh hasil klasifikasi sentimen dari data uji tersebut dengan menggunakan model Naïve Bayes Classifier (NBC) diperoleh tingkat akurasi sebesar 82,02%, artinya dari 228 data ulasan yang diujikan, terdapat 187 ulasan yang benar pengklasifikasiannya. Selanjutnya, pada proses asosiasi teks diperoleh informasi bahwa penumpang maskapai Garuda Indonesia mayoritas membicarakan mengenai service, staff, food, dan check-in karena selalu muncul baik pada kelas sentimen positif maupun negatif. Secara umum metode asosiasi teks yang digunakan menunjukkan hasil ekstraksi informasi pada kelas positif diantaranya terkait service, food, seat, time, staff, entertainment, check-in, dan cabin. Sedangkan pada kelas negatif yang sering dikeluhkan diantaranya service, staff, seat, food, hour, check-in, luggage, dan boarding.
    URI
    https://dspace.uii.ac.id/123456789/27725
    Collections
    • Statistics [1227]

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    DSpace software copyright © 2002-2015  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    @mire NV