dc.description.abstract | Kemajuan teknologi yang pesat mengakibatkan terus bertambahnya jumlah
informasi. Kumpulan berbagai informasi dalam jumlah besar disebut sebagai dataset.
Peningkatan jumlah informasi harus diiringi dengan penyimpanan yang baik. Namun,
tanpa adanya pengorganisasian secara berkala dapat mengakibatkan penumpukan
sehingga dokumen sulit untuk dicari, sebagai contoh ketika mencari dokumen yang
memiliki tema yang sama akan membutuhkan waktu yang lama sehingga tidak efisien.
Salah satu cara untuk menyelesaikan masalah tersebut menggunakan teknik Clustering.
K-Means dan K-Medoids merupakan metode dalam teknik clustering. Metode K-Means
dan K-Medoids sama-sama memiliki kelebihan yaitu, memiliki waktu komputasi yang
cepat namun Metode K-Means memiliki kelemahan sensitif terhadap data outlier.
Berbeda dengan Metode K-Medoids yang hampir dapat bekerja pada setiap jenis data
matriks dan mampu mengatasi outlier. Penelitian ini akan membahas tentang
efektvitas Modifikasi Algoritma K-Medoids untuk kumpulan data dalam jumlah besar
dengan membandingkan rata-rata waktu komputasi dengan algoritma K-Means, dan KMedoids yang diusulkan oleh Gandhi dan Sarivastava (2014). Dalam penelitian ini akan
digunakan 1000 data yang dipilih secara random yang diambil dari data (Internet Movie
Database) IMDB 5000 Movie Dataset. Hasil yang diperoleh yaitu Modifikasi Algoritma
K-Medoids memiliki rata-rata waktu komputasi lebih cepat daripada Algoritma K-Means
dan K-Medoids, sehingga Modifikasi Algoritma K-Medoids lebih efektif digunakan.
Kemudian optimal jumlah cluster untuk modifikasi algoritma K-Medoids ada pada
jumlah cluster 2, dengan menggunakan indeks Davies Bouldin (DB), indeks
Calinski-Harabasz (CH), dan indeks Krzanowski-Lai (KL). | id |