ANALISIS KINERJA HADOOP PADA CLUSTER RASPBERRY PI
Abstract
Apache Hadoop merupakan sebuah framework yang digunakan untuk
pemrosessan Big Data yang dirancang untuk dijalankan di sebuah cluster yang
terdiri dari beberapa komputer. Hadoop mengimplementasikan model pola
komputasi yang disebut MapReduce, di mana aplikasi dibagi menjadi banyak
fragmen yang dapat dijalankan dalam node pada sebuah cluster. Selain itu
Hadoop menyediakan media penyimpanan data dengan sebuah file sistem
terdistribusi yang disebut Hadoop Distributed File System (HDFS) yang
menyimpan data di tiap node pada cluster. MapReduce dan HDFS dirancang agar
kerusakan pada node ditangani secara otomatis oleh framework. Hadoop dapat
digunakan di banyak sistem, termasuk cluster Raspberry Pi. Penelitian ini
bertujuan untuk mengetahui bagaimana kemampuan cluster Raspberry Pi dalam
menjalankan Hadoop dan membandingkannya dengan komputer dengan harga
setara.
Analisis dilakukan dengan menjalankan program MapReduce di cluster
Raspberry Pi yang dibangun kemudian mencatat waktu eksekusi program.
Semakin cepat waktu eksekusi semakin baik performa Hadoop. Hal yang sama
dilakukan pada laptop yang menjadi perbandingan.
Dari hasil analisis diketahui bahwa cluster Raspberry Pi dengan 5 node
memiliki performa yang hampir sama dengan laptop yang menjadi perbandingan,
bahkan mengungguli laptop saat memproses data berukuran besar. Dengan
menggunkan fungsi power dapat diprediksi bahwa cluster Raspberry Pi dengan 6
node sudah cukup untuk dapat mengungguli performa komputer dengan harga
setara .
Collections
- Informatics Engineering [2148]