Perkembangan Analisis Data Kategori dan Tantangan di Era Big Data
Abstract
Manusia secara inheren memiliki kemampuan untuk merekam dan mengolah data menjadi informasi, mulai dari identifikasi dasar hingga pencarian pola dan prediksi, sebagaimana ditekankan dalam ajaran agama untuk senantiasa berpikir dan mengembangkan pengetahuan, khususnya di bidang statistika. Statistika, sebagai alat penting dalam berpikir kritis, melibatkan pengumpulan, analisis, dan ekstraksi data untuk memperoleh informasi atau pengetahuan, serta berperan dalam membuat penilaian ilmiah di tengah ketidakpastian. Data kategori, yang sering disebut data kualitatif dan berbeda dari statistik sebagai hasil analisis, sangat penting untuk diidentifikasi karena metode analisis statistik sangat bergantung pada sifat data. Meskipun perkembangan metode analisis data kategori tidak secepat data numerik, kontribusinya terhadap penelitian ilmiah di berbagai bidang seperti biostatistik, ekonomi, dan sosiologi sangat besar . Analisis data kategori umumnya mencakup inferensi parameter proporsi, asosiasi antar variabel, dan pemodelan, dengan banyak metode estimasi parameter proporsi telah dikembangkan dalam tiga puluh tahun terakhir, baik metode eksak untuk sampel kecil maupun pendekatan distribusi normal untuk sampel besar. Dalam konteks Big Data, model log-linear telah terbukti efektif untuk analisis data kategori dengan ratusan variabel, meskipun tantangan komputasi masih ada, terutama untuk regresi logistik nominal dan ordinal. Secara keseluruhan, analisis data adalah seni untuk mendapatkan informasi relevan melalui pemahaman masalah, pemilihan metode yang tepat, dan komputasi yang akurat dan cepat, meskipun masih ada keterbatasan dalam interpretasi kuantitatif dan masalah komputasi pada Big Data yang memerlukan pengembangan lebih lanjut.
Collections
- Professor's Speech [30]
