Pemodelan Topik Cuitan tentang Danantara menggunakan Bertopic yang dioptimasi dengan Optuna
Abstract
Penelitian ini bertujuan memetakan struktur wacana publik mengenai Danantara sebagai
lembaga pengelola investasi negara melalui pemodelan topik berbasis BERTopic yang
dioptimasi dengan UMAP dan HDBSCAN. Ketidakpastian informasi dan meningkatnya
volume percakapan digital terkait Danantara menuntut pendekatan analitis yang mampu
menangkap keragaman isu secara lebih komprehensif dibandingkan analisis sentimen
konvensional. Data diperoleh dari himpunan cuitan yang telah melalui tahapan pra-
pemrosesan, penghapusan duplikasi, serta deteksi anomali temporal untuk meminimalkan
distorsi akibat ledakan percakapan tidak organik. BERTopic dikonfigurasi dengan embedding
IndoSBERT-large yang secara spesifik dirancang untuk representasi semantik teks bahasa
Indonesia, serta penyesuaian parameter UMAP–HDBSCAN guna menghasilkan struktur
klaster yang stabil. Hasil pemodelan menghasilkan lima belas topik yang merepresentasikan
spektrum wacana mulai dari dukungan terhadap penguatan ekonomi nasional, pembahasan
energi dan BUMN, kritik terhadap isu legalitas dan akuntabilitas, hingga percakapan ringan
yang bersifat humor. Temuan ini menunjukkan bahwa percakapan publik mengenai Danantara
bersifat heterogen dan dipengaruhi oleh dinamika sosial-politik di media sosial. Secara
keseluruhan, pendekatan BERTopic dengan optimalisasi UMAP–HDBSCAN menunjukkan
efektivitas dalam mengungkap struktur diskursus yang berlapis berdasarkan tingkat koherensi
dan keragaman topik yang dihasilkan serta menyediakan dasar berbasis data bagi analisis
persepsi publik dan formulasi strategi komunikasi kebijakan.
Collections
- Informatics Engineering [2572]
