Perbandingan Kinerja Algoritma Machine Learning dalam Deteksi Potensi Risiko HIV
Keywords:
Prediksi risiko HIV, Pembelajaran mesin, LightGBM, CatBoost, XGBoost, Ketidakseimbangan data, Overfitting, Pemodelan prediktif, SMOTEAbstract
HIV/AIDS masih menjadi tantangan kesehatan masyarakat yang signifikan di seluruh dunia, yang memengaruhi jutaan orang dan menimbulkan beban substansial pada sistem perawatan kesehatan. Identifikasi dini individu yang berisiko tinggi terinfeksi HIV sangat penting untuk menerapkan intervensi pencegahan. Studi ini berfokus pada prediksi risiko infeksi HIV menggunakan model machine learning tingkat lanjut, yaitu LightGBM, CatBoost, dan XGBoost. Model-model ini dipilih karena kinerjanya yang tinggi dalam menangani kumpulan data yang kompleks dan tidak seimbang yang merupakan ciri khas studi epidemiologi. Penelitian ini memanfaatkan fitur klinis dan demografi untuk mengembangkan model prediktif, menggunakan teknik seperti cross-validation, regularization, dan oversampling (misalnya, SMOTE) untuk mengatasi masalah umum seperti overfitting dan ketidakseimbangan data. Hasilnya menunjukkan bahwa model-model ini dapat mencapai akurasi tinggi, menawarkan alat yang berharga untuk penilaian risiko dini dan membantu dalam penerapan intervensi yang ditargetkan untuk mengendalikan penyebaran HIV