Forecast chronic kidney disease with machine learning on cloud

Phạm Văn Âu * , Huỳnh Chí Hiếu

Abstract

There are many dangerous and potentially fatal diseases, including chronic kidney disease. If the disease is detected early, accurate diagnosis and timely treatment will limit the likelihood of disease and prevent the disease from progressing more and reduce the possibility of death from the disease. So far, there are many models to predict diseases and predict chronic kidney failure by building different models. However, previous prediction models do not have high accuracy, performance and generalizability. In this study, we focus on building models with higher generalization and better predictive performance. We use 3 techniques namely, Decision Tree, Bagging, Boosting. Experimental results on the Chronic KIdney Disease L.Jerlin Rubini dataset show that Boosting has a higher predictive performance than the prediction models we use.

Keywords: Decision tree, Bagging, Boosting, machine learning, chronic kidney disease.

Tóm tắt

Có rất nhiều bệnh nguy hiểm và nguy cơ gây tử vong trong đó có bệnh suy thận mãn tính. Nếu người bệnh sớm phát hiện dấu hiệu, chẩn đoán chuẩn xác và chữa trị kịp thời sẽ hạn chế đến mức thấp khả năng mắc bệnh và ngăn chặn bệnh diễn tiến nhiều hơn và giảm được khả năng tử vong do bệnh gây ra. Từ trước cho đến nay có rất nhiều mô hình để dự đoán các loại bệnh và dự đoán suy thận mãn tính bằng phương pháp xây dựng từng mô hình khác nhau[1][2][3]. Trong nghiên cứu này chúng tôi tập trung vào việc xây dựng các mô hình là, Cây quyết định, Bagging, Boosting. Kết quả thực nghiệm trên bộ dữ liệu Chronic KIdney Disease L.Jerlin Rubini cho thấy Boosting có hiệu suất dự đoán cao hơn so với các mô hình dự đoán mà chúng tôi sử dụng.

Từ khóa: Cây quyết định, Bagging, Boosting, máy học, bệnh thận mãn tính.

References

[1] Dibaba Adeba Debal, Tilahun Melak Sitote, 2022; “Chronic kidney disease prediction using machine learning techniques”, Journal of Big Data.

[2] Elias Dritsas, Maria Trigka, 2022; “Machine Learning Techniques for Chronic Kidney Disease Risk Prediction”, MDBI.

[3] Imesh Udara Ekanayake, Damayanthi Herath, 2020; “Chronic Kidney Disease Prediction Using Machine Learning Methods”, IEEE

[4] Cha Zang, Yunqian Ma, 2012; “Ensemble Machine Learning Methods and Applications”, Springer Science+Business Media. LLC

[5] Rosaida Rosly, Mokhairi Makhtar, Mohd Khalid Awang, Nordin Abdul Rahman, Mustafa Mat Deris, 2015; “Comparison of Ensemble Classifiersfor Water Quality Dataset”. Proceedings of the UniSZA Research Conference .

[6] Harris Drucker, Corinna Cortes, Larry Jackel, Yann LeCun, 1994; “Boosting and Other Ensemble Methods” Neural Computation 6.

[7] Ljupco Todorovski, Saso Dzeroski, 2003; “Combining classifiers with meta decision trees”, Machine learning, 50(3).

[8] David H.Wolpert, 1992; “Stacked generalization”, Neural networks

[9] Adele, C., David, R. C., John, R. S, 2011; “Random Forests”, Machine Learning.

[10] Panagiotis Pintelas, Ioannis E. Livieris, 2020; “Ensemble Algorithms and Their Applications”, Mdpi AG.

[11] Theyazn H. H. Aldhyani, Mohammed AI-Yaari, Hasan Alkahtanni, Mashael Maashi. 2020; “Water Quality Prediction Using Artificial Intelligence Algorithms”, Applied Bionics and Biomechanics.

[12] Lior Rokach, Oded Maimon, 2005; “Decision Tree”, researchGate.

[13] SOCIAL-SCIENCES https://www.encyclopedia.com/social-sciences/applied-and-social-sciences-magazines/bootstrap-method, (2022).

[14] https://www.geeksforgeeks.org/boosting-in-machine-learning-boosting-and-adaboost, (2022).

[15] https://www.geeksforgeeks.org/ml-xgboost-extreme-gradient-boosting/?ref=lbp, (2022).

[16] Felipe Kenji Nakano, Saulo M. Mastelini, Sylvio Barbon, Ricardo Cerri, (2017); “Stacking Methods for Hierarchical Classification”, IEEE International Conference on Machine Learning and Applications

[17] Leo Breiman,1996; “Bagging predictors”, Machine learning.

[18] J.R.Quinlan, 1986; “Induction of Decision Trees”, Mach. Learn.

[19] https://matthew-brett.github.io/cfd2019/data/chronic_kidney_disease

Issue

Section

Article