作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2020, Vol. 46 ›› Issue (3): 315-320. doi: 10.19678/j.issn.1000-3428.0054109

• 开发研究与工程应用 • 上一篇    

基于GA_Xgboost模型的糖尿病风险预测

张春富a,c, 王松b, 吴亚东b, 王勇a,c, 张红英a,c   

  1. 西南科技大学 a. 信息工程学院;b. 计算机科学与技术学院;c. 特殊环境机器人技术四川省重点实验室, 四川 绵阳 621010
  • 收稿日期:2019-03-05 修回日期:2019-04-08 发布日期:2019-05-28
  • 作者简介:张春富(1994-),男,硕士研究生,主研方向为机器学习、数据挖掘;王松,讲师、博士研究生;吴亚东,教授、博士、博士生导师;王勇,硕士研究生;张红英(通信作者),教授、博士。
  • 基金资助:
    国家自然科学基金(61802320);四川省军民融合研究院开放基金(18sxb030);四川省科技创新苗子工程项目(2018034)。

Diabetes Risk Prediction Based on GA_Xgboost Model

ZHANG Chunfua,c, WANG Songb, WU Yadongb, WANG Yonga,c, ZHANG Hongyinga,c   

  1. a. School of Information Engineering;b. School of Computer Science and Technology;c. Robot Technology Used for Special Environment Key Laboratory of Sichuan Province, Southwest University of Science and Technology, Mianyang, Sichuan 621010, China
  • Received:2019-03-05 Revised:2019-04-08 Published:2019-05-28

摘要: 糖尿病是一种无法根治的代谢性慢性病,早发现、早治疗能降低其发病风险。机器学习模型可以对疾病进行有效预测,提供辅助诊疗。为此,提出一种GA_Xgboost模型应用于糖尿病风险预测。以Xgboost算法为基础,利用遗传算法良好的全局搜索能力弥补Xgboost收敛较慢的缺陷,通过精英选择策略保证每一轮的进化结果最佳。实验结果表明,GA_Xgboost模型在糖尿病预测中的均方误差为0.606,预测精度优于线性回归、决策树、支持向量机和神经网络等算法,调参时间为152 s,用时少于网格搜索和随机游走方法。

关键词: 糖尿病预测, 机器学习, 辅助诊疗, GA_Xgboost模型, 遗传算法

Abstract: Diabetes is a metabolic chronic disease that cannot be thoroughly cured.Early detection and early treatment can reduce the risk of this disease.Machine learning model can effectively predict the disease and provide auxiliary diagnosis and treatment.Therefore,this paper proposes a GA_Xgboost model to predict diabetes risk.Based on Xgboost algorithm,this method makes use of the good global search ability of Genetic Algorithm(GA) to make up for the shortcoming of slow convergence of Xgboost.The elite selection strategy is used to guarantee the best evolutionary results in each round.Experimental results show that the mean square error of GA_Xgboost in diabetes prediction is 0.606,so the prediction accuracy is better than those of the linear regression,decision tree,support vector machine and neural network.Besides,the time of parameter adjustment is 152 s,which is less than grid search and random walk method.

Key words: diabetes prediction, machine learning, auxiliary diagnosis and treatment, GA_Xgboost model, Genetic Algorithm(GA)

中图分类号: