随机森林算法对体检人群糖尿病患病风险的预测价值研究
摘要: 背景 2017年我国是全世界糖尿病患者人数多的国家,糖尿病患者人数达到了1.14亿,及早识别糖尿病高危人群并对其进行有效干预,能够降低糖尿病的患病风险.目的 探讨随机森林算法在体检人群糖尿病患病风险预测中的应用价值.方法 2016年9月—2017年3月,利用乌鲁木齐市石油新村街道和卡子湾街道社区卫生服务中心35~74岁全民健康体检的数据进行研究,考虑到数据的完整性终纳入6727例体检者数据(包含调查问卷、体格测量和实验室检测3部分内容),其中调查问卷内容包括一般人口学资料,体格测量指标包括身高、体质量、腰围等,实验室检测指标包括血液、血糖、血生化等.将数据集按3:1分为训练集和测试集,在训练集中分别应用多因素Logistic回归和随机森林算法建立糖尿病风险预测模型,用测试集进行模型验证,通过预测一致率和受试者工作特征曲线下面积(AUC)评价模型的预测效能.结果在本次体检的6727例体检者中,既往糖尿病患者和新检测出糖尿病患者717例,糖尿病患病率为10.7%.糖尿病患者中65岁及以上者占37.1%(266/717),女性占51.0%(366/717),汉族占94.0%(674/717),初中学历者占35.3%(253/717),超重者占48.0%(344/717),从不吸烟者占72.8%(522/717),从不饮酒者占77.0%(552/717).采用多因素Logistic回归分析在训练集建立糖尿病风险预测模型对测试集进行预测,其灵敏度为0.202,特异度为0.950,预测一致率为0.696,约登指数为0.151,AUC为0.685;采用随机森林算法在训练集建立糖尿病风险预测模型对测试集进行预测,其灵敏度为0.608,特异度为0.953,预测一致率为0.864,约登指数为0.561,AUC为0.702.结论 随机森林算法对体检人群的糖尿病患病风险具有较高的预测效能,但是多因素Logistic回归分析对糖尿病影响因素有直观的解释.建议在实际应用中结合两个模型的优点,使其在疾病风险预测中发挥大的价值.
-
英国社区卫生服务考察札记
[编者按] 近期,以卫生部副部长彭玉为组长的社区卫生服务考察组对英国布里思特市蒙特皮乐社区卫生中心、伦敦东区帕姆社区医学中心等医疗机构进行了访问、考查.鉴于国内社区卫生服务正处于起步阶段,这里将考察的一些重要内容介绍给读者,以开拓视野和思路,汲取、借鉴其有益经验.
-
思考病例(7)请你做一次全科医生
患者,男,26岁,农民.以情绪低落,全身不适7月余就诊.7月前患者常因小事与妻子吵架,多次说想弄死妻子,自己也去死,经劝解方安静.渐表现话少疲乏无力,头昏头闷.否认有精神疾病.在当地医院就诊,给口服奋乃静和多虑平,疗效不佳,入院前2周停服,开始口服"安神补心丸".目前进食差,体重下降6公斤.以"抑郁状态"收住院.
-
纵隔脂肪肉瘤病例分析
患者,男,33岁,一个月前胸闷、发热、咳嗽,胸片及胸部CT检查有上纵隔实质性占位,当地医院疑为良性肿瘤,按上呼吸道感染治疗,症状渐加重,3天前再次复查CT发现前上纵隔肿物明显增大,经治疗后出现气短、心慌,不能平卧,急转我院.查体:气管向右侧移位,左胸语颤减弱,并叩浊音,呼吸音减弱,左下肺呼吸音消失.
-
李延芳针刺治疗小儿先天性斜颈经验
李延芳主任医师行医近40年,临床经验丰富,针刺每起沉疴.尤其对小儿先天性斜颈,臂丛神经麻痹及腓神经损伤等病的治疗,有独到之处.作者有幸随师学习,仅将吾师治疗小儿先天性斜颈经验整理如下.
-
筛前神经封闭治疗鼻睫状神经痛疗效观察
我院自1988~1998年间,采用筛前神经封闭治疗鼻睫状神经痛40例,效果良好,现报道如下.
-
ICA、GAD-Ab检测在2型糖尿病中的临床意义
部分2型糖尿病病人胰岛分泌功能以不同速度进行性减低并终发展为胰岛素依赖型糖尿病.为了及早发现这部分病人并预防及延缓其进展为胰岛素依赖型糖尿病,我们对186例2型糖尿病患者及40例正常人进行了ICA、GAD-Ab检测.现报道如下.
-
脑梗死与肾病综合征(附3例报告)
肾病综合征的卒中患者报道极少,现就我院收治的3例报告如下.
-
原发性左心室恶性神经鞘瘤1例
患者,男,31岁,因"阵发性心悸气短18个月,昏厥2次",于1994年2月收住我科.体格检查:血压14.0/10.0kPa,双肺呼吸音清,无罗音;心率90次/分,节律整齐,心前区无震颤及杂音.
-
对侧疼痛尿石症6例报告
尿石症致对侧疼痛临床少见,文献鲜有报道.我院于1990年6月以来共收治表现为对侧疼痛的尿石症6例,报告如下.
-
高锰酸钾热水足浴为主治疗早期糖尿病足的临床观察
糖尿病足是糖尿病的一种严重并发症.作者采用高锰酸钾热水足浴为主的治疗方法,对社区31例老年糖尿病足病患者进行治疗,取得较好疗效.