首页 > 文献资料
-
不平衡数据处理方法对中药不良反应预测的应用研究
目的:针对中药不良反应数据的不平衡性,探索并应用不平衡数据的处理方法,对中药的不良反应进行预测.本文以使用丹红注射液的患者为研究对象,对来自37家医院集中监测数据进行深度挖掘,在使用了丹红注射液的患者中预测是否发生不良反应.方法:从数据层面采用四种方法:不处理、随机欠采样、随机过采样、SMOTE采样;从算法层面采用四种模型或算法:决策树、随机森林、AdaBoost算法、Gradient Boosting算法,对数据的不平衡性进行处理.两个层面的方法两两结合,对16种方法与模型或算法组合的预测效果进行比较.结果:随机欠采样和AdaBoost算法相结合、随机欠采样和Gradient Boosting算法相结合的预测效果较为理想,recall和G-mean都达到80%以上,AUC指标也高达0.86.结论:初步探索中药不良反应可能适用的不平衡数据处理方法,预测结果结合实际经验,能较准确地预测使用了丹红注射液的患者是否发生不良反应,在临床实际应用中能起到一定的警示作用.同时,根据输出的变量重要性排名,能大程度地避免用药后的不良反应的发生,为丹红注射液的安全性再评价提供一些科学参考依据.
-
脑卒中类型与复发的Logistic回归预测
目的 本研究拟构建脑卒中缺血性或出血性分型回归模型、脑卒中复发回归模型.方法2012年5月-2013年9月在河北医科大学第二医院因脑卒中入院治疗244例患者的病例,对其出院后进行随访,平均随访时间为18个月.通过IBM SPSS进行Logistic回归分析,采用向前法,获得Logistic回归方程.并用Cox&Snell R Square检验计算拟合优度,获得预测准确率.使用SMOTE算法用R语言平衡数据.结果脑卒中分型的回归模型检验拟合优度为0.634,预测准确率为86.1%;缺血性脑卒中复发预测的回归模型检验拟合优度为0.236,其灵敏度为28.6%,出血性脑卒中检验拟合优度为0.272,其灵敏度为60%;SMOTE算法处理缺血性脑卒中复发预测数据,获得的回归模型Cox&Snell R Square检验拟合优度为0.488,灵敏度为89.3%.结论缺血性与出血性脑卒中类型可以使用Logistic回归进行辅助诊断,以提高诊断准确率;脑卒中患者的复发可以根据出院后对其健康检测的数据代入Logistic回归方程评估,继而针对性进行强化二级预防管理.
关键词: 脑卒中 Logistic回归分析 判别分析 SMOTE 不平衡数据