欢迎来到360期刊网!
学术期刊
  • 学术期刊
  • 文献
  • 百科
电话
您当前的位置:

首页 > 文献资料

  • 随机森林方法在医学中的应用

    作者:韩玉;施海龙;曲波;武玉欣;刘洁

    随机森林(random Forests,RF)方法作为一个数据分析技术近年来在医学及其他领域中的应用十分广泛.与其他算法相比,随机森林方法有着精度高、可容忍噪声等诸多优点,并且近年来在随机森林方法的基础上又衍生出了许多改进算法.本研究主要介绍了随机森林的原理和方法,以及它在医学中的应用现状与前景.

  • 基于随机森林的冠心病患者住院费用影响因素的分析

    作者:张晔;迟卫军;徐云伟;付凌雨

    目的 分析非手术和手术治疗冠心病患者的住院费用结构特征及其影响因素重要度,为有效控制住院费用,合理分配卫生资源提供依据.方法 基于单因素分析和随机森林回归树模型对辽宁省某医院2018年1月-4月2149例去识别化的主要诊断为冠心病的患者的住院费用及其影响因素进行分析.结果 2149例冠心病患者住院费用均值为31564.93元,手术组平均住院费用为38011.90元明显高于非手术组9794.94元.是否手术及类型、住院天数、主要诊断类型为主要的住院费用影响因素.非手术组中年龄和性别也是住院费用的重要影响因素.手术组中是否伴有糖尿病也是住院费用的重要影响因素.全样本组中是否PCI术后即陈旧性冠心病也是影响住院费用的重要因素.结论 住院费用的影响因素较多,控制住院费用的协同需要采取综合措施,以控制、缩短平均住院日为突破口,加强可控因素的控制,强化管理,优化服务流程,提升工作效率.

  • 高维肺癌病例-对照研究资料的随机森林降维分析

    作者:朱晶晶;赵杨;陆凤;胡志斌;陈峰

    目的 探讨随机森林算法在肺癌高维病例-对照资料分析中的应用效果.方法 选取500例医院来源肺癌患者作为病例组,以517名社区来源对照人群作为对照组,每名研究对象均常规采集静脉抗凝血5 ml,位点基因型通过GoldenGate定制芯片平台分型,经筛选获得399个SNP位点,先利用随机森林算法进行降维,再用传统的logistic回归对降维后的变量进行分析,并采用受试者工作特征曲线(ROC)曲线下面积(AUC)分析多个SNP位点与肺癌的遗传易感性.结果 经随机森林算法筛得50个平均重要性得分高且错误率低的变量,其中环境变量(吸烟、年龄分组、性别)的重要性得分均位于前20,分别为4.05、3.12、1.16;在调整3个环境变量后,经阳性结果错误率(FDR)法进行多重性校正,结果仍有统计学意义的SNP位点有6个(FDR-P<0.05),而如果直接采用传统logistic回归分析,则无法发现有统计学意义的SNP位点.对于2个ROC曲线(分别为只包含环境变量模型ROC曲线、包含环境变量和SNP位点模型的ROC曲线)AUC(分别为0.6491±0.0172、0.6811±0.0166)的似然比检验结果表明,6个SNP位点与肺癌的关联性有统计学意义(X2=43.82,p=3.6×10-11).结论 利用随机森林算法先剔除高维数据的噪声位点,再利用logistic回归分析,可提高检验效能,优于直接利用logistic回归分析.

  • 基于RBF-RF级联分类器电子鼻对中药的快速鉴别

    作者:邹慧琴;李硕;闫永红;刘勇;赵婷;韩玉;苏玉贞;彭莲

    目的:将电子鼻引入中药研究领域,探讨其在实际应用中的难点并提出解决方案,建立优化判别模型,为中药鉴别提供一种简便、快速、有效的分析方法,同时为气敏传感器的研发及应用提供新思路。方法:采用电子鼻提取中药气味特征,基于MOS传感器的离子迁移谱,建立中药气味指纹图谱。以传感器大响应值为分析指标,针对鉴别难点,提出两种解决方案:尝试不同检测器,即扩充传感器数量,尽量缩小“嗅觉盲区”;采用“级联分类器”构建法,即采用径向基函数(RBF)与随机森林(RF)二级级联分类器构建判别模型。通过十折交叉验证和外部测试集验证对所建模型进行系统性能的评估。结果:两种方案准确、可行,具有较高的正判率和较好的泛化能力(所得高正判率分别为95%和100%、96%和80%)。结论:本研究首次采用“级联分类器”模式构建中药电子鼻鉴别的判别模型,在传感器数量有限的情况下,从所得数据中挖掘大信息量;以“拆分任务、剥离难点、由易到难、分级递进”为原则,实现电子鼻对中药的快速、准确鉴别。所建模式识别法在可操作性、鉴别准确率和稳定性上均优于传统嗅觉识别法,为中药鉴别提供一种简便、快速的分析方法。

  • 基于指纹相似度的药物-靶点相互作用预测

    作者:于亚运;刘勇国;蒋羽;李利民

    药物通过结合人体靶点发挥药效,识别药物-靶点相互作用对于药物新功能发现至关重要.该文提出基于分子子结构的靶点指纹特征和基于指纹相似度的药物-靶点特征计算方法,构建随机森林分类模型识别和预测药物-靶点相互作用,通过酶、离子通道、G蛋白偶联受体和核受体数据集测试并与现有方法对比分析,并将所提模型应用于中药成分-靶点相互作用预测,实验结果表明所提方法的有效性.

  • 电子鼻MOS传感器阵列优化及其在中药材快速鉴别中的应用

    作者:邹慧琴;刘勇;陶欧;林辉;苏玉贞;林相龙;闫永红

    电子鼻广泛应用于诸多领域,在不同领域中电子鼻传感器阵列的构成不同.由于中药气味的复杂性和特殊性,在中药鉴别分析中,需建立阵列优化法、筛选专属佳阵列.采用法国Alpha MOS公司的α-FOX3000电子鼻对姜科常用10味中药进行气味检测,基于逐步判别分析法和聚类分析结合典型指标筛选法,建立了MOS传感器阵列的优化法.同时针对优化前后的数据,分别采用主成分分析、Fisher判别分析和随机森林算法进行了对比研究.结果表明,优化后的阵列不仅保留了原始阵列的有效信息,而且在一定程度上剔除了冗余信息、提高了识别效率.随机森林分类器计算结果表明:佳阵列为逐步判别分析筛选的S1,S2,S5,S6,S8,S12组合而成,此阵列优化法有效、可行;为电子鼻在中药鉴别中MOS传感器阵列的优化提供思路与方法参考.

  • 随机森林算法在中药指纹图谱中的应用:以不同品牌夏桑菊颗粒指纹图谱分析为例

    作者:夏伯候;胡玉珍;熊苏慧;唐洁;闫庆梓;林丽美

    该研究旨在建立随机森林算法鉴别和分类不同品牌夏桑菊颗粒,为多指标的复杂指纹图谱的鉴别提供有效的参考.采用高效液相法采集83批不同品牌的夏桑菊颗粒指纹图谱,比较主成分分析、偏小二乘法-判别分析、随机森林等方法在处理不同分类样品复杂数据时的不同.结果表明本研究成功建立了83批不同品牌夏桑菊颗粒的指纹图谱;经过不同模式识别方法比较可得,主成分分析分析只能解释56.52%的方差贡献率,同时不能完全将样品分类;偏小二乘法-判别分析优于主成分分析的结果,能达到一定的分离,解释总体方差贡献率63.43%;而随机森林法能够很好的将样品分为3类,且3类样本的10折交互验证准确率达到96.5%.因此,随机森林算法联合HPLC指纹图谱能够有效构建中药质量控制和分析体系.

  • 基于随机森林算法的高维脑电特征优选

    作者:李飞;高小榕;高上凯

    在基于脑电的脑-机接口研究中,脑电信号的分类是较为重要的部分.从多导脑电中得到大量可用于分类的特征,并对这些特征进行优选是研究热点.本文应用多分类器组合的分类树方法和自助法重采样技术,结合随机特征选择,使用随机森林组合分类器方法对想象运动实验中的高维脑电特征进行分析.根据不同特征在生成森林过程中被选用于分枝次数的不同,提出了一种有效的特征优选方法,并在特征优选的基础上可以进行导联的筛选.

  • 随机森林在医学影像分析中的应用研究进展

    作者:孙凯

    随机森林(random forest,RF)是一种机器学习方法,在医学、生物信息、管理学等领域广泛应用,常用于处理分类和回归问题.随机森林属于集成学习算法族,特点是在训练过程中加入了数据样本扰动和输入属性扰动,因此可以处理多种数据类型.在现有医学影像分析中,随机森林主要用于以下3个方面:医学图像的图像处理、辅助医学治疗诊断、探究某些病症的发病因素.本文首先对随机森林的基本原理进行简单介绍,然后对随机森林在医学影像中的使用加以重点介绍,后对随机森林的优缺点加以小结和展望.

  • 一种基于有监督奇异值分解和随机森林的卵巢癌磷脂代谢物特征提取方法

    作者:来海锋;韩斌;厉力华;陈岩;SUTPHEN Rebecca;祝磊;代琦

    卵巢癌是一种常见的妇科肿瘤,死亡率占各类妇科肿瘤的首位.选取既有较高的分类疾病模式能力又具有生物学关联的特征肿瘤标志物用于肿瘤的诊断是目前研究的重点.本研究针对卵巢癌磷脂代谢物数据的问题,提出了一种融合有监督奇异值分解和基于信息增益的随机森林决策的方法用于特征标志物的选择.首先应用有监督奇异值分解计算各标志物的权重值,并根据权重值粗选出候选标志物;其次应用基于信息增益的随机森林决策理论从候选标志物中选出特征标志物;后通过SVM分类器测试,分类率高达90%以上.本研究方法与其他常用方法比较具有一定优势,其中一个明显的特点是所选特征标志物不但保持了较高的分类率,而且具有生物学关联意义,从而证实本研究方法具有较高的可行性和实用性.

  • 利用整体经验模态分解和随机森林的脑电信号分类研究

    作者:秦喜文;吕思奇;李巧玲

    癫痫脑电信号的自动监测与分类在临床医学上具有重要意义.针对脑电信号的非平稳特点,提出一种基于整体经验模态分解和随机森林相结合的脑电信号分类方法.选取波恩大学脑电信号数据集中癫痫发作间期和发作期的200个单通道信号,共819 400个数据作为样本.首先利用整体模态分解将癫痫脑电信号分解成多个固有模态函数,然后对各阶固有模态函数提取有效特征,后分别用随机森林和小二乘支持向量机对脑电信号的特征进行分类.将随机森林与小二乘支持向量机分类正确识别率对比,结果表明,随机森林分类方法对发作期和发作间期的癫痫脑电信号的分类效果比较理想,识别精度为99.60%,高于小二乘支持向量机的准确性.该方法的提出能有效提高临床癫痫脑电信号分析的效率.

  • 基于随机森林的慢性丙型肝炎纤维化和活动度分析

    作者:蔡加欣;邱璇;黄智力;骆榕澜

    为对慢性丙型肝炎病情相关的肝纤维化阶段和炎症活动度进行预测,提出一种基于两阶段随机森林的自动分级方法.首先,在训练病例集上进行第一阶段随机森林模型学习,获取各个血清学指标的特征重要度,以衡量这些指标与肝炎纤维化阶段和炎症活动度之间的相关程度;其次,选择特征重要度大于阈值的血清学指标,可作为下一步进行分类的特征;后,在选出的显著性特征上进行第二阶段的随机森林模型训练,对慢性丙型肝炎的肝纤维化程度和炎症活动度进行自动分级.通过对123例慢性丙型肝炎的血清学指标进行分析,得到纤维化阶段、纤维化S4阶段和炎症活动度的分类正确率分别为68.29%、100%和73.17%,得到与慢性丙型肝炎纤维化分期和活动度分级密切相关的重要血清指标为总胆固醇、高密度脂蛋白胆固醇、谷丙转氨酶、天门冬氨酸转氨酶等.实验结果表明,采用的检验指标获取成本低、计算量低,能达到较好的分级准确度,有助于慢性丙型肝炎诊断.

  • 基于随机森林算法的小鼠micro-CT影像中骨骼关节特征点定位

    作者:屠睿博;陈中华;王洪凯

    随着小动物成像技术的发展,技术人员每天需要处理的小动物影像数量急剧增长,这使得自动化的小动物图像分析方法成为迫切的需求.在小鼠图像分析方面,小鼠灵活多变的身体姿态给自动化的图像分析带来困难.基于随机森林算法实现小鼠micro-CT图像中骨骼关节点的自动定位,为解决小鼠影像中身体姿态的自动识别打下基础.该算法主要分3步:先通过分类随机森林算法得到小鼠骨骼关节点的粗定位,再通过回归随机森林算法进一步减小定位误差,后通过图匹配的方法在备选点中挑选正确位置上的关节点.对49例不同身体姿态的小鼠全身三维micro-CT图像进行测试,全身关节点定位的成功率为98.27%,定位误差的中值为0.68 mm.同时验证联合使用分类与回归随机森林的必要性,并探究训练数据的数量对不同骨关节的识别效果的影响.研究为小鼠micro-CT影像中身体姿态的识别提供一种新方法,为后续的自动化图像配准、图像分割以及自动化图像测量提供重要的定位信息.

  • 一种2型糖尿病中医证型的舌图像识别方法

    作者:阚红星;张璐瑶;董昌武

    舌诊是2型糖尿病辨证方法之一,为降低因外界光线、医生经验等因素造成的临床2型糖尿病舌象诊断误差,提出一种2型糖尿病中医证型的舌图像识别方法.首先,通过色差校正,获得校正后舌象图像;其次,基于不同颜色空间特性,运用快速K均值聚类方法分离图像背景区域与舌体区域,再对舌体区域图像运用Ohta色度阈值法分离出舌质区域和舌苔区域;然后,根据2型糖尿病3种证型的舌象特征,提取舌体、舌苔及舌质区域的颜色、裂纹和胖大特征值;后,使用随机森林作为分类器训练识别数据,并与支持向量机的方案进行对比.通过对218例数据训练识别,得出随机森林方法平均识别准确率为90.37%,比支持向量机方法提高了10.74%.结果表明,在2型糖尿病中医证型分类识别方面,随机森林方法更准确,且提出的舌图像识别方法可以实现2型糖尿病的中医证型识别.

  • 一种生物相关性优先的两步卵巢癌化疗疗效敏感基因选取方法

    作者:韩斌;王清;解瑞飞;厉力华;祝磊

    作为卵巢癌主要诊疗手段之一的化疗,费用昂贵,副作用大,且患者反应的个体差异很大.本文提出一种首先依据诊断结果(卵巢癌化疗疗效)相关性进行特征选择,然后利用蒙特卡洛方法对特征基因排序,终建立预测化疗反应模型的方法,克服了过度依赖分类率的弊端.首先利用奇异值分解,基于散点图和Kolmogorov-Smimov test(K-S test)的定性和定量分析非生物因素对基因表达谱的影响,结合化疗反应样本的聚类图进行基因筛选;然后采用基于信息增益的随机森林方法精选基因,得到与化疗相关的敏感基因.实验结果表明,此方法与经典方法( SVMRFE、T-test)相比,所选取出的特征基因具有较好的分类能力且保持稳定;从生物学角度分析显示,此方法所得到的敏感基因与化疗疗效的联系更加紧密,50个基因中,有4个( NR2F2、CLDN3、PURA、ClORF38)直接与卵巢癌相关;17个(US01、TCF7L2、NR2F2等)与肿瘤或癌症直接相关,或与肿瘤密切相关的生物过程(例细胞生长与繁殖、新陈代谢、细胞循环、DNA修复等)相关.

  • 基于随机森林和误差反向传播神经网络的糖尿病性周围神经病变患病风险研究

    作者:桑祎莹;黄仕鑫;易静;曾庆;罗亚玲

    目的 建立准确判别糖尿病性周围神经病变(DPN)的分类模型,为疾病的诊断提供有价值的计算机辅助方法.方法 收集重庆医科大学附属第二医院2016年1-12月确诊的2199例DPN患者及在该院健康体检的2610例体检对象的52项临床信息资料,使用R软件分别构建随机森林(RF)模型和误差反向传播(BP)神经网络模型,并比较两种诊断模型的评价指标,选择优分类模型.结果 采用随机森林和BP神经网络模型对4809例观察对象进行个体患病风险分类研究,两种模型测试样本的正确率分别为99.93%、99.58%,约登指数分别为99.85%、99.14%,ROC曲线下面积分别为0.9994、0.9959.结论 两种模型的分类效果均很好,但随机森林模型在判别DPN患病风险研究中具有更高的实用性.

  • 随机森林算法在中医药院校贫困生认定预测中的应用研究

    作者:唐燕;王苹

    中医院校的贫困生认定工作是非常重要的,但是目前的认定方法还存在着不科学不公正等问题.为完善贫困生的认定工作,本文基于随机森林分类算法,对贫困生的认定进行研究.在相同的数据集中,分别使用决策树算法和随机森林算法对贫困生进行分类,决策树算法的平均正确率为74.43%,而随机森林算法模型的平均正确率为85%,并进一步对两种算法进行比较.实验证明,随机森林算法分类正确率较高,适合贫困生的认定工作.随机森林为贫困生的认定提供了一种新方法.

  • 应用机器学习算法构建心梗患者风险预测模型

    作者:宗慧;赵韡

    目的:应用机器学习中的相关算法构建一个风险预测模型,预测急性心肌梗死患者出院后是否会有严重不良事件发生.方法:采用机器学习中的随机森林算法构建预测模型,用ROC曲线评估模型预测性能.结果:通过随机森林算法建立的风险预测模型,准确预测了急性心梗患者出院后是否发生严重不良事件.结论:该模型可以为实际临床急性心梗预后康复提供参考依据.

  • 基于机器学习的再入院预测

    作者:汤培楷

    为了预测住院病人是否会在短时间内再入院,提出了基于机器学习的再入院预测方法.通过选取合适的数据集,利用ICD-10诊断相关组编码(DRGs)等信息,选择合适的机器学习算法,训练预测病人短时间内再入院的概率.通过训练测试分类器的正确肯定率与错误肯定率得到的R0C曲线,对比逻辑回归、随机森林和支持向量机三种分类器的性能指标,发现随机森林对复杂数据有良好的适应性,实验所得AUC均值更高,更适合应用于再入院的预测.

  • 随机森林模型在ICU患者住院死亡风险预测中的应用

    作者:谢俊卿;蔺轲;李春晓;孔桂兰

    目的:应用随机森林模型构建ICU患者住院死亡风险预测模型.方法:采用随机森林算法构建预测模型,通过ROC曲线下面积评估其预测性能,并与ICU常用的危重症病情评分模型SAPS-Ⅱ进行比较.结果:随机森林模型的ROC曲线下面积比SAPS-Ⅱ模型高出5个百分点,两者分别为0.855和0.800.结论:随机森林模型对复杂数据有良好的适应性,相比SAPS-Ⅱ,分类准确度高,更适合应用于ICU患者住院死亡风险的预测.

62 条记录 1/4 页 « 1234 »

360期刊网

专注医学期刊服务15年

  • 您好:请问您咨询什么等级的期刊?专注医学类期刊发表15年口碑企业,为您提供以下服务:

  • 1.医学核心期刊发表-全流程服务
    2.医学SCI期刊-全流程服务
    3.论文投稿服务-快速报价
    4.期刊推荐直至录用,不成功不收费

  • 客服正在输入...

x
立即咨询