首页 > 文献资料
-
利用大数据开源项目实现医疗临床大数据筛选
目的:用大数据技术,实现对复杂类型数据即席查询、文本搜索处理的临床大数据筛选和分析平台.方法:应用基于Hadoop的文件分布存储(HDFS)、大数据仓库(Hive)、数据抽取技术(Sqoop)以及分布式文本搜索(Solr)大数据开源项目,实现对临床大数据的分布存储管理、即席查询、筛选规则加载和病历文本分析.结果:按照“Bolondi再分期模型对肝切除术后患者总体生存预测”课题的数据筛选要求,平台能帮助研究者从大量的具有复杂结构的临床数据中获取符合规则的样本数据.结论:融合应用大数据开源项目是海量医疗临床数据筛选和分析的有效技术方法.
-
机构规范文档构建中机构筛选方法研究
分析文献数据库中的机构数据,从大量机构数据中获取活跃度高、代表性强的机构,为机构规范文档的初步构建提供基础数据.将机构发文的稳定性和活跃度及机构的学科影响作为筛选机构的重要指标,并运用模糊计算构建模糊集合,确定筛选机构的隶属函数,设计机构的筛选方法.以近年的机构数据为例进行验证,筛选结果具有较好的全面性和代表性.
-
多目标优化模型在艾滋病疗法的疗效预测上的应用
本文依据美国艾滋病医疗试验机构ACTG公布的临床数据[1],建立艾滋病疗法的疗效预测模型.同时采用数据筛选和构造病况函数的方法进行求解,得出该疗法的佳治疗终止时间.
-
相关系数分析法在滚动细胞数据筛选中的应用
背景:常用的传统人工筛选流动腔实验数据的方法繁琐费时并有一定的主观性.目的:建立一种基于相关系数的高效数据筛选方法,应用于流动腔实验的细胞滚动黏附数据的筛选中.方法:以E-选择素/配体介导的人早幼粒白血病细胞的滚动为模型,运用相关系数分析法筛选稳定滚动细胞,分析平行平板流动腔实验中稳定滚动的细胞的瞬时速度和位移数据,统计细胞滚动的平均速度,并与人工筛选的结果进行比较.结果与结论:相关系数法筛选目标与人工筛选目标得到的细胞滚动速度结果相吻合.在剪切力0.01~0.07 Pa范围内,平均速度对力的依赖关系表现为两阶段曲线,即随剪切力的增大,平均速度呈现先减小后增大趋势,符合实验观察事实,表明该方法具有可行性.提示相关系数法可以作为筛选流动腔实验数据的重要手段,并代替传统人工筛选法.
-
基于遗传算法的运动想象脑电信号分类准确率的提升方法
为了提高运动想象脑电信号的分类准确率,本研究提出了一种基于遗传算法(genetic algorithm, GA)的脑电信号分类提升方法.该方法利用遗传算法与共空间模式算法(common spatial pattern, CSP)相结合,进行不同时间段的特征提取,再利用遗传算法得到不同时间段对分类正确率的权值及数据可信度.利用本实验室采集的脑电信号进行测试,分类准确率由加权前的80%左右提升至加权后的95%以上.实验结果证实,该方法可以有效提高脑电信号分类准确率,并且可以根据可信度剔除低质量的数据.同时,该方法还可以与其他特征提取方法相结合,对不同时、频特性进行有效性及可信度计算,提升分类准确率.这也是本方法更深一层的意义.
-
IF OR函数及数据筛选在血吸虫病疫情控制达标预评估中的应用
实现湖北省荆州市血吸虫病疫情控制目标,2007年荆州市对所辖的疫区村开展了大规模调层查病工作,对调查的流行村预评估标准数据进行汇总、分析,应用IF(选择性返回函数)、OR(取并集)及数据筛选方法,高效、便捷筛选出达到疫情控制标准的村和审核血清学检查小样本量[1].