缺失值方向的医学|核心|好投期刊有哪些_缺失值方向的期刊推荐-360期刊网

您当前的位置：

首页 > 文献资料

缺失值文献资料

卡方自动交互检测法及其应用

作者：何凡；沈毅；叶众期刊：中华预防医学杂志 2005年02期

卡方自动交互检测法(chi-squared automatic interaction detector,CHAID)早由Kass于1980年提出,其核心思想是:根据给定的反应变量和解释变量对样本进行优分割,按照卡方检验的显著性进行多元列联表的自动判断分组.利用卡方自动交互检测法可以快速、有效地挖掘出主要的影响因素,它不仅可以处理非线性和高度相关的数据,而且可以将缺失值考虑在内,能克服传统的参数检验方法在这些方面的限制,结果的解释也简单明了.现就卡方自动交互检测法及其应用进行探讨.

关键词：交互检测法最优分割自动判断影响因素卡方检验解释变量检验方法应变量缺失值列联表非线性应用样本思想数据分组处理参数
对204名大学生拨牙恐惧情况的调查

作者：郑谧；郑新宇期刊：中国心理卫生杂志 2004年08期

本文以某大学二、三年级204名大学生为研究对象,剔除有缺失值的问卷,完成有效问卷的有202人,其中女性97人,男性105人.年龄21±1岁.参照国内外有关牙科恐惧研究的资料[1-3],以Cynthia C.等人[4]编制的DHFS问卷为基础,直接翻译后形成本调查问卷;该问卷共有22个项目,分为4个维度:一般性焦虑、特定性恐惧、信任度、绝望感.项目的评分采用4点评分法,具体为:1=没有,2=有一点,3=较多,4=很多.国外研究表明该问卷具有良好的信效度.

关键词：大学生拨牙调查问卷直接翻译研究对象评分法国外研究性焦虑信效度信任度特定性缺失值绝望感资料牙科女性年龄男性基础国内
欧洲医药产品管理局关于临床研究中缺失值的考虑要点

作者：唐健元；马坤期刊：中国临床药理学杂志 2009年04期

临床研究中缺失值的出现,可能会对评价的客观性造成一定影响.欧盟医药产品管理局专门就缺失值问题制定了相关指导原则,其中见解可为国内新药研究提供一定参考.

关键词：欧洲医药产品管理局缺失值指导原则
褪黑素时间序列中缺失值的填补方法研究

作者：钱淑雯；李海燕；杨学智；李慧；张尚尚；芦煜；王京平；张治霞；徐静期刊：现代中西医结合杂志 2014年35期

目的：模拟同一时间点数据完全缺失和部分缺失2种情况，通过填补值和实际值的对比，比较各填补方法对褪黑素（MT）时间序列的填补效果。方法同一时间点完全缺失时，比较实际值与 SPSS 5种填补方法填补结果；部分缺失时，除完全缺失的填补方法外，增加拟合时间序列模型填充。结果完全缺失时，临近点的中位数和线性插值法的填补结果和两因素析因设计资料方差分析结果更接近于实际。实际值波动幅度较小的时候，插值法拟合效果好；在实际值波动较大时，临近中位数拟合效果好。部分缺失时，拟合模型填充效果好。结论完全缺失时，如排除缺失值大幅波动，可以运用临近中位数和插值法对缺失值进行填充。在临近值波动幅度较小时，选用插值法填充值；在临近值波动幅度较大时，选用临近中位数填充值。部分缺失时，选用时间序列拟合模型填充。

关键词：时间序列缺失值填补方法
基于Monte Carlo模拟的四种完全随机双变量缺失数据处理方法的比较

作者：朱高培；朱乐乐；孟马承；吴学森期刊：中国卫生统计杂志 2018年05期

目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势.方法运用R语言,采用Monte Carlo技术模拟完整数据集、不同缺失比例和相关系数条件下的数据集,比较各种方法处理缺失值的效果.结果当缺失比例为10%时,4种方法处理效果一致.随着缺失比例增加,4种方法处理后均值变化不大;均值填补法处理后相关系数小于其他方法,多重填补法和标准一致,回归填补法填补后相关系数比其他方法偏高而且呈增加趋势.随着回归系数的增加,回归填补法的相关系数准确性增加.结论 4种方法处理完全随机缺失机制下两个相关变量的效果不同,当缺失比例较低时,建议采用成组删除法或回归填补法.当缺失比例较大时,建议使用多重填补法.

关键词：缺失值相关变量多重填补法 Monte Carlo模拟
加权估计方程用于缺失数据的处理

作者：张伟；冯萍；赵永红；袁佳英；李梅期刊：中国卫生统计杂志 2013年03期

在医学研究过程中缺失数据现象是普遍存在的[1-3],目前实际应用中对缺失值处理的方法主要采用缺失值的删失以及单一填补[4-5].随着统计软件相关程序的实现,更有效的缺失值处理方法逐渐引起研究者的关注,如基于多重填补的方法,基于参数似然的方法以及基于加权估计的方法[6-7].weighted estimating equations (WEE)法是加权估计法中的一种,是广义估计方程(gemeralized estimating equations,GEE)方法的推广,被认为估计效率高,稳健性好,尤其在模型假定错误的情况下,仍可以获得更接近真实值的无偏估计.目前,国际对于缺失数据处理方法的理论应用研究热点多为WEE法[8-10],而国内相对集中于多重填补的研究[10-14],对于WEE法的研究应用相对较少.因此本文对WEE法的理论框架进行详细介绍.

关键词：加权估计方程处理方法缺失值缺失数据多重填补应用研究广义估计方程程序的实现医学研究无偏估计统计软件实际应用理论框架估计效率相对集估计法模型国内参数
诊断试验缺失值处理方法的比较研究及应用

作者：黄耀华；唐欣然；王杨；李卫期刊：中国卫生统计杂志 2013年04期

目的探讨诊断试验中缺失值的处理方法并进行比较.方法分别介绍诊断试验常用的4种缺失值处理方法:完整数据法(complete case,CC),随机缺失法(missing at random,MAR),差值法(worst case,WC)以及无信息结转法(non-informative imputation,NI),采用不同方法对实例数据进行填充,分别从诊断试验灵敏度、特异度、阳性预测值和阴性预测值四个方面评价缺失值的填充效果.结果无信息结转法与传统缺失值处理方法比较,相对保守且假设简单.结论当诊断试验中诊断结果存在缺失值时,无信息结转方法可以较保守地估计真实的诊断效果.

关键词：诊断试验缺失值无信息结转
不同缺失值填充方法在全国血吸虫病监测资料中的比较研究

作者：赵飞；张志杰；刘建翔；王海银；周艺彪；彭文祥；赵根明；姜庆五期刊：中国卫生统计杂志 2010年02期

以全国血吸虫病疫情监测资料为数据来源,比较不同缺失值处理方法对模拟缺失值的处理结果,为确定适用于处理该资料缺失值的方法提供依据.方法从资料中分别随机抽取10%、20%、30%、40%、50%的观测值作为假设缺失值,采用均值填充法、热平台填充法和多重填充法对模拟缺失值进行填充,分别从分布特征、准确度和精确度三个方面评价缺失值的填充效果.结果不同假设缺失比例下,三种填充方法填充后的结果与原始值相比差异均无统计学意义.多重填充方法填充后结果精确度较好且分布特征与原始值符合度好.结论多重填充技术较为适合处理该资料中缺失比例较少的缺失值.

关键词：血吸虫病疾病监测缺失值多重填充
缺失森林算法在缺失值填补中的应用

作者：沈琳；胡国清；陈立章；谭红专期刊：中国卫生统计杂志 2014年05期

目的介绍R环境下缺失森林算法在缺失值填补中的应用并评价其填补效果.方法通过实际数据阐述填补估算流程,比较缺失森林算法与直接删除法处理缺失数据的效果.结果当数据缺失率为10％时,缺失森林算法填补的效果明显优于删除法;当数据缺失率在20％时,两种方法处理缺失值的效果都不太理想,效果相近.当缺失率达50％时,3种类型的变量估算的误差已经较大,两种方法的估算效果均欠佳.结论缺失森林算法在软件操作上简便,并且对数据结构和分布的要求宽松,可充分利用现有记录的信息,能较为准确地反应调查的真实情况,在实际工作中具有较好的应用价值.

关键词：缺失森林随机森林决策树缺失值
期望大化法和回归法对亚洲心血管病国际合作研究缺失数据填充效果比较

作者：杨永利；付鹏钰；胡东生；张卫东；张梅喜；王重建；平智广期刊：中国卫生统计杂志 2009年04期

目的分析亚洲心血管病国际合作研究(international collaborative study of cardiovascular disease in ASIA,InterASIA)缺失值缺失机制,探索适合该资料的方便、有效、合理的填充方法.方法利用SPSS 16.0软件,分析数据的缺失机制,分别采用期望大化法和回归法对缺失数据进行填充.结果 InterASIA资料缺失指标缺失率在0.1%～2.1%,缺失机制为随机缺失,年龄偏小的人指标缺失率更高;采用期望大化法和回归法对缺失数据进行填充后各指标的算术均数、标准差以及线性回归模型中的回归系数及标准误与填充前各指标的取值非常接近.结论 InterASIA资料缺失率低,其缺失机制为随机缺失,期望大化法和回归法是方便、有效、合理的填充方法.

关键词：缺失值随机缺失期望最大化法回归法
配比设计中缺失数据的hot-deck估算

作者：任金马；赵杨；陈峰；蓝绍颖期刊：中国卫生统计杂志 2004年05期

目的探讨hot-deck估算在含有缺失数据的配比设计资料分析中的应用.方法在Stata7.0软件上利用Adrian Mander和David Clayton开发的hot-deck程序进行数据模拟.结果hot-deck估算可以使缺失数据所包含的信息得到一定程度的弥补,当含有缺失值的变量是分类或等级变量时,效果更为显著.结论hot-deck估算是解决配比设计资料中离散型数据缺失问题的一个有效工具.

关键词：缺失值 hot-deck估算匹配近似贝叶斯自举法
利用Monte Carlo技术模拟研究不同缺失值处理方法对完全随机缺失数据的处理效果

作者：武瑞仙；邓子兵；谯治蛟；李晓松期刊：中国卫生统计杂志 2015年03期

目的以医疗卫生机构年报资料为数据来源,采用成组删除法、极大似然估计法、多重填补法分别对模拟的完全随机缺失数据集缺失值进行处理,比较不同缺失率下三种方法的缺失处理效果.方法运用SAS9.3,采用Monte Carlo技术模拟完整数据集及不同缺失比例数据集,利用成组删除法、EM算法、MCMC算法对缺失数据进行处理,得到不同处理方法后的参数估计结果,与完整数据集参数估计进行比较.结果对于完全随机缺失数据,不同缺失率下,成组删除法的准确率均比较好;缺失率小于10％,三种方法处理效果差异不大;缺失率在10％～30％,成组删除法精确度逐渐降低,EM与MCMC准确度与精确度较好,缺失率大于30％,MCMC准确度与精确度相对较好.结论对于不同缺失率的数据,综合考虑准确度和精确度,采用不同的方法进行处理.

关键词：缺失值 EM算法 Markov Chain Monte Carlo 模拟参数
生存质量资料中缺失值的内在机制及处理措施

作者：胡运涛；曹袁媛；章诗琪；史济洲；李素文；王静期刊：中国卫生统计杂志 2008年06期

WHO把生存质量定义为个体对其身体、精神和社会交往状况的满意程度以及与自身所处环境相适应的程度[1].由于生存质量资料的多变量、多维度,加之长期随访中的偶然因素,缺失数据无法避免.20世纪90年代以来,大规模的国际性研究机构如欧洲癌症研究与治疗组织、国际乳腺癌研究组等都面临数据缺失的挑战并开始积极寻求对策,进行总结和经验交流[2].有鉴于此,本文将对生存资料中缺失数据的表现形式、产生机制以及处理方法做进一步综述,为生存质量资料的预处理和统计分析提供有效的信息.

关键词：生存质量生存资料缺失值内在机制缺失数据数据的表现质量定义统计分析数据缺失偶然因素经验交流处理方法程度产生机制预处理乳腺癌环境相国际性多维度多变量
缺失数据统计处理方法的研究进展

作者：帅平；李晓松；周晓华；刘玉萍期刊：中国卫生统计杂志 2013年01期

临床试验和流行病学调查中经常出现缺失数据[1-2].一直以来,统计学家们研究的分析方法主要针对完整数据,含缺失值的数据无疑给生物医学者在实际应用分析时带来不少困难[3-4].Croy[5]等的研究发现,在随机抽取的25篇关于质量分析的文献中,仅有3(12％)篇文章对缺失值进行了处理,采用的方法仅是均值替代、多重回归或根据经验取值替代.Wood[6]等对2001年发表在BMJ、JAMA、Lancet和New England Journal of Medicine期刊上的随机对照试验分析后发现,缺失数据在这些试验中普遍存在,但未得到很好的处理和分析.缺失数据的出现给数据分析

关键词：数据统计缺失数据试验分析缺失值流行病学调查质量分析应用分析完整数据随机对照随机抽取数据分析临床试验分析方法多重回归处理统计学学者文献生物取值
临床研究中缺失值的类型和处理方法研究

作者：唐健元；杨志敏；杨进波；黄钦；吴春芳；冯毅期刊：中国卫生统计杂志 2011年03期

临床研究过程中的一些缺失值,可能导致新药评价过程中的偏倚和降低评估的精确性和损耗随机化的效果,以至于做出偏倚性结论.由于脱落数据很可能是一些极端值(如因治疗无效而未再回访),缺失的这部分研究数据会导致低估结果的变异性,从而得到一个"人为狭窄"的治疗效应(1).

关键词：临床研究缺失值值的类型处理治疗效应数据评价过程偏倚因治疗随机化精确性极端值变异性新药狭窄脱落损耗评估结果
多变量缺失数据的不同处理方法及分析结果比较

作者：武建虎；贺佳；贺宪民；程红岩期刊：第二军医大学学报杂志 2004年09期

目的:探讨多变量缺失数据的不同处理方法对结果的影响.方法:分别利用删除含缺失值的观察、简单填补、多重填补3种方法对多变量中度缺失的925例肝癌患者的临床资料进行统计分析并对其结果进行比较.结果:不同方法所产生的结果差别较大.在α=0.05的水平下,利用多重填补处理的数据集分析得到影响肝癌患者生存时间的危险因素:临床分期、肝硬化史、门脉癌栓、g-GT和WBC;而用删除含缺失值方法得到的却是:TNM分期、碘油剂量、AST、ALP;简单填补比多重填补多产生3个危险因素,分别是:TNM分期、ALP和AFP.结论:本资料采用删除含缺失值的观察的方法结果差;简单填补相对较好,但容易降低标准误、减小P值;而多重填补处理比较合理、科学.建议对多变量数据缺失的处理一定要慎重.

关键词：多变量缺失值多重填补肝肿瘤
用Stat/Transfer进行数据转换

作者：钱俊；陈平雁期刊：中国医院统计杂志 2006年02期

不同统计软件在处理数据时各有所长.当我们用不同软件处理同一数据对象时,存在着一个数据转换(data transfer)问题.通常,不同软件的数据文件不是不能直接转换,就是转换过程比较复杂[1];例如,常用的统计软件SPSS在11.0以前的版本还不能实现与SAS数据的直接转换.即使这些权威的统计软件具有了较强的数据转换功能,但对某些数据(库)类型的转换仍无能为力,例如SPSS和SAS就不具备与另一个极具影响的统计软件Minitab的数据转换功能.而Stat/Transfer软件[2]恰恰可以方便地解决这一问题,其操作简单,包含的数据类型广泛,下面简要介绍之.

关键词：数据转换变量选择记录选择缺失值
成组删除法和多重填补法对随机缺失的二分类变量资料处理效果的比较

作者：王曼；施念；花琳琳；杨永利期刊：郑州大学学报（医学版）杂志 2012年05期

目的:评价两种随机缺失的二分类变量资料处理方法.方法:以艾滋病中医症候的调查资料为数据来源,利用SAS 9.2对完整数据集随机模拟,构建不同比例的随机缺失数据集,对缺失数据集采用多重填补法中的logistic回归法(MI/logistic)进行填充处理;同时对缺失数据集采用成组删除法进行处理;根据各个数据集建立logistic回归模型,与完整数据集进行比较.结果:缺失10%时,成组删除法处理结果与完整数据集更接近;缺失20%~40%时,MI/logistic填补后常数项和x的回归系数明显偏离完整数据集;缺失50%时,MI/logistic填充2次时x的回归系数和标准误更接近于完整数据集;缺失60%时,MI/logistic填充后x的回归系数严重偏离完整数据集,成组删除后x回归系数的标准误明显偏离完整数据集.结论:缺失较少(缺失率<40%)时,成组删除法处理效果较好;缺失50%时,采用MI/logistic回归法填充效果更好;缺失60%以上时,两处理方法均不理想.

关键词：二分类变量缺失值成组删除法多重填补法
不同缺失值处理方法对随机缺失数据处理效果的比较

作者：花琳琳；施念；杨永利；赵天仪；施学忠期刊：郑州大学学报（医学版）杂志 2012年03期

目的:比较不同的缺失值处理方法处理随机缺失数据的效果.方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS 9.1,分别模拟完整数据集和不同缺失率的数据集,从精确度、准确度和分布三方面比较不同方法对缺失数据集的处理效果.结果:任意缺失比例下血红蛋白和白细胞数据经不同的方法处理后与完整数据集比较差异无统计学意义.不同缺失比例下,多重填补(MI)法的精确度高.缺失率10%～20%时,MI法填充后的准确度高.缺失率30%时,成组删除法处理后的准确度高.缺失40%以上时,准确度填充效果不稳定.不同缺失比例下,回归法、成组删除法和MI填充2次后的数据的分布特征与完整数据集一致.结论:数据缺失10%～20%时,MI法填充效果好;缺失30%时,成组删除法处理效果好;缺失40%以上时,所有方法填充效果均不佳.

关键词：连续变量缺失值随机缺失
多重填补法与Ad Hoc法对模拟纵向数据集缺失值处理的比较

作者：茅群霞；李晓松期刊：现代预防医学杂志 2005年04期

目的:采用多重填补法(multipleimputation,MI)和Ad hoc法分别对模拟的纵向数据集中的缺失值进行处理,比较两种方法的优劣并探讨其适用性.方法:运用SAS9.0,采用数据模拟技术,分别模拟纵向完整数据集和具有各种缺失率的随机缺失数据集,分别用MI和Ad hoc法对各缺失数据集进行处理,对结果进行比较和分析.结果:数据缺失率≤10%时,Ad hoc方法有一定优势;数据缺失率在20%～40%时,经MI处理后的分析结果更接近"真实";数据缺失率≥50%时,两种方法均无效.结论:对不同缺失率的数据集,MI和Ad hoc法对缺失值的处理各有优劣.

关键词：多重填补法 Ad Hoc法缺失值模拟技术