首页 > 文献资料
-
不同缺失机制并存时应答偏倚校正方法在医保学生医疗费用调查中的应用
流行病学调查中常会出现数据缺失,目前对此有多种处理方法,但这些方法对数据的缺失机制均有严格要求.Rubin[1]认为缺失机制主要包括完全随机缺失(missing completely at random,MCAR)、随机缺失(missing at random,MAR)和非随机缺失(not missing at random,NMAR)三类.MCAR数据缺失的概率与任何观测到或未观测到的变量值均无关,完全观测个体使用任何分析方法均有效;MAR数据缺失的概率与其他变量有关,但与该变量本身取值无关,一般是采用多重填补(multiple imputation,MI)技术[2-3];而NMAR则对于数据缺失的概率与其他变量及该变量本身均有关,可采用样本选择模型(sample selection model)给予校正[4-5].
-
不同缺失机制并存时偏倚校正的模拟研究
目的 探讨在医疗费用调查中针对因变量数据所存在的选择性偏倚和随机无应答问题的两阶段校正方法.方法 通过模拟得出不同程度随机缺失和非随机缺失并存时的多个数据集.首先对随机缺失(MAR)通过预测均数匹配法(PMM)、倾向性得分法(PS)、基于Bootstrap的EM算法(EMB)和马尔科夫链蒙特卡洛算法(MCMC)四种填补方法进行多重填补(第一阶段);在此基础上对选择性偏倚造成的缺失数据进行样本选择模型拟合(第二阶段);后对多个拟合结果进行合并.对模拟出的结果以标准偏倚、均方误差的平方根和可信区间平均长度作为评价填补方法优劣的标准.结果 在任意一种缺失情况下,PS法的结果相对不理想.当非随机缺失为轻度时,不同程度随机缺失情况下的填补方法选择为:在随机缺失也为轻度时,MCMC法好;在随机缺失为中度时,EMB法好;在随机缺失为重度时,PMM法好.当非随机缺失为中度时,无论随机缺失程度如何,MCMC都是好的方法;当非随机缺失为重度时,无论随机缺失程度如何,PMM都是好的方法.结论 PMM、EMB和MCMC法均是处理随机缺失较好的填补方法,可以根据本次研究的模拟结果有选择的将填补方法运用于各种不同缺失情况的实际调查.