首页 > 文献资料
-
全球健康数据报告变革刻不容缓
近日,《柳叶刀》杂志发表了题为“Time for a rev-olution in reporting of global health data”的评论。文章认为,从千年发展目标相关的数据来看,全球健康取得的成绩令人瞩目,但由于贫穷国家信息系统不完善,大量重要数据缺失,其结果的准确性还有待进一步考证。
-
数据缺失对中国16个大城市MSM人群HIV感染者病毒载量抽样调查结果的影响
目的 分析我国MSM人群HIV感染者(MSM感染者)病毒载量(VL)抽样调查数据缺失及对调查结果的影响.方法 利用国家科技重大专项课题2013-2015年在北京、上海、南京、杭州、武汉、重庆、昆明、西安、广州、深圳、南宁、乌鲁木齐、哈尔滨、长春、成都和天津16个大城市MSM人群中开展的HIV感染者VL抽样调查数据库,采用SPSS 17.0软件对VL缺失数据进行描述性分析.结果 在12 150名随机抽样的MSM感染者中,75.2%(9 141/12 150)调查对象接受了VL数据收集,24.8%(3 009/12 150)调查对象VL数据缺失;目前正在接受抗病毒治疗与未接受抗病毒治疗者缺失率分别为11.5%(765/6 675)、39.4%(2 060/5 223);本地与外地户籍VL数据缺失率分别为21.9%(1 866/8 523)、28.4%(959/3 374).结论 MSM感染者VL抽样调查存在一定比例的数据缺失,抗病毒治疗和户籍是VL数据缺失的主要影响因素,VL数据缺失会对准确评价MSM感染者社区病毒载量水平和人群病毒载量水平造成影响.
-
2688名长沙市公务员血脂现况研究与分析
为了解长沙市公务员血脂现况,笔者对2688名长沙市公务员的血脂水平及血脂异常患病率情况进行分析,现报告如下.一、对象与方法1.对象:应用数字表法,从长沙市15家公务员健康体检定点医院中随机抽取1家.2006年12月至2007年2月共有2916名公务员于该院进行健康体检,剔除弃检、推迟体检及数据缺失的人员后,共2688名有效体检者纳入本次研究.
-
中医临床队列研究中缺失数据的分析处理
中医诊疗以个体化辨证论治和复杂干预为特点,接近真实世界研究的队列设计更能充分显示中医诊疗优势,但由于队列研究存在样本量大、研究周期长、开放度高、允许偏倚等问题,直接或间接破坏了数据完整性.传统以删失、均值替代为主的数据处理方法容易造成样本浪费,降低了统计效能,而以多重填补和大似然思想为基础的数据缺失处理方法较多又难以选择,且方法间存在误用的问题.若能按照数据缺失判定、方法选用及拟合、拟合效果评价三个步骤,并根据缺失数据的属性仔细辨别方法间的区别和使用条件,构建中医临床队列研究的缺失数据拟合处理路径,将有效提高数据质量,使拟合后数据接近患者治疗的真实世界,更确切和真实地反映中医药临床疗效.
-
确证性临床试验中数据缺失的处理指南
数据缺失是确证性临床试验研究中不可避免的问题,如何正确处理数据缺失是影响临床试验结论客观性的重要因素.临床试验中的数据缺失主要表现为病例脱落,根据其机制可分为完全随机缺失、随机缺失和非随机缺失.通过完善病例分析、谨慎选择缺失值处理方法(如填补法和混合效应模型法)和进行敏感性分析等尽量减少数据缺失所致的试验结论偏倚.欧洲医药产品管理局就临床试验中的数据缺失问题制订了指导原则,现已正式发布并实施.本文以该指导原则为核心阐述临床试验中数据缺失的主要处理方法,旨在为国内新药研发和临床研究提供有益参考.
-
数据非随机缺失机制的混合效应模式混合模型分析与应用
目的 阐明混合效应模式混合模型原理,实现数据非随机缺失机制医学纵向资料的模型分析.方法 采用限制极大似然法进行参数估计,拟合含非随机缺失数据高血压随访资料的混合效应模式混合模型,利用SAS9.2完成模型参数估计与检验等.结果 在混合效应模式混合模型(组间模型和组内模型)中得到四种缺失模式下的参数估计值及可信区间后,根据各缺失模式概率,求得参数总估计值.结论 混合效应模式混合模型是分析数据非随机缺失机制资料的佳选择.
关键词: 数据缺失 非随机缺失 混合效应模式混合模型 限制极大似然估计 -
运用SAS对不完整数据集进行多重填补--SAS 9中的多重填补及其统计分析过程(一)
在所有的实验研究和调查研究领域,数据缺失是一个普遍存在的问题.缺失数据会增加分析任务的复杂性、造成结果偏倚、降低统计工作的效率.尤其是在完全观测与不完全观测之间存在系统差异的情况下,运用常规统计分析方法对不完整数据集所做出的结果,不能代表整体.
-
医院卫生统计调查表数据源数据缺失的填补预测
在医院中,卫生统计调查表数据源数据缺失已经成为一个普遍性的问题,并在一定程度上危害统计调查表的数据质量,进而会影响到医院乃至上级卫生部门的预测与决策.因而,进行缺失数据的研究,对重要的缺失数据进行有效的预测填补工作具有重要的现实意义.
-
调查研究中数据缺失的机制及处理方法
缺失数据(Missing Data)在调查研究中(特别是对大规模人群的调查)是一非常普遍的问题,并在一定程度上危害研究结果的有效性[1].例如调查对象拒绝或忘记回答某个或某些调查问题,文件的遗失,数据不准确的记录等,都会造成数据的缺失或丢失.
-
完全随机缺失条件下分类随机变量数据缺失插补方法的比较研究
目的 探讨完全随机缺失条件下分类随机变量数据缺失对研究结果的影响,对各方法插补效果进行评价.方法 基于上海地区35岁及以上吸烟人群吸烟与肺癌死亡关系的完整数据集,在5%、10%、20%及30%缺失率下,模拟有序分类变量(吸烟年数分组syfz)缺失和二分类变量(性别sex)缺失,重复模拟100次.采用删除法、众数插补法、多重插补-logistic回归法(MI/logistic)及多重插补-判别分析法(ML/discrim)对分类变量数据缺失进行处理.对插补效果从插补正确率及插补后模型参数的变化两个方面进行评价.结果 有序分类变量缺失:各缺失率下,MI/logistic插补的正确率高,MI/logistic和MI/discrim插补后模型参数的偏差均较小,对于吸烟年数sy以分组形式syfz纳入模型数据缺失导致模型参数的相对偏差更小,对syfz插补后模型参数相对偏差也小于连续变量sy插补后模型参数相对偏差.二分类变量缺失:各缺失率下,众数插补的正确率高,删除法处理缺失数据后模型参数的偏差小.结论 连续变量缺失对模型结果的影响大于分类变量缺失,对于有数据缺失的连续变量可将其离散化,以分类变量的形式进行分析.缺失数据插补模型的拟合效果会直接影响插补效果,当模型拟合效果较差时可能会带来更大的偏差.
-
生存质量资料中缺失值的内在机制及处理措施
WHO把生存质量定义为个体对其身体、精神和社会交往状况的满意程度以及与自身所处环境相适应的程度[1].由于生存质量资料的多变量、多维度,加之长期随访中的偶然因素,缺失数据无法避免.20世纪90年代以来,大规模的国际性研究机构如欧洲癌症研究与治疗组织、国际乳腺癌研究组等都面临数据缺失的挑战并开始积极寻求对策,进行总结和经验交流[2].有鉴于此,本文将对生存资料中缺失数据的表现形式、产生机制以及处理方法做进一步综述,为生存质量资料的预处理和统计分析提供有效的信息.
-
精神医学中的生物统计学(9):从研究设计角度考虑如何避免数据缺失以及由此带来的问题
One of the most common challenges in biomedical and psychosocial research is missing data, which occurs when respondents refuse to provide answers to sensitive questions and when study subjects are lost to follow-up during the repeated assessments of longitudinal trials.This paper is the first in a 3-part series focusing on this important topic; it describes different types of missing data and their differential effects on model estimates, focusing on study design strategies that can be used to prevent or minimize missing data and, thus, maintain the scientific integrity of the research.The second paper in the series will discuss implementation strategies to manage and reduce missing data while conducting the study, and the third paper will discuss analytic strategies for dealing with missing data after completion of data collection.
-
运用多重填补方法分析世界健康调查数据
目的:解决世界健康调查(World Health Survey,WHS)数据中的数据缺失问题,进行更加有效的统计推断.方法:根据多重填补(multiple imputation,MI)的原理,运用Amelia软件和Stata○R中的综合统计推断程序对WHS数据集进行处理.结果:由缺失数据造成的信息缺失得到了弥补,综合评价结果的质量得到了提高.结论:MI具有良好的特性,和针对特定问题但操作复杂的方法相比,MI是一种解决数据缺失问题的简单和近似的方法.
-
数据缺失的类型和处理方法及其在医学中的应用
目的 对数据缺失的类型、单一填充法和多重填充法的概念、特点和优缺点进行了探讨,采用不同处理方法对不同缺失率的数据进行填充比较其效果.方法 根据原始数据集建立回归模型,对完整数据集的均值、标准误差和标准方差进行描述,采用不同填充方法对缺失数据进行处理,模拟不同缺失率的随机缺失数据集,将其得到的结果与完整数据的属性值集进行比较.结果在缺失率为5%时,均值填充法比较接近完整数据集的各属性值,在缺失率为15%,随机填充的效果佳.结论 随着缺失率的不断增大,各种填充方法对数据填充的效果也不尽相同.
-
广州地区18间医院新生儿科现状分析
新生儿学作为一门研究新生儿保健、医疗和教学的学科,近数十年来得到迅速的发展,广州市新生儿科的建设近年来所取得的成绩得到全国的肯定.为进一步完善并规范广州市新生儿科的建设,加强各单位之间的医疗协作,充分利用人力和物质资源,改善高危儿结局,从而提高整个广州市新生儿危重症救治水平,我们于2005年初组织对广州市部分二级医院、三级医院进行了相关调查.本次调查采用问卷的形式,进行抽样调查,时间段在2004年1~12月.其中二级医院9家,三级医院9家,剔除2家数据缺失的医院,此次有效调查的医院为16家.
-
数据缺失及其填补方法综述
在社会调查资料中,为常见的问题就是数据缺失.造成数据缺失的原因有:失访、无响应或是回答问题不合格等等.统计学上,将含有缺失数据的记录称为不完全观测.缺失数据或不完全观测对调查研究的影响是很大的.所以在统计学中,为了能够更加充分地利用已经搜集到的数据,国内外很多学者都对缺失数据的处理提出了自己独到的见解,来挽救有缺失的调查数据,以保证研究工作顺利进行[1].