首页 > 文献资料
-
肿瘤流行病学研究资料的统计分析第六讲相对生存率的统计学检验
相对生存率定义为研究人群的观察生存率与假定其为一般人群时的期望生存率之比,校正了诸如性别、年龄、年代等因素对研究人群生存情况的影响[1,2].在分析比较时,两组或多组研究人群相对生存率的估计可以采用多种方法.但它们各自所代表的总体相对生存率是否相等,这是研究者经常需要回答的问题.本讲将结合实例分析就相对生存率假设检验的若干问题及统计推断作一介绍.
-
护理期刊论文中统计推断应用错误的影响因素分析
目的 探讨护理期刊论文中统计推断错误的影响因素,以提高护理人员及护理期刊编辑对统计学的重视程度,减少论文中的统计错误.方法 以3种护理期刊为对象,手工检索其2007年1~12期刊登的文献.对每篇文章进行详细阅读并逐项记录,内容包括是否使用统计推断方法,统计推断是否存在错误,论文是否为课题,以及作者性别、年龄、职称、职务、学历、医院级别等.结果 在应用了统计推断方法的591篇论文中,存在统计错误237篇,错误率40.10%.不同期刊发表的论文中的统计推断错误率比较,差异有统计学意义(P<0.01),无行政职务的作者错误率显著低于有职务者(P<0.05).以统计推断错误为应变量进行多元Logistic逐步回归分析,结果为论文发表的期刊类型及作者的职务进入回归方程(P<0.05,P<0.01).结论 护理期刊论文中存在的统计学错误较多.期刊在统计学的正确使用方面正发挥着越来越重要的引导作用.护理管理者、护理科研人员及期刊编辑均应提高对统计学的重视程度.
-
重复原则在骨科实验设计中的应用
实验设计是科学研究的一个重要环节,良好的实验设计是顺利进行科学研究和数据分析的先决条件,也是获得预期结果的重要保证[1].科学研究的目的,是为了揭示事物的客观规律.研究的价值首先决定于研究的目的,而研究的结果是通过一定方法步骤而获得的.一个周,密的实验研究全过程,通常要联系质的特性,研究量的表现,所以从统计方面讲,主要应考虑随机、对照、重复、均衡等问题,这是实验研究的一般原则.实验要求一定重复数(样本例数),其目的是使均数逼真,并稳定标准差,只有这样来自样本的统计量才能代表总体的参数,统计推断才具有可靠的前提[2].
-
临床试验结果的统计分析
统计分析方法在临床试验中起着十分重要的作用,从临床试验的设计、监督、中期分析、终末分析到后的报告,统计分析方法贯穿着临床试验的始终.主要介绍了临床试验统计分析报告包含的内容、统计分析集的类型及应用、临床试验中常见的设计方法及常用的统计分析方法,并举例说明统计分析中常见的问题.
-
资料的统计分析
统计分析包括统计描述和统计推断,通过计算相应的指标和进行必要的统计学处理,结合专业知识,进而阐明事物的内在规律,然后得出结论。在统计学中,人们将资料分为定量资料和定性资料。研究者从观察对象身上得到某个指标的具体取值,如身高、体质量、血压等,这样的资料称为定量资料。有的指标没有具体的取值,只能用一种性质来描述,如血型、性别、民族等,这样的资料称为定性资料。根据资料的不同性质、不同特点,定量资料可以通过平均数、标准差、中位数、四分位数间距等来描述;定性资料可以用相对数、绝对数来描述。此外,还可以用统计表和统计图等来描述所整理的资料。综上,通常根据研究设计的类型、资料性质以及研究目的,选择合理的统计方法。
-
伤害定量研究方法的选择与资料收集整理(一)
国内《卫生统计学》和《流行病学》教科书上介绍的调查研究和试验研究方法,都属于定量研究。定量研究是应用统计学的基本原理对研究对象的数量特征和数量关系进行分析,通过统计描述和统计推断反映事物的现状和规律。如研究某地儿童伤害的发生率及其影响因素,通过统计指标和统计图表描述抽样调查结果,用样本发生率推断总体发生率,用假设检验方法分析儿童伤害发生率水平与家庭、学校和社会环境等因素的关联。
-
临床试验设计与统计分析应注意的问题
临床试验(Clinical Trial)系指任何一种有病人参加的有计划的研究,这种研究的目的是寻求在相同条件下,对未来病人的一种合适的治疗方法.其基本特征是利用由有限病人样本(Sample)得出的结果,对未来的具有相似条件的病人总体(Population)作出统计推断,即对未来病人的治疗方案提出指导性的意见.生物统计学(Biostatistics)是运用数理统计原理,结合医学、生物学实际,研究数字资料的收集、整理、分析和推断的一门学科,它是临床试验所必须的重要手段.
-
低强度半导体激光治疗少年儿童弱视逐米观察法的疗效检验
应用低强度 632 8 nm He-Ne激光治疗少年儿童弱视的疗效已得到临床观察的充分肯定.但应用低强度 650 nm半导体激光治疗少年儿童弱视目前国内外未见报道,为了观察其疗效,我们采用视力逐米观察法对弱视儿童治疗前后视力进行记录, 3个疗程后将所记录的数据利用医用统计学方法中的秩和检验法进行检验及统计推断,结果表明疗效显著.现报告如下.
-
医学研究中统计表述的几点注意事项
统计描述和统计推断是临床研究中经常用到的数据表达和分析工具,因此表达方式的准确性与合理性将影响到整个研究报告的说明能力.在统计描述方面,按照数据特征临床数据通常被分为计量资料,计数资料和等级资料.
-
Meta分析系列之五:贝叶斯Meta分析与WinBUGS软件
贝叶斯Meta分析(Bayesian Meta-Analysis)是近年来基于贝叶斯统计发展起来的一种新型的Meta分析方法,主要采用"马尔科夫链-蒙特卡罗"(Markov chain MonteCarlo,MCMC)方法、使用WinBUGS软件[1]进行.经典统计学派的统计量,往往不易找到其精确的有限样本分布,因此多数情况下是基于大样本渐近分布做出统计推断,而贝叶斯学派则可直接计算精确的有限样本分布,并不依赖于渐近理论,且充分考虑了模型的不确定性,故认为Meta分析贝叶斯估计更可靠、更合理,特别在有序数据及网状Meta分析[2]中有传统Meta分析无法企及的优点.当前,贝叶斯Meta分析已得到愈发广泛的应用,本文将简要介绍贝叶斯Meta分析与WinBUGS软件.
-
随机化检验在药物经济学评价中的应用
目前,国内关于药物经济学评价大多采用点估计的方法简单对比不同用药方案的评价指标,但是基于统计推断的理论,这种简单处理并不能反映研究人群总体的比较结果。本文将随机化检验应用于药物经济学评价中,能在一定程度上解决药物经济学疗效评价的问题。
-
经济计量学及在大型医疗设备管理中的应用
1经济计量学概念经济计量学就是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学.运用数理统计知识分析经济数据,对构建于数理经济学基础之上的数学模型提出经验支持并得出结果.
-
医学研究统计推断中两类错误及相关问题
在医学研究中.如果对总体的情况进行直接研究会相当耗费人力、物力和财力,有时也是不可能和不必要的,所以在实际工作当中,经常从总体中随机抽取一部分观察单位,构成样本,用样本信息推断总体特征,称之为统计推断.
-
利用(Xi-)si及ni进行多个样本均数比较的方差分析
多个样本均数比较的方差分析,是数值变量资料统计推断的一个重要内容,其中应用多的是单因素方差分析与双因素方差分析.就方差分析的基本思想而言,是将所有观察值的总变异按设计与研究的目的分解为两个或更多个部分.例如,单因素方差分析将总变异SS总分解为SS组内与SS组间,而双因素方差分析是将总变异SS总/分解为SS处理、SS区组与SS误差[1].以上不同来源变异的计算,如果利用目前各类教科书与参考书提供的计算公式,都离不开原始数值.当资料不提供原始数值,只给出各组的均数i、标准差si及样本例数ni时,上述不同来源的变异无法计算,方差分析便不能进行.尤其是医学期刊论文中,往往只提供各组的均数i、标准差si和样本例数ni,若要对方差分析的结论进行验证,现有的公式显然不能满足这个要求.本文通过标准差与离均差平方和之间的关系,导出一套利用均数、标准差及样本例数进行多个样本均数比数的方差分析F值的计算公式,不仅计算简单,而且易于理解.
-
PSU数量与入样比对抽样误差近似估计和统计推断影响
目的 了解初级抽样单元(PSU)数量与入样比对抽样误差近似估计和统计推断的影响,为今后调查的抽样设计提供参考.方法 收集2010年中国慢性病及其危险因素监测中的98587条收缩压测量数据开展二阶段模拟抽样;采用泰勒级数线性化法估计每个样本在考虑有限总体校正(FPC)和不考虑FPC情况下的均值、标准误及95%可信区间,比较估计的标准误和真实标准误间差异,分析不同设计下95%可信区间包含总体均值参数的概率.结果 PSU个数增加至10个时,抽样误差迅速从4.13 mmHg降到1.91 mmHg,下降了53.8%,但PSU个数增加至≥20个时,估计精度未见明显提升;在考虑FPC情况下,随着PSU入样比的增加,均值95%可信区间覆盖真值的概率波动较大:入样比<30%时,95%可信区间覆盖真值概率在94.0%上下波动;入样比>30%时,95%可信区间覆盖真值的概率呈现出震荡下降的趋势,低到达88.2%,统计推断较敏感;在不考虑FPC情况下,95%可信区间覆盖真值概率均较考虑FPC情况高,在PSU入样比>20%时,95%可信区间覆盖真值概率较入样比<20%时出现了一个小幅跃升,统计推断较保守.结论 PSU数量的确定需同时考虑估计精度和调查可行性;PSU入样比过大时,应慎重使用基于误差近似估计的统计推断.
关键词: 复杂抽样设计 初级抽样单元(PSU) 抽样误差 统计推断 -
基于LASSO的高维数据线性回归模型统计推断方法比较
目的 比较五种基于LASSO的高维数据线性回归模型统计推断方法:LASSO-惩罚计分检验,多重样本拆分、稳定选择、低维投影、协方差检验.方法 采用R软件模拟不同情形的高维数据,用五种方法做统计推断,以期望假阳性率和检验效能为评价指标,比较这五种方法在不同高维数据情形下的表现.结果 在理想高维数据情形下,除协方差检验推断结果保守外,其余方法表现都较好.在复杂高维数据情形下,LASSO-惩罚计分检验的检验效能是五种方法中高的,其次为多重样本拆分,而LASSO-惩罚计分检验的EFP也是高的,多重样本拆分的EFP基本接近0.结论 在常见复杂高维数据中LASSO-惩罚计分检验和多重样本拆分是两种较好的高维线性回归模型统计推断方法,两者相对而言前者较宽松,后者较保守.在实际应用中可根据应用需求来选择合适的统计推断方法.
-
逆向累积分布图及其在疫苗免疫原性数据分析中的应用
在疫苗临床试验中,接种后血清抗体水平的高低与该疫苗能否产生保护作用及保护水平的高低有着直接关系,因此对免疫原性的分析是疫苗临床试验统计分析的重要部分.就体液免疫反应而言,这类数据的一个重要特征是数据的取值范围较大,变化范围常跨越多个数量级,观察值间呈现倍数关系.虽然其原始观测数值呈右偏态分布[1],但经对数转换后,免疫原性值一般满足正态或近似正态分布.对这类数据,目前国内通用的方法是首先计算其描述性统计指标如几何均数和对数标准差,而后对经对数变换后的数据采用假设检验和区间估计等方法进行统计推断[1-2].这些方法虽然行之有效,但其结果表达方式均为在特定点(如几何均数)和较抽象的范围(如95%可信区间)表达其临床试验结果,这样一方面使研究工作者难以从体液免疫原性的整体数据变化上(如不同滴度的抗体水平上)把握数据的变化趋势和分布状况,另一方面也使非统计工作者难以理解一些组间比较的假设检验结果.
-
群随机试验与传统随机试验统计方法对比分析
目的介绍群随机试验的统计方法并与传统方法比较.方法以青少年戒烟干预试验为例,介绍群随机试验的假设检验及样本含量估计方法.结果用传统统计方法分析群随机试验会产生虚假的统计显著性结论,增大了Ⅰ型错误;用传统样本含量计算公式将低估群随机试验所需的样本含量,增大了Ⅱ型错误.结论忽视群效应将产生严重的统计分析偏性.
-
调查问卷中多选题数据转换的SAS程序设计
多选题数据录入常用的编码方法有二分法编码、分类法编码和原始编码.其中,原始编码节约数据录入时间.由于只有二分法编码是符合统计分析原则的数据排列格式,以分类法编码和原始编码录入的数据均需转换为二分法编码数据方可进行后续的统计推断.目前多选题数据的转换多使用 SPSS[1-3],应用SAS的较少.本文主要介绍调查问卷中多选题原始编码数据向二分法编码数据转换的SAS程序设计.
-
多元数据正态性检验的SAS/IML程序设计
在均值向量检验和协方差阵的检验以及一些多元统计方法中都是假定样本来自多元正态总体,因此,所作统计推断的结论是否正确,在一定程度上取决于实际总体与正态总体接近的程度如何.