首页 > 文献资料
-
第五讲如何对数据资料进行一般性统计分析
医学论文中常用的一些统计方法,如t检验、χ2检验,虽然计算简单,却容易出错.作者通过剖析医学科研论文中的正反两方面实例,以引起作者的足够重视.一、随机误差医学观察值不可避免地存在误差.统计上的误差概念专指随机误差(random error),即多种不可控制因素的影响造成的误差,大小没有方向性和系统性,如人体身高值、体重值及实验室检测结果.由于各种统计分析方法都需度量观察值的随机误差大小,因而在论文中表述统计结果时,都必须报告变异指标,如正态分布资料选用标准差s或±s,偏态分布资料选用四分位数间距或极差(大值~小值).统计指标的随机误差(与研究的样本大小有关,又称抽样误差),用标准误(standard error,s)表示,如样本均数的误差用s或±s表示,样本率p的误差用sp或p±sp表示.系统误差和过失误差不属于随机误差的范畴,必须在研究中尽可能杜绝,如测量仪器偏差、失灵、数据记录或计算机录入错误等.
-
资料的统计分析
统计分析包括统计描述和统计推断,通过计算相应的指标和进行必要的统计学处理,结合专业知识,进而阐明事物的内在规律,然后得出结论。在统计学中,人们将资料分为定量资料和定性资料。研究者从观察对象身上得到某个指标的具体取值,如身高、体质量、血压等,这样的资料称为定量资料。有的指标没有具体的取值,只能用一种性质来描述,如血型、性别、民族等,这样的资料称为定性资料。根据资料的不同性质、不同特点,定量资料可以通过平均数、标准差、中位数、四分位数间距等来描述;定性资料可以用相对数、绝对数来描述。此外,还可以用统计表和统计图等来描述所整理的资料。综上,通常根据研究设计的类型、资料性质以及研究目的,选择合理的统计方法。
-
男性糖尿病患者,睾酮低水平预示急性心梗
会上一项小样本观察研究显示,睾酮水平与急性心梗存在负相关,尤其是在糖尿病男性中.该研究纳入了居住在瑞典西南部的538名男性和571名女性(年龄>40岁),研究者报告,睾酮高水平的糖尿病男性,相比于睾酮水平处于低四分位数的糖尿病男性,急性心梗风险低25% (P=0.02).然而,在非糖尿病男性以及有或无糖尿病女性中,睾酮水平都不能预测急性心梗风险.
-
生长激素治疗对透析儿童骨骼的作用:一项随机试验
重组人生长激素对肾性骨病的影响目前尚不清楚。近,美国学者评估了生长激素对小儿终末期肾病患者骨形态的计量学影响。1994年7月至1999年5月进行骨活检的33例患者,被随机分配到有或无生长激素的治疗组。根据骨形成率对患者进行划分,所有骨更新率高的患者给予骨化三醇腹腔注射治疗。每月检测血清生化,8个月复查骨活检。患者的中位数年龄为11.7岁(四分位数年龄7.6岁,14.1岁);45%的患者为男性,52%的患者处于青春前期。中位数透析时间为0.4 y(四分位数透析时间0.3岁,0.8岁)。骨更新率低的患者接受生长激素治疗后,骨表面骨形成率从15.0(9.6,21.8)μm3/(μm2·年)增加到154.6(23.7,174.3)μm3/(μm2·年)(P=0.05);而骨更新率高的患者接受标准治疗后,其骨表面骨形成率从103.3(57.0,173.4)下降为60.3(20.3,13.7)μm3/(μm2·年)(P=0.03)。另外两组的骨表面骨形成率没有发生改变。各组之间的甲状旁腺激素水平没有差异。无论患者的骨组织学特征如何,生长激素治疗都能够增加患者的骨形成率(P=0.05),并使患者的身高标准差分数增幅更大(估计的平均变化幅度±SD:0.324±0.076,P<0.001)。结论:无论患者的骨组织学特征如何,生长激素治疗都能改善透析儿童患者的身高;接受生长激素治疗患者的骨形成率增高;生长激素治疗可以改变循环甲状旁腺激素水平与骨代谢之间的关系。
-
医学科研中的统计学方法简介(二)
计量资料的描述性分析指对原始数据的分布状态进行描述,包括两类指标,描述分布集中的位置或平均水平的指标及分布离散程度或离中趋势的指标.前者常用的有均数、几何均数及中位数,后者有方差、标准差和四分位数间距.分布状态有两种情况,即对称分布和偏态分布,前者指分布是以均数为中心,左右分布是对称的;后者指多数分布在数值偏小或偏大的一侧,左右不对称.常用均数和标准差来描述对称分布的两种状态,用中位数和四分位数来描述偏态分布.均数和标准差计算式如下:=Σx/n,s=[Σ(x-)2/(n-1)](1)/(2),为样本场数;Σx为全部观察值之和;n为样本含量;s为标准差;(n-1)为自由度,表示全部观察值中允许自由取值的观察值的个数.如x+y+z=10,受10的限制可以自由取值的只有两个,当x=2,y=3时,z就只能取5了.用有统计功能的计算器很容易获得与s.为计算中位数和四分位数间距,首先要介绍百分位数,将全部观察值由小到大排列后分成100等份,有99个分位点,第x分位点称为第x百分位数,用Px表示.Px把数列分成两部份,比x小的部份占x%,比x大的部份占(100-x)%.中位数M即第50百分位数P50,四分位数间距即第75和第25百分位数之差,用Q=QU-QL,QU=P75,QL=P25.PX=L+(i)/(f)(n*x%-ΣfL),式中L为第x百分位数所在组段的下限;i为该组段的组距;f为该组段的频数;ΣfL为该组段前一组的累积频数.举例如下,见表1.
-
DPP-4抑制剂或不增加胰腺癌风险
在这项基于人群的研究中,研究者对二肽基肽酶-4(DPP-4)抑制剂治疗患者与噻唑烷二酮类药物和磺脲类药物治疗患者的胰腺癌发生率进行比较,随访时间的四分位数间距为5~18月。虽然这项研究受限于治疗周期较短,但是,研究结果仍显示,糖尿病患者起始DPP-4抑制剂治疗后,胰腺癌发生风险低于磺脲类药物治疗患者(HR,0.6),与噻唑烷二酮类药物相似(HR,1.0)。
-
肾脏替代治疗时机与患者预后:一项随机对照研究的再次分析
?有学者对一项评价正常水平和增强水平肾脏替代治疗(RRT)的随机对照研究进行了再次分析,探讨连续性肾脏替代治疗(CRRT)的时机与危重患者急性肾损伤(AKI)临床结局的关系。主要研究终点为28?d和90?d全因病死率。患者数据来源于澳大利亚和新西兰23个重症加强治疗病房(ICU)中满足AKI?RIFLE标准〔风险(R)、损伤(I)、衰竭(F)、肾功能丧失(L)、终末期肾病(E)〕中I级的439例危重患者。该研究中将CRRT开始时间(从RIFLE-I级AKI到开始进行正常与增强水平RRT的时间)作为变量。对所有纳入患者的基线特征进行了评估。用多变量Cox、逻辑和线性回归模型评估CRRT开始时间与患者预后的独立关系。所有患者CRRT开始时间平均为17.6(7.1,46.0)h。基于CRRT开始时间的四分位数将患者分为?4组进行评估分析,即<7.1?h(组1,作为参照),≥7.1?h且<17.6?h(组2),≥17.6?h且<46.0?h(组3),≥46.0?h(组4)。结果显示,更早接受CRRT并不与显著降低28?d死亡风险相关〔组2危险比为1.06,95%可信区间(95%CI)=0.62~1.81,P=0.83;组3危险比为1.23,95%CI=0.71~2.12,P=0.46;组4危险比为1.33,95%CI=0.77~2.31,P=0.31〕。对90?d死亡风险也观察到类似的结果。该研究者得出结论:在对随机评价正常与增强水平的RRT研究参与者的亚组分析显示,早期开始CRRT并不能显著改善AKI患者的生存情况。进行更大样本量和更广泛的RRT开始时机的研究是必要的。
-
本刊对运用统计学方法的有关要求
1统计学符号:按GB 3358.1-2009《统计学词汇及符号》的有关规定,统计学符号一律采用斜体。
2研究设计:应告知研究设计的名称和主要方法。例如:调查设计分为前瞻性、回顾性还是横断面调查研究;实验设计应告知具体的设计类型,如自身配对设计、成组设计、交叉设计、析因设计、正交设计等;临床试验设计应告知属于第几期临床试验,采用了何种盲法措施、受试对象的纳入和剔除标准等,并提供临床试验注册机构的名称和注册号。主要做法应围绕重复、随机、对照、均衡4个基本原则概要说明,尤其要告知如何控制重要非试验因素的干扰和影响。
3资料的表达与描述:用均数±标准差(x±s)表达近似服从正态分布的定量资料,用中位数(四分位数间距或四分位数)〔M(QR)或M(QL,QU)〕表达呈偏态分布的定量资料。用统计表时,要合理安排纵横标目,并将数据的含义表达清楚。用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则。用相对数时,分母不宜小于20,要注意区分百分率与百分比。 -
WONCA研究论文摘要汇编--与预防保健服务收入相关的初级医疗属性:一项全国性研究
背景初级医疗属性( PCAs)是以患者为中心的医疗之家的组成部分,可以增加预防保健服务收入,但目前与其相关的全国性研究较少。方法从2007—2010年美国医药费用委员会的调查数据中,选取成年人自我报告数据(n=50457),进行横断面调整。以个人为单位进行PCAs评分,其主要内容包括综合性(对新出现或现有问题的治疗来源、预防保健及转诊情况)、以患者为中心性(决策分享)、加强随访性(夜间和周末时间)。预防保健措施包括乳腺X线摄影、流感疫苗接种、年度体检、结直肠癌筛查、前列腺特异性抗原检测及胆固醇监测。结果 PCAs评分与各项预防保健措施收入间均呈正相关。结直肠癌筛查(18.5%)和前列腺特异性抗原检测(20.7%)的PCAs四分位数增长高。PCAs中的综合性和以患者为中心性均与各项预防保健措施收入呈正相关;加强渠道性与年度体检收入呈负相关〔OR(95%CI)=0.83(0.77,0.91)〕。结论在全国代表性样本中,除加强渠道性外,其他关键PCAs均可增加预防保健收入。该结论有利于基层医疗机构实现预防保健服务交付量的大化。
-
不分组资料百分位数计算方法的探讨
在常用的统计学教材中,对于中位数均有论述和计算公式.关于百分位数,虽都介绍其基本概念,但有的无计算方法[1],有的给出了分组资料的计算公式[2],有的给出不分组资料四分位数的计算公式[3],却都没有不分组资料百分位数的计算公式.
-
基础血尿酸浓度对药物降压效果的影响研究
随着生活水平的不断提高,人民饮食习惯与结构的不断改变,高尿酸血症患病率不断升高,逐渐与高血压、肥胖和血脂异常共同形成心血管疾病的危险因素[1‐3]。早在1870年,Frederick Mohamed 发现有痛风家族史者的高血压发病率明显增高,因此提出尿酸具有促进高血压发生和发展的假设。近年来亦有研究表明,相较于低四分位数尿酸水平,高血压患病风险在高四分位数尿酸水平下约升高1.96倍[4]。但是,血尿酸水平对高血压患者降压效果的影响程度尚存在疑问。为探索基础尿酸水平对药物降压效果的影响,本研究对住院高血压患者入院时的血尿酸浓度与体重指数、糖尿病史、吸烟史、收缩压和舒张压之间的关系进行分析;校正以上各影响因素后,对血尿酸与降压效果的相关性进行统计分析,探讨高血压患者基础尿酸水平对药物降压效果的影响。
-
原发性尿道癌确定治疗后的预后因素和效果:国际协作研究结果
原发性尿道癌的治疗选择和效果尚无定论,本文目的是根据大样本群体研究判断其存活参数。德国、美国、埃及、捷克和瑞士5国9个中心协作,1993年至2012年共诊断原发性尿道癌126例,男82例,女44例,单元和多元分析评估其独立危险因素。随访时间中位数20个月,四分位数间距4~48个月。确定治疗时年龄中位数63岁,四分位数间距53~74岁。组织学检查结果尿路上皮癌63例(50%);鳞状上皮癌34例(27%);腺癌18例(14%);混合组织学(尿路上皮癌-鳞状上皮癌、尿路上皮癌-腺癌、鳞状上皮癌-腺癌)18例(14%);其他组织学11例(8%)。3、5年无复发存活率分别为60%和45%。临床分期和病理学肿瘤分期高度一致(P<0.001),临床进展的肿瘤更适于行根治性外科手术(P <0.005)和围手术期化疗(P <0.001)。pT3/4期(P <0.001)、pN+(P <0.001)、近侧位置肿瘤(P <0.012)、手术类型(根治性手术 vs 保留尿道手术,P <0.001)和围手术期化疗(P<0.05)无复发存活率低。淋巴结分期(P <0.016)和外科手术范围是无复发存活率的独立预后因素。淋巴结分期对原发性尿道癌患者是必不可少的,因其与存活率低相关。临床和病理学分期高度一致,对这些患者应充分考虑到多模式疗法。
-
《广东医学》杂志对来稿中统计学处理的有关要求
1资料的表达与描述用“均数±标准差”(x珋±s)表达服从或近似服从正态分布的定量资料,用“中位数(四分位数范围)”[ M( P25,P75)]表达呈偏态分布的定量资料;采用表格,要合理安排纵横标目,并将数据的含义表达清楚;采用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;采用相对数时,分母不宜小于20,要注意区分率与构成比。
-
《广东医学》杂志对来稿中统计学处理的有关要求
1资料的表达与描述用“均数±标准差”(x珋±s)表达服从或近似服从正态分布的定量资料,用“中位数(四分位数范围)”[ M( P25,P75)]表达呈偏态分布的定量资料;采用表格,要合理安排纵横标目,并将数据的含义表达清楚;采用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;采用相对数时,分母不宜小于20,要注意区分率与构成比。
-
《广东医学》杂志对来稿中统计学处理的有关要求
1资料的表达与描述用“均数±标准差”( x珋±s)表达服从或近似服从正态分布的定量资料,用“中位数(四分位数)”[ M( P25,P75)]表达呈偏态分布的定量资料;采用表格,要合理安排纵横标目,并将数据的含义表达清楚;采用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;采用相对数时,分母不宜小于20,要注意区分率与构成比。
-
《广东医学》杂志对来稿中统计学处理的有关要求
1 资料的表达与描述 用“均数±标准差”(ˉx ±s)表达服从或近似服从正态分布的定量资料,用“中位数(四分位数)”[M(P25,P75)]表达呈偏态分布的定量资料;采用表格,要合理安排纵横标目,并将数据的含义表达清楚;采用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;采用相对数时,分母不宜小于20,要注意区分率与构成比。
-
《广东医学》杂志对来稿中统计学处理的有关要求
1 资料的表达与描述 用“均数±标准差”(ˉx ±s)表达服从或近似服从正态分布的定量资料,用“中位数(四分位数)”[M(P25,P75)]表达呈偏态分布的定量资料;采用表格,要合理安排纵横标目,并将数据的含义表达清楚;采用统计图时,所用统计图的类型应与资料性质相匹配,并使数轴上刻度值的标法符合数学原则;采用相对数时,分母不宜小于20,要注意区分率与构成比。