首页 > 文献资料
-
第五讲如何对数据资料进行一般性统计分析
医学论文中常用的一些统计方法,如t检验、χ2检验,虽然计算简单,却容易出错.作者通过剖析医学科研论文中的正反两方面实例,以引起作者的足够重视.一、随机误差医学观察值不可避免地存在误差.统计上的误差概念专指随机误差(random error),即多种不可控制因素的影响造成的误差,大小没有方向性和系统性,如人体身高值、体重值及实验室检测结果.由于各种统计分析方法都需度量观察值的随机误差大小,因而在论文中表述统计结果时,都必须报告变异指标,如正态分布资料选用标准差s或±s,偏态分布资料选用四分位数间距或极差(大值~小值).统计指标的随机误差(与研究的样本大小有关,又称抽样误差),用标准误(standard error,s)表示,如样本均数的误差用s或±s表示,样本率p的误差用sp或p±sp表示.系统误差和过失误差不属于随机误差的范畴,必须在研究中尽可能杜绝,如测量仪器偏差、失灵、数据记录或计算机录入错误等.
-
医生小词典--两组或多组计量资料的比较
两组资料:(1)大样本资料或服从正态分布的小样本资料;(2)若方差齐性,则做成组 t 检验;(3)若方差不齐,则做 t'检验或用成组的Wilcoxon 秩和检验;(4)小样本偏态分布资料,则用成组的 Wilcoxon 秩和检验。
-
新疆生产建设兵团住院费用影响因素分析
住院费用数据的频数分布多为偏态分布,因此在进行统计分析时将受到许多限制。经过合适变量转换将其转换为正态分布将解决这个问题,本文对住院费用数据进行对数转换,探讨对数线性回归分析方法在不符合正态分布资料中的应用。
-
Jackknife估计在正常人尿氟含量百分位值确定中的应用
本文结合某地区正常人尿氟含量的调查测定情况,采用适用于任何分布资料的参数估计方法Jackknife估计,确定该地区正常人尿氟含量百分位值,为医疗机构的检查和监控提供依据。
-
用矩法进行正态性检验及其在统计软件中的实现
有些统计方法只适用于正态分布资料或近似正态分布的资料,如用t检验和方差分析进行两个或多个样本均数的比较,每个样本都要满足正态性要求,进行直线回归要求应变量y来自正总体,因此在进行资料的分析之前,首先要探讨样本资料是否来自正态总体,即正态性检验.
-
两个非正态分布资料比较方法的选择
问题提出分析临床科研数据,需要选择适宜的统计检验方法,首先明确是参数检验还是非参数检验.不同的检验方法有不同的前提假设,如果违反了假设,统计分析就会得出错误的结论(P值).
-
正态分布资料等效性评价的传统假设检验方法与贝叶斯方法比较
近年来等效性试验在我国新药临床试验中逐渐被应用,等效性评价的统计学研究也逐渐展开.等效性是指新药的疗效与标准有效药疗效相等,严格地说即,新药的疗效既不差于其标准有效药,也不比标准有效药好.
-
三种平均住院日计算方法的比较
平均住院日是反映医院资源利用情况的一项重要指标,国内外医院一般均以算术均数来表示,但因住院日一般属于非正态分布资料,因此有的作者在研究中用中位数表示平均住院日[1],有的作者则认为应该以几何均数表示[2,3].本文通过平均住院日的实际计算,对这三种平均住院日进行比较.
-
百分位数的可信区间估计
百分位数(percentile)是用于描述计量资料尤其是偏态分布资料极为常用的指标体系.如用于允许区间的估计,变异度的描述,百分位数回归等.但百分位数本身亦存在抽样误差,有必要对其进行区间估计.本文介绍百分位数的bootstrap区间估计,并与二项分布近似法进行比较.
-
河南省地方性氟中毒流行动态抽样调查
河南省地方性氟中毒(简称地氟病)防治工作起步至今已20余年,其流行与分布资料主要来源于20世纪80年代初期,根据近几年来工作中掌握的情况,有相当数量的自然村属于病区而没有列入病区,而原定为病区的部分自然村,患病率在病区标准以下.为了解地氟病流行动态和饮水含氟量变化情况,在河南省6个县开展了抽样调查工作.
-
血清抗体定量检测指标的计算
血清抗体定量检测的数据多数不属正态分布,在对随机抽样资料进行统计推断时需通过变量转换使其正态化.其中常用的是对数转换,就是把血清抗体滴度的倒数(T)转换成x=log2T,使x值的频数分布呈正态.然后,按正态分布的原理和方法对转换后的对数值x表1中(2)作为新的分析数据,对计算结果再用反转换(反对数)求得相应的统计量.若log2T的频数分布呈明显的偏峰态或分布类型不明时,多采用中位数描述其频数分布的中心位置.以下只介绍抗体数据呈对数正态或对数近似正态分布资料的计算.
-
医学科研论文中非正态分布资料的统计学分析
我们在医学临床工作中会遇到各种各样的数据,其中有许多数据在不同个体之间,甚至在同一个体的不同生理和病理时期,呈现高低不等,起伏不定.医学科研的目的就是从这些看似杂乱无章的数据中,如实、准确地揭示其内在的变化规律,用于探索各种生命现象,研究疾病的发生、发展和转归.
-
Poisson分布资料的治疗前后比较检验方法
在临床医学上,常有一类疾病是不易根治的(如支气管哮喘、癫痫等疾病),在临床上常采取药物控制治疗,使患者不发作或少发作这类疾病.因此在临床研究中常需要通过考察治疗前后的患者发病次数对某个治疗方案的疗效进行评判.在某一个固定时期,一个患者的发病次数是随机的,可以认为近似服从Poisson分布.因此考察某控制治疗方案是否有效的问题就是考察患者治疗前后的发病次数是否减少,由于治疗后的发病情况与治疗前发病情况有关,故不能采用两组Poisson资料均数比较的统计方法进行检验.目前尚无有关文献报道此类资料的统计方法,所以本文将导出这类资料的统计检验方法.
-
对<数据库中园形分布资料的处理>一文的补充
<数理医药学杂志>1997年第10卷第4期刊发的赵宝玉同志的<数据库中园形分布资料的处理>[1]一文,对已建立数据库的园形分布资料来说,在数据库中对园形分布资料直接进行统计处理,无疑是一种方便、简捷的方式,这对于非统计专业的医务、卫生工作者来说,的确是一种较为理想的处理园形分布资料的方法.
-
福建汉族群体15个STR基因座频率分布
由于STR基因座在较短重复单位(2bp),扩增时易出现酶滑脱现象,产生干扰附加带;而在较长重复单位(7bp),扩增效率相对要低.本文作者选出重复单位4~5bp的D3S1358、TH01、D21S11、D18S51、D13S317、D7S820、D16S539、CSF1PO、Penta D、Penta E、vWA、D8S1179、TPOX、FGA、D5S818等15个基因座及Amelogenin基因座,应用四色荧光复合扩增技术,调查了200名福建汉族个体,获得频率分布资料,现报道如下.
-
深圳地区汉族人群13个STR基因座的遗传多态性
运用荧光标记、复合扩增、ABI3100型基因分析仪电泳、自动荧光检测分型,对居住深圳地区的205个汉族无关个体的D3S1358、vWA、FGA、D8S1179、D21S11、D18S51、D5S818、D13S317、D16S539、TH01、TPOX、CSF1PO、D7S820等13个STR基因座进行了群体遗传多态性分析,获得上述13个STR基因座的频率分布资料,得到多项群体遗传学参数,现报道如下.
-
广西汉人D1S80基因座扩增片段长度多态性
在人类基因组中,存在许多具有高度多态性的可变数目重复序列(VNTR.Variable number of tandem repeat),这类遗传标记已广泛应用于法医学、群体遗传学及器官移植等方面[1].本文作者调查了广西汉族人群D1SS0基因座频率分布资料,报道如下.
-
STR FGA基因座变异 1例
在采用 PCR-STR技术进行亲子鉴定的案例中,发现 1例 FGA基因座变异,现报道如下。 1 案情摘要 某男( 35岁,汉族)和某女( 32岁,汉族)携 " 儿子 " 来本室要求做亲子鉴定。 2 检验过程 分别抽取该女、 " 儿子 " 及该男静脉血各 1ml,用 Na2EDTA. 2 H2O抗凝,分别标明 1号 " 、 2号 " 、 3号 " ,备检。用 Chele x-100 提取 1号、 2号、 3号检材的 DNA,然后进行 F13A01、 FES/FPS、 D1 9S253、 TPOX、 D7S820、 D12S391、 CYP19、 TH01、 FGA、 D3S1359、 D13S317、 FOLP2 3、 GABRB15、 CSF1P0、 vWA、 D5S818、 D7S2846、 D2S441、 D3S1358、 D7S221共 20个座位的 PCR扩增,扩增产物用含 4mol/L尿素、 0.5mm厚的变性聚丙烯酰胺凝胶( T6%、 C5%)电泳分离、银染,得到各位点的扩增片段长度多态性图谱。根据扩增片段电泳迁移的距离,借用顶蓬原则,参考各座位在中国汉族人群的基因频率分布资料进行各位点基因型命名,并计算父权概率( RCP)小值。结果显示,本案检验的 20个 STR座位除 FGA外有 19个座位的结果符合孟德尔遗传定律,经计算 RCP大于 99.99%,认定亲权关系。孩子仅 FGA 座位在父亲的基因型中(杂合子)找不到相同的基因,不符合孟德尔遗传定律 ,推测 FGA座位存在突变。
-
有关中国人ABO血型分布问题的商榷
有关中国人ABO血型分布类型的研究已有不少报道。近在“2002-2006年郑州市无偿献血者ABO及Rh血型分布调查”一文的讨论中见到“从ABO系统来看,长江以北各地A型血为多,长江以南B型血占多数,而且越往东,B型血越多。”[见《职业与健康》2008,24(11):1052-1053],这显然与我国ABO血型分布的实际情况不符。1982年陈稚勇等根据后挑选的197份28万多中国人的ABO血型资料,使用遗传距离来比较不同地区之间的ABO血型分布的差异程度,通过聚类分析,将中国各省区ABO血型的分布归为4组:第1组为中国北方各省,B基因频率较其他地区高;第2组为云贵川和长江流域,A基因频率较其他地区高;第3组为两广、福建和台湾,O基因频率较其他地区高[1,2]。1991年,笔者收集到符合Hardy-Weinberg平衡的59万多中国汉族人的ABO血型分布资料,根据计算其基因频率、民族指数与遗传距离,结果与陈稚勇等的前述3组ABO血型分布特征基本一致,北方组多数B>O>A(西北少数O>B>A),西南、华中和华东(除上海)O>A>B,华南及闽、台组则O>B>A[3-4]。