首页 > 文献资料
-
logistic回归应用中容易忽视的几个问题
logistic 回归在流行病学研究中应用十分广泛,在病例对照研究和队列研究中, logistic 回归是经常用到的多变量统计分析方法,在随访研究和横断面调查中,logistic 回归的应用也较为普遍[1-5].与多元线性回归相比,logistic回归具有许多独特的优点,如对正态性和方差齐性不做要求,对自变量类型不做要求、系数的可解释性等.正是这些优点,使得logistic 回归成为流行病学研究中广受欢迎的分析工具.
-
回归树的建模与应用
近年来,大量研究致力于建立新的回归技术解决经典回归中假设过于严格的问题,包括预测变量与反应变量的线性关系、反应变量的正态性及方差齐性等.当线性关系不成立时选用线性模型明显不适宜,此时一种方案是在模型中加入交互作用项或采用变量变换,但这种方式容易导致解释时的困难,并且可能仍然不能解决非线性的问题.另一种解决方案则是选用非参数回归技术,包括Friedman和Stuetzle[1]提出的光滑技术和Yarnlod等[2]及Breiman等[3]提出的分类与回归树.其中分类与回归树的区分关键在于反应变量为连续性变量或为分类变量,若为连续性变量则建立回归树,反之则建立分类树.现就回归树的建模与应用进行探讨.
-
定量资料统计分析错误辨析与释疑
通过揭示大量定量资料统计分析方面的错误案例,说明重视判定设计类型和检查资料前提条件,对于合理选用定量资料统计分析方法是至关重要的.由于不少科研人员缺乏多因素实验设计类型方面的知识,现行很多统计学教科书在这方面又十分薄弱,因此,广大实际工作者加强这方面知识的学习,是十分必要的.
-
样本含量与检验效能估计(四)——拟作成组设计定量与定性资料差异性检验时的样本含量估计特殊试验的样本含量估计
在2011年第4期和第5期的讲座中,我们介绍了成组设计三种特殊检验的样本含量估计问题,本期讲座中将为读者介绍成组设计定量资料和定性资料差异性检验的样本含量估计.所谓差异性检验,研究目的是分析两组样本所代表的两个总体均数(或总体率)是否相等.对于定量资料,若资料满足参数检验的前提条件(独立性、正态性和方差齐性),可采用成组设计定量资料检验进行分析;否则,需要采用秩和检验.对于定性资料,可采用卡方检验或Fisher精确检验进行分析.
-
数据正态性简易判断方法及偏态数据幂变换法
许多计量资料的分析方法要求数据分布是正态或近似正态.对于偏态分布的数据资料分析,一般有两种处理方法:非参数检验或对数据作变换使其接近正态分布.当样本含量较小时,由于非参数检验方法的检验功效较低,因此对数据作变换使其接近正态分布常常是较好的方法.
-
基于人工神经网络的馆藏核心期刊评价模型研究
人工神经网络是近年来计算机科学、信息科学和医学交互发展形成的一门边缘学科[1,2].在人工神经网络中,BP(Back propagation)神经网络即误差反传信息前馈神经网络的提出和发展为人工神经网络理论注入了新的活力.BP神经网络不要求变量满足正态性和独立性等条件,它对信息的处理方式提示BP神经网络是一种非传统的多元非线性模型.本文将借助BP神经网络,构建出一个动态评价馆藏核心期刊的模型,以期为馆藏核心期刊的评价建立起一个科学、实用、有效的评价体系.
-
引入指示变量进行两样本均数的比较
两样本均数的比较,在资料具有正态性与方差齐性的条件下,一直使用t检验(或F检验)处理,这两种方法均属于单变量分析。目前,由于多变量分析理论的快速发展和广泛应用,将上述单变量资料引入指示变量,转化为双变量资料后,再进行直线回归分析,其结论与t检验的结论是完全一致的。 一、方法及意义 将符合t检验的两样本变量值合并,总样本例数为n=n1+n2,把原始变量值看作Y,再引入一个指示变量值X值。Y值作为应变量,引入的X值看作事先选定的自变量。两样本合并引入相反的指示变量的数据如下:Y: Y11 Y12 Y13 …… Y1n1 Y21 Y22 Y23……Y2n2X: 0 0 01 1 1 …… 0 1 1 11 0 0 0 …… 1
-
重复测量数据的两变量的独立性
两个变量间的相关程度在满足正态性条件前提下,我们可以用Pearson相关系数来刻划,并作相应的假设检验.但是经常会遇到两变量的样本观察值来自于重复测量数据,同一个变量不同时间点的观察值可能来自于不同的正态总体,且各时间点间具相关性.例如要研究乳癌患者在用药前、用药后1天、用药后5天、用药后14天的尿白蛋白和尿球蛋白之间是否独立. 本文通过广义多元分析原理分析两个向量变量的独立性来作重复测量数据两变量的独立性检验,并给出相应的SAS计算程序.
-
非线性混合效应模型和广义线性模型拟合随机效应logistic回归的应用比较
在临床药物试验中药物疗效的评价经常遇到二分类资料,即反应变量有两个水平如有效、无效;成功、失败等.二分类变量服从二项分布,可采用logistic回归模型.运用logistic回归模型对分类资料进行分析,能给实际研究带来很多便利.与多元线性回归相比,logistic回归具有许多独特的优点,如对正态性和方差齐性不做要求,系数的可解释性等.
-
Nemenyi法检验的SAS实现
对于来自正态总体完全随机设计多组样本数据资料的多重比较可以通过方差分析方法来实现.然而,对总体分布未知的数据资料利用方差分析方法来直接进行检验,可能增加统计推断的误差[1].秩和检验是这类数据资料分析的重要工具,因为秩和检验方法并不要求数据资料满足正态性假定.
-
基于bootstrap方法的组间判决
在临床实践中,当针对某种疾病出现一种新的干预手段,例如新药、新的诊断方法或者新疗法等时,经常需要判断新的干预手段与已有的干预手段是否有类似的效果.在医学实践中所得到的数据有其特殊性.首先,试验数据的概率分布通常是未知的,并且经常不满足正态性.其次,数据的样本量比较小,有时甚至只有三五个.后,由于试验对象的个体性差异,数据的变异往往比较大.
-
参考区间的发展与现状
今天我们所知的"参考区间"概念是Graetsbeck和Saris在上世纪六十年代末建立的,并于1969年在斯堪的纳维亚学会大会上提出[1].20年后,国际临床化学联合会(IFCC)专家组发表了第一篇关于参考值理论的正式IFCC文件[2].30多年前Galen和Gambino就发表了标志性书籍<超越正态性>,为何在现在这个循证医学的时代还讨论参考区间并使用决定界限来描述特征[3].三个新生事实驱动了以上论题的讨论:国际标准化组织(ISO)发布的标准15189:2007[4]对临床实验室质量和能力的要求、体外诊断(IVD)医疗器械欧洲指令98/97[5]的执行以及与指令间接相关的检验医学溯源性联合委员会(JCTLM)的建立.
-
用单值-移动极差法建立HBsAg定量检测室内质量控制图
目的 用单值-移动极差(x-MR)法建立HBsAg定量检测室内质量控制图.方法 首先用箱线图法剔除HBsAg室内质控数据离群值,然后对剔除离群值后质控数据进行Anderson-Darling (A-D)正态性和独立性检验,再以(x)±2.66 ×MR为单值控制图控制限、3.27MR为移动极差控制图控制上限绘制x-MR控制图,并对控制图进行失控分析,比较x-MR与均值-标准差((x)-s)控制图对失控的监测效果.结果 HBsAg第3个质控数据35.00 ng/mL为离群值;A-D正态和A-D独立分别为0.507和0.609,质控数据兼具正态性和独立性;x-MR图表明第10个质控数据失控,提示存在系统变异.按常规绘制(x)-s控制图则未能检出x-MR控制图所检出的第10个真失控数据.结论 x-MR控制图有助于提高失控判断的灵敏度.
关键词: 乙型肝炎病毒表面抗原 移动极差 单值-移动极差控制图 均值-标准差控制图 正态性 独立性 -
基于BP神经网络模型的住院费用影响因素研究
近年来医疗费用急剧上涨,高额的医疗费用特别是住院费用给老百姓带来了严重的经济负担,如何有效控制住院费用的上涨也成为了研究者关心的问题.控制住院费用应该从分析其影响因素着手,目前常用的为多重线性回归模型,但它对资料有一定的要求,如独立性、正态性、方差齐性、线性等,而住院费用及其影响因素之间可能存在非线性关系,各影响因素之间也可能存在多重共线性,因此应考虑另一种适合住院费用数据特征的分析方法[1~2].
-
Logistic回归模型中自变量相对重要性评价方法的研究进展
在流行病学研究中,经常会遇到结果变量是非连续的分类资料,这时常选用Logistic回归模型来分析各影响因素和结果变量之间的关系.研究者除了通过回归方程来预测外更关心的是哪些因素对结果有影响并解释其影响程度如何,同时把评估各因素的重要性大小作为主要目的之一.多年来研究者一直关注于寻找合适的评价多重回归中自变量相对重要性的方法,在线性模型中已经发展了多种可行的方法[1].但Logistic回归模型违反了多元线性回归的分布假设(线性、正态性和方差齐性),部分学者已将评价多重线性回归中自变量相对重要性的方法拓展应用于Logistic回归模型.本文对Logistic回归模型中自变量相对重要性评价方法作一综述,以期为多数研究者提供参考.
-
医学研究中Logistic回归与其他方法的结合应用
Logistic回归(logistic regression)属于概率型非线性回归,是分析反应变量为独立分类资料的常用统计分析方法,由于对资料的正态性和方差齐性不做要求、对自变量类型也不做要求等,使得近年来Logistic回归模型在医学研究各个领域被广泛用,如流行病学、病因学的队列研究、病例对照研究,临床诊断的判别模型,治疗效果评价等.
-
唐氏综合征筛查指标MoM值的正态性研究
目的: 考察江苏唐氏综合征产前筛查指标AFP和HCG的MoM值的正态性,探索Johnson分布体系中的SL分布族在上述指标正态性转换中应用的可行性和有效性. 方法: 资料来自于江苏省出生缺陷干预项目研究,采用对数正态和Johnson分布体系中的SL正态性转换方法. 结果: 两指标的MoM值均不服从正态分布;对数MoMHCG值以样本均数和标准差作为参数时,指标AFP的正态性较好,HCG仍不服从正态;Z=0.31时MoM指标SL转换后正态性明显改善. 结论: Johnson分布体系中SL分布族在我国唐氏综合征产前筛查指标HCG的MoM值的正态性转换中具有一定的应用价值.
关键词: 唐氏综合征 产前筛查 正态性 Johnson分布体系 -
能力验证均匀性检验的两种统计分析方法比较及结果合理性判断
分析了0.3?σ方法与F检验两种统计方法各自的优缺点和适用范围。0.3?σ方法以能力统计量作为评价的依据,F检验使用正态分布下的显著性偏差作为临界条件。因此,在使用0.3?σ方法时,应关注样品的不均匀性和方法的精密度;在使用F检验时,应预先进行数据正态性的验证。