在临床研究中,随机对照试验和观察性研究都是常用的研究方法,但由于随机对照试验要求更为严格复杂,近年来观察性研究越来越为大家所青睐。不幸的是,我们辛辛苦苦的收集了大量的数据,分组后却发现组间基线资料不均衡,这可如何是好?

image.png

  医学研究中不可避免存在混杂偏倚,混杂偏倚是指暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰。

  例如,研究某药物对肿瘤患者生存率的影响,药物的作用效果可能会受到个体人口学、社会经济、既往病史等因素的影响,进而影响生存结局。那么,如何解决这些混杂因素带来的问题呢?

  一 分层分析

  按照混杂因素的不同水平分层进行比较,可通过CMH(Cochran-Mantel-Haenszel)方法计算控制混杂因素后的合并OR/RR值(SPSS交叉表卡方检验即可实现分层分析,如下)。

image.png

  二 多因素回归分析

  三大回归:线性、Logistic和Cox回归,是解决混杂偏倚常用的方法。利用回归模型先进行单因素分析筛选可能的混杂因素,再将单因素纳入多因素回归模型,即可校正混杂因素。(操作常见,在此不再赘述)

  三 倾向性评分

  倾向性评分在近年来应用越来越火爆,且用法丰富,也是解决混杂偏倚的好方法。倾向性评分是应用倾向性评分值综合所有的观察变量信息从而达到均衡变量、减少偏倚的目的。

  1. 倾向性评分匹配(PSM)

  PSM是通过一定的统计学方法对实验组和对照组进行筛选,使筛选出来的对象在某些重要临床特征上具有可比性。通常以分组变量为因变量,以可能影响结果的混杂变量为协变量构建Logistic模型,求得每个个体的倾向性得分,再按照就近匹配的原则进行匹配。

  匹配后的实验组和对照组之间具有可比性,可直接比较结局事件(SPSS 22.0以上版本可进行1:1 PSM分析,如下)。

image.png

  2. 倾向性评分+回归

  利用Logistic模型求得研究对象的倾向性评分后,将倾向性评分作为协变量放入回归模型中,分析结局事件的发生风险。

  3. 倾向性评分分层

  利用Logistic模型求得研究对象的倾向性评分后,按照评分将研究对象排序,以百分位数将研究对象划分为若干层(一般5-10层),在层内进行均衡性检验,组间均衡则计算层内效应量,然后合并各层的统计量和效应尺度。

  4. 倾向性评分加权

  类似标准化法的原理,即制定一个统一的“标准人口”,按照“标准人口”中混杂因素构成的权重来调整两组观察效应的平均水平,从而消除两组之间由于内部混杂因素分布不同对效应值的影响。

  通过倾向性评分赋予每个研究对象一个相应的权重,使得各组中倾向性评分分布一致,从而消除混杂影响,常用逆概率加权法(IPTW)或标准化死亡比加权法(SMRW)。

  四 工具变量分析

  以上方法仅能控制已测量到的混杂因素所引起的偏倚,而无法消除未知的、被遗漏的、以及测量不准确的混杂因素所造成的残余混杂,而工具变量分析恰恰解决了这一问题。

  工具变量分析是一种用来控制测量误差和未知混杂因素引起的偏倚的估计方法,工具变量的类型及选择方法较为复杂,此处不再展开叙述,有兴趣的朋友可以进一步查阅学习。