首页 > 文献资料
-
差异表达基因筛选方法的比较
目的 比较基因芯片数据分析中常用的用于筛选差异表达基因的几种方法,探讨各方法的筛选效果.方法 使用Borferroni修正法等8种保守的方法以及两样本t检验、Wilcoxon非参数法、SAM共11种方法对模拟的芯片数据进行处理,以FDR(False discovery rate)和筛检的差异表达基因个数为指标考察其筛选效果.结果 SAM的FDR仅次于8种保守的方法,但筛检的差异表达基因个数较多,适合基因芯片初筛差异表达基因的目的.结论 SAM适合基因芯片初筛差异表达基因的目的.
-
量反应指标联合诊断效果的规律阐述
本文试图通过标准的模拟数据,采用多元判别分析方法,以Youden指数为评价指标,对多项指标联合使用效果的规律性进行探索,避免有关研究和新指标研发中的盲目性.
-
截尾正态分布的随机抽样和R软件的实现
统计学中所使用的数据大概可分为真实数据和模拟数据,模拟数据是所有Monte Carlo研究的基础,又称伪数据(pseudo data)[1].几乎所有统计软件都提供了常用分布(如正态、均匀和beta分布等)的随机数生成器,应用这些函数在变量的整个样本空间抽样很容易,但要想在分布的部分取值范围内(比如截尾分布)抽样却有些困难,此时或者需要复杂的数学转换,或者需要考虑抽样的效率问题[2].所谓截尾分布(truncated distribution)是指变量取值被限制在特定范围而不能在整个支撑上取值[2].如果只能取小于某个数a的值称为右截尾(right truncated),如果只能取大于某个数b的值称为左截尾(left truncated),如果取值范围限定在一个区间[a,b]称之为区间截尾(interval truncated),a,b称为截点或阈值.显然,[-∞,a]即为右截尾,[b,∞]即为左截尾,因此右(左)截尾是区间截尾的特例.
-
利用正态模拟数据对定量诊断指标的界值进行分析
大量研究表明,自然界和人体的各种参数和指标多符合正态分布规律[1],但由于抽样样本量等原因所限,符合总体条件的正态分布数据很难获得,在疾病的诊断中,少见疾病和首发疾病的资料更难获得,为此本文提出一种利用正态模拟数据分析某一诊断指标诊断某种疾病的界值的方法,为类似研究提供新的思路.