TCGA这个数据库大家都不陌生,包含了多个肿瘤的生存数据。但是对于想要研究肿瘤的医学生来说,不会R语言编程是个痛点;今天给大家介绍几款在线生存分析数据库,方便大家研究基因表达与生存的关系。

  01OncoLnc

  网址:http://www.oncolnc.org/

  OncoLnc收集了TCGA中21种肿瘤,共8647个病人的生存数据,以及对应的mRNA和miRNA的表达谱数据。同时收集了来自MiTranscriptome项目lncRNA表达量数据,从而提供了包含mRNA,miRNA,lncRNA 3中基因的生存分析,可以方便的挖掘各种肿瘤中和生存相关的基因。

  选择感兴趣的基因和肿瘤,在首页的搜索框中输入需要查询的基因,可以是entrez ID,也可以是gene symbol。

  以KRAS为例,示意如下:

TCGA:不会R语言编程如何做出生存分析

  点击submit按钮,可以看到事先用cox回归计算好的生存分析结果,示意如下:

TCGA:不会R语言编程如何做出生存分析

  选择感兴趣的肿瘤,可以进一步进行KM生存分析。

  为了探究基因和生存的相关性,这里根据基因表达量的大小将样本分为high和low两组,自己指定每组的比例,加起来是100%,示意如下。

TCGA:不会R语言编程如何做出生存分析

  上图中设置两组的比例都是50%,根据该基因的表达量从低到高排序,前50%定义为地表达组,后50%定义为高表达组,示意如下。

TCGA:不会R语言编程如何做出生存分析

  确定好分组之后,点击submit,就可以得到如下所示的生存分析结果

TCGA:不会R语言编程如何做出生存分析

  02GEPIA

  网址:http://gepia.cancer-pku.cn/index.html

  主页点击Survival Analysis

TCGA:不会R语言编程如何做出生存分析

  首先输入所研究的基因,然后在“Datasets Selection”处选定要分析的癌种,点击“Plot”就可以生成生存曲线图并自动生成Logrank和HR值。

TCGA:不会R语言编程如何做出生存分析

  在“95% Confidence Interval”选择NO就可以去掉虚线,只显示两条线。

TCGA:不会R语言编程如何做出生存分析

  03TIMER

  网址:https://cistrome.shinyapps.io/timer/

  与上面两个工具不同的是,TIMER可以矫正一些因素,比如性别、年龄等等。首先点击Survival。

TCGA:不会R语言编程如何做出生存分析

  选择Cancer Type以及所要研究的基因类型Gene Symbol。此处需要注意的是,如果要做基因的生存分析,那么不需要在“Immune Infiltrates”选择任何细胞类型,如果选择了会在右下角跳出的结果中显示不同免疫细胞浸润比例的生存曲线。

TCGA:不会R语言编程如何做出生存分析

  点击Plot KM Curve即可得到结果。

TCGA:不会R语言编程如何做出生存分析