不会写代码是生信小白面前大的拦路虎!
但随着生信的普及,已经有很多在线生信网页和软件可以进行在线分析,不仅不用写代码,甚至不需要从GEO上下载原始数据。
今天我们就结合近发表的一篇纯生信零代码文章,简单介绍7个在线生信分析网页和软件,这7个工具正好组成一套生信分析的完整流程。
这篇文章名为“Exploring the Key Genes and Pathways in the Formation of Corneal Scar Using Bioinformatics Analysis”,即“利用生物信息学分析探索角膜瘢痕形成的关键基因和途径”。期刊名为BioMed Research International,新影响因子为2.2分。
作者通过前期阅读文献,发现转化生长因子-β(TGF-beta)是角膜瘢痕形成的关键基因。高表达的TGF-beta意味着高表达的角膜瘢痕发生率。于是该团队选取GEO数据库的GSE6676基因芯片作为研究对象,该芯片包括8个样本,4个是高表达TGF-beta的小鼠样本,4个是野生型小鼠样本。下面从原文中提到的5个步骤来一一介绍这7个工具。
01筛选差异表达基因(DEGs)
使用的工具是GEO2R网页工具,网址是http://www.ncbi.nlm.nih.gov/geo/geo2r/
具体用法,网页里有youtube链接演示,简单来说是输入GEO编号,定义组别,点击Top 250即可分析。
02DEGs的GO富集和KEGG分析
筛选出DEGs之后,这些差异基因有什么功能?在什么通路中表达作用?可以使用在线网站DAVID(https://david.ncifcrf.gov/)进行分析。GO富集和KEGG分析都集成在这个网站里。
另外也可以通过以下进行分析:
GO: http://www.geneontology.org
KEGG: http://www.genome.jp/kegg/
我们选择Functional Annotation,粘贴入所有的DEGs到对应的框里,根据步骤1,2,3,4,点击submit,选择KEGG或者是GO分析,即可得到相应结果。后续可以通过Excel作图以形象展示。
03PPI(蛋白互作网络)分析
我们通过STRING网站(www.string-db.org),上传DEGs List,即可得到蛋白互作网络的表格文件。如果我们把这个文件导入软件Cytoscape中,即可得到PPI网络的形象展示。
04 模块分析
Cytoscape是生信分析为强大的软件之一,它可以装上很多插件。作者利用MCode插件将DEGs分成2个模块。对有意义的模块再次进行GO富集和KEGG分析。
05筛选hub gene
cytoHubba是Cytoscape另一重要的插件,它可以通过算法筛选出hub gene。本文终得到7个hub gene。
以上就是我们今天介绍的生信分析五大步骤,全程利用了4个在线网站,1个软件,2个插件,共7个工具。
这些工具构成了一个完整的生信分析过程,成功发表了2分的SCI,而且没有用到一个代码,也不需要从GEO上下载原始数据。