首页 > 文献资料
-
基于二代测序技术的黄芪萜类合成酶基因挖掘与生物信息学分析
目的:对黄芪萜类合成酶(TPS)基因进行挖掘与生物信息学分析,为黄芪萜类化合物特别是三萜皂苷的合成、积累作用及其分子机制研究奠定基础.方法:通过二代测序技术构建黄芪转录组文库,根据基因注释信息进行TPS序列初步筛选,BLAST同源比对确认.运用MEGA 4.0构建邻接(NJ)系统进化树,采用在线工具开放阅读框(ORF) Finder,Compute pI/Mw,ProtComp 9.0进行生物信息学分析.结果:共获得76条TPS序列,其中13条拥有完整的ORF.获得的TPS序列中注释为TPS10序列多,其次为大根香叶烯D合成酶和单萜合成酶;选取17条代表性TPS序列进行同源性分析,发现黄芪TPS序列分为3个类群,每一类群均包括Ⅰ型和Ⅱ型萜类合成酶序列.此外,挖掘得3条环阿屯醇合酶(GAS)序列,其中原始编号为CL6827.Contig1和Unigene19112的CAS序列具有完整的ORF,所编码蛋白质序列长度分别为795,757个氨基酸,亚细胞定位于内质网,与已报道黄芪CAS序列同源性高.结论:利用黄芪转录组文库成功挖掘得黄芪单萜、倍半萜及三萜合成环化酶基因,定位于内质网的CAS序列与三萜皂苷主要由细胞质中的甲羟戊酸途径合成特征吻合.
-
锌指蛋白ZNF580定位在MGC803细胞核
新基因(AF184939)ZNF580是由本组克隆并于Genbank 注册的C2H2型锌指蛋白转录因子基因,其cDNA 748~1266 bp之间的碱基构成一个完整的开放阅读框,编码172个氨基酸.蛋白功能基序分析表明:其羧基端序列中含有3个重复串联的C2H2型锌指蛋白主构域:CX2CX3FX5LX2HX3H(X代表保守性差的氨基酸),富含脯氨酸残基的氨基端序列为转录激活结构域[1].利用绿色荧光(green fluorescence protein,GFP)在活细胞内的示踪作用[2],我们将GFP与ZNF580cDNA开读框融合,导入胃癌MGC803细胞株中,直观地观察到ZNF580基因在细胞内的表达及亚细胞定位,为阐明新基因ZNF580的功能奠定了基础.
-
HCMV IE2蛋白调控功能研究新进展
人巨细胞病毒( human cytomegalovirus , HCMV)属于β疱疹病毒亚科,是人类疱疹病毒中大的一组病毒。在人群中,HCMV感染相当普遍,大多数感染呈临床隐性感染或潜伏感染;但在新生儿、免疫抑制或免疫功能低下的人群中则可引起临床显性感染,出现明显症状,甚至发生致死性疾病。而在孕妇,则可发生垂直传播,导致死胎、畸形以及婴幼儿神经系统发育障碍、智力低下等。 HCMV基因组全长超过240 kb的双链DNA,整个基因组含有250个开放阅读框( ORF )。在病毒感染过程中, HCMV基因的表达表现一定的时序性,可分为早早期( IE )、早期( E)和晚期( L)基因。病毒穿入细胞后, IE基因被宿主细胞因子激活并早表达,编码两种重要的调控蛋白 IE1( IE72)和 IE2( IE86)。其中 IE2( IE86)蛋白是从 HCMV 基因组的开放阅读框UL122上翻译过来的,是一种重要的反式激活因子并在HCMV感染中发挥了重要作用。已有研究表明,IE2( IE86)能反式激活细胞周期蛋白cyclinE启动子,并能延缓宿主细胞进入S期[1-2]。近年有资料证实,IE2( IE86)调节许多与控制细胞周期相关的因子。 IE2( IE86)是一种重要的病毒蛋白质,而缺少IE2( IE86)的HCMV子代突变体不能进行复制。下面主要就IE2( IE86)蛋白对病毒蛋白表达调控的作用作一综述。
-
E V71复制策略研究进展
EV71属人类肠道病毒基因组A组,微小核糖核酸病毒科,是单链正链RNA病毒。其基因组包含约7400个核苷酸,其中开放阅读框包括3个区域:P1编码4个结构蛋白:VP1~4;P2和P3编码7个非结构蛋白:从2A到2C,3A到3D;开放阅读框两侧是复杂的5′UTR和带有polyA尾的3′UTR;且5′UTR与病毒VPg蛋白共价结合。 EV71通过识别宿主细胞上特定的受体(人类P选择性糖蛋白配基1以及清道夫受体B2)进入细胞[1-2]。感染宿主细胞后,其基因组虽缺乏5′帽子结构,但在其5′非转录区(5′UTR )有内在核糖体进入位点( internal ribo-some entry site,IRES),其能在不依赖帽子结构的情况下翻译成单个的多聚蛋白质,该蛋白质可被病毒编码的蛋白2Apro及3Cpro加工成外壳结构蛋白和非结构蛋白,参与病毒RNA的复制[3-5]。虽然目前关于EV71复制的具体机制尚不清楚,但几乎所有的肠道病毒均具有相似的病毒基因组结构及复制策略。其中,脊髓灰质炎病毒是已被深入研究的小RNA病毒,其复制的特点可作为研究EV71复制的参考模式。本文将主要描述参与EV71复制的宿主因素、尤其是在病毒RNA合成、依赖IRES翻译中的作用。
-
戊型肝炎病毒 ORF1研究进展
戊型肝炎病毒(hepatitus E virus,HEV)是急性病毒性戊型肝炎的病原体[1],近年来研究发现免疫力低下或器官移植患者感染 HEV 后形成 HEV 的持续性感染,发展成为慢性戊型肝炎[2]。公认的 HEV包括4个基因型,其中基因1、2型只感染人,而基因3、4型既感染人也感染猪[3]。除人、猪 HEV 外,还发现了兔、禽、鹿、鼠等 HEV[4]。HEV 是肝炎病毒科戊型肝炎病毒属的唯一成员,为无包膜、正义、单链RNA 病毒,病毒基因组全长约7.2 kb,包括5ˊ非编码区、3个开放阅读框(ORFs)和3ˊ非编码区;ORF1编码与病毒复制相关的酶等非结构蛋白,ORF2编码660 aa 的病毒衣壳蛋白,ORF3编码小分子的磷蛋白[5]。ORF2蛋白是公认的病毒抗原,是病毒的主要结构蛋白[6],ORF3蛋白是病毒多功能蛋白,参与多种调节及病毒释放[7];ORF1在明确其与病毒复制相关功能后研究较少,近年来,对 ORF1的研究报道增多,发现其新的特征,以下综述 ORF1的研究进展。
-
长链非编码RNA在中枢神经系统中的研究进展
长链非编码RNA(long non-coding RNA,lncRNA)是一类长度为200 nt至100 kb、缺乏显著开放阅读框(ORF)的非编码RNA(ncRNA).据估计,人类基因组大约含有7000~23 000条lncRNA.研究证实,lncRNA与生物进化、胚胎发育、物质代谢以及肿瘤发生等都有着密切的联系.在中枢神经系统的研究中,lncRNA参与了神经元分化、脑发育、突触可塑性以及神经退行性疾病及肿瘤的发生、发展.因此,对中枢神经系统中lncRNA功能和作用机制的深入研究将丰富我们对脑发育、功能和疾病的认识,同时也可为某些治疗药物的设计与研发提供新思路.
-
GP73在肿瘤诊断中的研究进展
GP73是Kladney等[1]从巨细胞肝炎的肝脏cDNA文库中筛选出的一种高尔基体Ⅱ型跨膜糖蛋白,其基因位于9号染色体长臂,全长3 042 bp,内含1个1 200 bp的开放阅读框,编码400个氨基酸,因在WB显示的相对分子质量73 000而得名,又称GOLPH2或GOLM1.
-
长链非编码RNA及其与结直肠肿瘤相关研究进展
长链非编码RNA( long non-coding RNA,lncRNA)是一类长度超过200 nt的RNA分子,因其缺乏有意义的开放阅读框( open reading frame ,ORF) ,不参与编码蛋白质,而是直接以RNA的形式在表观遗传学、转录及转录后等多种层面上调节蛋白编码基因的表达[1] ,其异常表达与包括恶性肿瘤在内的多种重大疾病的发生、发展密切相关[2].
-
人类神经丝蛋白基因hSTE的分子克隆
啤酒酵母是人类基因组计划的重要模式生物,它的全基因组测序已于两年前完成,其功能基因组研究亦已全面展开.到目前为止,在已知基因中约1/3功能已经清楚,余下2/3基因的功能有待进一步研究.在全基因组所有6 000多个基因中,约1/4的基因尚未被研究,其中一部分基因在功能上尚不能进行归类,称为"孤儿基因"(orphan genes).我们根据系统测序发现的新的开放阅读框基因STE编码的蛋白质序列,在Internet下进行Blast分析,搜寻到一个高分值的人EST,再根据获得的EST序列设计两条引物分别和人脑cDNA文库插入子两端的载体序列配对组成类似于5′-RACE和3′-RACE的扩增体系,获得5′端序列和3′端序列.完成测序后和人的EST库中相关EST进行比较分析,拼接出一个全长为3773bp的cDNA,其中长的开放阅读框在1~3078之间,编码的蛋白质含1026个氨基酸,并含有多个重复的KSP磷酸化位点.同源性检索发现它和人类神经丝蛋白H的同源性在90%以上.将克隆的该基因命名为hSTE并登录到Genbank,登记号为AF203032.利用模式生物对克隆的基因进行遗传互补测验的工作目前正在进行中.
-
酵母RAD24基因区域功能分析
啤酒酵母是人类基因组计划的重要模式生物,其全基因组序列测定通过国际合作已于1996年完成.我们继先前(1993年)克隆出RAD24基因区域DNA大片段后,对照全基因组测序结果进行比较,发现在我们曾预测的RAD24基因编码区存在一个移码突变.为此,我们对该区域进行了再测序,结果证实在我们报道的RAD24基因编码区少了一个碱基.应用plasmid premier基因分析软件对下载的该区域10 kb DNA大片段进行6相开放阅读框(ORF)分析,发现原RAD24基因区域的左侧尚存在一个ORF,命名为RAD24L,于是将原RAD24基因处的ORF改名为RAD24R,预测的编码蛋白质含2 130个氨基酸.应用一步基中断法和质粒交换技术,发现RAD24L缺失突变不影响细胞存活,但生长速度减慢,对紫外线和X线敏感;RAD24R基因缺失则细胞死亡,这与我们以前报道的原RAD24基因缺失的结果是一致的,说明所谓的RAD24基因缺失引起细胞死亡,实际上是由于RAD24R基因缺失所致.我们用功能互补法克隆了RAD24L的人类同源基因hR24L(Genbank No. AF126424),它参与细胞周期检定点调控,RAD24R的人类同源基因的克隆工作目前正在进行中.
-
微小RNA与恶性淋巴增殖性疾病相关性的研究进展
真核生物中存在两种主要的非编码RNA(non-coding RNA),并发挥重要作用.一类为小干扰RNA(small interfering RNA,siRNA),另一为微小RNA(microRNA,miRNA).miRNA是一种大小19~25核苷酸(nt)、非编码蛋白的单链小分子RNA,由具有发夹结构的70~90个碱基大小的前体microRNA(pre-microRNA)经过Dicer酶剪切加工而形成的[1].它广泛存在于真核生物中,其本身不具有开放阅读框(ORF).现就目前miRNA与恶性淋巴增殖性疾病的研究进展作一综述.
-
长链非编码RNA与白血病的研究进展
白血病是骨髓造血干细胞异常增殖、分化障碍、凋亡受阻为特征的恶性克隆性疾病,是造血系统常见的恶性肿瘤。反复化疗、严重出血、多重复杂感染,患者在承受巨大痛苦的同时承担着极大的经济压力,目前急性白血病的总生存率仍低。长链非编码RNA(long non‐coding RNA ,LncRNA)是一类长度为200 nt~100 kb ,缺乏显著开放阅读框(OFR)的非编码RNA。随着高通量测序技术、大规模LncRNA cDNA 文库的建立、基因芯片技术的高速发展,L ncRN A与生物进化、胚胎发育、物质代谢以及人类多种重大疾病关系密切,包括肿瘤发生、转移等关键问题受到人们的广泛重视。在造血系统中,L ncRN A 参与血细胞成熟分化,并与白血病等多种恶性血液病的发生、复发及转移密切相关。为此,现对近年来 L ncRN A 在白血病方面的研究成果做一综述,为后续的预后判断及靶向治疗提供新思路。
-
EPS8与肿瘤关系的研究进展
1 EPS8的发现,结构特点及其作用表皮生长因子受体通路底物8(EPS8)是细胞内信号通路底物.1993年Fazioli[1]在过表达表皮生长因子受体(EGFR)的小鼠成纤维细胞(NIH-3T3)中,克隆出EGFR受体通路中受到酪氨酸磷酸化的底物,通过构建这些底物的cDNA文库,发现第8号克隆含有一段1.6 kb片段,用ORF(开放阅读框)确定其为一种新蛋白,并取EGFR-pathway-substrate no.8 的首字母命名为EPS8.该蛋白在进化上高度保守,在果蝇、线虫、非洲蟾蜍、人类中均有表达.编码人的EPS8基因定位于染色体的12q23.q24,大约含有821个氨基酸,相对分子量为97 kD.有研究发现[2],EPS8具有3个基因类似物成员分别为EPS8L1、EPS8L2、EPS8L3,三者的线性拓扑学结构一致.
-
口蹄疫病原免疫学的分子基础
FMDV属于微RNA病毒科,口蹄疫病毒属成员,是一种单股正链RNA病毒.基因组长度约为8 500 nt, 5'端共价连接一种特殊的小蛋白VPg(3B),其后为一个约1 300 nt的5'非编码区,与宿主RNA相比,FMDV的5'非编码区没有帽子结构,而是靠一个内部核糖体进入位点(IRES)启动基因组的复制;3'端含有poly(A)的尾巴,尾巴上游为100 nt的非编码区.5'非编码区和3'编码区之间为一个大约7 500 nt 的开放阅读框(ORF),编码一个2 300 aa多聚蛋白,这个多聚蛋白在感染细胞中或体外翻译体系从未发现,因为其被病毒编码的蛋白酶迅速裂解,这个蛋白酶也存在于多聚蛋白中.
-
丙型肝炎病毒NS5A蛋白功能的研究进展
丙型肝炎病毒(HCV)可引起肝炎、肝硬化和肝癌等一系列肝脏疾病,且慢性化几率较高.目前全世界HCV感染人数仍呈增加趋势,因此科学家对HCV的研究高度重视.HCV有一个大的开放阅读框编码约三千多个氨基酸的多聚蛋白,经蛋白酶裂解为十个多肽片段;氨基末端为结构蛋白包括有核心蛋白、包膜蛋白E1和E2、P7蛋白;羧基末端为非结构蛋白包括有NS2、NS3、NS4A、NS4B、NS5A和NSSB蛋白.基中NS5A蛋白位于HCV多聚蛋白前体的1973-2419氨基酸区域,由447个氨基酸组成,氨基末端为双亲性α螺旋可与内质网膜结合.
-
Dystrophin基因3-7号外显子缺失后下游新翻译区启动与BMD关系的生物信息学分析
目的:研究dystrophin基因3-7号外显子缺失后下游新翻译区启动与贝克氏肌营养不良(Becker muscular dystrophy,BMD)的关系及可能机制.方法:用生物信息学方法对dystrophin基因3-7号外显子缺失后可能的启动子、开放阅读框、翻译起始位点、蛋白疏水性性质改变及重要结构域进行分析.结果:3-7号外显子缺失后,起始于正常肌肉启动子的转录体,其翻译阅读框提前终止,但在8号外显子内可能启动一个新的翻译阅读框;内含子2或7里可能含有类似启动子的元件,也可能导致8号外显子内翻译区的启动.新阅读框编码的蛋白仍然保留有重要的功能区,患者可以表现为BMD.结论:dystrophin基因3-7号外显子缺失后下游新翻译区仍有存在启动的可能,患者可以表现为BMD表型.
-
MATLAB 7.X生物信息工具箱的应用——基因序列分析(一)
MATLAB 7.X生物信息工具箱为广大用户提供了一个用于基因组和蛋白质组分析的综合环境,它利用数据库资源,使科学研究事半功倍,在工具箱提供的开放环境里,用户甚至可以按照自己的目的来设计和利用分析工具.本文主要介绍了MATLAB7.X生物信息工具箱在基因序列分析中的应用,包括确定核苷酸组成,密码子组成,氨基酸转化和组成等,所有操作简便高效,结果可视化程度高.
-
MATLAB 7.X生物信息工具箱的应用——序列比对(二)
序列比对是基因序列分析中的一项重要工作.本文以人和鼠的基因为对象,介绍MATLAB 7.X生物信息工具箱中的序列比对方法,内容包括从数据库获取序列信息,查找序列的开放阅读框,将核苷酸序列转换为氨基酸序列,绘制比较两氨基酸序列的散点图,用Needleman-Wunsch算法和Smith-Waterman算法进行比对,以及计算两序列的同一性.
-
蛋白质组学在大肠癌研究中的应用
蛋白质组学(Proteomics),其是以蛋白质组为研究对象,是在人类基因组计划研究发展的基础上形成的新兴学科,主要是在整体水平上研究细胞内蛋白质的组成及其活动规律.蛋白质组学对应于基因组学(Genomics),并回答基因组学不能解决的几个难题:(1)基因组中的基因是否被转录、翻译及相应时相;(2)基因产物表达量的变化;(3)翻译后修饰;(4)ORF(开放阅读框)的预测;(5)基因敲除或基因表达的生物学效应;(6)蛋白质的半衰期及在蛋白复合物中的定位;(7)药物效应、细胞周期、发育、老化、各种应激反应及涉及多基因疾病的现象[1].
-
乙型肝炎病毒X蛋白与宿主细胞浆内蛋白质相互作用的研究
乙型肝炎病毒(HBV)的基因组结构紧凑,含有S、C、P、X 4个部分重叠的开放阅读框(ORF),其中小的开放阅读框是X基因,位于第1374~1836位核苷酸之间,编码的蛋白即HBx蛋白.HBx是一种功能复杂的蛋白,不仅存在于细胞核.也存在于细胞浆中.在细胞核中,HBx并不与双链DNA直接结-合,而是与转录因子和基本转录元件相互作用.介导转录起始复合物的形成,调节转录激活子的合成.目前研究发现,尽管在细胞核内存在HBx蛋白,但HBx蛋白的表达主要集中在细胞浆内.细胞浆中,HBx与多种蛋白质相互作用,影响HBV转录与复制及宿主细胞基因的转录、增殖、转化与凋亡等.