首页 > 文献资料
-
人类肿瘤特异性启动子计算机识别方法研究
本文介绍了一种利用转录因子结合位点应用计算机技术对人类肿瘤特异性启动子进行预测的方法.实验结果证明该方法具有较高的准确性.
-
应用新的基于知识编码方法及双层SVM识别人类PolⅡ启动子
目的 优选对人类RNA聚合酶(Pol)Ⅱ启动子数据识别分类并提高识别准确率的方法.方法 采用基于知识的统计编码方法、CpG编码、五联体(Pentamers)编码、模式字典(Pattern Dictionary)编码,后建立共识模型,使用支持向量机(SVM)方法对启动子数据进行分类.结果 启动子数据编码后在SVM中识剐,与其他利用SVM工具相比,得到了较高的识别准确率、特异性及灵敏度.将新编码方法应用到人类22号染色体启动子数据的识别中,其中模式字典编码识别准确率达到了90.98%.结论 共识模型考虑了各子模型的独立性和模型之间的差异性,发挥了各模型之间的互补优势,从而提高了终的识别准确率.
-
利用转录因子结合位点识别人类肿瘤特异性启动子研究
目的研究应用计算机技术对人类肿瘤特异性启动子进行识别、预测.方法通过收集肿瘤特异性启动子序列、转录因子结合位点序列、非肿瘤启动子序列3种数据集合,利用转录因子结合位点在不同序列集合中的密度求出各位点的对应密度比,确定识别特征,进行肿瘤特异性启动子的识别.结论该方法具有较高的准确性,在保证对训练集合90%以上的识别率的情况下,对测试集合的识别率达到80%以上.
-
基于遗传神经网络的启动子识别系统
将遗传算法与神经网络结合,用遗传算法优化神经网络的连接权值,建立遗传神经网络模型,并将其应用于真核生物蛋白编码基因启动子的识别中.实验结果表明:我们以此模型为基础构建的系统对训练集和测试集中的启动子序列均能有效识别,在训练集和测试集上的平均识别率分别为99%和97%,表明此算法用于启动子序列的识别可行且十分有效.