首页 > 文献资料
-
肿瘤参数属性偏序结构可视化实现乳腺癌诊断
为实现乳腺癌数据规则可视化,提出一种基于Lasso和增量学习结合的、以改进的属性偏序结构图为可视化工具的乳腺癌诊断规则提取方法.采用乳腺癌数据为数据源基础上算法分为4步:首先使用Lasso方法进行特征选择实现降维,在9个特征中选出前4个关联度大的特征;其次进行基于Gini指数的连续数据粒化,通过增量学习方式动态生成形式背景;再次融合二次Lasso筛选,将维数由17降为3;后使用新的基于基尼指数和覆盖对象的行列优化方法生成属性偏序结构图可视化规则,提取出规则7条.将数据处理结果与主流分类器对比,结果表明,基于该算法的规则提取实现96.52%的诊断准确率,均高于随机森林(94.25%)、Adaboost(90.00%)、1NN(91.33%)、3NN(90.67%)、支持向量机算法(95.00%).后采用不同增量比例(10% ~ 90%)数据验证增量学习算法效果,表明顺序学习数据量达到30%时模式已经完备,数据量在20%时准确率已经接近支持向量机算法,证明该方法是一种用于诊断可视化的规则发现的有效手段.
-
增量孪生支持向量机后验概率方法及脑电分类应用
目的 研究一种对多任务脑电信号进行快速识别的自适应分类算法,提高脑-机接口(brain-computer interface,BCI)系统的实用性.方法 将孪生支持向量机(twin support vector machine,TSVM)作为初始分类模型,通过后验概率输出建模方法求得新样本属于各个类别的概率,并将该样本归为概率大的类别,然后引用增量学习方法将满足一定条件的新样本加入到训练集中来更新分类模型,以新的分类模型对新增样本进行识别.结果 对2008年BCI竞赛数据集Dataset1和Dataset2a进行分类,与传统SVM和现有TSVM等方法相比,该方法降低了分类耗时,能更好地识别出多数受试者的脑电信号.结论 本文算法能提高分类器的自适应性和分类速度,为BCI系统提供了一种有效的在线识别方法.