首页 > 文献资料
-
基于t分布邻域嵌入算法的流式数据自动分群方法
流式细胞仪中多参数流式数据分群传统方法主要是利用专业软件采取人工设门方式,圈出目标细胞进行分析,分析过程较为复杂,专业性较强.基于此,本文提出了一种基于t分布邻域嵌入(t-SNE)算法对多参数流式数据进行分群处理.该算法将样本数据在高维空间中的欧几里德距离转化为条件概率来表征相似性,使数据降到低维空间.本文通过使用流式细胞仪处理染色后的人体外周血细胞,并将处理后的数据导出作为实验样本数据,对其利用t-SNE算法进行降维,并与核主成分分析(KPCA)降维算法对比,分别使用K均值(K-means)算法对降维得到的主成分数据进行分类.结果表明,t-SNE算法对呈非对称且有拖尾分布的细胞类群具有很好的分群效果,分群准确率可达92.55%,或可有助于多色多参数流式数据进行自动分析.
-
基于核主成分分析的流式细胞数据分群方法研究
针对多参数流式细胞数据分析过程复杂、自动化程度不高、要求操作者具有一定专业背景等问题,本文提出了一种基于核主成分分析算法(KPCA)进行多参数流式细胞数据分群的方法.利用KPCA对多参数流式细胞数据进行非线性变换,降低数据的维度,得到主成分特征变量下的散点图分群结果,并使用改进的K-means聚类算法实现不同亚群的自动设门.以人体外周血淋巴细胞样本检测结果为实验数据,分别对其进行传统分群、主成分分析(PCA)分群、KPCA分群处理,并对特征参数的选取进行了探索.结果表明,KPCA方法能够较好地应用于多参数流式细胞数据分析中,与传统细胞分群方法相比,该方法无需操作者具备专业知识,即可实现快速准确的自动分群,能够提高流式细胞仪临床诊断分析的效率.