首页 > 文献资料
-
基于GPU并行计算的超声波束合成方法
逐列扫描式的聚焦成像方法会限制超声成像帧频的提高.采用平面波发射模式只需要一次发射和接收即可获得一幅完整的超声图像,平面波成像是可以大幅度地提高成像帧频,从而实现超声超高速成像的方法之一.但是现有的超声波束合成器无法达到超声超高速成像对于计算能力的要求.对基于平面波成像的超声延时-叠加波束合成算法进行并行性分析,在此基础上设计并实现两种基于图形处理器(GPU)并行计算的超声平面波成像波束合成方法——基于2个Kernel和基于1个Kernel的并行波束合成方法.两种方法的主要区别在于波束合成中对延时值的计算和存储策略的不同处理,仿体实验证明两种方法的计算帧频分别达到2 178和2453帧/s.相比于普通的方法,这两种基于GPU的并行波束合成方法的计算帧频分别提速99倍和111倍.实验结果表明,GPU波束合成器相比于传统方法,可以大幅度提高计算能力.
-
磁共振成像虚拟扫描技术的发展及趋势浅谈
磁共振成像虚拟扫描技术自上个世纪80年代诞生以来,一直随着几个方面的发展在不断发展:(1)磁共振虚拟扫描近似计算核的理论设计的发展;(2)计算技术,可视化技术,数值技术特别是并行计算技术的发展;(3)磁共振应用技术的发展;(4)虚拟人技术,MRI-man技术的发展.本文系统地论述了磁共振虚拟扫描技术的各个发展方向,和当前的面临的一些主要的问题.提出了一些发展思路.
-
基于CUDA的BLASTN加速研究
目的 利用图形处理器(graphic processing unit,GPU)计算技术对广泛使用的生物信息学序列比对工具BLASTN加速,服务于新一代测序技术条件下海量生物序列数据分析任务.方法 采用计算统一设备架构(compute unified device architecture,CUDA)并行计算架构,从GPU多线程并行和多GPU并行两个维度,对核酸序列比对工具BLASTN的种子查找阶段和不允许空位延伸阶段进行并行加速.结果 基于CUDA的CUDA-BLASTN取得了显著的加速效果,与FSA-BLAST相比,采用单个Nvidia Tesla C2075显卡在以上两阶段取得了高达26.8倍的加速比,而且结果准确度没有降低.CUDA-BLASTN特别适合于中长查询序列对长序列数据库的比对任务.结论 利用GPU计算可在较大程度上加速序列比对过程,性价比较高,具有很好的应用前景.
-
局部序列比对算法及其并行加速研究进展
随着新一代测序技术的发展,传统的序列比对工具已无法满足测序产生的海量生物学数据分析处理的需求,研究如何利用新的计算技术加速序列比对过程具有十分重要的意义.本文回顾了常用的局部序列比对算法,介绍了基于并行计算原理的序列比对算法的加速优化策略和主要进展,详细说明了如何利用新的图形处理器(GPU)计算技术实现高性能的BLAST(basic local alignment search tool)比对算法.后,结合实际需求,提出和讨论了综合利用云计算和GPU 计算实现高性能、高能效的序列比对平台的研究思路.
-
基于CUDA的多角度平面波复合算法研究
多角度平面波复合算法是超快速超声成像技术的基础,有利于提高传统聚焦超声的成像帧频及分辨率.但是现有的多角度平面波复合技术由于其计算量较大,导致CPU计算耗时不能满足实时成像要求.该文提出了基于CUDA架构的多角度平面波复合算法,并进行了仿真工作以及对比实验.实验结果表明,基于GPU的多角度平面波复合计算耗时远低于CPU计算方法,可以大幅度提高计算速度以满足超声设备实时成像要求.
-
一种通用的、基于Agent的生物资源整合架构
众所周知,随着基因组测序工作的蓬勃发展和后基因组时代的到来,生物信息学数据呈指数级增长.生物界在享受着资源共享所带来便利的同时,也随着数据总量和复杂性的不断增加而变得异构化和分布化.目前,各种生物计算软件和数据库资源通常标准不一而且很难兼容.因此,如何在这些异构资源之间实现数据集成与软件共享是有效利用生物信息资源的关键.为解决以上问题,本文提出了一种新型的数据整合架构,该架构通过将web服务与并行计算相结合的方法,轻松地实现了对异地资源数据的访问、提取、转化以及整合.实验证明,本系统在处理异构、海量数据方面有着巨大的计算潜力.
关键词: 生物信息学 异构资源 Agent、Web服务 并行计算 -
改进的拉普拉斯金字塔多光谱术中引导快速融合算法
本研究利用吲哚菁绿(indocyanine green,ICG)对肿瘤进行标记,通过改进的拉普拉斯金字塔算法对非顶层图像的肿瘤细节进行增强,同时去除顶层图像的非肿瘤信息,从而达到强化与区分肿瘤信息的目的;利用图形处理单元(graphics processing unit,GPU)技术将融合算法进行并行化处理,可以有效提高本研究算法的运算速度,实时显示多光谱融合图像.相对于传统成像方式,本研究提供的成像方法可以实时获取更为全面的肿瘤信息,提高了肿瘤检测的准确性,从而帮助外科医生更好地实施肿瘤切除手术.
-
Bessel声场的并行计算和仿真
计算时间较长和存储空间较大,是时域有限差分法在PC系统上求解声场问题的瓶颈.为解决该问题,我们研究了由数个PC机、计算机网络和MPI并行编程实现的并行时域有限差分算法及其在声场计算中的应用,并在此基础上对Bessel声场进行了仿真.结果表明:并行计算在声场的时域有限差分法算法中,能明显提高计算效率并降低对单个PC机存储空间的要求,而虚拟拓扑结构的优化,能够提高并行计算的效率.
-
基于CUDA的医学影像数据处理工作站的配置方法
目的:以个人电脑为平台,结合CUDA(Compute Unified Device Architecture,统一计算设备架构)以显著提高个人电脑的计算能力,使其能够承担大运算量医学影像数据处理任务.方法:CUDA是NVIDIA公司推出的一款运算模型,把GPU多线程并行性能引入除图像显示之外的领域,可以大幅提升个人电脑的运算能力.在装有Windows XP的电脑上安装支持CUDA的NVIDIA显卡,然后依次下载安装CUDA Driver,toolkit,SDK,Visual Studio及CUDA VS wizard x32软件.让CPU和GPU协同工作,把程序中可以并行处理的部分并行化,使原来在CPU上只能顺序处理的大量循环计算,可以在GPU上以大量线程并行处理的方式一次计算完成.结果:在配备支持CUDA的NVIDIA显卡的个人电脑上可以安装CUDA,但配置比较复杂,安装完成通过测试后可以利用显卡中大量的流处理器进行并行计算.结论:个人电脑安装CUDA后可以利用GPU中大量的流处理器进行并行计算,将个人电脑转变为一台高性价比的医学影像数据并行处理工作站.
-
关联规则算法的演化和进展
关联规则挖掘是数据挖掘的一个重要应用.从1993年Agrawal等首先提出了用基于频集理论的递推方法来解决挖掘顾客交易数据库中项集间的关联规则问题以来,关联规则的算法已经进行了很多改进.这些改进集中在三个方面:减少候选集和压缩事务总数;减少数据库扫描次数;引入并行技术.近年来,研究人员引入更能代表人类决策思维模式的模糊集理论,并将研究目标对准更复杂的时序和空间数据,挖掘的范围也从单维事务扩展为多维事务,但相应的要面临更加复杂的计算.
-
分布式并行计算对数字化人体图像重采样时间的影响
目的 探讨不同客户机规模的分布式并行计算对数字化人体图像重采样时间的影响.方法 将计算机分为1个串行计算组与5个并行计算组,对同一个数字化人体数据集重采样生成冠状面与矢状面图像,比较各组重采样时客户机与服务器的处理时间,以及并行计算加速比.结果 ①并行计算组与串行计算组比较,客户机重采样时间均显著减少(P<0.01).②16台客户机组与8台客户机组、24台客户机组与16台客户机组比较,客户机重采样时间均显著减少(P<0.01),但32台客户机组与24台客户机组、40台客户机组与32台客户机组比较,客户机重采样时间无显著差异(P>0.05).结论 分布式并行计算能够大幅度减少数字化人体数据集重采样生成冠状面与矢状面图像的时间,但串行处理和通信开销制约了进一步并行化的规模.
-
高分辨锥束CT并行重建算法在基于NVDIA GPU显卡计算平台上的实现
目的:探讨高分辨率锥束显微CT断层重建中引入并行计算的必要性及其加速效果.方法:在具有并行计算功能的GPU显卡(NVIDIA QUADRO K5000显卡,显存4G)中为投影图像和重建体数据分配显存空间,每一个像素分配一个线程进行投影图像的各种校正和滤波,再给每个体素分配一线程进行反投影重建,在显存中实现全部断层重建.程序使用C+十面向对象方法实现,内核函数用CUDA实现.结果:重建体数据大小是2 048×2 048×128,每个体素用32位浮点数记录,实验采集1 800张投影,每张投影图像大小为2 048×1 536,重建时间小于9 min,是图像采集时间的i/3,是基于CPU重建耗时的2%.将GPU并行重建得到的图像和CPU单线程重建图像结果进行对比,数据结果一致,满足实验设计的要求.结论:并行计算引入高分辨锥束CT重建可大大提高重建速度,并且能实现采集与重建同步进行.