欢迎来到360期刊网!
学术期刊
  • 学术期刊
  • 文献
  • 百科
电话
您当前的位置:

首页 > 文献资料

  • 基于两位一体的中文电子病历命名实体识别

    作者:郁小玲;张铁山;吴彤;方明哲;黄建一;胡长军

    命名实体识别是信息抽取中的一项重要任务.在医疗研究领域,从电子病历中自动识别命名实体形成结构化的文本为医疗决策提供数据支持,已经成为重要的研究课题.分词和实体识别分步进行容易造成下层错误向上累加传递且不能充分利用融合信息.针对这一问题,本文提出一种两位一体字标注方法,该方法将识别过程看做是序列的字标注过程,采用条件随机场模型经过标注实现病历的命名实体识别.实验结果表明,两位一体字标注方法在命名实体识别中性能得到很大的提升.

  • 基于深度表示的中医病历症状表型命名实体抽取研究

    作者:原旎;卢克治;袁玉虎;舒梓心;杨扩;张润顺;李晓东;周雪忠

    目的:命名实体识别在自然语言处理中是基本的任务之一,本文通过应用深度表示的方法实现临床上的现病史数据的自动标识.方法:本文随机选取了10426条现病史句子作为主要的文本研究对象,分别用词嵌入(word2vec)和网络结构特征(node2vec)两种构建向量的方法生成不同的词向量特征,再在基于条件随机场(Conditional Random Field,CRF)和结构化支持向量机(Structured Support Vector Machines,SSVM)的方法上进行十重交叉验证,计算并比较基于深度表示的症状表型命名实体抽取的性能.结果:传统的CRF算法的三个评价指标(准确率,召回率,F值)为(0.888 9,0.786 9,0.834 8);基于WENER方法下的CRF和SSVM的评价指标为(0.975 0,0.984 9,0.979 8)和(0.992 8,0.988 9,0.990 8);在GENER方法下基于词的CRF和SSVM算法的三个评价指标为(0.972 8,0.976 8,0.975 2)和(0.983 3,0.974 5,0.978 8);GENER方法下基于字的CRF和SSVM算法的评价指标为(0.927 8,0.862 8,0.887 9)和(0.943 7,0.946 8,0.941 3).结论:深度表示的命名实体抽取算法性能要比传统的非深度表示的命名实体标识算法性能好.另外,通过比较深度表示的两种算法的性能后发现,无论是基于word2vec生成的词向量还是基于node2vec生成的词向量,SSVM模型算法性能均优于CRF算法的性能.

  • 面向中医临床现病史文本的命名实体抽取方法研究

    作者:袁玉虎;周雪忠;张润顺;李晓东

    目的:中医临床病历作为重要的临床数据,以文本的形式记录了医生和患者交互的整个过程.目前,在大数据的背景下,针对临床病历所涵盖的主体问题信息如现病史的分析利用相关研究仍有所欠缺.因此,本文针对中医临床病历中的现病史部分展开症状术语抽取方法研究,为临床病历的进一步使用奠定基础.方法:首先通过随机挑选与专家审核的方式获得了12 367份现病史数据,按照疾病种类分成了两组实验,其中糖尿病组包含了4 838份数据,脾胃病组7 529份数据,以及合并后的混合组12 367份数据.并整理出了一份涵盖22 996个词的症状术语字典.然后选取滑动窗口特征、词的前后缀特征、词典特征等5种特征模板,使用CRFs模型开展症状术语命名实体抽取实验.结果:在实验结果评价标准(准确率、召回率和F1值)上的表现:在开放测试上的评价结果为(0.83、0.8、0.82)、(0.9、0.9、0.89)和(0.88、0.87、0.87);在十重交叉验证上的评价结果为(0.83、0.82、0.83)、(0.95、0.95、0.95)和(0.93、0.92、0.92).结论:CRFs模型作为一种优秀的序列标注算法,适用于现病史文本的症状术语命名实体抽取任务.

  • 电子病历中命名实体的智能识别

    作者:叶枫;陈莺莺;周根贵;李昊旻;李莹

    电子病历中命名实体的识别对于构建和挖掘大型临床数据库以服务于临床决策具有重要意义,而我国目前对此的研究相对较少.在比较现有的实体识别方法和模型后,采用条件随机场模型(CRF)机器学习的方法,对疾病、临床症状、手术操作3类中文病历中常见的命名实体进行智能识别.首先,通过分析电子病历的数据特征,选择以语言符号、词性、构词特征、词边界、上下文为特征集.然后,基于随机抽取的来自临床医院多个科室的电子病历数据,构建小规模语料库并进行标注.后,利用条件随机场算法执行工具CRF++进行3次对照实验.通过逐步分析特征集中的多种特征对CRF自动识别的影响,提出在中文病历环境下CRF特征选择和模板设计的一些基本规则.在对照实验中,本方法取得了良好效果,3类实体的佳F值分别达到了92.67%,93.76%和95.06%.

  • 基于新型深度全卷积网络的肝脏CT影像三维区域自动分割

    作者:孙明建;徐军;马伟;张玉东

    肝脏分割对于肝肿瘤肝段切除及肝移植体积测量具有重要的临床价值.由于在CT影像中肝脏与邻近脏器的灰度值相似性很高,因此对肝脏区域的三维自动分割是一项具有挑战性的难题.为解决精准肝脏分割的问题,提出一种新型的深度全卷积网络结构3 DUnet-C2.该结构充分利用肝脏CT图像的三维空间信息,并有效结合肝脏区域的浅层特征和深层特征.特别地,还提出一种新的3DUnet-C2网络训练策略,通过选取清晰图像,并从图像中截取肝脏区域作为样本进行训练的方式,得到初步3DUnet-C2模型权重,并使用该权重来初始化3DUnet-C2的网络参数,从而使网络达到收敛.后,针对3DUnet-C2网络分割肝脏边界不精准的问题,在原有3DUnet-C2网络模型的基础上,运用三维条件随机场构建3DUnet-C2-CRF模型来优化肝脏分割边界.为了验证所提出三维分割模型的性能,从ISBI2017 Liver Tumor Segmentation Challenge的数据集中选取100张CT图像用于训练、验证和测试,3DUnet-C2-CRF模型在随机选取的20张测试集上的分割准确率的Dice系数为96.9%,高于3DUnet和Vnet模型的Dice系数.实验结果表明,3DU net-C2-CRF模型具有更好的特征表达能力以及更强的泛化性能,从而可提升模型的分割准确率.

  • 基于条件随机场的《伤寒论》中医术语自动识别

    作者:孟洪宇;谢晴宇;常虹;孟庆刚

    目的:探索中医术语的自动识别方法,扩充中医文本的自然语言处理形式。方法采用基于条件随机场( CRF)的方法,针对《伤寒论》文本中的症状、病名、脉象、方剂等中医术语的自动识别标注问题,通过结合字本身、词性、词边界、术语类别标注的特征,分析不同特征组合对术语识别的影响,并探讨具有效性的组合。结果以字本身、词边界、词性、类别标签为特征组合的中医术语识别模型准确率为85.00%,召回率为68.00%,F值为75.56%。结论字本身、词性、词边界、术语类别标注的多特征融合的模型识别效果优。

  • 基于自然语言处理技术的医学命名实体解析研究

    作者:易应萍;张志强;王强

    命名实体识别技术是大数据处理中的基本且重要的问题之一,通过命名实体识别技术可以有效从医学文本中提取出关键性的医学命名实体,从而进一步进行医学研究分析.通过选取300篇入院记录进行研究,采用条件随机场(CRF)进行命名实体识别的基础模型构建,并且加入字典及规则方法进行准确率的提升,终将模型中数量多的实体标签的交叉验证准确率提升至96%以上.实验结果表明,多方法结合的命名实体识别技术能够有效提升医学文本实体识别的准确性.

  • 基于条件随机场的中医术语抽取方法及其应用探析

    作者:孟洪宇;孟庆刚

    中医文献有种类繁多,数量庞大,记录随意,术语表达方式独特等的特点,为知识的获取带来困难.信息抽取技术可以利用计算机对文本信息进行针对性抽取,以结构化的形式将结果储存到数据库中,这种技术可以帮助医学研究者从海量信息中高效获取所需知识.命名实体识别是信息抽取准确与否的关键,对目前常用的几种识别方法进行分析,认为基于统计的方法更适用于中医文献的研究,并选定条件随机场算法,结合中医术语的特点,对该方法及步骤进行了详细阐述.同时,举例介绍了信息抽取技术在中医结构化电子病历及中医专业领域搜索引擎建立中的辅助作用,为其在中医领域的应用提供更广阔的参考思路.

360期刊网

专注医学期刊服务15年

  • 您好:请问您咨询什么等级的期刊?专注医学类期刊发表15年口碑企业,为您提供以下服务:

  • 1.医学核心期刊发表-全流程服务
    2.医学SCI期刊-全流程服务
    3.论文投稿服务-快速报价
    4.期刊推荐直至录用,不成功不收费

  • 客服正在输入...

x
立即咨询