欢迎来到360期刊网!
学术期刊
  • 学术期刊
  • 文献
  • 百科
电话
您当前的位置:

首页 > 文献资料

  • 基于两位一体的中文电子病历命名实体识别

    作者:郁小玲;张铁山;吴彤;方明哲;黄建一;胡长军

    命名实体识别是信息抽取中的一项重要任务.在医疗研究领域,从电子病历中自动识别命名实体形成结构化的文本为医疗决策提供数据支持,已经成为重要的研究课题.分词和实体识别分步进行容易造成下层错误向上累加传递且不能充分利用融合信息.针对这一问题,本文提出一种两位一体字标注方法,该方法将识别过程看做是序列的字标注过程,采用条件随机场模型经过标注实现病历的命名实体识别.实验结果表明,两位一体字标注方法在命名实体识别中性能得到很大的提升.

  • 基于深度学习的电子病历命名实体识别及其在知识发现中的应用

    作者:欧阳恩;李作高;李昱熙;张晓艳

    通过引入医学文本语言和文档类别特征,构建了一个基于深度学习的电子病历命名实体识别系统.识别的实体包括身体部位、症状和体征、疾病和诊断、检查和检验以及治疗5大类.基于模型识别的结果,将其应用在基于共现的临床知识发现中.命名实体识别系统的准确率为93.29%,召回率为93.53%,F1值为93.41%.医学语言特征的引入能够进一步提高基于深度学习的医学实体识别系统的效果,实体识别的结果可以作为电子病历知识发现的基础.

  • Lattice LSTM神经网络法中文医学文本命名实体识别模型研究

    作者:王博冉;林夏;朱晓东;朱万琳;马学华

    目的 探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题.方法 利用Lattice LSTM来表征句子中的词汇词(lexicon word),从而将潜在词信息整合到基于字符的长短期记忆网络—条件随机场(long short term memory-conditional random field,LSTM-CRF)模型中.进一步使用一个大型自动获取的词典来匹配句子,进而构建基于词的Lattice.利用Lattice LSTM结构自动控制从句子开头至结尾的信息流.结果 门控单元可用于将来自不同路径的信息动态传送到每个字符.在NER数据基础上进行训练后,Lattice LSTM能够学会从语境中自动找到更有用的词汇,以取得更好的NER性能.结论 与基于字符和词的NER方法相比,本文所提出的模型优势在于利用显性词汇信息而不是字符序列进行标注,同时较少出现分词误差.

  • 基于多特征融合的中文电子病历命名实体识别

    作者:于楠;王普;翁壮;方丽英

    目的 针对某三级甲等医院电子病历中的非结构化部分(诊断和病情),建立多特征融合的条件随机场模型,自动化识别用自然语言描述的电子病历(electronic medical records,EMR)中的疾病和症状,从而实现电子病历信息的结构化存储,以利于电子病历的信息挖掘和统计分析.方法 将手动标注的语料库分为训练集和测试集,借助NLPIR工具分割文本,选择CRF++工具进行实验.针对中文电子病历的数据特点,先选取基本特征和相应的特征模板,通过不同上下文窗口的对比实验确定其大小;再分别添加引导词特征和构词结构特征,对比两种高级特征对实验结果的影响.结果 仅选取基本特征,上下文窗口为7时,识别效果好;添加高级特征后,终疾病实体F值为92.80%,症状实体F值为94.17%.结论 条件随机场模型融合多种有效的特征,可以很好地识别出电子病历中的疾病和症状实体.本研究对电子病历的命名实体识别有重要的意义.

  • 电子病历中命名实体的智能识别

    作者:叶枫;陈莺莺;周根贵;李昊旻;李莹

    电子病历中命名实体的识别对于构建和挖掘大型临床数据库以服务于临床决策具有重要意义,而我国目前对此的研究相对较少.在比较现有的实体识别方法和模型后,采用条件随机场模型(CRF)机器学习的方法,对疾病、临床症状、手术操作3类中文病历中常见的命名实体进行智能识别.首先,通过分析电子病历的数据特征,选择以语言符号、词性、构词特征、词边界、上下文为特征集.然后,基于随机抽取的来自临床医院多个科室的电子病历数据,构建小规模语料库并进行标注.后,利用条件随机场算法执行工具CRF++进行3次对照实验.通过逐步分析特征集中的多种特征对CRF自动识别的影响,提出在中文病历环境下CRF特征选择和模板设计的一些基本规则.在对照实验中,本方法取得了良好效果,3类实体的佳F值分别达到了92.67%,93.76%和95.06%.

  • 基于字词联合训练的Bi-LSTM中文电子病历命名实体识别

    作者:万里;罗曜儒;李智;綦小蓉

    为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法.根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入.实验过程中训练集、验证集与测试集随机按电子病历数量的3:1:2的概率生成.通过对比论文提出的语言模型与其他模型,实验结果显示基于字词联合训练的Bi-LSTM能达到高准确率98.28%与低复杂度1.169.该结果证明提出的模型能有效识别中文电子病历中如疾病、症状等相关实体,为自动化处理医学文本数据提供现实基础.

  • 基于自然语言处理技术的医学命名实体解析研究

    作者:易应萍;张志强;王强

    命名实体识别技术是大数据处理中的基本且重要的问题之一,通过命名实体识别技术可以有效从医学文本中提取出关键性的医学命名实体,从而进一步进行医学研究分析.通过选取300篇入院记录进行研究,采用条件随机场(CRF)进行命名实体识别的基础模型构建,并且加入字典及规则方法进行准确率的提升,终将模型中数量多的实体标签的交叉验证准确率提升至96%以上.实验结果表明,多方法结合的命名实体识别技术能够有效提升医学文本实体识别的准确性.

  • 医学知识图谱构建研究进展

    作者:修晓蕾;吴思竹;崔佳伟;邬金鸣;钱庆

    针对医学数据专业性强、结构复杂等特点,解析了构建医学知识图谱的关键技术,介绍了利用机器学习和深度学习的方法识别医学命名实体、实体链接和抽取语义关系,以及医学知识图谱在医院智能导诊、疾病筛查和预测、辅助临床诊断、医疗保险风险预测和医学知识科普方面的应用.结合当前我国医学知识图谱构建在数据和技术层面临的问题和挑战,提出了相应的对策和建议.

  • 基于文本挖掘的高通量癌症基因组数据注释

    作者:刘燕;孙月萍;郭臻;侯丽;李姣

    癌症基因组学科学计划的实施,推进了分子层面疾病诊断、疾病预防检测和靶向治疗等临床应用,积累了大规模的癌症基因组学数据,对癌症基因组数据进行有效挖掘和利用,成为该领域的研究重点。在高通量癌症基因组学数据挖掘的基础上,以美国国家癌症研究中心的癌症基因组数据为研究对象,利用文本挖掘技术对特异癌症基因加以注释和可视化展示,即从基因功能描述文本中识别疾病实体和药物实体,从临床应用的角度注释高通量数据挖掘结果,便于研究人员从高通量的数据和科学文献中发现疾病、药物及基因之间的关系。

  • 文本挖掘在生物医学领域中的应用及其系统工具

    作者:吕婷;姜友好

    系统介绍了生物医学文本挖掘的具体流程和文本挖掘技术在生物医学领域中的应用情况,并着重从自然语言处理和本体、命名实体识别、关系抽取、文本分类与聚类、共现分析、系统工具及评价、可视化等方面分别做了阐述.

  • 生物医学文本挖掘:步骤与工具

    作者:崔雷

    介绍了生物医学领域里的文本挖掘研究的步骤及各个步骤中所采用的方法,重点介绍了各个步骤中所用的工具和案例,以期促进生物医学文本挖掘研究的开展.

  • 基于双向LSTM神经网络电子病历命名实体的识别模型

    作者:杨红梅;李琳;杨日东;周毅

    背景:电子病历数据是医疗领域大数据的重要源头,是医学知识的体现.电子病历是患者就医过程的记录,是临床辅助决策系统、精准医学研究和疾病监控等应用的重要数据支撑.目的:研究电子病历的信息抽取技术,提取中文电子病历中的重要医学实体,支持肝细胞癌的知识发现.方法:数据集来自广东省某三甲医院的电子病历数据库.共收集了240例患有肝细胞癌的病历记录(18542个句子),包括入院记录和出院小结.按照预先定义的标准进行标注.随机抽取180例患者病历(13839个句子)进行训练,并保留60个病例记录(4703个句子)作为测试集.利用双向的LSTM网络结合CRF训练命名实体识别模型.在测试数据集上评估NER系统的性能,并计算出严格匹配的准确率、召回率和F1值.结果与结论:对测试数据集的评估表明,入院记录中实体识别F1值为0.8535,出院小结中实体识别的F1值为0.7265,总体F1值为0.8052.研究实现了电子病历文本自动命名实体识别模型,下一步的研究重点将改进实体抽取的准确率.

  • 基于CRF与RUTA规则相结合的卒中入院记录医学实体识别及应用

    作者:许源;葛艳秋;王强;熊刚;易应萍

    [目的]研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西省医疗大数据平台中卒中病人的病历进行结构化数据提取.[方法]从江西省医疗大数据平台中随机筛选500份2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以及参数提升识别准确率.[结果]经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,Fscore 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院记录进行抽取,共抽取命名实体264 580条,命名实体修饰1 161 077条.[结论]构建的自然语言抽取模型识别准确率较高,通过该模型能够准确地从大量非结构化病历中获取病人的既往史、生活史、临床表现等有价值的科研数据,有效提升心脑血管疾病的临床科研效率和科研水平.

  • 生物医学命名实体识别研究现状及中文生物医学命名实体识别难点与意义综述

    作者:潘璀然;施维;薛均;王青华;王理;董建成

    介绍国内外生物医学命名实体识别的研究现状,详细阐述生物医学命名实体识别的技术方法,包括基于词典和规则的方法、基于机器学习的方法、混合方法和神经网络方法以及相关测评组织和标准,总结中文生物医学命名实体识别难点和意义.

  • 基于实体词典与机器学习的基因命名实体识别

    作者:夏光辉;李军莲;阮学平

    将实体词典以特征的形式引入到机器学习模型中,提出一种基于实体词典与机器学习的基因命名实体识别方法,在GENIA 3.02语料上进行实验.测试结果表明引入实体词典特征后,在获得较高实体识别准确率的同时,优化CRFs识别模型的时间复杂度,提高系统识别效率.

  • 文本挖掘技术在药物研究中的应用

    作者:胡双;陆涛;胡建华

    介绍生物医学文献中文本挖掘的过程,重点分析论述文本挖掘在药物研究中的应用,主要包括在药物命名识别、药物靶标发现、药物疗效评价和中医用药规律中的应用,后指出文本挖掘在生物医学知识发现中需要解决的问题,并展望文本挖掘在药物研究领域的发展前景.

360期刊网

专注医学期刊服务15年

  • 您好:请问您咨询什么等级的期刊?专注医学类期刊发表15年口碑企业,为您提供以下服务:

  • 1.医学核心期刊发表-全流程服务
    2.医学SCI期刊-全流程服务
    3.论文投稿服务-快速报价
    4.期刊推荐直至录用,不成功不收费

  • 客服正在输入...

x
立即咨询