您当前的位置:
首页 > 文献资料
所属专业:
分块重要度模型文献资料
-
医院门户网站门诊专家信息的抽取研究
门诊专家信息可以为需要就诊的居民提供一定的参考,通常这类信息分布于各个医院的门户网站,而且大多数需要通过查询才能获取.为了自动抽取医院门户网站的门诊专家信息,首先要解决查询接口判别的问题.针对此问题,根据查询接口的属性特征,构建了一种树状结构的领域模型,用于对查询接口进行分类判别,并进行领域关键词的填写.其次,对于返回的网页,需要进行噪声过滤,本文针对此问题,提出了分块重要度模型.实验结果表明,基于领域模型的查询接口判别方法比基于规则方法的准确率提高了10.83%,分块重要度模型的F1值比XPath方法提高了10.5%.