整合BiLSTM-CRF网络和词典资源的中文电子病历实体识别
关键词:实体识别;长短期记忆网络;条件随机场;电子病历;词典资源;深度学习;BiLSTM-CRF神经网络模型
摘 要:[目的/意义]通过整合BiLSTM-CRF神经网络和具有先验领域知识的词典资源,提高中文电子病历领域中的实体识别效果。[方法/过程]采用BiLSTM-CRF神经网络模型,以CCKS-2017测评任务提供的脱敏中文电子病历数据为实验数据集,结合Word2Vec和外部词典构造神经网络的词嵌入输入改进实体识别模型。[结果/结论]与传统的CRF和单纯的BiLSTM-CRF模型相比,引入先验知识的词典资源可以取得更好的实体识别效果,F1值达到最高的90. 41%。深度学习模型BiLSTM-CRF能够显著提升传统CRF方法的实体识别效果,同时先验的词典知识能进一步增强神经网络的性能。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取