关键词:电子病历;神经网络;数据抽取
摘 要:非结构化电子病历采用自然文本录入,系统无法自动识别,不易进行特征抓取与统计查询,本文利用循环神经网络算法,采用Bi-LSTM-CRF模型训练与迭代学习,最终获得6万个术语及上千种常见句式,并在此基础上继续挖掘更多的实体与实体关系,完成电子病历的后结构化转换。神经网络在电子病历后结构化转换过程中的应用前景广泛,但现阶段受病历书写不规范、中文语义复杂等因素影响,数据抓取准确性仍有待提高。随着人工智能以及算法的不断改进,神经网络在电子病历后结构化方面的普及应用指日可待。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取