基于实体知识的石油炼化领域命名实体识别
作者:丁建新; 王晓伟; 温欣; 屈克将; 王建华; 赵艳红; 胡思颍
加工时间:2024-10-29
信息来源:现代信息科技
关键词:命名实体识别;石油炼化领域;数据增强;BERT
摘 要:石油炼化领域中的命名实体识别任务存在着标注数据稀缺,以及现有的预训练语言模型不能很好识别领域组合和嵌套实体的问题。基于此,首先提出一种基于外部实体知识的数据增强方法(EEKR),通过引入外部实体知识库,将其与标注数据中的实体进行实体级别替换完成数据增强,有效解决标注数据稀缺的问题。之后提出了基于内部实体知识的命名实体识别模型(IIEKNER),通过获取标注样本中的内部实体嵌入,将内部实体知识融入预训练模型,从而可以更准确地识别出石油炼化领域中的嵌套和组合实体。实验结果显示,相比于其他模型,基于EEKR数据增强方法的IIEKNER模型的识别效果更优。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取