基于朴素贝叶斯和word2vec的中医电子病历文本信息抽取
关键词:朴素贝叶斯;word2vec;中医电子病历;信息抽取
摘 要:目的本文主要讨论如何用机器学习算法对非结构化的中医电子病历文本进行信息的分类抽取,抽取出症状、处方、治法等有用信息。方法先将电子病历文本进行分词,然后进行标签标注,采用朴素贝叶斯和word2vec算法训练形成模型,最后进行模型测试。结果实验结果表明,该算法模型的信息抽取查准率可达80%以上。结论该研究在中医电子病历文本信息抽取领域做出了初步探索,为进一步进行中医药领域的数据挖掘和科研工作提供了良好的基础。
内 容:原文可通过湖北省科技信息共享服务平台(http://hbstl.hbstd.gov.cn/webs/homepage.jsp)获取