基于语义共现匹配的在线食品安全谣言相关文档识别方法研究
关键词:谣言传播;食品安全;词向量;分布特征
摘 要:[目的/意义]文章通过设计一种有效的在线食品安全谣言相关文档识别方法,从而提升人工审核的效率,减轻在线食品安全谣言传播带来的不良影响。[方法/过程]基于待分类文档中的词语分布在不同类型的特征向量库(在线食品安全谣言相关库以及非相关库)中的差异性,设计了基于无监督的文档特征相似性计算方法以及基于有监督的回归方法来识别在线食品安全谣言相关文档。[结果/结论]基于无监督的RM-Sort方法能够有效地识别在线食品安全谣言相关文档,并且优于现有的朴素贝叶斯,决策树以及支持向量机方法。进一步地,基于有监督的RM-LR方法效果则更优。[局限]模型只能够判别文档是否和食品谣言相关,但无法确定该文档是辟谣文章还是谣言文章本身。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取