欢迎访问行业研究报告数据库

行业分类

当前位置:首页 > 报告详细信息

找到报告 1 篇 当前为第 1 页 共 1

针对弱规范石油文档的自然语言数据收集方法
作者:常启帆; 杨煦旻; 朱方辉; 金龙; 刘伟; 郑力会 加工时间:2024-11-20 信息来源:石油钻采工艺
关键词:非常规油气;低渗透油藏;工程技术;数据资产;数据收集;自然语言处理;修井;智能油田
摘 要:(目的意义)现有数据收集方法在弱规范、强专业词汇文档中产生误读导致收集准确度低、时间长,通过建立适合石油工程文档特点的快速准确的数据收集模型,解决数据收集准确度低、收集时间长的难题,为大数据计算提供数据基础。(方法过程)首先建立层次化结构词条,识别石油工程文档记录差异性;然后建立专业词汇词典,让计算机能够识别文档中石油工程的专业术语;最后,在自然语言模型基础上通过大量数据训练构建了Structure Petroleum Bidirectional Encoder Representation from Transformer(缩写,SPBERT)数据收集模型。实现导入修井相关的Word文档,模型便可自动输出文档中的数据及对应标签。(结果现象)将模型与现有的2种正则表达式方法和3种通用自然语言模型的准确性在长庆油田现场修井数据上对比验证,并统计模型收集数据所用时间。5种数据收集模型平均准确度为40.06%,SPBERT模型在修井数据收集中准确度为82.3%,相比平均准确度提高105.44%。每收集一组正确数据SPBERT模型收集时间为402 ms,相比其余模型平均收集时间554 ms,减少27.44%。(结论建议)SPBERT模型能以高准确度收集补充数据,模型收集时间短,可进一步增强自然语言模型的专业性,推进油田数智化建设。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取
© 2016 武汉世讯达文化传播有限责任公司 版权所有
客服中心

QQ咨询


点击这里给我发消息 客服员


电话咨询


027-87841330


微信公众号




展开客服