关键词:石油工人;肾功能异常;风险预测;随机森林
摘 要:目的 探索导致石油工人肾功能异常的危险因素,建立石油工人肾功能异常的预测模型。方法 本研究采用队列研究的方法,纳入中国北方某石油公司油田工人2 292名作为研究对象。2017年9月通过问卷调查、体格检查、实验室检查收集了性别、年龄、文化程度、人均月收入、体质量指数(BMI)、血压、血糖、血脂、尿酸、吸烟情况、饮酒情况、饮食评分、高温暴露、噪声暴露、生产性粉尘暴露、苯系物暴露、倒班情况等基线资料,分别于2019年4月、2020年4月和2021年1月进行3次随访调查。根据肾小球滤过率判断肾功能异常,采用Cox分析石油工人肾功能异常的影响因素。选用logistic回归、随机森林和XG Boost分别建立石油工人肾功能异常风险预测模型,比较区分度、校准度和临床适用度等指标以筛选最优模型。结果 2 292名研究对象中,男性工人1 520人,女性工人772人,年龄分布M(P25,P75)为42(37,46)岁;其中肾功能异常的人数为562人,四年间的累积发病率为24.52%,发病密度为87.44千人年。Cox分析结果显示,性别(HR:3.017,95%CI:2.378~3.829)、年龄(HR:1.500,95%CI:1.236~1.820)、人均月收入(HR:0.546,95%CI:0.459~0.649)、血糖异常(HR:1.424,95%CI:1.113~1.822)、吸烟(HR:1.499,95%CI:1.200~1.872)、饮酒(HR:1.434,95%CI:1.164~1.767)、高温(HR:1.330,95%CI:1.099~1.609)、噪声(HR:1.425,95%CI:1.181~1.719)、苯系物暴露(HR:1.703,95%CI:1.418~2.045)和倒班(HR:1.060,95%CI:0.840~1.340)为石油工人肾功能异常的危险因素;模型验证集结果显示,随机森林模型的准确率、灵敏度、特异度、曲线下面积(AUC)、Brier分数、Log损失和校准截距表现最好,分别为80.11%、30.95%、96.73%、0.822、0.132、0.428和0.059,优于其它两种模型。结合三种模型受试者工作特征(ROC)曲线、校准曲线以及临床决策曲线,本研究表明随机森林模型具有最好的预测性能。结论 石油工人肾功能异常不仅受一般人口学特征因素影响,例如性别、年龄、人均月收入、血糖异常、吸烟和饮酒等;也受多种职业因素的影响,例如高温暴露、噪声暴露、苯系物暴露和倒班等;随机森林模型预测效果优于其它两种模型,是该研究中预测石油工人肾功能异常的最优预测模型。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取