欢迎访问行业研究报告数据库

行业分类

当前位置:首页 > 报告详细信息

找到报告 1 篇 当前为第 1 页 共 1

引入门控机制的Transformer模型探究-学界纵横系列之三

加工时间:2024-02-01 信息来源:EMIS 索取原文[12 页]
关键词:Transformer 架构;RNN 模型;GTrXL
摘 要:

在时序依赖的任务中(如 RL),基于 RNN 的模型性能和稳定性优于 Transformer 架构。然而,Transformer 中的自注意力机制能够长时间跨度上有效整合信息并扩展到大量数据。为了提升时序依赖任务场景中的模型表现,在 Transformer-XL 基础上提出的 Gated Transformer-XL(GTrXL),该模型架构在稳定和性能上持平甚至赶超 LSTM 模型。


目 录:

image.png

© 2016 武汉世讯达文化传播有限责任公司 版权所有 技术支持:武汉中网维优
客服中心

QQ咨询


点击这里给我发消息 客服员


电话咨询


027-87841330


微信公众号




展开客服