5408 篇
13915 篇
478255 篇
16334 篇
11777 篇
3948 篇
6562 篇
1254 篇
75716 篇
38097 篇
12190 篇
1672 篇
2873 篇
3423 篇
642 篇
1242 篇
1980 篇
4927 篇
3893 篇
5508 篇
稀疏率降低的白盒Transformers-AI前沿跟踪系列九
Yi Ma et al. 在论文《White-box transformers via sparse rate reduction: compression is all there is?》中提出了一个具备数学可解释性的白盒类 Transformer 模型 CRATE。文中引入了一个核心概念“稀疏率降低”(Sparse Rate Reduction),通过同时最大化内在信息增益和外在稀疏性来评估在深度学习网络学习到的表征的质量。基于 CRATE 架构的深度学习模型在多个基准测试中证明作为一种新型的网络架构在大规模真实数 据集上的有效性和潜力。