5411 篇
13916 篇
478298 篇
16343 篇
11779 篇
3948 篇
6564 篇
1254 篇
75732 篇
38177 篇
12196 篇
1672 篇
2874 篇
3423 篇
642 篇
1242 篇
1980 篇
4929 篇
3895 篇
5517 篇
软件与服务行业:预训练综述-大模型技术探索系列一
与传统的深度学习类似,由于模型神经网络的节点过于复杂且缺乏可解释性,大模型的工程化落地过程类似一个“黑盒”效应;在搭建模型算法、确定参数时并没有标准答案可以参照,模型的数据组成、结构到调参方式都需要一步步地迭代才能得到较好结果。所以大模型的工程化落地需要开发者在迭代中摸索最佳答案。