5393 篇
13905 篇
477978 篇
16302 篇
11766 篇
3933 篇
6543 篇
1253 篇
75636 篇
37863 篇
12163 篇
1665 篇
2866 篇
3421 篇
641 篇
1241 篇
1974 篇
4917 篇
3875 篇
5483 篇
算力新变局:训练范式、架构创新、工程优化 ——华为系列深度之十八暨 GenAI 系列深度之四十九
AI 大模型训练范式正在转向多阶段,强化学习算力投入仍需提升。OpenAI o1 后,黄仁勋提出三大 Scaling Law:预训练、后训练和推理阶段提升算力投入,都能够提升模型性能。Deepseek V3 和 R1 模型爆火,后训练阶段的强化学习(Reinforcement Learning)以及推理阶段的长思考是核心特点,也再次佐证了后训练阶段、推理阶段的 Scaling Law。我们认为这两大 Scaling Law 仍处于起步阶段,模型厂商将继续加码强 化学习,算力投入仍有增量空间。