2634 篇
1089 篇
194716 篇
3325 篇
6317 篇
2231 篇
2785 篇
537 篇
29661 篇
9807 篇
3163 篇
759 篇
2303 篇
1321 篇
449 篇
752 篇
1387 篇
2611 篇
2740 篇
4043 篇
算力新变局:训练范式、架构创新、工程优化 ——华为系列深度之十八暨 GenAI 系列深度之四十九
AI 大模型训练范式正在转向多阶段,强化学习算力投入仍需提升。OpenAI o1 后,黄仁勋提出三大 Scaling Law:预训练、后训练和推理阶段提升算力投入,都能够提升模型性能。Deepseek V3 和 R1 模型爆火,后训练阶段的强化学习(Reinforcement Learning)以及推理阶段的长思考是核心特点,也再次佐证了后训练阶段、推理阶段的 Scaling Law。我们认为这两大 Scaling Law 仍处于起步阶段,模型厂商将继续加码强 化学习,算力投入仍有增量空间。
