5408 篇
13915 篇
478255 篇
16334 篇
11777 篇
3948 篇
6562 篇
1254 篇
75716 篇
38097 篇
12190 篇
1672 篇
2873 篇
3423 篇
642 篇
1242 篇
1980 篇
4927 篇
3893 篇
5508 篇
算力新变局:训练范式、架构创新、工程优化 ——华为系列深度之十八暨 GenAI 系列深度之四十九
AI 大模型训练范式正在转向多阶段,强化学习算力投入仍需提升。OpenAI o1 后,黄仁勋提出三大 Scaling Law:预训练、后训练和推理阶段提升算力投入,都能够提升模型性能。Deepseek V3 和 R1 模型爆火,后训练阶段的强化学习(Reinforcement Learning)以及推理阶段的长思考是核心特点,也再次佐证了后训练阶段、推理阶段的 Scaling Law。我们认为这两大 Scaling Law 仍处于起步阶段,模型厂商将继续加码强 化学习,算力投入仍有增量空间。