欢迎访问行业研究报告数据库

行业分类

当前位置:首页 > 报告详细信息

找到报告 1 篇 当前为第 1 页 共 1

算力新变局:训练范式、架构创新、工程优化 ——华为系列深度之十八暨 GenAI 系列深度之四十九

加工时间:2025-02-19 信息来源:EMIS 索取原文[22 页]
关键词:算法;算力;AI 大模型;开源+蒸馏
摘 要:

AI 大模型训练范式正在转向多阶段,强化学习算力投入仍需提升。OpenAI o1 后,黄仁勋提出三大 Scaling Law:预训练、后训练和推理阶段提升算力投入,都能够提升模型性能。Deepseek V3 和 R1 模型爆火,后训练阶段的强化学习(Reinforcement Learning)以及推理阶段的长思考是核心特点,也再次佐证了后训练阶段、推理阶段的 Scaling Law。我们认为这两大 Scaling Law 仍处于起步阶段,模型厂商将继续加码强 化学习,算力投入仍有增量空间。



目 录:

image.png

© 2016 武汉世讯达文化传播有限责任公司 版权所有
客服中心

QQ咨询


点击这里给我发消息 客服员


电话咨询


027-87841330


微信公众号




展开客服