行业报告详情 - 行业报告数据库

行业分类

找到报告 1 篇当前为第 1 页共 1 页

计算机行业：s1和LIMO带来的产业启示-财通证券

加工时间：2025-02-17 信息来源：EMIS

关键词：计算机行业；s1；LIMO；产业启示
摘要：

s1-32B 模型：知识蒸馏技术实现小样本高性价比训练：TechCrunch 于 2 月 5 日报道，斯坦福大学与华盛顿大学联合研究团队在李飞飞的带领下，成功以低于 50 美元的训练成本开发出高性能 AI 推理模型 s1-32B。该模型在数学推理和编程能力测试中展现出与 OpenAI 的 o1 模型及 DeepSeek 的 R1 模型相匹敌的优异表现。李飞飞团队运用“测试时缩放”技术，选择开源预训练模型 Qwen2.5-32B-Instruct 作为基座模型，并使用包含 1000 个样本的 s1K 数据集进行监督微调，最终获得了 s1-32B 模型。训练过程仅使用了 16 块英伟达 H100 GPU 进行 26 分钟的核心训练。我们认为，高质量数据是模型训练的基石，尽管 s1K 数据集样本量较小，但其中蕴含的丰富推理信息为 Qwen2.5- 32B-Instruct 语言模型的监督微调提供了有力支持，这也充分表明了训练数据集质量的重要性。同时，未来产业的发展依然离不开基座模型能力的持续迭代，我们在看到 s1-32B 模型带来高性价比路径的同时，也不可忽视基座模型能力上的前期投入。

行业分类

友情链接

联系我们

QQ咨询

电话咨询

微信公众号

感谢访问