行业报告详情 - 行业报告数据库

行业分类

找到报告 1 篇当前为第 1 页共 1 页

计算机行业：DeepSeek引发广泛关注，大模型应用落地将加速－AI动态跟踪系列（四）-平安证券

加工时间：2025-02-17 信息来源：EMIS

关键词：计算机行业；DeepSeek；引发广泛关注；大模型应用；落地将加速
摘要：

DeepSeek-V3 和 DeepSeek-R1 陆续发布，国产大模型能力已可比肩海外领军大模型。2024 年 12 月 26 日，杭州 AI 公司深度求索（DeepSeek）正式发布 DeepSeek-V3 大模型首个版本并同步开源。根据 DeepSeek 网站信息，DeepSeek-V3 为自研 MoE 模型，671B 参数，激活 37B，在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方面，根据 DeepSeek 发布的技术文档论文信息，DeepSeek-V3 的训练时长为 2788K 个 H800 GPU 小时，训练花费约为 557.6 万美元。2025 年 1 月 20 日，DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1，性能对齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性能已可比肩海外领军大模型，且成本更低。

行业分类

友情链接

联系我们

QQ咨询

电话咨询

微信公众号

感谢访问