2598 篇
1062 篇
239897 篇
3242 篇
7545 篇
2208 篇
2753 篇
531 篇
37486 篇
9164 篇
3116 篇
739 篇
2289 篇
1311 篇
448 篇
752 篇
1386 篇
2587 篇
2739 篇
3961 篇
计算机行业:DeepSeek引发广泛关注,大模型应用落地将加速-AI动态跟踪系列(四)-平安证券
DeepSeek-V3 和 DeepSeek-R1 陆续发布,国产大模型能力已可比肩海 外领军大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式发布 DeepSeek-V3 大模型首个版本并同步开源。根据 DeepSeek 网 站信息,DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界 顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方 面,根据 DeepSeek 发布的技术文档论文信息,DeepSeek-V3 的训练时 长为 2788K 个 H800 GPU 小时,训练花费约为 557.6 万美元。2025 年 1 月 20 日,DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1,性能对 齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性 能已可比肩海外领军大模型,且成本更低。