2660 篇
1096 篇
195014 篇
3374 篇
6324 篇
2248 篇
2807 篇
539 篇
29783 篇
10068 篇
3200 篇
771 篇
2310 篇
1328 篇
451 篇
753 篇
1391 篇
2634 篇
2746 篇
4077 篇
计算机行业:DeepSeek引发广泛关注,大模型应用落地将加速-AI动态跟踪系列(四)-平安证券
DeepSeek-V3 和 DeepSeek-R1 陆续发布,国产大模型能力已可比肩海 外领军大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式发布 DeepSeek-V3 大模型首个版本并同步开源。根据 DeepSeek 网 站信息,DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界 顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方 面,根据 DeepSeek 发布的技术文档论文信息,DeepSeek-V3 的训练时 长为 2788K 个 H800 GPU 小时,训练花费约为 557.6 万美元。2025 年 1 月 20 日,DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1,性能对 齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性 能已可比肩海外领军大模型,且成本更低。