[信息传输、软件和信息技术服务业] [2025-02-18]
DeepSeek部署与蒸馏模型推理评测-量化漫谈系列
[信息传输、软件和信息技术服务业] [2025-02-18]
“DeepSeek-R1 模型”概念基金筛选 在国金证券金融工程团队 2025 年 2 月 9 日发布的研报《ChatGPT 热点挖票系列:DeepSeek-R1 模型产业链解析》中, 我们给出了“DeepSeek-R1 模型”产业链及概念股。根据此概念股清单,结合基金持仓及指数最新成分股数据,我们 筛选了“DeepSeek-R1 模型”概念基金,包含主动权益基金 32 只及被动指数基金 34 只。
[信息传输、软件和信息技术服务业] [2025-02-18]
策略:春季行情,科技领涨。宏观政策基调积极、流动性和国内基本面均有 边际改善,这为春季行情提供了有力支撑。从行业维度看,我们回顾历史发 现春季行情中领涨行业无普适性规律,而是得益于当时政策或产业因素催 化。近期 Deepseek 大模型或将加速 AI 应用的落地,引起市场广泛关注。 因此,我们认为随着春季行情的徐徐展开,需重视 AI 等产业趋势迎来积极 催化的领域。
[信息传输、软件和信息技术服务业] [2025-02-17]
s1-32B 模型:知识蒸馏技术实现小样本高性价比训练:TechCrunch 于 2 月 5 日报道,斯坦福大学与华盛顿大学联合研究团队在李飞飞的带领下,成 功以低于 50 美元的训练成本开发出高性能 AI 推理模型 s1-32B。该模型在数 学推理和编程能力测试中展现出与 OpenAI 的 o1 模型及 DeepSeek 的 R1 模型 相匹敌的优异表现。李飞飞团队运用“测试时缩放”技术,选择开源预训练模 型 Qwen2.5-32B-Instruct 作为基座模型,并使用包含 1000 个样本的 s1K 数据 集进行监督微调,最终获得了 s1-32B 模型。训练过程仅使用了 16 块英伟达 H100 GPU 进行 26 分钟的核心训练。我们认为,高质量数据是模型训练的基 石,尽管 s1K 数据集样本量较小,但其中蕴含的丰富推理信息为 Qwen2.5- 32B-Instruct 语言模型的监督微调提供了有力支持,这也充分表明了训练数据 集质量的重要性。同时,未来产业的发展依然离不开基座模型能力的持续迭 代,我们在看到 s1-32B 模型带来高性价比路径的同时,也不可忽视基座模型 能力上的前期投入。
[信息传输、软件和信息技术服务业] [2025-02-17]
DeepSeek-V3 和 DeepSeek-R1 陆续发布,国产大模型能力已可比肩海 外领军大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式发布 DeepSeek-V3 大模型首个版本并同步开源。根据 DeepSeek 网 站信息,DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界 顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方 面,根据 DeepSeek 发布的技术文档论文信息,DeepSeek-V3 的训练时 长为 2788K 个 H800 GPU 小时,训练花费约为 557.6 万美元。2025 年 1 月 20 日,DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1,性能对 齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性 能已可比肩海外领军大模型,且成本更低。
[信息传输、软件和信息技术服务业] [2025-02-17]
Agent让AI与人类协同从“副驾”到“主驾”。 • Agent是LLM的进阶。大语言模型适用于完成相对孤立、直接的任务,而AI Agents更适合完成连续的、 复杂的场景和任务。未来有望过渡到Agent模式,由人类设定目标并提供资源,AI完成绝大部分工作。 • Agent能力目前处于类似GPT3到ChatGPT阶段。以OSWorld为基准,人类专家水平benchmark为 72.4%。2025年1月,Open AI Operator得分38.1%。
[信息传输、软件和信息技术服务业] [2025-02-17]
性能:DeepSeek V3 / R1 均可与 OpenAI 等同类大模型实现较好对标。通过 671B 的 总参数量,在每个 token 激活 37B 参数的精准控制下,DeepSeek-V3 构建出了一个能够超 越所有开源模型,直逼 GPT-4 和 Claude-3.5 的 AI 巨人;DeepSeek-R1 在后训练阶段大 规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数 学、代码等任务上,性能比肩 OpenAI o1 正式版。
[信息传输、软件和信息技术服务业,计算机、通信和其他电子设备制造业] [2025-02-17]
Ayar Labs 估值已超 10 亿美元。根据芯东西 2024 年 12 月 12 日报道,硅谷光互连 芯片设计公司 Ayar Labs 于 2024 年 12 月 11 日宣布完成英伟达、AMD、INTEL、 格芯等参投的 1.55 亿美元融资。与台积电有战略合作关系的 VentureTech Alliance、美国机器制造巨头 3M 也参与了此轮融资。
[汽车制造业,信息传输、软件和信息技术服务业] [2025-02-16]
智能驾驶芯片行业:千亿市场空间大赛道,国产芯片厂商崭露头角。技术进 步+成本下降+消费者接受度高,智能驾驶行业渗透率加速提升,在 ADAS 功 能进一步普及的推动下,全球 ADAS SoC 市场预计从 2023 年的 275 亿元增至 2028 年的 925 亿元,CAGR 为 27.5%。自动驾驶 SoC 供应商方面,中国的主要 自动驾驶 SoC 市场参与者包括地平线、黑芝麻智能等;其他国家的主要自动 驾驶 SoC 市场参与者包括英伟达、Mobileye、高通、Texas Instruments(TI) 及瑞萨。目前英伟达、高通、地平线、华为、黑芝麻等均推出了适配 L3 级 及以上高阶智能驾驶的芯片方案。
[汽车制造业,信息传输、软件和信息技术服务业] [2025-02-16]
汽车行业:DeepSeek对智能驾驶影响几何?-专题研究-国联证券