5407 篇
13915 篇
478201 篇
16330 篇
11777 篇
3946 篇
6555 篇
1254 篇
75700 篇
38090 篇
12190 篇
1672 篇
2872 篇
3423 篇
642 篇
1242 篇
1980 篇
4927 篇
3890 篇
5503 篇
计算机行业:大模型研究框架(2025)“大模型_系列-国海证券
2017年谷歌团队提出Transformer架构,创造性推动注意力层以及前馈神经网络层的发展,加速提升模型性能。2018–2020年是预训练Transformer 模型时代,GPT-3以1750亿参数突破大规模预训练的可能性界限,而SFT及RLHF等技术帮助模型加速对齐人类价值观。此后随着训练侧Scaling Law 描述的幂律关系出现收益递减,叠加高质量文本数据或逐步被AI耗尽,推理模型开始进入人们视野;以OpenAI发布o1-preview将AIME 2024的模型 回答准确率从GPT4o的13.4%提升至56.7%,模型维持加速迭代更新。