2646 篇
1094 篇
194911 篇
3352 篇
6319 篇
2242 篇
2800 篇
538 篇
29740 篇
9936 篇
3171 篇
767 篇
2308 篇
1326 篇
451 篇
752 篇
1391 篇
2629 篇
2744 篇
4066 篇
国产大模型专题:被低估的大模型“腾讯混元”
基础能力测试:混元 VS Claude 3 VS Mistral 1、数学能力:Claude 3 >混元 > Mistral。测试3道高数题、1道线代题、1道概率题,Claude 3 正确率为80%,混元正确率为60%,Mistral 正确率为40%。2、编程能力:混元 >Claude 3 ? Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude 和 Mistral 均为40%。
