2634 篇
1089 篇
194711 篇
3325 篇
6317 篇
2231 篇
2785 篇
537 篇
29654 篇
9797 篇
3163 篇
759 篇
2303 篇
1321 篇
449 篇
752 篇
1387 篇
2611 篇
2740 篇
4037 篇
国产大模型专题:被低估的大模型“腾讯混元”
基础能力测试:混元 VS Claude 3 VS Mistral 1、数学能力:Claude 3 >混元 > Mistral。测试3道高数题、1道线代题、1道概率题,Claude 3 正确率为80%,混元正确率为60%,Mistral 正确率为40%。2、编程能力:混元 >Claude 3 ? Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude 和 Mistral 均为40%。
