5379 篇
13902 篇
477791 篇
16278 篇
11761 篇
3926 篇
6531 篇
1251 篇
75586 篇
37735 篇
12156 篇
1656 篇
2859 篇
3417 篇
641 篇
1240 篇
1973 篇
4916 篇
3871 篇
5467 篇
国产大模型专题:被低估的大模型“腾讯混元”
基础能力测试:混元 VS Claude 3 VS Mistral 1、数学能力:Claude 3 >混元 > Mistral。测试3道高数题、1道线代题、1道概率题,Claude 3 正确率为80%,混元正确率为60%,Mistral 正确率为40%。2、编程能力:混元 >Claude 3 ? Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude 和 Mistral 均为40%。