5411 篇
13918 篇
478362 篇
16355 篇
11779 篇
3949 篇
6564 篇
1255 篇
75762 篇
38242 篇
12197 篇
1674 篇
2874 篇
3423 篇
642 篇
1242 篇
1980 篇
4930 篇
3896 篇
5520 篇
国产大模型专题:被低估的大模型“腾讯混元”
基础能力测试:混元 VS Claude 3 VS Mistral 1、数学能力:Claude 3 >混元 > Mistral。测试3道高数题、1道线代题、1道概率题,Claude 3 正确率为80%,混元正确率为60%,Mistral 正确率为40%。2、编程能力:混元 >Claude 3 ? Mistral。测试数据分析、编写应用程序、贪吃蛇、爬虫,共5道编程题。编程1次运行成功率混元为80%,Claude 和 Mistral 均为40%。