首个AI高考全卷评测结果发布:最高分303,数学全不及格

来源: 陀螺科技332天前

6月19日消息,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分。

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥6,304.91亿
2 欧易OKX欧易OKX ¥2,728.78亿
3 HTXHTX ¥518.31亿
4 CoinbaseCoinbase ¥90.70亿
5 芝麻开门芝麻开门 ¥1,425.50亿
6 BitgetBitget ¥2,098.63亿
7 BybitBybit ¥2,042.17亿
8 Crypto.comCrypto.com ¥296.74亿
9 BitfinexBitfinex ¥16.41亿
10 抹茶抹茶 ¥2,162.97亿