首个AI高考全卷评测结果发布:最高分303,数学全不及格

来源: 陀螺科技502天前

6月19日消息,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分。

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥1.47万亿
2 欧易OKX欧易OKX ¥5,203.42亿
3 HTXHTX ¥884.68亿
4 CoinbaseCoinbase ¥385.93亿
5 大门大门 ¥3,632.39亿
6 BitgetBitget ¥2,245.06亿
7 BybitBybit ¥4,066.04亿
8 K网(Kraken)K网(Kraken) ¥173.57亿
9 双子星(Gemini)双子星(Gemini) ¥28.46亿
10 UpbitUpbit ¥262.73亿