李飞飞团队 s1 模型基于 Qwen 训练?阿里云确认:基于 Qwen2.5-32B-Instruct 模型训练

来源: 陀螺科技168天前

2 月 6 日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型,该模型在数学和编码能力测试中的表现与 OpenAl 的 o1 和 Depsek 的 R1 等尖端推理模型类似,引发广泛关注。 不过很快,该 s1 模型被指「并非从零开始训练」,其基座模型为「阿里通义千问(Qwen)模型」。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息,并回应称:「他们以阿里通义千问 Qwen2.5-32B-Instruct 开源模型为底座,在 16 块 H100 GPU 上监督微调 26 分钟,训练出新模型 s1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比 o1-preview 高出 27%。」

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥1.08万亿
2 欧易OKX欧易OKX ¥3,805.48亿
3 HTXHTX ¥724.52亿
4 CoinbaseCoinbase ¥406.04亿
5 芝麻开门芝麻开门 ¥2,792.85亿
6 BitgetBitget ¥3,265.99亿
7 BybitBybit ¥3,314.59亿
8 双子星(Gemini)双子星(Gemini) ¥40.81亿
9 UpbitUpbit ¥151.25亿
10 Crypto.comCrypto.com ¥515.69亿