MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4

来源: 陀螺科技375天前
4 月 17 日消息,国内 AI 初创企业 MiniMax 稀宇科技今日正式推出 MoE 混合专家模型架构的 abab 6.5 系列模型,核心能力开始接近 GPT-4、 Claude-3、 Gemini-1.5。 abab 6.5 系列包含两个模型:abab 6.5 包含万亿参数,支持 200k tokens 的上下文长度;abab 6.5s 与 abab 6.5 使用了同样的训练技术和数据,但是更高效,支持 200k tokens 的上下文长度,可以 1 秒内处理近 3 万字的文本。 自一月发布国内首个基于 MoE 架构的 abab 6 模型后,MiniMax 通过改进模型架构,重构数据 pipeline,训练算法及并行训练策略优化等,在加速 Scaling Laws 过程上取得阶段性成果。(IT之家)
利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥5,795.58亿
2 欧易OKX欧易OKX ¥2,430.92亿
3 HTXHTX ¥360.24亿
4 CoinbaseCoinbase ¥158.17亿
5 芝麻开门芝麻开门 ¥1,158.72亿
6 BitgetBitget ¥1,850.60亿
7 BybitBybit ¥1,869.88亿
8 Crypto.comCrypto.com ¥265.18亿
9 BitfinexBitfinex ¥24.13亿
10 抹茶抹茶 ¥2,254.27亿