小红书开源首个大模型,预训练未使用合成数据

来源: 陀螺科技6天前

小红书开源了首个大模型dots.llm1,小红书方面表示,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥4,645.74亿
2 欧易OKX欧易OKX ¥1,914.01亿
3 HTXHTX ¥361.30亿
4 CoinbaseCoinbase ¥69.06亿
5 芝麻开门芝麻开门 ¥1,328.01亿
6 BitgetBitget ¥1,276.87亿
7 BybitBybit ¥1,509.20亿
8 Crypto.comCrypto.com ¥175.02亿
9 BitfinexBitfinex ¥10.91亿
10 抹茶抹茶 ¥1,533.75亿