小红书开源首个大模型,预训练未使用合成数据

来源: 陀螺科技52天前

小红书开源了首个大模型dots.llm1,小红书方面表示,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥1.05万亿
2 欧易OKX欧易OKX ¥4,089.97亿
3 HTXHTX ¥869.53亿
4 CoinbaseCoinbase ¥224.29亿
5 芝麻开门芝麻开门 ¥3,191.83亿
6 BitgetBitget ¥3,439.76亿
7 BybitBybit ¥3,258.24亿
8 双子星(Gemini)双子星(Gemini) ¥25.87亿
9 UpbitUpbit ¥161.60亿
10 Crypto.comCrypto.com ¥708.55亿