小红书开源首个大模型,预训练未使用合成数据

来源: 陀螺科技103天前

小红书开源了首个大模型dots.llm1,小红书方面表示,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥4,132.86亿
2 欧易OKX欧易OKX ¥1,090.62亿
3 HTXHTX ¥240.04亿
4 CoinbaseCoinbase ¥62.61亿
5 大门大门 ¥884.81亿
6 BitgetBitget ¥794.71亿
7 BybitBybit ¥1,192.31亿
8 双子星(Gemini)双子星(Gemini) ¥5.30亿
9 UpbitUpbit ¥49.97亿
10 Crypto.comCrypto.com ¥95.68亿