小红书开源首个大模型,预训练未使用合成数据

来源: 陀螺科技148天前

小红书开源了首个大模型dots.llm1,小红书方面表示,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥1.31万亿
2 欧易OKX欧易OKX ¥4,585.98亿
3 HTXHTX ¥769.71亿
4 CoinbaseCoinbase ¥353.43亿
5 大门大门 ¥3,210.19亿
6 BitgetBitget ¥1,934.65亿
7 BybitBybit ¥3,631.07亿
8 K网(Kraken)K网(Kraken) ¥156.23亿
9 双子星(Gemini)双子星(Gemini) ¥26.93亿
10 UpbitUpbit ¥220.44亿