小红书开源首个大模型,预训练未使用合成数据

来源: 陀螺科技148天前

小红书开源了首个大模型dots.llm1,小红书方面表示,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。

利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥1.29万亿
2 欧易OKX欧易OKX ¥4,564.10亿
3 HTXHTX ¥772.63亿
4 CoinbaseCoinbase ¥350.76亿
5 大门大门 ¥3,201.70亿
6 BitgetBitget ¥1,888.86亿
7 BybitBybit ¥3,621.68亿
8 K网(Kraken)K网(Kraken) ¥151.28亿
9 双子星(Gemini)双子星(Gemini) ¥26.26亿
10 UpbitUpbit ¥219.55亿