新的LLM极限压缩方法将AI部署成本降低8倍

来源: 陀螺科技279天前
Yandex Research、IST Austria(奥地利科学技术研究所)、Neural Magic和KAUST开发并开源了两种大型语言模型(LLM)压缩方法,AQLM和PV-Tuning,将模型大小减少多达8倍,同时保留95%的响应质量。据介绍,新方法将设备成本降低最多8倍,大幅降低AI部署的进入门槛。
利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥6,036.09亿
2 欧易OKX欧易OKX ¥2,537.43亿
3 HTXHTX ¥374.58亿
4 CoinbaseCoinbase ¥171.04亿
5 芝麻开门芝麻开门 ¥1,217.86亿
6 BitgetBitget ¥1,900.01亿
7 BybitBybit ¥1,944.82亿
8 Crypto.comCrypto.com ¥282.40亿
9 BitfinexBitfinex ¥24.56亿
10 抹茶抹茶 ¥2,277.82亿