英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍,支持 OpenAI 的 Chat API

来源: 巴比特527天前
据 IT 之家 11 月 16 日报道,英伟达在今天 Ignite 2023 大会上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。 TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成,开发者可以使用这个统一、易用的工具包,在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。
利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥3,908.30亿
2 欧易OKX欧易OKX ¥1,457.36亿
3 HTXHTX ¥220.83亿
4 CoinbaseCoinbase ¥87.31亿
5 芝麻开门芝麻开门 ¥716.12亿
6 BitgetBitget ¥944.14亿
7 BybitBybit ¥1,088.78亿
8 Crypto.comCrypto.com ¥136.06亿
9 BitfinexBitfinex ¥6.03亿
10 抹茶抹茶 ¥1,606.08亿