英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍,支持 OpenAI 的 Chat API

来源: 巴比特719天前
据 IT 之家 11 月 16 日报道,英伟达在今天 Ignite 2023 大会上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。 TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成,开发者可以使用这个统一、易用的工具包,在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。
利好利好
0
利空利空
0
交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥9,671.22亿
2 欧易OKX欧易OKX ¥3,328.25亿
3 HTXHTX ¥649.84亿
4 CoinbaseCoinbase ¥253.93亿
5 大门大门 ¥2,460.96亿
6 BitgetBitget ¥1,439.43亿
7 BybitBybit ¥2,627.02亿
8 K网(Kraken)K网(Kraken) ¥127.16亿
9 双子星(Gemini)双子星(Gemini) ¥19.40亿
10 UpbitUpbit ¥166.03亿