AWS 推出专为 Nvidia AI 芯片设计的定制冷却技术

1天前 21 技术
摘要
AWS 开发了一种名为 In-Row Heat Exchanger (IRHX) 的定制液体冷却系统来冷却 Nvidia 的下一代 AI GPU 。
币币情报道:

亚马逊云计算部门亚马逊网络服务 (AWS) 近日推出了一套全新的定制冷却系统,旨在有效控制 Nvidia 最新高性能人工智能 (AI) 芯片的运行温度。

周三,AWS 宣布开发了行内热交换器 (IRHX),这是一款专为配备高性能 Nvidia GPU 的数据中心设计的液体冷却解决方案。

这些芯片被广泛用于训练大型人工智能模型,如流行的聊天机器人和图像生成器,是全球最耗电的硬件之一。随着其在 AI 工作负载中的普及,传统的空气冷却解决方案正面临巨大压力。

为了应对这一挑战,亚马逊选择自主研发创新冷却技术,而非依赖市场上的现有解决方案。IRHX 可灵活应用于数据中心的改造和新建项目,无需大规模重新设计。该系统通过在服务器排附近循环冷却液,为紧密排列的 GPU 提供高效散热。

AWS 计算和机器学习服务副总裁 Dave Brown 表示,传统冷却方案无法满足 AWS 的需求,因为它们会浪费大量数据中心占地面积且用水效率低下。虽然此类系统可能适用于小型供应商的几个机柜,但缺乏支持 AWS 规模所需的液体冷却能力。

AWS 推出搭载 Nvidia Blackwell GPU 的 P6e 实例

与此同时,AWS 还推出了全新P6e 实例,利用 Nvidia 的 GB200 NVL72 平台,这是一个密集的超级计算平台,整合了 72 个 Blackwell GPU 到单个机架中。这些实例旨在应对大型 AI 模型和生成式 AI 任务的高度计算需求。

截至目前,仅有微软和 CoreWeave 等少数公司提供这种新一代 GPU 集群。如今,AWS 客户可以通过云端访问最新、最先进的定制 GPU 机器学习训练基础设施,该设施由最新一代水冷式 NVIDIA A100 Tensor Core GPU 提供支持。

IRHX 系统能够将这些 GPU 集群保持在安全温度范围内,确保最佳性能并避免过热问题。通过将 IRHX 直接集成到其数据中心设计中,AWS 不仅节省了昂贵的改造费用,还提升了整体运营效率。

Dave Brown 在 P6e 发布会上指出,结合 GB200 NVL72 系统与 IRHX 技术,客户可以大规模利用无与伦比的计算能力。这还将帮助开发者、研究人员和企业以更快、更高效的方式训练更大规模的 AI 模型。

亚马逊巩固其云基础设施领先地位

亚马逊正在建设的新数据中心进一步体现了其减少对第三方供应商依赖的战略。近年来,AWS 在芯片、存储系统和网络设备等领域的自主研发投入显著增加,为其云服务提供了坚实的技术支持。

这些技术创新使亚马逊能够在运营绩效和成本之间取得平衡,并逐步降低对外部供应商的依赖。

目前,这一策略已初见成效。2025 年第一季度,AWS 创下了自成立以来的最高营业利润率,成为亚马逊整体盈利的主要驱动力。IRHX 的推出进一步强化了 AWS 在云行业的创新领导地位。

其他科技巨头也在采取类似措施。例如,微软推出了自己的 AI 芯片和定制冷却系统 Sidekicks;谷歌和 Meta 也在研究针对 AI 工作负载优化的硬件和系统。

然而,亚马逊凭借其遍布全球的数据中心以及多年积累的大规模定制硬件部署经验,占据了独特优势。IRHX 的引入不仅提高了其 AI 就绪型基础设施的效率,还增强了可持续性和可扩展性,进一步巩固了其市场地位。

KEY 差异线助力加密货币品牌迅速突破并占据头条新闻

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥9,774.23亿
2 欧易OKX欧易OKX ¥3,627.46亿
3 HTXHTX ¥728.12亿
4 CoinbaseCoinbase ¥248.03亿
5 芝麻开门芝麻开门 ¥2,551.64亿
6 BitgetBitget ¥3,278.78亿
7 BybitBybit ¥2,885.25亿
8 双子星(Gemini)双子星(Gemini) ¥32.63亿
9 UpbitUpbit ¥139.28亿
10 Crypto.comCrypto.com ¥479.92亿