Supermicro推三款基于NVIDIA技术的全堆栈结构，加速生成式AI...

darthracer · 2024-5-1 00:14

Supermicro三款强大的SuperCluster解决方案现已上市，并可被用于生成式AI工作运行。

Supermicro, Inc.为AI、云计算、存储和5G/边缘领域的全方位IT解决方案制造商，宣布推出其最新产品组合，加速生成式AI部署。Supermicro SuperCluster解决方案能为如今及未来大型语言模型（Large Language Model，LLM）硬件基础设施提供核心构建组件。

Supermicro三款强大的SuperCluster解决方案现已上市并可被用于生成式AI工作运行。这些解决方案内的4U液冷系统或8U气冷系统是专为强大LLM训练性能以及高度批次大小且大量的LLM推论所设计。配备了1U气冷Supermicro NVIDIA MGXTM系统的第三款SuperCluster超级集群则针对云计算级推论进行了优化。

Supermicro总裁暨首席执行官梁见后表示：“在AI时代，运算力单位是以集群来衡量，不再只用服务器数量作为依据。我们的全球制造产能已扩大到每月5,000台机柜，能比以往更快地为客户提供完整生成式AI运算集群。

只需通过我们采用400Gb/s NVIDIA Quantum-2 InfiniBand和Spectrum-X Ethernet网络技术的数个可扩展型集群构建组件，一个64节点的运算集群能支持具有72TB HBM3e的512个NVIDIA HGX H200 GPU。

结合了NVIDIA AI Enterprise软件的Supermicro SuperCluster解决方案非常适合用于针对如今企业与云计算基础架构的LLM训练，且最高可达兆级参数。互联的GPU、CPU、内存、存储、以及网络硬件在被部署至机柜内的多个节点后形成如今AI技术的基础。Supermicro的SuperCluster解决方案为快速发展的生成式AI与LLM提供了核心构建组件。”

NVIDIA GPU产品部门副总裁Kaustubh Sanghani则表示：“NVIDIA最新型GPU、CPU、网络与软件技术助力能让系统制造者为全球市场内不同类型的下一代AI工作运行实现加速。通过结合基于Blackwell架构产品的NVIDIA加速运算平台，Supermicro能提供客户所需要的前沿服务器系统，且这些系统可容易地被部署至数据中心。”

Supermicro 4U NVIDIA HGX H100/H200 8-GPU系统通过液冷技术使8U气冷系统运算密度加倍，同时降低能耗量与总体拥有成本（TCO）。

这些系统旨在为了支持下一代NVIDIA的Blackwell架构GPU。Supermicro冷却分配单元（Cooling Distribution Unit，CDU）与冷却分配分流管（Cooling Distribution Manifold，CDM）是主要冷却液流动脉络，可将冷却液输送至Supermicro定制的直达芯片（Direct-to-Chip，D2C）冷板，使GPU和CPU处于最佳运行温度，进而实现性能最大化。

此散热技术可使一整座数据中心电力成本降低最多40%，同时节省数据中心占地空间。

搭载NVIDIA HGX H100/H200 8-GPU的系统非常适合用于训练生成式Al。通过NVIDIA NVLink技术高速互联的GPU，以及高GPU内存带宽与容量，将成为符合成本效益地运行LLM的核心关键。Supermicro的SuperCluster具备庞大GPU共享资源，能作为一个AI超级计算机进行运算作业。

无论是导入一个最初就以数兆级词元（token）数据集进行完整训练的大型基础模型，或开发一个云计算级LLM推论基础架构，具有无阻式400Gb/s网络结构的主干枝叶式架构（Spine and Leaf Network Topology）都能从32个运算节点顺畅地扩展至数千个节点。针对完全集成的液冷系统，Supermicro在产品出厂前会借由经认证的测试流程彻底验证与确保系统运行成效与效率。

采用了NVIDIA GH200 Grace Hopper Superchip的Supermicro NVIDIA MGX系统设计将能打造出未来AI运算集群的架构样式以解决生成式AI的关键瓶颈：运行高推论批次大小的LLM所需的GPU内存带宽及容量，进而降低运营成本。具256节点的运算集群能实现云计算级大量推论算力引擎，并易于部署与扩展。

通过GPU间可实现的顶级互联性能，Supermicro的SuperCluster解决方案针对LLM训练、深度学习，以及大量且高批次推论进行了优化。Supermicro的L11和L12验证测试结合了现场部署服务，可为客户提供更顺畅体验。客户收到即插即用的可扩展单元后能实现数据中心内的轻松部署，并可更快获取成果。

Supermicro推三款基于NVIDIA技术的全堆栈结构，加速生成式AI...

浏览过的版块