欢迎访问集团网商讯

联想ThinkSystem SR685a V3和SR680a V3 GPU服务器发布

金融科技 2024-06-024359baixun

  联想 ThinkSystem SR685a V3 和 SR680a V3 GPU 服务器是该公司最新的 8 路 GPU 服务器,专为满足各种企业 AI 需求而量身定制。尽管具有不同的型号名称,但它们共享模块化基础,允许在每个系统内互换组件。

  从根本上说,这些服务器有三个或四个核心组件,具体取决于您的计数方式。首先,外壳构成机箱外壳,后部嵌入式风扇。顶部有内部导轨,可固定 2U 模块化服务器。底部的 6U 容纳 GPU、交换机和 PCIe 结构。2U 服务器的 I/O 因 AMD 或 Intel 产品而异。联想目前支持 NVIDIA 和 AMD GPU 主板,未来支持 Intel Guadi 3.

  联想 SR685a V3(AI 小 a)采用双第 4 代 AMD EPYC 处理器,专门针对高带宽 GPU 到 GPU 通信进行了优化,使其成为生成式 AI 应用的理想选择。相反,SR680a V3 配备第 5 代英特尔至强可扩展处理器,支持多功能 AI 和计算应用,可适应 NVIDIA 和 AMD GPU 以满足不同的行业需求。两种型号都采用了创新的模块化方法,允许用户定制和扩展他们的系统,以精确地满足特定的运营需求。

  可配置模型和定制

  Lenovo ThinkSystem SR685a V3 和 SR680a V3 系统提供各种按订单配置 (CTO) 型号,可作为定制框架。具有自定义配置模型的能力扩展到 GPU 的详细选择,其中模型是根据所选的特定 GPU 定义的。例如,联想配置器中列出的基本功能代码允许在 AMD MI300X 和 NVIDIA H100/H200 之间进行选择,每种功能代码都满足不同的性能和计算需求。该平台设计使联想在新加速器上市时能够更灵活地集成它们。

  Lenovo ThinkSystem SR685a V3 参数

  

组件 规范
外形尺寸 8U机架
处理器 两个 AMD EPYC 9004 系列处理器(原代号为“Genoa”)。支持高达 64 个内核的处理器、高达 3.1 GHz 的核心速度和高达 400W 的 TDP 额定值。支持 PCIe 5.0 实现高性能 I/O。
图形处理器 选择:

 

  • 8 个 AMD MI300X 750W OAM GPU,每个 GPU 配备 192GB HBM3 GPU 内存
  • 8 个 NVIDIA H100 700W SXM5 GPU,每个 GPU 配备 80GB HBM3 GPU 内存
  • 8 个 NVIDIA H200 700W SXM5 GPU,每个 GPU 配备 141GB HBM3 GPU 内存
记忆 24 个 DIMM 插槽,带两个处理器(每个处理器 12 个 DIMM 插槽)。每个处理器有 12 个内存通道,每个通道 (DPC) 有 1 个 DIMM。Lenovo TruDDR5 RDIMM 支持高达 4800 MHz。
最大内存 高达 1.5TB,带 24 个 64GB RDIMM 高达 2.25TB,带 24 个 96GB RDIMM
内存保护 ECC、SDDC、巡检/按需清理、有界故障、DRAM 地址命令奇偶校验与重放、DRAM 未更正的 ECC 错误重试、片上 ECC、ECC 错误检查和清理 (ECS)、打包后修复
磁盘驱动器托架 多达 16 个 2.5 英寸热插拔驱动器托架,支持 PCIe 5.0 NVMe 驱动器。
操作系统启动驱动器 支持集成 RAID-1 的 M.2 适配器;支持 2 个 NVMe M.2 驱动器,用于操作系统启动和数据存储功能
最大内部存储空间 51.2 TB,使用 16 个 3.2TB 2.5 英寸 NVMe SSD
存储控制器 板载 NVMe(非 RAID)
网络接口 它支持 8 个高性能网络适配器,连接速度高达 400 Gb/s,支持 GPU Direct。它支持用于用户/控制平面的 NVIDIA BlueField-3 2 端口 200Gb 适配器,以及用于管理的 OCP 网络适配器。OCP 3.0 插槽具有 PCIe 5.0 x16 主机接口,其中一个端口可选择与 XClarity Controller 2 (XCC2) 管理处理器共享,以支持 LAN 唤醒和 NC-SI。
PCI 扩展插槽 10 个 PCIe 5.0 x16 插槽:

 

  • 正面:8 个 PCIe 5.0 x16 FHHL 插槽,支持 GPU Direct
  • 背面:1 个 PCIe 5.0 x16 FHHL 插槽 + 1 个 OCP 3.0 插槽,带 PCIe 5.0 x16 接口
端口 正面:1 个 USB 3.2 G1 (5 Gb/s) 端口、1 个 USB 2.0 端口(也用于 XCC 本地管理)、1 个 VGA 视频端口。背面:3 个 USB 3.2 G1 (5 Gb/s) 端口、1 个 VGA 视频端口、1 个用于 XCC 远程管理的 RJ-45 1GbE 系统管理端口。
冷却 5 个前置双转子风扇,用于 CPU 和存储子系统,N+1 冗余。10 个后置双转子风扇,用于 GPU 子系统,N+1 冗余。每个电源都集成了一个风扇。从前到后的气流。
电源 8 个热插拔冗余交流电源,具有多达 N+N 的冗余。80 PLUS钛金认证。需要 220 V AC 电源的 2600 W AC 电源。
视频 具有 16 MB 内存和 2D 硬件加速器的嵌入式视频图形集成到 XClarity 控制器中。两个视频端口(前 VGA 和后 VGA)不能同时使用;使用前置 VGA 端口禁用后置 VGA 端口。最大分辨率为 1920×1200 32bpp (60Hz)。
热插拔部件 驱动器、电源和风扇。
系统管理 集成诊断面板,带状态 LED 和拉出式 LCD 显示屏。基于 ASPEED AST2600 基板管理控制器 (BMC) 的 XClarity 控制器 2 (XCC2) 嵌入式管理。专用的后置以太网端口,用于 XCC2 远程访问以进行管理。用于集中式基础架构管理的 XClarity Administrator、XClarity Integrator 插件和 XClarity Energy Manager 集中式服务器电源管理。可选的XCC Platinum将启用远程控制功能和其他功能。
安全特性 打开电源密码、管理员密码、支持 TPM 2.0 的信任根模块和平台固件复原 (PFR)。
支持的操作系统 Ubuntu 服务器。
有限保修 三年或一年(取决于型号)客户可更换的装置和现场有限保修,下一工作日 9×5 (NBD)。
服务与支持 联想服务提供可选服务升级:4 小时或 2 小时响应时间、6 小时修复时间、1 年或 2 年保修延长、联想硬件的软件支持以及一些第三方应用程序。
尺寸 宽度:447 毫米(17.6 英寸),高度:351 毫米(13.8 英寸),深度:924 毫米(36.3 英寸)。
重量 最大值:108.9 千克(240 磅)

 

  Lenovo ThinkSystem SR680a V3 参数

  

组件 规范
外形尺寸 8U机架
处理器 两个第 5 代英特尔至强可扩展处理器(原代号为“Emerald Rapids”)。支持 48 核处理器,核心速度为 2.3 GHz,TDP 额定值为 350W。支持 PCIe 5.0 实现高性能 I/O。
芯片组 英特尔 C741“Emmitsburg”芯片组,代号为“Eagle Stream”的平台的一部分
图形处理器 选择:

 

  • 8 个 AMD MI300X 750W OAM GPU,每个 GPU 配备 192GB HBM3 GPU 内存
  • 8 个 NVIDIA H100 700W SXM5 GPU,每个 GPU 配备 80GB HBM3 GPU 内存
  • 8 个 NVIDIA H200 700W SXM5 GPU,每个 GPU 配备 141GB HBM3 GPU 内存
记忆 32 个 DIMM 插槽,带两个处理器(每个处理器 16 个 DIMM 插槽)。每个处理器有 8 个内存通道,每个通道 (DPC) 有 2 个 DIMM。支持 Lenovo TruDDR5 RDIMM。DIMM 在 1 DPC 下的工作频率高达 5600 MHz,在 2 DPC 下的工作频率高达 4400 MHz。
最大内存 高达 2TB,支持 32 个 64GB RDIMM
内存保护 ECC、SDDC(适用于基于 x4 的内存 DIMM)、ADDDC(适用于基于 x4 的内存 DIMM,不包括 9×4 RDIMM,需要白金或黄金处理器)和内存镜像。
磁盘驱动器托架 多达 16 个 2.5 英寸热插拔驱动器托架,支持 PCIe 5.0 NVMe 驱动器。
操作系统启动驱动器 支持两个 M.2 驱动器,可选英特尔 VROC NVMe RAID 支持操作系统启动和数据存储功能
最大内部存储空间 51.2 TB,使用 16 个 3.2TB 2.5 英寸 NVMe SSD
存储控制器 板载 NVMe(非 RAID)
网络接口 支持 8 个高性能网络适配器,连接速度高达 400 Gb/s,支持 GPU Direct。支持用于用户/控制平面的 NVIDIA BlueField-3 2 端口 200Gb 适配器和用于管理的 Mellanox ConnectX-6 Lx 2 端口 10/25GbE 适配器。
PCI 扩展插槽 10 个 PCIe 5.0 x16 插槽:

 

  • 正面:8 个 PCIe 5.0 x16 FHHL 插槽,支持 GPU Direct
  • 背面:2 个 PCIe 5.0 x16 FHHL 插槽
港口 正面:1 个 USB 3.2 G1 (5 Gb/s) 端口、1 个 USB 2.0 端口(也用于 XCC 本地管理)、1 个 Mini DisplayPort 视频端口。背面:2 个 USB 3.2 G1 (5 Gb/s) 端口、1 个 VGA 视频端口、1 个用于 XCC 远程管理的 RJ-45 1GbE 系统管理端口。
冷却 5 个前置双转子风扇,用于 CPU 和存储子系统,N+1 冗余。10 个后置双转子风扇,用于 GPU 子系统,N+1 冗余。每个电源都集成了一个风扇。从前到后的气流。
电源 8 个热插拔冗余交流电源,具有多达 N+N 的冗余。80 PLUS钛金认证。需要 220 V AC 电源的 2600 W AC 电源。
视频 具有 16 MB 内存和 2D 硬件加速器的嵌入式图形集成到 XClarity Controller 2 管理控制器中。两个视频端口(前部 Mini DisplayPort 和后部 VGA);如果需要,两者可以同时使用。两个端口的最大分辨率为 1920×1200 在 60Hz。
热插拔部件 驱动器、电源和风扇。
系统管理 集成诊断面板,带状态 LED 和拉出式 LCD 显示屏。基于 ASPEED AST2600 基板管理控制器 (BMC) 的 XClarity 控制器 2 (XCC2) 嵌入式管理。专用的后置以太网端口,用于 XCC2 远程访问以进行管理。用于集中式基础架构管理的 XClarity Administrator、XClarity Integrator 插件和 XClarity Energy Manager 集中式服务器电源管理。可选的 XCC Platinum 可实现远程控制功能和其他功能。
安全特性 打开电源密码、管理员密码、支持 TPM 2.0 的信任根模块和平台固件复原 (PFR)。
支持的操作系统 Ubuntu 服务器。
有限保修 三年或一年(取决于型号)客户可更换的装置和现场有限保修,下一工作日 9×5 (NBD)。
服务与支持 联想服务提供可选服务升级:4 小时或 2 小时响应时间、6 小时修复时间、1 年或 2 年保修延长、联想硬件的软件支持以及一些第三方应用程序。
尺寸 宽度:447 毫米(17.6 英寸),高度:351 毫米(13.8 英寸),深度:924 毫米(36.3 英寸)。
重量 最大值:108.7 千克(239.8 磅)

 

  联想 ThinkSystem SR685a V3 和 SR680a V3 设计和制造

  系统前部支持多达 16 个热插拔 PCIe Gen5 NVMe 驱动器托架,这对于以 GPU 为中心的服务器来说是一个异常慷慨的数量,这些服务器通常提供较少的托架和通道进行扩展。驱动器托架下方是八个前置 PCIe Gen5 FHHL(全高半长)插槽和 PCIe 交换复合体。这些插槽配备了 GPU Direct 技术(8 个 NDR 400Gb/s InfiniBand 适配器),可实现高速联网和数据传输,从而减少延迟并提高数据处理速度。

  该系统在机箱顶部装有五个可热插拔风扇,旨在冷却服务器,服务器占用顶部 2U,包括 CPU、内存和后插槽。另外 10 个风扇安装在机箱后部,用于冷却驱动器托架、适配器和 GPU。

  前面板还包含必要的连接和管理端口,包括三个 USB 3.2 Gen1 端口和一个视频输出,便于直接管理和本地控制台交互。

  GPU 单元的后部装有 8 个 2.600W 电源,每个电源都连接到一个中央配电板。此设置包括电路板背面的连接器(联想将其称为“盲插”),可促进与 2U 计算穿梭的无缝连接。

  此外,如上所述,后视图显示了服务器广泛的冷却系统,包括 10 个热插拔后置风扇,旨在保持 GPU、交换机和 PCIe 结构的最佳散热条件。这种冷却系统对于保持硬件性能稳定性和使用寿命至关重要,尤其是在连续高负载运行期间。

  电源、布线和开关

  该服务器系列的 AMD 和 Intel 版本共享通用电源布局,允许更大的模块化,这是这些系统的主要亮点。

  PCIe 信令流经连接计算托架和 PCIe 交换托架的带状电缆。在计算滑槽的另一侧,有一个盲连接。计算托架与这些连接器配对,将 PCIe 信号传递到机箱的其余部分。托架背面的支架(标有其指定的 PCIe 连接)允许您在不改变服务器底部的情况下在计算穿梭区之间切换。

  AMD and NVIDIA GPU Boards

  NVIDIA H100/H200 主板紧紧装有 8 个 NVIDIA GPU,并配有可伸缩手柄,便于携带和安装主板。安装后,手柄整齐地塞在 GPU 旁边以避免阻塞。AMD 和 NVIDIA 主板之间的连接器是相同的。英特尔 Gaudi 3 主板将具有不同的连接器。

  AMD MI300 板与 NVIDIA 板类似,但有一个显着突出的标准手柄。虽然仍然有用,但它不如NVIDIA板上的可伸缩手柄优雅。无论哪种方式,客户都不会在意,因此我们添加了脚注,因为设计差异引起了我们的注意。

  最后的思考

  联想 ThinkSystem SR685a V3 和 SR680a V3 GPU 服务器提供令人印象深刻的模块化设计,支持强大的 NVIDIA H100/H200 和 AMD MI300X GPU,以及 AMD EPYC 9004 和第 5 代至强英特尔 CPU。这种灵活性和风冷设计使它们易于集成到现有的生态系统中。这些服务器还支持比典型 GPU 服务器更多的存储空间(通过 16 个热插拔 PCIe Gen5 NVMe 驱动器托架),增强了它们在数据密集型任务中的实用性。此外,包括联想的 XClarity 管理可确保简化操作和监控,进一步简化复杂基础设施的管理。

  尽管没有进行性能测试,但这些服务器的设计非常出色。模块化架构使联想能够轻松地为客户提供 AMD 和 NVIDIA GPU,以及 Intel 或 AMD 计算机服务器。借助 Intel Guadi 3 和 NVIDIA B200 等更多 GPU 支持,联想可以让客户混合搭配计算和 GPU 组件,以针对特定应用程序调整服务器。

The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

Copyright © 2099 集团网商讯 版权所有

苏ICP备2023036119号-9 |——:合作/投稿联系微信:nvshen2168

|—— TXT地图 | 网站地图 |