人工智慧/機器學習 |人工智慧伺服器
| AGS8600
AGS8600
Edgecore AGS8600 是一款基於 GPU 的高效能、可擴展伺服器,適用於 AI/ML(人工智慧/機器學習)和 HPC(高效能運算)應用。這款伺服器非常適合訓練大型語言模型、自動化、物件分類和識別用例。系統採用八顆 AMD Instinct MI325X 處理器和兩顆 AMD EPYC 9005/Turin 系列處理器。 AMD MI325X 處理器整合 256 GB HBM3 記憶體。
每個 MI325X 配備 16 通道 PCIe Gen5 主機介面和七個 AMD Infinity Fabric™ 鏈路,可實現環中八個 GPU 之間的完全連接。 AMD Infinity Fabric 技術可在業界標準加速器模組 (OAM) 設備包內部及之間提供卓越的 I/O 效率、擴展能力和通訊能力。
為什麼選擇 AGS8600?
AMD Instinct™ MI325X

AGS8600 功能
規格
Form Factor | 8U |
Compute Node | ▪️CPU:AMD EPYC™ 9005/Turin系列處理器,2個插槽 ▪️EPYC 9575F 64C 3.3GHz 400W SP5 ▪️內存:24 x 64GB RDIMM 2 RANK 5600 ▪️作業系統:Linux ▪️BIOS:AMI BIOS(32 MB SPI 快閃 ROM) ▪️前端介面:2 x BCM957608-P2200GQF00 雙埠 200GbE QSFP112 PCIe 乙太網路卡 ▪️儲存:2 x 1.92TB U.2 2.5 NVME4 1DWPD(非 SED) |
GPU | 配備 Infinity Fabric 的 AMD MI325X 8 GPU |
Input/Output | ▪️USB:2 個 USB3.0 連接埠 ▪️VGA:1 x D-Sub 15 針端口 ▪️RJ-45:1 x GbE 連接埠專用於 IPMI ▪️按鈕:UID按鈕、電源按鈕、重設按鈕 ▪️LED: UID 指示燈 PWR 指示燈 基板管理控制器 指示燈(過熱警告指示燈/風扇和PSU故障) |
Scale-Out Interface | ▪️RDMA(ROCE v2) ▪️8 x LP 插槽用於交換板(PCIe x16) ▪️8 x BCM957608-P1400GDF00 單埠 400G QSFP112-DD PCIe 乙太網路卡 |
儲存裝置 | 正面:6 x 7.68TB U.2 2.5 NVME4 1DWPD(非 SED) |
基板管理控制器 | AST2600 |
信賴平台模組 | TPM2.0 SPI |
PSU | 3300 W 熱插拔 RPSU,80+ 鈦金(4+2 冗餘) |
風扇 | 15個熱插拔風扇 |
Dimensions | 寬 x 深 x 高:448 x 850 x 351 毫米(17.63 x 33.46 x 13.82 英吋) |
工作溫度 | 10℃~35℃ |
Expansion Slots | 8 個半高 + 4 個全高 PCIe 5.0 x16 插槽 |
Soſtware | ROCm:6.2.4 RCCL:2.20.5 PyTorch:2.3、2.2、2.1、2.0、1.13 TensorFlow:2.16.1、2.15.1、2.14.1 JAX:0.4.26 ONNX Runtime:1.17.3 |
相關解決方案
相關資源