AMD公司在“Advancing AI”大会上宣布推出全新的Instinct MI325X加速卡,该加速卡基于CDNA 3架构,相较于旧款MI300X进行了多项升级。为了应对日益增长的AI模型计算需求,MI325X特别强化了HBM3E内存和计算能力。
MI325X加速卡配备了高达256 GB的HBM3E内存,相较于MI300的192GB提升了1.8倍,同时内存带宽也达到了6 TB/s。在计算能力方面,MI325X在FP16下提供1.3 PetaFLOPS,在FP8训练和推理下提供2.6 PetaFLOPS,较MI300提升1.3倍。
加速器的核心在于ROCm软件堆栈,AMD计划将ROCm引入每一款GPU,并与开源社区合作,整合PyTorch、Triton、ONNX等框架的功能。
AMD还透露了对于未来的规划,预计将在2025年下半年推出基于TSMC 3纳米工艺的CDNA 4 Instinct MI355X加速器,配备288 GB的HBM3E内存。