寒武纪 思元MLU370-X8

MLU370-X8采用双芯思元370配置,为双槽位250w全尺寸智能加速卡,提供24TFLPOS(FP32)训练算力和256TOPS (INT8)推理算力,同时提供丰富的FP16、BF16等多种训练精度。基于双芯思元370打造的MLU370-X8整合了两倍于标准思元370加速卡的内存、编解码资源,同时MLU370-X8搭载MLU-Link多芯互联技术,每张加速卡可获得200GB/s的通讯吞吐性能,是PCIe 4.0带宽的3.1倍,可高效执行多芯多卡训练和分布式推理任务。

产品亮点:

  • MLU370-X8采用双芯思元370配置,为双槽位250w全尺寸智能加速卡,提供24TFLPOS(FP32)训练算力和256TOPS (INT8)推理算力,同时提供丰富的FP16、BF16等多种训练精度。基于双芯思元370打造的MLU370-X8整合了两倍于标准思元370加速卡的内存、编解码资源,同时MLU370-X8搭载MLU-Link多芯互联技术,每张加速卡可获得200GB/s的通讯吞吐性能,是PCIe 4.0带宽的3.1倍,可高效执行多芯多卡训练和分布式推理任务。



规格参数 


计算架构

Cambricon MLUarch03

制程工艺

7nm

内存规格

48GB LPDDR5

内存带宽 614.4 GB/s

视频编解码

最高可支持至8K;

264路HEVC全高清视频解码;

48路HEVC全高清视频编码;

图片编解码

图片编解码最高分辨率支持16384x16384;

8000 Frames/s 全高清图片解码;

6000 Frames/s 全高清图片编码;

vMLU实例4个
散热规格MAX 250W

全高全长双槽位被动式散热

计算精度支持FP32、FP16、BF16、INT16、INT8、INT4
峰值性能256 TOPS (INT8)

128 TOPS (INT16)

96 TFLOPS (FP16)

96 TFLOPS (BF16)

24 TFLOPS (FP32)


电话咨询
产品中心
在线询价
QQ客服