寒武纪 思元MLU370-S4
MLU370-S4加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板载24GB低功耗高带宽LPDDR5内存,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。
MLU370-S4加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板载24GB低功耗高带宽LPDDR5内存,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。
产品亮点:
MLU370-S4加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板载24GB低功耗高带宽LPDDR5内存,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。
规格参数
计算架构 | Cambricon MLUarch03 |
制程工艺 | 7nm |
内存规格 | 24GB LPDDR5 内存带宽 307.2 GB/s |
视频编解码 | 最高可支持至8K; 132路HEVC全高清视频解码; 24路HEVC全高清视频编码; |
图片编解码 | 图片编解码最高分辨率支持16384x16384; 4000 Frames/s 全高清图片解码; 3000 Frames/s 全高清图片编码; |
vMLU实例 | 4个 |
散热规格 | MAX 75W 半高半长单槽位被动式散热 |
计算精度支持 | FP32、FP16、BF16、INT16、INT8、INT4 |
峰值性能 | 192 TOPS (INT8) 96 TOPS (INT16) 72 TFLOPS (FP16) 72 TFLOPS (BF16) 18 TFLOPS (FP32) |