面对国外高端算力资源的限制与挑战,我国正加速推进国产算力的自主研发与应用,以确保科技创新与国家安全的自主可控。随着政策红利的持续释放和市场需求的快速增长,国产GPU厂商如沐曦、曙光、华为等纷纷崭露头角,致力于打破国际技术垄断。在此背景下,高性能计算中心积极调研国内主流算力品牌性能,特别推出基于沐曦、曙光、华为三类产品的国产GPU测试项目,邀请广大科研人员参与。
一、主流国产GPU简介
虽与国际上的NVIDIA和AMD等巨头相比,国产GPU在性能和技术成熟度方面可能还存在一定的差距,但国产GPU在传统的2D/3D图形渲染GPU和专注高性能计算的GPU领域上均推出了较为成熟的产品,在性能上不断追赶行业主流产品,在特定领域达到业界一流水平。在软件生态方面国产厂商有两种技术路线一种兼容英伟达CUDA,另外一种完全自主开发。
以下是将陆续参与测试的三款主流的国产GPU和英伟达GPU的技术指标对比:
二、本次测试品牌:沐曦
本次中心特别邀请参与测试的国产GPU企业为沐曦科技,拥有完全自主研发的GPU IP、指令集和架构,以及兼容主流GPU生态的完整软件栈,专注于为异构计算提供全栈GPU芯片及解决方案,满足数据中心对“高性能”、“高能效”及“高通用性”的算力需求。
产品优势
(1)生态易用可用、应用移植零成本。MXMACA原生兼容CUDA,基于CUDA开发的源代码,直接在C500平台进行编译即可运行,客户应用迁移零成本。
(2)具备强大的互联能力。C500/C550具备强大的多卡互联能力,搭载光互连模块,支持多种互联拓扑,适配客户多场景应用需求。
(3)支持多元异构智算集群建设。C500的设计基于大量的工程应用场景调研和计算分析,并结合芯片架构设计科学理论指导,全自研的核心IP、编译系统、指令集、数学库、通信库乃至MXMACA软件栈,支撑了计算芯片未来发展的可持续性和可迭代性。
(4)超智融合,训推一体。
三、测试项目及资源
为验证国产GPU卡针对我校科研计算的可用性,通过软件和模型测试,就移植成本、性能、适配度和兼容性等指标与NVIDIA GPU卡做横向对比。我们选取沐曦MXC500和X201为测试卡,拟测试的软件分类如下:
1. 大模型测试
AI测试,沐曦提供远程在线资源,部署GPU卡为8卡MXC500。
大模型:
丨Qwen2-72b 已测(8月上旬)
丨Stable diffusion 已测(8月上旬)
丨Segment anything 待测(8月下旬)
丨音乐生成大模型(musicgen) 待测(8月下旬)
2. 软件测试
HPC应用测试,沐曦提供本地实体卡机器,部署8卡X201。(X201具有双精度算力,其他指标与MXC500相同)
软件列表:
丨Gromacs2024待测 (8月底-9月上旬)
丨AMBER24 待测 (8月底-9月上旬)
丨Vasp6.2 待测 (8月底-9月上旬)
3. 其他待测试需求
丨Pytorch
丨Tensorflow
丨自研模型Unimol
丨DeePMD和DPA-2
欢迎感兴趣的老师参与本次测试,有意者请联系俞老师:kyu@cc.ecnu.edu.cn。后续中心会陆续开展基于曙光、华为等国产GPU芯片的测试项目,请持续关注。
公共创新服务平台
高性能计算中心