高性能计算中心——国产GPU邀您来测

发布时间:2024-08-26浏览量:350

面对国外高端算力资源的限制与挑战,我国正加速推进国产算力的自主研发与应用,以确保科技创新与国家安全的自主可控。随着政策红利的持续释放和市场需求的快速增长,国产GPU厂商如沐曦、曙光、华为等纷纷崭露头角,致力于打破国际技术垄断。在此背景下,高性能计算中心积极调研国内主流算力品牌性能,特别推出基于沐曦、曙光、华为三类产品的国产GPU测试项目,邀请广大科研人员参与。

一、主流国产GPU简介

虽与国际上的NVIDIAAMD等巨头相比,国产GPU在性能和技术成熟度方面可能还存在一定的差距,但国产GPU在传统的2D/3D图形渲染GPU和专注高性能计算的GPU领域上均推出了较为成熟的产品,在性能上不断追赶行业主流产品,在特定领域达到业界一流水平。在软件生态方面国产厂商有两种技术路线一种兼容英伟达CUDA,另外一种完全自主开发。

以下是将陆续参与测试的三款主流的国产GPU和英伟达GPU的技术指标对比:

二、本次测试品牌:沐曦

本次中心特别邀请参与测试的国产GPU企业为沐曦科技,拥有完全自主研发的GPU IP、指令集和架构,以及兼容主流GPU生态的完整软件栈,专注于为异构计算提供全栈GPU芯片及解决方案,满足数据中心对“高性能”、“高能效”及“高通用性”的算力需求。

产品优势

1)生态易用可用、应用移植零成本。MXMACA原生兼容CUDA,基于CUDA开发的源代码,直接在C500平台进行编译即可运行,客户应用迁移零成本。

2)具备强大的互联能力。C500/C550具备强大的多卡互联能力,搭载光互连模块,支持多种互联拓扑,适配客户多场景应用需求。

3)支持多元异构智算集群建设。C500的设计基于大量的工程应用场景调研和计算分析,并结合芯片架构设计科学理论指导,全自研的核心IP、编译系统、指令集、数学库、通信库乃至MXMACA软件栈,支撑了计算芯片未来发展的可持续性和可迭代性。

4)超智融合,训推一体。

三、测试项目及资源

为验证国产GPU卡针对我校科研计算的可用性,通过软件和模型测试,就移植成本、性能、适配度和兼容性等指标与NVIDIA GPU卡做横向对比。我们选取沐曦MXC500X201为测试卡,拟测试的软件分类如下:

1.   大模型测试

AI测试,沐曦提供远程在线资源,部署GPU卡为8MXC500

大模型:

  丨Qwen2-72b                                已测(8月上旬)

  丨Stable diffusion                          已测(8月上旬)

  丨Segment anything                      待测(8月下旬)

  丨音乐生成大模型(musicgen)     待测(8月下旬)

2.   软件测试

HPC应用测试,沐曦提供本地实体卡机器,部署8X201。(X201具有双精度算力,其他指标与MXC500相同)

软件列表:

Gromacs2024待测   (8月底-9月上旬)

AMBER24  待测    (8月底-9月上旬)

Vasp6.2    待测     (8月底-9月上旬)

3.   其他待测试需求

 丨Pytorch

 丨Tensorflow

 丨自研模型Unimol

 丨DeePMDDPA-2

欢迎感兴趣的老师参与本次测试,有意者请联系俞老师:kyu@cc.ecnu.edu.cn。后续中心会陆续开展基于曙光、华为等国产GPU芯片的测试项目,请持续关注。


公共创新服务平台

高性能计算中心

2024826