您现在的位置是:弘兴快讯网 > 知识

华为联手中科大铸就高校超算新标杆

弘兴快讯网2024-03-28 22:54:15【知识】2人已围观

简介“承瀚海之辽阔,比星云之光华”。“瀚海”极具中科大特色,具有很高的辨识度;“瀚海”也代表了超算系统计算能力强大,能够有力支撑教学及科研工作,勇攀科研高峰。——题记中国科学技术大学(以下简称“中科大”) 特种狂龙在都市

“承瀚海之辽阔,联手比星云之光华”。中科“瀚海”极具中科大特色,大铸特种狂龙在都市具有很高的高校杆辨识度;“瀚海”也代表了超算系统计算能力强大,能够有力支撑教学及科研工作,超算勇攀科研高峰。新标

——题记

中国科学技术大学(以下简称“中科大”)素来拥有“千生一院士,联手百生一杰青”美誉。中科在华为的大铸协助下,中科大建成了当前中国高校中最大高性能计算校级平台之一——中国科大瀚海20超级计算系统(简称“瀚海20系统”),高校杆已稳定高效运行7个多月。超算

图:中科大瀚海20系统负载

图:中科大瀚海20系统运行作业数

中科大“超算”需求旺盛旧平台难担重任

中科大超算中心自2003年成立后,新标便致力于为师生提供计算资源以及应用调优等服务,联手特种狂龙在都市协助院校师生顺利开展教学及科研项目,中科中心作为中国国家网格CNGrid合肥中心和合肥运行中心、大铸中国科学院超级计算环境合肥中心(中科大)、中国教育与科研网格项目ChinaGrid中科大子节点及安徽省高校科研协作高性能计算公共平台同时服务社会,向校外提供一定的资源服务及技术支持。

得益于中科大超算中心所具备的优质管理体系以及院校师生的高效使用,中科大超算中心在用用户数已超1000个,覆盖校内全部院系。2013年起,用户发表的致谢超算中心论文每年都超过100篇,其中Nature、PRL、JACS三类顶级期刊更是高达48篇。中科大师生对超算平台需求的不断增长,要求平台更快、更强。然而当时超算平台常年在85以上超高的利用率,科研人员作业排队时间过长、无法运行大规模科学计算任务。于是,实现中科大超算平台算力“质”的飞跃,成为中科大超算中心迫在眉睫要解决的难题。

图:用户致谢超算中心论文统计

华为铸就“瀚海20系统”中科大“双一流”建设进入快车道

2019年12月,华为完成了“瀚海20系统”的全部建设和系统调优,顺利通过了项目验收,成为当前中国高校中最大的超级计算校级平台之一:CPU计算集群30480颗核,系统理论峰值性能2.52Pflops,实测HPL双精度浮点计算能力:700个节点1.43PFlops,计算效率为63.95,甚至部分计算节点HPL效率跑出了71以上的超高性能。

图:瀚海20系统单节点HPL性能统计

“瀚海20系统”是中国高校首家在超算平台中采用InfiniBand HDR100100Gbps网络技术构建的全线速的高速计算网络,基于ConnectX-6芯片的InfiniBand和以太网卡可提供无与伦比的性能,在600纳秒的极低延迟下,每秒可发送2亿条消息,让中科大科研用户获得更快的网络性能。

中科大合肥微尺度物质科学国家研究中心的胡老师针对大尺度分子固体材料的第一性原理计算模拟,以自主开发的第一性原理线性标度计算软件DGDFT[JCP 143, 124110 2015]为基础,开发低标度、低通讯,低内存、低访存的并行计算方法,实现超大规模高性能并行计算,DGDFT采用了多级MPI并行以及高效求本征值方法,DGDFT具有高度可扩展性,本次测试在某校外超算平台和“瀚海20系统”超算平台上分别计算金属石墨烯C2880,在相同核数下的绝对计算速度比该校外超算运行提升30。

图:DGDFT软件在校外某超算和“瀚海20”超算系统上测试固体硅Si2880计算的并行可扩展性对比

该系统也为科研用户提供了多种计算选择,采用20台华为Taishan服务器构建全自研的鲲鹏生态计算集群。华为Taishan服务器采用了自研鲲鹏架构,该架构芯片在部分单精度和整型计算应用程序性能表现优异,可用于生物信息学计算软件,和流体力学计算。中国科大网络信息中心张焕杰老师利用其实现了ARM平台甄别邮件系统中用户弱口令问题,由原来的X86单机1天,缩短到利用Taishan服务器30几秒即可完成,大大缩短了处理时间,提高了邮件系统的安全性。

华为与科大共建“瀚海20系统”,推动高校超算集群的创新

在中科大网络信息中心兼超级计算中心李京教授的带领下,针对中科大对计算资源的需求特点,超算中心展开了全方面调研。中科大在量子信息、化学与材料、物理、微尺度物质科学、核科学等学科,位居国内科研领域的前沿,此类学科对于计算量需求巨大,主要以传统CPU计算为主。围绕超算平台中CPU和GPU之间的比例分配,以及现有机房空间及制冷不足等问题,不仅要实现放置5000万元的计算集群,同时还要考虑到计算集群耗能、散热以及计算效能等诸多挑战,经过多轮研讨,最终确定高效、清洁、集约、循环的绿色的超算数据中心建设方案。

图:中科大瀚海20系统

中科大“瀚海20系统”采用液冷技术进行高效散热,可循环使用的冷却水流经CPU、内存等高发热量器件,80的热量直接由冷却水带走,大幅降低超算中心的散热能耗。华为承诺基础设施10年以上的寿命,设备5年以上的寿命,可充分保护用户投资。“瀚海20系统”的720台华为X6000液冷高密服务器计算节点仅需10个机柜即可部署,单机柜72节点39KW的超高密计算系统相比传统服务器每年至少可节省电费17余万元。

图:中科大瀚海20系统液冷计算节点

中心主任李京教授说,在华为的帮助下,我们成功建设了超算平台“瀚海20系统”,整个系统运行流畅、运维简单、绿色节能,能够满足师生日益增长的高性能计算的要求,相信中科大的师生在瀚海20系统上继续产出高水平研究成果。“工欲善其事,必先利其器”,相信这套先进、高效的超算平台——“瀚海20系统”,将更好地助力中科大各院校师生开展科学研究,极大地促进中科大的双一流建设发展。

很赞哦!(48553)