联想助力搭建南大高性能计算中心,运行六年故障率小于1%

485次阅读
没有评论

联想助力搭建南大高性能计算中心,运行六年故障率小于1%

“2017年南京大学携手联想,打造了南大高性能计算中心二期计算平台。六年来,系统运行稳定,故障率小于1%,近三年的CPU利用率大于93%。”

5月30日,在由联想、南京大学与CIO时代联合主办的“高校算力之美”擎智媒体沙龙活动上,南京大学高性能计算中心高级工程师盛乐标博士表示,目前南京大学高性能计算中心全系统共有33280个CPU核,理论浮点运算峰值1500万亿次/秒。

以高性能计算典型应用场景——行星物理环境模拟为例,受限于客观条件,对行星内部环境和物质的实验观测、研究挑战巨大,有必要采用理论模拟计算。依托南京大学高性能计算中心的算力,物理学院师生研究了行星内部高压下的新材料,且大幅提高了研究效率,目前相关成果已在Nature、Physics、PRX、NSR等国际一流学术刊物发表。

目前,南大高性能计算中心已经助力产出部分科研成果,覆盖流体力学模拟、系统仿真、中大尺度气象模式模拟等多个领域。“2019至2021三年,高性能计算中心超算平台支持了超百篇卓越学科论文的发表,并支撑学校教师承担三十多项国家重大科研项目”。南京大学高性能计算中心副主任周庆林表示。

“除了南京大学,联想还携手北京大学、上海交通大学、南方科技大学等数十所高校打造了高性能计算平台。” 联想高性能计算和人工智能主任技术顾问郝常杰表示。

在上海交通大学,联想采用温水水冷技术,打造了“思源一号”绿色水冷高性能计算机群。“思源一号”总计算力为6000万亿次/秒(双精度),PUE可低至1.1左右,可实现42%的节能减排。自2013年以来,“思源一号”累计服务一级学科30多个,支撑用户发表高水平论文600多篇(其中CNS及其子刊47篇),为10多个学科提供了学科融合的计算服务。

联想助力搭建南大高性能计算中心,运行六年故障率小于1%

采用联想温水水冷技术的还有北京大学‘未名一号’,是国内首个大型温水水冷高性能计算集群。”未名一号”由196个节点组成,理论计算峰值高达411万亿次/秒,LinPack效率高达92.6%。由于应用了温水水冷技术,“未名一号”可节省50%的制冷散热成本,每年可为北京大学节省60万度电。

“在高性能计算领域,联想坚持‘双P’战略,即在降低PUE的同时提高生产力(Productivity),联想有信心也有能力保持这一战略的高效执行。”

郝常杰表示,在存储领域,联想的高性能存储方案,以持续读写带宽、单流性能、IOPS性能,满足多场景需要;在软件层面,联想打造了融合的智能高性能计算平台LiCO支持多种主流操作系统、软件系统。同时联想还推出了LiCO-AI——可以同时支持高性能计算和AI作业运行。 

(本文首发钛媒体App)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy