近日,云南大学的科研人员在新引进的曙光4000A超级计算机上进行了HIV 病毒gp120 糖蛋白分子动力学模拟实验,运算时间从以往通过单机需要一星期缩短到了13个小时。
西陲名校的困惑
位于中国西陲的云南大学已经拥有了80余年的历史,是国家“211工程”重点建设的高校之一。随着教学科研工作的不断深入,各学科对大型、密集、高性能计算的需求与日俱增,材料科学、信息科学、数理化、生命科学、地理和大气科学的科研人员都急需一个能提供高性能计算服务的平台,而分散在各学院和实验室的现有计算资源都无法满足如此大规模的计算需求。
为了解决这一矛盾,云南大学从 211建设经费中划拨出了专款,要建一个高水平的高性能计算中心!这一中心不仅要能实现高速网络环境下多种计算资源的有效聚合与充分共享,为各学科提供高性能计算服务,而且要为云南省重要领域的大型计算软件开发提供支撑,并逐步形成多学科交叉和创新研究的平台。
上海超算的启示
上海超算采用中国最快超级计算机10万亿曙光4000A成功部署国家网格和上海信息服务平台的做法在国内外引起了广泛的关注,也同样成为云南大学的参考样板。云南大学的领导在对上海超算和曙光公司进行实地考察,并在曙光技术支持部的高性能计算测试实验室中进行软件测试后,一个采用曙光 4000A搭建高性能计算中心的蓝图开始萌生。
9月,云南大学高性能计算中心正式成立,新引进的曙光4000A也开始投入运行。这套基于机群架构的超级计算机系统采用了96颗AMD皓龙处理器,配备了192GB海量内存和2044GB外部存储,峰值计算速度达到了每秒 3840 亿次,在11月公布的2005年中国高性能计算机性能TOP 100排行榜中,排第89位。中心通过采用国际标准超级计算机性能测试标准 HPL 程序对曙光4000A进行了 Linpack 测试,系统 Linpack 运算与峰值比为 75.83% ,比上海超算曙光4000A 还要高出近4个百分点。
据云大高性能计算中心技术负责人介绍说,引进的曙光4000A是个中等规模的机群系统,由高速计算网、存储接入网和治理监控网等3套网络组成,其中24个计算节点全部采用2U高密度的机架式四路服务器天阔R4280A。由于该服务器采用了AMD皓龙64位处理器,具有直连架构、HT超传输技术、集成内存控制器等特点,加上曙光自主研发设计的四路主板,节点机和机群系统的性能和稳定性都得到了很好的保障。该款产品仅在上海超算就部署了500多个节点,平均无故障运行时间达到了25万小时的惊人品质。
曙光4000A初显身手
在试运行阶段,高性能计算中心联合校内的多家相关研究单位,针对一些成熟的高性能计算应用课题做了初期联合测试,测试结果达到预期性能指标。生命科学院生物资源保护与利用重点实验室使用 Gromacs 分子动力学模拟软件从事 HIV 病毒 gp120 糖蛋白分子动力学模拟实验,在运行 24 个节点、每节点 1CPU的 条件下,1ns 蛋白质结构模拟仅需13小时,而以往在单机上要运行整整一个星期。资源环境与地球科学学院大气数值模拟实验室则进行了黑炭气溶胶辐射气候效应的数值试验,即通过使用区域气候模式 Regcm3 模式对 2001-2002 年 BC 气候效应进行数值模拟,以往在普通 PC 单机上运行需要 96 小时,目前使用该系统单节点仅需 48 小时,缩短了一半。
目前,高性能计算中心在前期调研的基础上,部署了许多应用软件,涉及大规模非线形复杂系统的计算和模拟、有限元计算、流体动力学计算模拟、分子动力学计算及力场模拟、计算化学与药物筛选等领域,校内用户已可通过网络远程登陆并提交相关计算作业。
云大高性能计算中心副主任李汉斌表示:“我们也曾尝试过自己搭建集成系统,但十分不稳定而且速度慢,这次采用曙光4000A机群服务器,稳定性非常好,到目前还没有出现过宕机现象,并且速度也明显提高了好多倍。曙光4000A机群系统的引入有效地解决了云大在材料科学、生命科学、大气科学等学科基础研究上的高性能计算应用需求,同时也为云南各行各业科学研究和经济建设提供了良好的服务。”
为了更好地推动高性能计算在云南省科学研究与经济建设中的应用,进一步提高云南省科技创新能力,为云南省培养高性能计算研发和应用方面的高层次专门人才,云大高性能计算中心先后与中科院计算所、上海超算、曙光、 AMD、中科院昆明植物所以及上海药物所等多家单位建立了全面的合作关系,相继成立上海超算云南大学分中心、云南大学-中科院计算所高性能计算联合实验室、云南大学-曙光公司高性能计算技术支持中心、AMD64高性能计算教学科研实验室等多个研发平台,为推动云大深入开展高性能计算的教学、科研和应用奠定了良好的基础。
曙光公司销售总监王成江表示,随着机群技术的日渐成熟,机群服务器已经教育城域网、高校信息化和教育科研网格建设中得到广泛青睐。在西部四十多所高校校园网,北京、烟台、上海、南阳等地城域网以及中山大学、北京邮电大学等重点高校的教育科研网格项目中,曙光机群服务器中的TC1700、曙光3000以及最新一代的曙光4000系列机群服务器实现了广泛部署。云南大学高性能计算中心的建立和曙光4000A的成功运行,对西南地区高性能计算应用将起到非常好的示范和辐射效应,带动其他行业通过高性能计算来提升业务效率和科技竞争力。