中国气象局武汉暴雨研究所是经国家科技部、财政部、中央编办批准成立的国家级公益类非营利性科研机构,为中国气象局所属九个专业气象研究院所之一。人员编制50人,下设暴雨应用基础研究室、暴雨监测技术研究室、暴雨信息应用研究室和综合办公室。
暴雨所基本定位为瞄准暴雨防灾减灾的国家目标和气象业务服务需求,开展中国暴雨的应用基础研究、应用研究和技术开发。研究重点是我国陆地暴雨,特别是江淮梅雨锋暴雨和锋前暖区暴雨,同时开展我国北方暴雨的比较研究。重点学科领域包括暴雨监测技术研究、暴雨形成机理和预测方法研究、暴雨预报应用研究和暴雨灾害评估与对策研究等,同时开展中尺度暴雨外场监测试验基地建设和中国暴雨(资料)数据库建设。
暴雨所开发完成了具有国际先进水平的中尺度暴雨数值预报模式系统AREMS,并荣获2005年度湖北省科技进步一等奖。积极推动AREM模式在全国14个省(市、区)及水利部门推广应用,开展业务化评估工作。开发完成了全国及单站多普勒天气雷达资料传输及显示软件,并在全国推广应用。在全国率先实现了多部新一代雷达的高频度(6分钟)实时拼图,基本完成中国南方暴雨短时预警系统。自主设计了一套雷达降水资料一维变分同化方案。
由于用户研发了AREM软件是基于某小型机而开发的,所以用户要厂商提供AREM在其所提供平台上的顺利移植。由于暴雨所肩负着预报武汉暴雨的责任和中尺度天气预报研究的科研任务,所以需要一台较高性能的高性能计算机。
用户前期使用国外的机器,由于机器维护十分不便费用过高。因此用户决定选择国产高性能计算机,曙光公司是国内高性能计算机最专业的厂商,因此最终选择了曙光公司。
曙光针对用户主要用于科研的需求,提供了7台R4280AD和1台A950,以及一台2120FA半光纤存储(共计3TB),组建成Cluster,为用户提供科研用高性能计算。
为了满足用户日常的管理和监控要求,在集群软件方面,采用了最新研发的曙光DCAS集群管理系统。DCAS是一种高级群集管理软件,能够通过单点控制来管理Linux/Windows系统群集。它简化了群集的管理,使其能够很方便地扩展,有助于提高系统管理员的效率。本管理系统采用有Browser/Server分布式结构、跨平台管理等特性,提供了一整套对集群系统进行并行操作、性能监控、信息获取的工具,为整体集群计算资源的统一管理构建了一个基础平台,满足了企业级集群管理所需的扩展性(Scalability)、可用性(Usability)、可管理性(Manageability)和实用性(Availability)等方面的要求。DCAS的主要功能包括:管理授权 — 负责管理过程的授权控制,只有将管理节点的公钥部署到被管理节点,才能执行各种集群管理操作。
用户管理 — 负责管理集群系统中的用户与组群,允许集群系统管理员查看集群系统中用户与组的配置,并且可以完成对集群系统的用户和组的增加,删除,修改等功能。
进程管理 — 显示集群中运行的进程信息,在选定的节点组上运行特定进程,以及杀死特定进程,保存当前运行的进程信息等。
服务管理 — 显示集群中运行的服务信息,在选定的节点组上启动、停止、禁用指定的系统服务
文件管理 — 集群由少到几个节点多到上百个节点组成,而管理集群中的文件则变成相当复杂的任务。DCMS的集群文件浏览器Spreader是用于集群文件管理的工具,界面风格犹如微机Windows下Explorer,操作方便、直观。
网络配置 — 这个模块支持集群网络管理中最常见的几种工作:维护系统hosts表,以及设置网络设备的IP地址。
并行终端 — 可在多节点并发执行命令,关机管理 — 快速的对选定节点或整个集群进行关机/重启/开进操作。
采用DCAS,大大减轻了管理员的集群维护工作,让用户将主要精力集中到所研究的课题上,提高了工作效率。
同时,曙光也协助用户从UNIX平台顺利迁移到了Redhat Linux平台,让用户迅速掌握了Linux平台下的气象模式的并行计算。曙光也反复努力,将AREM等模式进行了很好的移植到了曙光提供的TC4000A集群上。
从采用了曙光的高性能计算机以后,除了满足用户日常业务化需求以外。用户利用曙光高性能计算机开发的AREM模式也从2.1发展到了2.3.7,然后顺利进入到了v3.0的开发。运行方式也从v2.1的串行,到v2.3的MPI并行,再到V3.0支持嵌套功能。AREM借助曙光高性能计算机得到了长足的发展。目前V3版本已经包括较完善的物理过程和完备的同化初值系统,能满足目前区域模式开展短时天气预报和区域天气气候模拟研究等主要需求。