【正文】
TOP500是由Hans Meuer和Erich Strohmaier 1993年在德国曼海姆大学创建的全世界最权威的超级计算机排名榜。TOP500以超级计算机系统Linpack测试值为基准进行排名,每年发布两次。由于高性能计算机的应用代表了一个国家计算机研发和应用的最高水平,所以每次TOP500的公布都可以显示一个国家的高性能计算科研实力。所以每次中国最快的高性能计算机在TOP500的排名可以代表目前我国高性能计算领域的发展水平。在这个排名当中中国的最好成绩是第十名,就是在2004年研发成功并部署在上海超级计算中心的曙光4000A。曙光公司研发的曙光4000A在2004年的ISC大会上以11.2万亿次Linpack测试值历史性地闯入TOP500前十名。但是,由于当年中国高性能计算机的应用水平和国外差距较大,同时全世界都集中精力发展超级计算机,在接下来的几年里,中国的高性能计算机再也没有进入TOP500前十名,而此次曙光5000A可以在众多高手如云的2008年再次入选TOP10才是我国在高性能计算机领域屹立世界巅峰的真正开始。
今天,我将向大家详细介绍曙光5000A到底是一台什么样的计算机。【正文】
自主知识产权
曙光5000A高性能计算机的体系架构、主计算单元的刀片服务器及胖节点、刀片主板、系统散热、信号仿真、基于ConnectX的DDR Infiniband交换模块完全由曙光公司在中科院计算所的支持下自主设计,全部达到了国际领先水平。首次采用的水冷系统也拥有部分知识产权。设计过程遵照中国自主刀片服务器标准。自主创新研制过程中,曙光取得了多项业界第一,并在系统研发设计阶段获得50余项自主专利。 业界最早实现了同等尺寸的4路4核SMP刀片主板设计; 业界最早实现了4路4核的高密度刀片系统; 业界最早实现了基于IOE的通用刀片系统; 业界最早实现了刀片内集成ConnectX的DDR HCA 和Infiniband交换; 业界领先的基于大规模计算平台的统一智能监控管理系统。
【正文】
高性能
曙光5000A高性能计算机采用AMD最新的低功耗四核Barcelona处理器,采用基于刀片架构的HPP体系结构,共有约30000颗计算核心,系统内存大于100TB,具有700TB SAN数据存储能力,采用低延迟的20Gbps的网络互联,设计双精度浮点运算速度峰值为每秒230万亿次,Linpack速度预测将达到160万亿次,效率超过70%,是目前国内运算速度最快的高性能计算机。曙光5000A一天完成的工作量,相当于全中国所有人每天24小时、每年365天利用手持计算器不停地进行计算,52年时间的工作量。
【正文】
高效能(高生产率)
曙光5000A采用4路刀片节点和8路胖节点设计,大幅提高了系统并行性及高生产率。CPU采用内部直连内存访问技术,可在节点内实现无阻塞的内存访问带宽及低延迟。刀片节点单CPU核本地可直接进行64GB内存寻址,胖节点单CPU核本地可直接进行128GB内存寻址,可满足特殊行业应用挑战性需求。
曙光5000A采用了基于ConnectX的DDR Infiniband 互联,二叉树无阻塞设计,实现了单向20Gbps的传输速率,MPI实测通讯延迟1.6us。
曙光5000A的高效并行文件系统,可以提供70GB的磁盘I/O访问带宽。
计算机详细解读" border="1" /【正文】
低能耗
曙光积极响应国家“节能减排”、“建设节约型社会”的号召,在曙光5000A中采用了多项具有大量的尖端节能措施,即使在满负载运行的状态下,功耗也仅为其他品牌同级别高性能计算机的六分之一,主机运行功耗为720千瓦,全系统(含水冷机柜系统)运行总功耗为1000千瓦。
曙光5000A由于采用了多项节能技术,可为用户节约大量耗电量。
低功耗CPU设计,比常规CPU节约30%耗电,全系统因采用低功耗CPU产生的节电规模超过200KW;
标准DDR2内存设计,比采用FBD DDR2内存节约60%耗电,全系统因采用DDR2内存产生的节电规模超过300KW;
全系统刀片设计,比常规机架式节电节约10%耗电,全系统因采用刀片架构产生的节电规模约60KW;
液冷系统散热技术,比常规空调制冷节约30%空调耗电,全系统因采用液态制冷技术产生的节电规模约60KW;
节能软件技术,采用节能软件和作业调度相结合,系统全年预计可节约10%~30%的耗电。
结论:曙光5000A超级计算机的节能技术,每年可为用户节约用电1000万度,折合人民币800万元左右!
【正文】
高密度
曙光5000A采用4路刀片节点和8路胖节点设计,大幅提高了系统并行性及高生产率。CPU采用内部直连内存访问技术,可在节点内实现无阻塞的内存访问带宽及低延迟。刀片节点单CPU核本地可直接进行64GB内存寻址,胖节点单CPU核本地可直接进行128GB内存寻址,可满足特殊行业应用挑战性需求。
曙光5000A采用了基于ConnectX的DDR Infiniband 互联,二叉树无阻塞设计,实现了单向20Gbps的传输速率,MPI实测通讯延迟1.6us。
曙光5000A的高效并行文件系统,可以提供70GB的磁盘I/O访问带宽。
计算机详细解读" border="1" /【正文】
高应用性
曙光5000A不仅像其他品牌高性能计算机一样可以应用于高性能计算,还可以应用于信息服务,电子政务,网络游戏等常见商业应用。
曙光5000A可广泛运行于证券指数计算、电力安全评估、建筑工程抗震性评估、天气预报、石油地震资料处理、核能开发利用、汽车碰撞、电磁辐射、计算流体力学、基因匹配与拼接、蛋白质结构分析和材料科学等20多个应用领域。
在商业应用方面,曙光5000A可使用Suse Linux和WHS 2008,可广泛运行目前Linux和Windows下的主流的行业软件,用户不需要对普通平台上开发的软件进行任何更改,即可使用。
【正文】
低价格、低TCO(运营总成本)
曙光5000A系统造价仅为2亿元人民币,全系统(含空调系统)年运营耗电约800万度,极大降低了用户初始采购成本和运营维护费用。
曙光将为曙光5000A提供3年全免费保修,并终身提供免费技术服务。
曙光5000A具有全系统统一的智能监控管理系统,系统管理工作简洁方便,降低用户人工成本。
计算机详细解读" border="1" /高可靠性
曙光5000A采用了全冗余刀片服务器设计,使系统中无单一故障点,较机架式Cluster减少了70%以上的系统电缆连接。
曙光5000A采用了全冗余的网络设计,机群内部采用了全无阻塞的Infiniband CLOS网络构建计算存储网络,冗余万兆级联的无阻塞Ethernet互联网络。
曙光5000A的全内置ConnectX DDR Infiniband二层交换,减少了50%的Infiniband连线,全面采用光纤传输技术,保证高速信号长距离传输质量。
曙光5000A采用液冷机柜,拥有冗余的制冷风扇,并采用智能散热控制,有效减少系统冷却故障带来的系统停机。
曙光5000A采用了自主开发的Grid View集群监控管理系统。该管理系统提供统一的集中式平台,具备可扩展、高集成、高可靠和易用性。当系统出现异常时,能准确进行定位和提示。