【正文】
曙光5000A以峰值速度230万亿次、Linpack测试值180万亿次的成绩再次跻身世界超级计算机前十,这一成绩使我国成为世界上第二个可以研发生产超百万亿次超级计算机的国家。这台安装在上海超级计算中心的曙光5000A已被正式命名为“魔方”(Magic Cube)。
对于寻常百姓而言,确实很难理解一台计算机的峰值运算速度能达到每秒230万亿次意味着什么,二百万亿次=200000000000000,感兴趣的朋友可以数数有几个零,不过那绝对是一件让你眼花缭乱的事情。我们不妨来举几个例子,每秒230万亿次相当于全中国所有人每天24小时、每年365天利用手持计算器不停地进行计算,持续计算五十二年的工作总量;每秒230万亿次可以在30秒内完成上海证交所近10年的1000多支股票交易信息的200种证券指数的计算……这听起来是不是有点像天方夜谭?其实,高性能计算的应用已经渗透到我们生活的方方面面,例如电信、石油、生物、气象等行业的复杂运算,超级计算机也绝不仅仅是象牙塔内被束之高阁的观赏品。正是有了行业的广泛需求,自主研发超级计算机被列为国家“863”计划的重大科研项目之一,而曙光公司作为国内超算行业的领军企业,毅然决然的肩负起开发国产超算的使命……
流金岁月 曙光超级计算机发展简史
1997年可以说是计算机高速普及的元年,那时,人们还在津津乐道使用“超级解霸”等支持MMX技术的软件配合8X CD-ROM流畅播放VCD,而曙光1000A大规模并行计算机系统确已经运抵喀麦隆,并安装在喀麦隆雅温得第二大学,国产超算实现了第一次走出国门。曙光1000A可以达到每秒40亿次以上的运算速度,要知道那时候计算机刚从“586”迈入Pentium MMX的时代,每秒40亿次对于大多数人来说只是4后面的一串零,并不能真正感受到超算的魅力。
有资料显示,在1995年,中国科学家首次推出运算能力为每秒10亿次的曙光1000时,这一速度落后发达国家同类产品约8年……
2000年,这一年可以称为是电脑行业的千禧年,所有焦点几乎都集中在了Intel与AMD谁是第一个推出千兆处理器的厂商,曙光公司在这一年再次推出超算新品,曙光2000-Ⅱ,该产品峰值浮点速度为每秒1100亿次,内存容量达到50GB,硬盘容量超过600GB。短短的三年时间内,曙光超算实现了从40亿次到1100亿次的飞速提升。同年8月,第一套曙光2000-Ⅱ正式落户中科院计算机网络信息中心,用于大规模科学计算和网络信息服务,国产超算也真正的迈向应用时代,无论在科学工程计算还是事务处理和网络信息服务,国产超算都显示了其强大的功能;
2002年初,在中国科学院和中国工程院566名院士评出的“十大中国科技进展新闻”中,曙光3000是应用科学领域唯一入选的项目,该集群计算机最高浮点运算速度高达每秒4032亿次、内存总量达168GB,相较2000年的每秒1100亿次,曙光3000将运算速度提升了大约四倍。如果说从每秒40亿次提升到每秒4032亿次还不足以让人兴奋,那么曙光4000A的横空出世绝对具有划时代的意义,在2004年6月29日,国家科技部在人民大会堂宣布:“863计划重点项目——曙光4000A通过鉴定验收。”作为国家“863计划”的最新成果,曙光4000A将作为中国国家网格最大主节点落户上海超级计算中心。同时,曙光4000A在同年公布的全球高性能计算机TOP500强排行榜以每秒80610亿次的成绩列全球第十,这也是当时中国超级计算机得到国际同行认可的最好成绩。【正文】
曙光超算大事记
1990年,国家智能机研究开发中心开始研制曙光系列高性能计算机。
1993年,第一台以微处理芯片构成的全对称多处理机系统曙光一号研制成功。
1999年,曙光2000Ⅱ超级服务器研制成功,系统峰值速度达到1117亿次浮点运算,内存容量50千兆字节,磁盘总容量622千兆字节。
2002年,曙光3000入选“十大中国科技进展新闻”,系统峰值速度达到每秒40亿次。
2004年,曙光4000A入选全球高性能计算机TOP500第十,峰值速度达到80610亿次每秒。
同样的TOP10 不同的意义和地位——曙光5000A
“同样的建筑材料,在不同工程师手里就会千差万别,或许美轮美奂,又或许破败不堪。”这个比喻很好的解释了许多网友对曙光5000A的质疑之声,一套超级集群计算机绝对不是简单的硬件堆积,就拿曙光5000A举例,该系统体系结构具有完全的自主知识产权,例如四核高密度刀片主板和基于该主板的世界上第一款7U高度的10片4路4核64位CPU的工业标准刀片服务器,该系统采用内置的ConnectXDDR二层交换模块,以及Ethernet交换模块,从而实现40CPU,160核的超高计算密度,并实现了单节点内部的并行计算。当然,对于曙光5000A,许多朋友还有种种的疑问,对此,曙光总裁厉军接受了媒体采访,对曙光5000A的种种问题作了比较详尽的解答:
媒体: 曙光5000A申报TOM500是180.6万亿次,我们看到第11名也是180万亿次,前后差0.6万亿次,曙光怎么把这个成绩提高到进入前十名的?
厉军:首先一个观点,关于TOM500排行对曙光来说,说有意义,也没意义。就像奥运比赛一样,得第几无所谓,关键是发挥自己的水平。我们在一个半月时间里不断在硬件、软件上进行优化,因为这是比较规则允许的,每一次得出一个数据都有5%左右的提高。这里系统的配制、驱动程序包括测试用例都是有一些优化的余地,大家所有人都这么做的,最终结果是巧合,180.6万亿次,我估计再有一礼拜,有可能到190万亿次。现在只发挥了78%左右的效率,我个人认为还有余地,就是没有时间,要是有时间有可能到80%,一些可以做优化的地方可以再深入研究。如果测到179.5万亿次,那第十是人家的,但中国人习惯认前十,第十一没人理你。我想可能有人会说,怎么就差这一点,这里面是否虚假成份,但对曙光来说这根本没有必要。【正文】
记者:TOM500中曙光5000A是目前世界上最快的基于Windows操作系统的超级计算机,其它99%都是用Linux和Unix,未来会大规模预装么?
厉军:大家千万不要有这样的误解,我也听说曙光5000A用Windows,但只是这次测试偶尔用了Windows,我们机器预装的是Linux,而且大规模使用Linux。为什么这次用Windows?准确的说要把高性能计算机应用的复杂度降低。前两天李院士在诺贝尔论坛上有一篇讲话,大家可以看看。超级计算机再往前发展必须和各个应用科学紧密的结合,也就是说未来很多高水平用户不是来自于计算机行业,而是搞核能、基因的,但对他们来说,要学成Linux高手不是那么容易,所以我们这次用Windows测试实际上也是实验一下,其实我们Windows和Linux全部都测过。当然美国人如果再弄什么黑屏,那我们基本可以扔出去,无所谓,而且卖的太贵没有人买。
记者:曙光6000会不会采用龙芯?性能在什么水平?
厉军:这个问题可以说从根本上不成立,曙光5000A只是一个平台,它可以用AMD的处理器,可以用英特尔的处理器,可以用龙芯的处理器,可以用Linux操作系统,可以用Windows操作系统,可以任意组合。而且卖出去的曙光5000A有可能有三片四路的AMD结点刀片,有20片英特尔的刀片,还有150片龙芯的刀片。比如做IO英特尔做的比较好,现在看四路处理器AMD的会好。当然,龙芯性能不比他们好但耗电比它低多了,也比它们便宜许多。所以给大家非常明确的说法,曙光5000A不是使用AMD处理器,也不是使用英特尔处理器,也不是使用龙芯的,而是曙光5000A是由这些东西共用这些平台,所以第二点就是我们随着龙芯三的开发进程,很快会推出一个支持曙光5000的龙芯结点,龙芯刀片。
记者:曙光在发展壮大自己的业务的同时,已经承担了国家的重任,十一五计划曙光也承担一系列重任,您能详细介绍一下么?
厉军:很显然,千万亿次一定是曙光下一步目标,我们一直都在赶超。我想未来代号为6000的一定是新架构的机器,围绕曙光6000应该还有一系列的研发任务,其中也包括高性能处理器、高性能交换芯片、更好的散热设计,包括专门的应用软件的移植优化,我们将会投入更多的力量,因为应用软件是限制高性能计算发展的瓶颈。