网格计算网罗一切
错过了传统因特网起步的头班车,失去了万维网发展的最好契机,而今,我们又面对着网格计算的新机遇,中国科技界何去何从?
4月4日、5日,由科技部主办的“网格战略研讨会”在北京召开,与会的专家学者、各行各业的用户纷纷道出了自己的心声……
如果一家老小计划去九寨沟游玩,提前要做的准备工作有很多,其中包括交通方式、景点选择、天气状况、日程安排、住宿条件等众多因素。如果准备工作不够周密,出现了始料不及的情况,那么长时间精心策划的旅游就可能“泡汤”。
如果网格成为现实,这一切准备工作都成为举手之劳:打开自己的智能终端、提出自己的需求,由于网格能把以上提到的诸多方面的服务连接在一起、形成服务网格,所有一切信息和计划安排就都会立刻呈现在眼前,一站式服务几乎可以解决所有难题。用户只需要交付足够的服务费用,就可以享受网格技术带来的益处。
这是从前人们对未来的设想。换句话说,很长时间以来,人们眼中的网格,仍然是高不可攀的未来技术,网格概念远未融入现实生活。
在4月4日、5日,由科技部主办的“网格战略研讨会”上,我们感受到网格平易近人的另一面。
在热烈的气氛中,遥远的“九寨沟网格”走下云端,一时间网格成为广大行业领域的应用“热门”。
难怪,中科院计算所所长李国杰院士也说:“这是一次应用的大会”。
与以往不同,本次由科技部主办的研讨会首先请了几十位国内各行各业的应用领域专家,介绍自己领域内网格技术的应用,以及将来对网格技术提出的需求。这些应用领域专家的演讲使得整个会场气氛达到高潮,主持人不断接到更多应用领域专家的要求,都希望能得到讲话的机会,和大家一起分享自己在网格技术应用过程中的经验、成功因素和接下来的技术需求。
应用推动网格
众多应用领域专家的演讲,把网格从高深技术的层面拉回到人们身边,让大家对网格技术的应用有了更感性的认识。
华大基因研究中心的汪健博士介绍说,在生物医药方面,网格技术主要有以下两种作用:首先,在高性能计算方面,网格技术用来进行科技数据的计算。在分析水稻的基因时,单纯用多台计算机进行计算的情况下预计3万小时的工作量,在网格技术的帮助下,只要400个小时就能完成。华大基因研究中心之所以能取得最终的研究成果,全世界同仁帮了大忙,网格也帮了大忙。
其次,生物科技对数据的存储和管理有相当高的要求,网格技术在这里帮了大忙。汪健表示,生物数据非常复杂,包括物体本身、细胞、染色体、DNA、单个细胞的循环等各个方面的信息,层次多且类型杂。这样,数据库的整合就成为关键问题。比如说,在研究水稻的蛋白结构时,可能会用到基因数据库、蛋白质数据库、基因表达数据库和蛋白质相互作用的数据库,在这种情况下,应用网格技术,能在较短时间内把需要的数据从不同的数据库中挑出来综合在一起,省去了多次访问不同数据库的烦恼。国际上已经有了一些成功的网格应用例子,在欧洲,最大的网格系统中最重要的一块就是生物网格。华大不久前发布了水稻的数据库,从发布到现在的两个多月内,已经有21个国家、2万多个用户,进行了多达4000次的下载。网格技术在生物医药领域的重要作用可见一斑。
除了成功的例子,有些应用领域的专家也特别提出了对网格技术的需求。比如在航空业,中国航空工业第二集团公司科学技术委员会副主任崔德刚表示,现在主要受两个问题的困扰。首先是海量计算的困扰。在电脑上进行飞机设计的时候,所有的零件,包括最小的螺丝钉,都是三维的,这样,最后的飞机模型,数据量大概会达到2GB到5GB。在电脑上进行预装的时候,这样一个庞大的数据量,运算相当复杂,有时候只要飞机换一个角度,计算机就要花上三五分钟的时间。如果能利用网格技术,解决海量计算的难点,会让整个设计速度加快数倍,从而让航空业的发展向前跨越一大步。
接下来是计算机利用率的问题。许多企业每年在信息技术方面的投入都很巨大,但是仍然不能满足工作的需要。在设计单位,一般都需要具备300台到500台计算机,但是在高峰期,即便500台电脑也远远不够用;而一旦设计结束,大量的电脑又会闲置无用。事实上,我们现在还是用网络技术,而不是网格技术,没有实现资源层面的共享,只有信息的传输。因而,大家都对网格翘首以待。
中科院计算所副所长徐志伟博士总结各个应用领域专家的发言时说,“有很多应用领域的专家这样问,到底网格是一种很遥远的理想,十多年后才能实现;还是说,现在我们正在应用网格技术?我觉得,对于企业而言,网格系统实际上并不遥远,它已经有了相当扎实的技术基础,现在很多资源上都有网格系统在运行,根据以往经验,国内很多行业对网格有切实的需求,这样科研就具备一定的工作基础。在生物和国家天文台这样比较单纯的科研机构,网格技术已经在用。”他预计,在最近的两三年内,就能看到更多的网格技术应用案例。
此外,徐志伟还提出另一种看法:重新考虑整个网格的客户端和服务端,把服务端整个看作一个整体的网格,由利益共享的资源组成。比如说,资源分布在北京、上海、广州和成都四个地方。在这样一个整体的网格中,服务端包括服务器、高性能计算机;包括航天和航空系统提出的仿生系统、仿生器以及上面连在一起的高级设备;包括虚拟天文台和国家天文台的高倍数望远镜;在数据和信息这方面,包括各式各样的国土资源信息、环保信息、劳动和社会保障信息,以及一些包括重工业、税务、企业管理等方面的信息库和数据库。在客户端可以使用各式各样微机或者PC等移动或固定设备。“目前国内很多大用户都反映,这样一个模式在市场上有很大的需求。”
目前国内网格技术的应用呈现出两个特点:首先,中国的市场上有很多行业已经在使用网格的相关应用和技术,只是没有使用网格计算这样一个名称,这种网格技术是根据过去十几年信息化经验总结出来的;其次,像我们的制造业的网络化虚拟制造环境,还有像电子政务和电子商务里面的一站式服务等,这些东西,跟网格的思想同出一辙,只不过是用了不同的名词,这些也是从各自的实际需求中总结出来的。所以,应用的网格其实就在我们身边。
对此,中科院计算所所长李国杰院士也表示,网格计算一定要和实际应用相结合。他说:“我常常是企业和科技研究院所各打五十大板,但科研院所可能应该对研究与实际相脱离的现状负更多责任。这段时间以来,863计划的成果在企业里面并没有发挥太大的作用,这是我深感悲哀的一件事。”因此,随着网格战略越来越快的前进步伐,863计划要在更实在的应用上进行规划,了解清楚现在国内有哪些方面对网格服务有需求,进行总结,让应用推动技术的发展。他指出,863计划不是要制造出一个超级计算机,供大家使用,而是要“制造一种环境”,让科研院所的研究都放在需求最大的技术开发工作上。这也是本次大会邀请众多应用领域专家做演讲的初衷。
冲击无处不在
除了网格战略向应用靠拢之外,网格计算对思维方式的冲击是本次大会另一个亮点。对于网格计算的含义,研讨会主持人在开幕词中这样说:“常常有人会问,网格是一种思想,还是一个概念?是解决问题的一种思路,还是一种方案?是一种新技术,还是一类产品?我觉得答案都是肯定的。”仔细分析应用领域专家的发言,可以发现,在网格战略面前,人们的思维模式和应用模式都在发生变化。
按照应用模式划分,网格计算可以分出很多不同的类型。徐志伟表示,在计算网格和数据网格这两类中,国内的研究工作开始得比较早,不少领域都有应用需求和实际案例,从航空航天的网络化、区域化和仿生、制药之类的研究,到国家天文台这种高层应用,都与计算网格和数据网格联系紧密,制造业、建筑业、科学研究和生物信息等领域应用较多,这些领域中的网格技术的应用可能会较早实现;在信息网格和知识网格的层面上,本次大会也请到了包括企业信息系统、电子政务和数字图书馆等方面的应用领域专家,共同分享网格技术的实际应用和前景,这个层面的网格计算主要涉足商业运作和企业信息化方面。
从制造业的角度看,网格技术对如何应用提出新的要求,需要新的思维模式来适应:第一,增强互操作性,即国内的信息企业利用全球的生产体系,平行开发出新产品,以适应市场的需求。这种动态联盟的企业,可以通过下一代互联网连接起来,建立一个全球的网络信息体系,从而方便快捷地获取所需的技术。第二,丰富Web服务中的交互模型。通过提供企业最需要的各种交互模型,把Web服务扩展到更广泛的商业运用中。第三,完善产品协同服务,企业计算模式走向集成的、多层次的分布系统,实现各类服务组件跨地域、跨企业的动态实践过程。
在仿生技术的研究中,网格同样能带来应用模式上的革命。通过网格技术,可以提供一个实用的、功能详细的仿生系统,用来复制仿生工具、仿生应用系统,这样,就需要一个仿生开发平台,开发过程中,要有一个仿生器和一个协同仿生团队。从这个角度看,网格技术的出现使整个仿生技术的研究找到新的、更加快捷的途径。
对劳动保障的网络建设而言,网格技术让很多人改变了从前惯有的思路。劳动保障部信息中心劳动力市场处处长胡伟伟指出,劳动保障部门原来的系统,很难适应政策的调整,其中最根本的问题就是,软件维护的成本太大。与大多数行业不同,国家在保险方面的政策始终处于调整状态,这就要求软件也要不断地跟上来,这样一来,旧的软件基本上丧失利用价值、导致大量投资“打了水漂”,而更新软件的成本又越来越高,“总是扔掉旧的买新的,使得我们不得不考虑另一种应用模式”。胡伟伟表示,网格技术是解决这个问题的最佳途径,现在劳动保障部正在和有关专家讨论解决方案。
中国测绘科学研究院院长林宗坚教授提出“数字地球”概念,实际上是网格技术对人们思维模式的又一冲击。他解释说,“数字地球”就是把地球上一切与地理位置有关的信息,用数字的形式进行描述,然后通过网络形成丰富的资源,从而为全社会服务。网格信息处理框架是实现“数字地球”的关键。他表示,现在人们获取数据的方式已经有了很大改进,无论从空中、地面还是水下,感知手段都有进步。在数据越来越多的同时,如何处理数据成为难题。大量的数据需要迅速处理才能得到应用,同时又要最大可能避免由于观测方法、使用仪器和环境差异带来的误差。在关键数据变成关键模式的过程中,需要大量、迅速的计算,技术上的工作量相当大。在这种情况下,网格技术成为实现这种新的思维方式的最佳工具。
针对网格在铁路运营中的应用,铁道部电子计算机中心网管中心李毓才时指出,通过网格技术的发展,铁道部看到了未来的发展契机。他表示,铁路的信息技术建设是一个庞大的信息工程,涉及铁路的方方面面,只有协同工作,才能保证列车的正常运转。随着网格技术的发展,铁路网络中的综合网和服务网的功能和作用都会得到全面提高,到时候整个系统会做出调整,分出骨干网和基础网络。这样,所有的服务,除了重要的数据库,都可以放在骨干网上。在客户提出请求或查询时,网络会自动处理数据,把信息安装到客户登录的节点上,从而使得铁路服务更加完善。
目前互联网上的内容每天都在飞速增长,不可能有哪个单一的服务器或者搜索引擎能掌握所有资源。美国国家科学基金会张晓东博士介绍说,现在每年互联网都会增加2×1018字节的内容,但大概只有3×1012字节能为公众所用,相当于总量的0.00015%,即便是Google这种功能强大的搜索引擎也只能查找1.3×108字节的内容。而网格技术得到充分应用后,能大大提高互联网的资源利用率。
网格技术能带来这么多变革,它有些什么样的技术特点?首先,网格能够提供资源共享,它能消除信息孤岛、实现应用程序的互连互通。网格与计算机网络不同,计算机网络实现的是一种硬件的连通,而网格能实现应用层面的连通。其次,网格第二个特点是协同工作,很多网格结点可以共同处理一个项目。第三,网格是基于国际的开放技术标准,这跟以前很多行业、部门或者公司推出的软件产品不一样。最后,网格可以提供动态的服务,能够适应变化。
标准创造机会
由于错过了参与互联网前两次浪潮,即Internet和Web的时机,我国的计算机产业在总体上落后于西方国家。目前,国际科技界正酝酿着第三次浪潮——网格,这是一个不可多得的机遇。徐志伟指出,根据Internet和Web发展的历史,网格的重要技术标准可能在2004~2005年时段出现,而这个技术将主导2004~2020年的信息技术领域发展趋势。
没有标准,就难以竞争,但是我国在技术标准文档的制定方面,远远落后于西方国家。徐志伟指出,在因特网发展的32年历史中,出现了3180个技术标准文档(RFC)。我国科技界仅参与了一个技术标准文档的制定,那就是1996年3月(因特网第一个标准制定27年后,TCP/IP协议制定22年后),胡道元教授牵头制定的中文字符编码标准(RFC 1922)。万维网(Web)发展至今也近12年了,出现了46个技术标准,我国参与制定的技术标准还一个也没有。徐志伟说:“我们不希望看到,在2005年或2010年的时候,国际科技界制定的网格技术标准中,还是没有我国科技界的参与。”
面对即将到来的第三代互联网应用浪潮,很多发达国家都投入了大量研究资金,希望能抓住机遇,掌握未来的命运。美国的“全球信息网格”和英国的“英国国家网格”等,都是雄心勃勃的网格战略。
我国也在加强网格研究方面的投入,科技部有关人士透露,科技部将通过863计划“高性能计算”专项的形式,在“十五”期间支持网格的研究和应用工作,专项专家组将在近期成立。
互联网的三次浪潮
因特网(internet)
万维网(web)
网格(grid)
第一个研究原型
1969.10.1
1980-1989
1998
第一个可用原型
1970
1990.12
1999
第一个标准
1969.4(imp)
1974.5(tcp/ip)
1994.6(uri)1996.5(http)
还没有
现在标准总数
3180个rfc
46
11个工作组9个研究组
中国参与标准
1(1996.3)
0
还没有
中科院计算所为自己的网格研究命名为“织女星网格”(Vega Grid),这个网格项目的目标是具备以下几种能力:大规模的数据处理能力、高性能计算能力,以及具备资源共享和提高资源利用率的能力。
与国内外其它网格研究项目相比,“织女星网格”的最大特点是“服务网格”(Service Grid)的概念。而服务网格有三个要点:第一,它是一种通用网格,不只是支持科学计算,还支持其它服务,包括通信服务、数据服务、信息服务、计算服务、交易服务等等;第二,服务是基本的应用模式,即客户端向网络发出服务请示,网格完成服务,并将结果通知客户端;第三,网格的主要评价标准不单纯是计算速度等传统指标,而是类似“服务等级协议”(Service Level Agreement)这样的一套用户满意度或服务质量评价标准。
李国杰
中科院计算所所长李国杰院士指出,网格计算的未来在于它与实际应用相结合,国家863计划正着手进行此方面的规划。
一个都不会少
与网格技术研究热潮相对应,众多IT跨国巨头跃跃欲试,纷纷公布自己以研究网格相关商业产品为核心的网格计划。
IBM公司曾经宣布一项40亿美元的投资计划,在全球建立40家数据中心,并将它们组成一个实验网,用来研究和发展网格计算。IBM表示,新兴的网格计算领域是公司新任CEO帕尔米萨诺力推的关键计算战略之一。
今年4月10日,惠普宣布,惠普将提供Utility Data Center(UDC),希望能借此增加网格计算在商业应用领域中的作用。将UDC与网格连接后,惠普能在技术计算和商业计算两方面提供更加安全、灵活的计算环境,从而使网格技术的应用步伐变得更快。
Sun在不久前发布了其企业版网格引擎软件,并与在分布式计算领域中享有极高声誉的开放源代码软件标准组织Globus组建联盟。
日本的NTT Data计划与Intel和SGI联合进行一项为期三个月的网格计算试验,届时将有包括家庭、企业和学术机构在内的100万台计算机相联,其总处理能力将比现有的最快超级计算机还要快5倍。
……
国际IT巨头抢滩网格战略“制空权”的战役已经打响,面对具有如此巨大潜力的市场机遇,我们认为国内科研界与企业应充分联合起来,在网络的世界里,争到我们的一片天!
名词解释
什么是网格?
中国科学院计算所所长李国杰院士认为,网格是继传统因特网、Web之后的第三次互联网浪潮,可以称之为第三代因特网应用。传统因特网实现了计算机硬件的连通,Web实现了网页的连通,而网格则试图实现互联网上所有资源的全面连通,其中包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。
简单地讲,网格是把整个因特网整合成一台巨大的超级计算机,实现各种资源的全面共享。当然,网格并不一定非要这么大,也可以构造地区性的网格,如中关村科技园区网格、企事业内部网格、局域网网格,甚至家庭网格和个人网格等等。网格的根本特征不是它的规模,而是资源共享,消除资源孤岛。
最“正统”的网格研究起源于美国政府过去十年来资助的高性能计算科研项目。这类研究的目标是将跨地域的多台高性能计算机、大型数据库、贵重科研设备(电子显微镜、雷达阵列、粒子加速器、天文望远镜等等)、通信设备、可视化设备和各种传感器等整合成一个巨大的超级计算机系统,支持科学计算和科学研究。这方面的代表性研究工作包括美国国家科学基金会资助的NPACI、“国家技术网格”(NTG)、分布式万亿次级计算设施(DTF),美国能源部的ASCI Grid,以及欧盟的Data Grid等。
作为一种新技术,目前研究人员对网格研究重点和内容的认识也不尽相同。有人把网格看成是未来互联网技术,称之为“下一代因特网”、“Internet2”、“下一代Web”等;还有一类研究的侧重点是智能信息处理,它关注的是如何消除信息孤岛和知识孤岛,实现信息资源和知识资源的智能共享,常见的名词包括语义网(Semantic Web)、知识管理(Knowledge Management)、知识本体(Ontology)、智能主体(Agents)、信息网格、知识网格、一体化智能信息平台等;企业界的研究则大多集中尽量利用现有的Internet/Web技术,将因特网上的资源整合成一台超级服务器,有效地提供内容服务、计算服务、存储服务、交易服务等,内容分发(Contents Delivery)、服务分发(Service Delivery)、电子服务(e-service)、实时企业计算(Real-Time Enterprise Computing,简称RTEC)、分布式计算、Peer-to-Peer Computing、万维网服务(Web Services)等名词都属于这一范畴。
企业界的网格相关研究开发工作中,最重要的就是Web服务。目前,一些业界巨头已经就几个底层标准协议达成了共识,包括XML、SOAP、WSDL、UDDI等。与“正统”的网格研究不同,Web服务的重点是产品开发,其相关产品可望在今明两年在市场上开始普及。
专家访谈
网格带来新机遇
——访中科院计算所副所长徐志伟博士
记者:网格与因特网和万维网(Web)的关系是什么?它是否会替代因特网和Web?
徐志伟:首先,网格是建立在因特网和Web基础上的,不会替代它们。因特网的出现,将独立的计算机个体联成网络,但是,它没办法共享其它机器的资源。Web兴起,通过网页的方式连接起来,计算机可以做包括电子商务在内的更多事情。但是,各行业在应用层面上的互联互通远远没有实现,计算机的使用也远不如电话这么方便。而网格将能实现应用层面上的互联互通,即用户使用层面上的互联互通。其次,网格可以实现全面的资源共享。第三,网格采用的是国际标准,标准化意味着,网格可以使接入设备像电话一样易用。
记者:网格技术应用带给IT企业的机会是什么?
徐志伟:首先是计算平台和技术会发生变化。目前的微机和网络的运行主要基于微软的操作系统、Intel的芯片、思科的网络设备。网格的应用会改变计算平台,带动网络界面发展。这是一个新的计算平台。平台使用模式改变了,平台也改变了,就会涌现大量的新产品和各种利用这些技术提供的各类服务的新模式,包括新的技术模式和商业模式。其次,基于国际开放的标准,将给我们带来发展的机会。与以前发展不一样,出现垄断的概率降低了。但是,我们也不能太过乐观,目前很多国外大企业正在做准备,要抢占市场先机。网格这个市场可能还有很多层面是我们目前还没有看到、想到的。
记者:我国网格技术的发展道路应该怎么走?
徐志伟:我们国家在应用、管理和基础设施建设层面上,与国外有很大差异,进行网格研究会有一些新的需求。我们曾经咨询过国际上的网格领域的专家,他们给我们的建议是:第一,网络和电脑是基础建设,要努力完善基础建设;第二,做好高性能的计算机和超级服务器,这是必备的计算和存储的能力;第三,与应用领域的专家联合起来,尤其是像计算方面、各行业信息系统管理部门以及应用系统方面的专家联合起来,共同开发;第四,搞好社会工程,即必要的宣传教育和人才培养工作。网格研究不是某一领域的事情,是跨领域的事业。
记者:计算所为什么提出以应用推动网格发展?
徐志伟:国外在网格研究方面的投入都不小。我国要想在这个领域不落后,就需要有自己特有的东西。首先要有自己的技术创新。既根据电脑技术发展的趋势来创新,更以中国市场需求为依据来创新。要研究如何用网格技术解决国家的科技问题、国民经济问题和社会发展问题,这应该是我们的方向。所以,从一开始,我们在网格研究的定位上就跟国外不一样。国外的网格研究是做科学计算的网格,我们则是从服务网格着手。
记者:计算所“织女星网格”项目的特性在哪里?
徐志伟:中科院计算所的网格研究工作统称为“织女星网格”,它不像某些公司那样以开发某种专业产品为目的,而是把网格做成像因特网和Web一样的开放性产品,使用并参与国际标准制定,不另搞一套体系。我们要做的创新工作,在符合我国国情的同时,又必须融入国际标准。
记者:在网格的商业性应用研究和标准研究上,应该更重视哪个?
徐志伟:两个一定要齐头并进。我们希望参与到网格的国际标准制定中去。网格标准目前是采用因特网式的开放原则,研究者把研究的成果展示给国际同行,供大家讨论,进行改善,然后大家一起应用。但我们做网格研究时,又必须以开发出自己的系统、投入应用为基础。