【独家特稿】本文是EMC存储专家罗建在2006教育信息存储大会上的发言,本次大会由51CTO独家直播。
直播页面:/eXP/zhibo/
我下面介绍的内容是把存储变得更加简单。这是我中心的话题。 假如不做简单,我想在座的朋友们,老师们,也没有时间去研究这一个SAN里面的通道怎么样传输,怎么样连接,要装什么软件和硬件,现在信息系统遍布校园各处,怎么样把信息连接起来,形成真正的信息共享,这么大的一个任务我觉得是靠几个人是很难完全的工作。
要把存储做得简单,首先大家要知道,信息的存储,他要走向一个网络化,走向网络化是我们必然之路。
我们知道,在我们读大学的时候,当时的计算机只有计算机中心有,大家到大型机上上机。现在读书的大学生条件很优势了,很多家长给买笔记本,在寝室里面自己可以用计算机。
说明了一个什么问题呢,信息技术从一种集中化走到分布化了,大家要共享信息采取什么方式呢,90年代初,出了一个IP网络。它把成千成万计算机联到一个共同网络环境里面去,可以形成网络化的共享,大家肯定会想到这样一个问题了,怎么样变得轻松轻易呢。 这么多服务器到英特尔上来,现在存在一个问题,服务器的东西怎么样共享呢?它的服务器后面的内容越来越多之后,就要放到存储里面了,而不是放在服务器里面了。就把磁盘放到一个专门的治理磁盘的计算机。我们今天在国内叫海量存储。海量存储更加严格地说是一个阵列,把里面几百个甚至上千个独立的磁盘放在里面,它专门来治理,这就是所说的海量存储了。所有磁盘治理工作和信息治理工作都是海量存储的系统来完成的。所以这是一个由软件、应用来做的。
刚才谈了服务器有这么多内容需要共享,内容多了之后,别的服务器怎么样来共享呢?课题就出来了。
把这么多分散的服务器都连接起来,但服务器要访问这一些内容,就形成了共享平台了,这就是存储网络诞生的背景。
现在存储网络连接的协议不像服务器跟前端、客户端的连接。服务器要很快获得存储的信息,要很快的速度。但是呢,为了把现在的IP很好的用起来,又想了一个招,把这一些用因特而连接起来,这就是大家听到的IP存储,现在已经开始在使用了。现在要建立一个网络存储,不是一定要去买交换机的。因为我们在学校里面的应用,对性能不是很高,实际上也是可以用现在的IP的,用IP把服务器存储联起来,用现有的资源联起来。 现在既有光纤连接,又有IP连接,信息孤岛又出来了,现在我们把IP连接起来的存储和SAN联起来,不要出现信息孤岛。
第一,为什么要把存储变得简单?这是一个概述。说明了我们的网络的连接太复杂了。我们要解决他们共性的问题。什么是共性的问题,大家都有一个问题:
1、存储的容量。
2、可扩展的能力。
3、数据备份的问题。
4、信息怎么样归档。
5、怎么样做的容量。
这是常用信息存储当中碰到四大问题。围绕这四大问题,我们推出了解决方案。
一,怎么样把信息存储整合,包括了SAN,还有内置型磁盘,有各式各样的方式,怎么样连接起来,让服务器形成一个统一的网络的环境。
我们的解决之道是什么呢,假如你性能要求比较地高,我建议你们还要用光纤,它是一个直接的带宽的独享,你的性能能够得到保证。大家看到我们EMC的产品会面带一个I,说明我们是支持IP支持的。 大家知道,用IP连接起来了,我们不要额外地投资,我们不要去买非凡的交换机,它的条件就是要前端一定只有Windows和Linux。假如你过来IP的,我通过IP来解决,假如你是光纤的,我通过光线来解决。这就是我刚才谈的把不同网络协议整合起来。
什么样的情况下,我会去用我们的NAS呢,是专用文件服务器,而我们谈的存储是解决块的图形,大家常用的数据库,数据库这一种应用,一般都是用我们的直联。让文件系统这一种数据以流的方式来治理。所以用我们的NAS。还有现在一种存储,是什么样的存储呢,是基于对象的存储,有一些数据格式不统一,比如说,有人介绍材料和图片,还有一些医疗的介绍,还有各种照相,它的画面不可以用数据来描述的,也不可以用文件系统来治理,现在人们解决之道就是用对象来描述它。所以第三种是机遇而的对象的存储。 你要治理你的数据,首先你要知道你的数据是什么样的格式,假如是以块来访问的格式,你的数据库是支持块图写的存储,用SAN,假如对象是文件来治理,你就用NAS,还有一种,你不可以用块也不可以用文件来治理的,就用对象。
第二个层面,把存储整合合起来之后里面的第二个难题是什么呢,把这一些数据很好的备份和恢复,现在既有基于磁带的备份也有磁盘的备份。
第三个难题是怎么样归档。有一些信息数据不是很频繁,我要放在廉价的存储里面去,我把它归档起来,我需要的时候,偶然地查询它。
第四,他们的共性是保护。 围绕四个层面,我们相对应的有四个不同的解决方案出来。让它变得简单,怎么样变得简单呢,大家也可以看到,在这一个图上面有很多服务器,自己有内置式磁盘,通过IP等等可以共享空间了。现在的网络连接,刚才也已经介绍了,有SAN,有IP、有NAS,还有一种基于IP,但是治理的是对象。
在一个局域网里面,假如我既有文件系统,又有数据库,我可以用一个既支持文件系统和数据库的存储来共享。另外一个,大家可以看得到,现在有很多文件系统服务器,我相信你们回去,在图书馆也好,还是在一些科室有很多通用的文件系统,他做的工作既有电子邮件,也有打印,也有一些文件治理等等,这一些利用率非常低,可以放在专门地服务器里面。 里面任何一种需求,在存储整合里面,我们有对应的软件和硬件和服务。让你们得到一个打包的解决方案。比如说,你是没有网络,但是我要去做我的存储整合,我10个、8个服务器联起来,这是我们的一个存储产品,加上你们的软件,加上你的服务,把所有服务器连接起来。
二,我连接的距离比较地远,超过20、50、100米,甚至几公里,我们是基于光纤的连接。
我们现在最远的距离在我们实践当中到100多公里,就是服务器跟存储的连接,也是可以完全保证性能的。假如你的需求是专门对文件系统的整合,也就是说我们的NAS产品,加上你们的软件,加上我们的服务。打包可以帮客户解决问题。
第二个难题刚才说了,就是备份和恢复,我们有小规模的备份和大规模的备份,我们有硬件和软件,硬件是根据他的容量,软件是根据他的性能,服务是根据你的要求的服务的水平。你说服务水平要求很高,比如说,像核心的区域里面,做到7乘24,我们有相应服务的提供。还有一些在图书馆里面,停10分钟也不碍事,对这一些服务相对来说比较地低。你自己都可以做这一种服务。它的产品也相应的有中低、高。我们介绍入门级,比较地简单。
入门级就是大量的桌面级,台式机也好,笔记本也好,如何把他们统一的做备份呢,这就是我们的一个软件。这一个软件可以小到自己去作备份,大到几百个桌面机集中化的备份。备份到我们磁盘系统里面来。中规模上来了,我们也有对应的产品,他可以备份到上面来,把你的数据按照你备份的规则或者说是时间的限制,它去完全一个备份,自动化地实现。再往高走,我的备份不要影响我业务的性能。比如说,我们正在做基因的连使得重合的组合,计算量非常地大,我要做备份,不要影响我的性能,可以加一个软件,把数据存储到另外一个区域,在区域里面通过通道的去完全备份。
现在有一种方式,就是备份而不是磁带而是磁盘,因为磁带有几个局面性。
第一,磁带介质轻易发生质变,比如说它的温度和湿度、磁场的情况,你读的时候会有错误。比如说,过了几年,你再听磁带,它的音质比较地差。我们客户要过几年要重新翻一下,看有没有问题,假如有问题,要马上换磁带。现在换磁盘,以前它的价格比较地贵,而且价格也是差不多了。而且磁盘是在一个真空的实体里面,它的盘片不会受到影响,所以他的时间保留是非常长的,再加上磁带坏了就不能用,而我们磁盘是可以修复的,有一个地方坏了,它还可以一样的工作。即使坏了,客户也是感觉不出来,只是觉得慢了一点了。
两个T的存储,对我们现在的存储来说是非常非常小的容量了,我们大可以达到3个T了,最小的价位是在两三万人民币左右。最大可以到3百万美元。因为大家知道,存储是专用的计算机,里面越大,它的CPU越大,它的功能越强,他实际上就是一个大型的并行的计算机,所以就非常的昂贵了。 你假如要备份数据,有两种磁盘。可见信息容量的增长和信息的密度同步在发展。像这样的,假如容量很大,你有上十个TB的备份,可以备份到这儿来。对这一类的存储,假如你再加上一些软件,使它的备份不受到影响。
现在还有一种方式,把备份恢复跟归档形成一体,备份跟归档是不一样的。 第三个我要介绍的是,在归档功能当中,大家要一些什么样的问题?
只要做了备份恢复了,你同时要考虑的问题是要归档,为什么要做归档呢,现在很多个人电脑里面,你现在看到,40GB、80GB、100GB觉得很便宜,我都放在里面,实际上你看到很多内容很少去访问,比如说3、4年你出去玩的时候,数码相机的图片,你放在自己电脑里面了,里面也有一些电影,已经看过了。把里面的空间是占用了。你的性能是下降了,个人是这样的情况,到了一个学校一个单位一个团体就成大问题了。你买了那么多昂贵存储系统,真正有效访问是占20%,这是业内的统计。70、80%的内容是很少访问的。你不如把它拿走啊。就像房间里面堆了那么多椅子,你要跳舞,能够跳吗。把椅子搬出去,舞场就出去。现在的人们看不到信息里面的东西,凡是什么样的东西都往里面放实际上放了很多垃圾在里面,也可能不是垃圾,利用率比较地低,但是可能需要随时地查。比如说图书馆里面的资料,平时很少有人看,但是人们一查查不到就着急了。现在想到了一个