蓝鲸集群存储系统是中国科学院计算技术研究所自主研发的科研成果之一,是由中国科学院计算技术研究所国家高性能计算机工程技术研究中心于2001年开始研究与开发的、基于IP的新型网络存储系统。蓝鲸集群存储系统的研究先后得到国家863、973等国家重点科技计划,以及国家自然科学基金、科学院百人计划等的持续支持。由于蓝鲸存储研发技术的领先性和应用技术的广泛性,在国家863系统主题项目和863软件重大专项项目验收时,863专家组给蓝鲸集群存储系统的验收评价为:“本系统采用集中式决策、分布式处理的总体设计原则,在体系结构、负载平衡、机群管理、数据管理、映射策略、高速互连网络、存储设备、硬件监控、虚拟存储模型等关键技术方面取得了进展,具有特色和创新;技术路线先进;该项目的完成情况被国家评为AB级。”
蓝鲸集群存储系统是一个跨平台共享、可扩展的大型海量分布式文件系统。本系统在底层互连技术上基于成熟的千兆及发展中的万兆以太网技术,通过采用可扩展体系结构、数据带外传输、LazyBinding、分层资源管理等多项专利技术;其系统架构上则采用了SAN的直连模式,控制流与数据流分开,数据采用“带外传输”模式,应用节点以块级方式对存储集群进行直接访问,是IP SAN架构的一种实现,可有效解决高性能计算环境中存储系统性能瓶颈的问题。它提供全局文件管理,应用节点的数据存储和管理像NAS一样方便,所以,本系统不但具备和SAN一样良好的扩展性,同时还可以以多个IP/IB通路聚合的方式,提供更平稳的高带宽。蓝鲸集群存储系统是目前唯一一款完全自主知识产权的国产集群文件系统产品,其性能达到甚至超过一些国外同类产品水平。
蓝鲸集群存储系统体系结构图如下所示:

蓝鲸集群存储系统结构示意图
蓝鲸集群存储系统在结构上的革新,结合对用户环境良好的兼容性、高性能计算环境下的文件共享、简化的管理方式以及性能和容量上的灵活扩展,确保了用户在不改变原有应用框架和使用习惯的基础上,获得全新的应用体验。
到目前为止,经过产品化后的蓝鲸集群存储系统的应用领域已覆盖到国防领域、军方领域、地球物理、电子政务、遥感领域、高教领域、数据中心、科学研究、信息服务、广播电视、平安城市等一系列高速增长的信息领域。具体应用形式包括数字风洞试验、勘探数据处理、政府政务网站、卫星图像处理、Email和Web服务、数字图书馆、广电非线编、奥运场馆视频监控等各种应用。在这些应用中,蓝鲸集群存储系统充分发挥了其重要特性,实现了数据集中存储的同时,大大缩短了用户完成数据处理所需的时间。在数据密集型高性能计算领域,采用蓝鲸存储技术后,计算效率被提高了4倍以上。
与此同时,蓝鲸存储技术的研制成功和蓝鲸集群存储系统的实际应用也引起了国内外同行的关注。在对首个国内存储产品进行的应用案例分析报告(China Research Lab Case Study Shows Benefits of ’Homegrown’ Advanced Technology)中,Gartner Group提到:“PGRI(新疆油田公司勘探开发研究院地球物理研究所)用户非常满意蓝鲸集群存储的使用。它有效地解决了系统性能瓶颈问题,并已稳定地工作一年。PGRI现在使用蓝鲸集群存储系统支持4个主要的计算工作,甚至可支持4个工作同时运行。到目前为止,蓝鲸集群存储系统还未遇到任何系统性能瓶颈问题。”这是对蓝鲸集群存储系统及其技术的极大肯定。