摘要:
本文论述了Java容器类库的产生、变化与发展,然而并没有具体讲解怎么使用这些类库,试图从其发展与变化的历史中帮助Java学习者把握Java的容器类库。另外在本篇最后会讨论在即将发布的代号为Tiger的J2SE1.5中加入的新特性之一:泛型,它将使容器的功能更加强大。
一、集合论引述
集合论是现代数学中重要的基础理论。它的概念和方法已经渗透到代数、拓扑和分析等许多数学分支以及物理学和质点力学等一些自然科学部门,为这些学科提供了奠基的方法,改变了这些学科的面貌。计算机科学作为一门现代科学因其与数学的缘源,自然其中的许多概念也来自数学,集合是其中之一。假如说集合论的产生给数学注入了新的生气与活力,那么计算机科学中的集合概念给程序员的生活也注入了新的生气与活力。
1、什么是集合
很难给集合下一个精确的定义,通常情况下,把具有相同性质的一类东西,汇聚成一个整体,就可以称为集合。比如,用Java编程的所有程序员,全体中国人等。通常集合有两种表示法,一种是列举法,比如集合A={1,2,3,4},另一种是性质描述法,比如集合B={X0<X<100且X属于整数}。集合论的奠基人康托尔在创建集合理论给出了许多公理和性质,这都成为后来集合在其它领域应用的基础,本文并不是讲述集合论的,所以假如你对集合论感爱好,可以参考相关书籍。
2、什么是集合框架
那么有了集合的概念,什么是集合框架呢?集合框架是为表示和操作集合而规定的一种统一的标准的体系结构。任何集合框架都包含三大块内容:对外的接口、接口的实现和对集合运算的算法。
接口:即表示集合的抽象数据类型。接口提供了让我们对集合中所表示的内容进行单独操作的可能。
实现:也就是集合框架中接口的具体实现。实际它们就是那些可复用的数据结构。
算法:在一个实现了某个集合框架中的接口的对象身上完成某种有用的计算的方法,例如查找、排序等。这些算法通常是多态的,因为相同的方法可以在同一个接口被多个类实现时有不同的表现。事实上,算法是可复用的函数。
假如你学过C++,那C++中的标准模版库(STL)你应该不生疏,它是众所周知的集合框架的绝好例子。
3、集合框架对我们编程有何助益
到底集合框架对我们编程有什么好处呢?
它减少了程序设计的辛劳。集合框架通过提供有用的数据结构和算法使你能集中注重力于你的程序的重要部分上,而不是为了让程序能正常运转而将注重力于低层设计上。通过这些在无关API之间的简易的互用性,使你免除了为改编对象或转换代码以便联合这些API而去写大量的代码。
它提高了程序速度和质量。集合框架通过提供对有用的数据结构和算法的高性能和高质量的实现使你的程序速度和质量得到提高。因为每个接口的实现是可互换的,所以你的程序可以很轻易的通过改变一个实现而进行调整。另外,你将可以从写你自己的数据结构的苦差事中解脱出来,从而有更多时间关注于程序其它部分的质量和性能。
减少去学习和使用新的API 的辛劳。许多API天生的有对集合的存储和获取。在过去,这样的API都有一些子API帮助操纵它的集合内容,因此在那些非凡的子API之间就会缺乏一致性,你也不得不从零开始学习,并且在使用时也很轻易犯错。而标准集合框架接口的出现使这个问题迎刃而解。
减少了设计新API的努力。设计者和实现者不用再在每次创建一种依靠于集合内容的API时重新设计,他们只要使用标准集合框架的接口即可。
集合框架鼓励软件的复用。对于遵照标准集合框架接口的新的数据结构天生即是可复用的。同样对于操作一个实现了这些接口的对象的算法也是如此。
有了这些优点,并通过合理的使用,它就会成为程序员的一种强大的工具。不过,从历史上来看,集合大多其结构相当复杂,也就给它们一个造成极不合理的学习曲线的坏名声。但是,希望Java2的集合框架能缩短你的学习曲线,从而快速把握它。
在许多高级语言中的数组其实也是集合的一种简单实现,比如C,C++,Pascal和Java。
数组保存着相同类型的多个值,它的长度在数组被创建时就固定下来,建立之后就无法改变。假如你需要一种大小能动态改变的存储结构,数组就不适合了,这时集合框架就有了用武之地了。
二、Java1.2之前的容器类库
其实在Java2之前,Java是没有完整的集合框架的。它只有一些简单的可以自扩展的容器类,比如Vector,Stack,Hashtable等。Vector中包含的元素可以通过一个整型的索引值取得,它的大小可以在添加或移除元素时自动增加或缩小。然而,Vector的设计却存在极多缺限(下面会说到)。Stack是一种后进先出(LIFO)的堆栈序列,学过数据结构的都会知道,它的重要特点是先放入的东西最后才能被取出。Hashtable与Java2中的Map类似,可以看成一种关联或映射数组,可以将两个或多个毫无关系的对象相关联,与数组不同的是它的大小可以动态变化。
Vector的操作很简单,通过addElement()加入一个对象,用elementAt()取出它,还可以查询当前所保存的对象的个数size();另外还有一个Enumeration类提供了连续操作Vector中元素的方法,这可以通过Vector中的elements()方法来获取一个Enumeration类的对象,可以用一个While循环来遍历其中的元素。用hasMoreElements()检查其中是否还有更多的元素。用nextElement()获得下一个元素。Enumeration的用意在于使你能完全不用理会你要遍历的容器的基础结构,只关注你的遍历方法,这也就使得遍历方法的重用成为可能。由于这种思想的强大功能,所以在Java2中被保留下来,不过具体实现,方法名和内部算法都改变了,这就是Java2中的Iterator以及ListIterator类。然而Enumeration的功能却十分有限,比如只能朝一个方向进行,只能读取而不能更改等。
另一个单元素容器是Stack,它最常用的操作便是压入和弹出,最后压入的元素最先被弹出。你可以想象一个只上面开口的书箱,最后放进去的书一定是最先被拿到,而最先放进去的只有在全部书拿出后才能取出,这种特性被称为后进先出(LIFO)。在Java中Stack的的用法也很简单,有push()压入一个元素,用pop()弹出一个元素。然而它的设计却无法让人理解,Stack继续了Vector而不用Vector作为其中一个元素类型来实现其功能,这样造成的结果是Stack也拥有Vector的行为,也就是说你可以把Stack当作一个Vector来用,而这与Stack的用意毫无关系。这应该算为Java1(1.0/1.1)中容器类库设计者的一大失误吧,还好,这些在Java2中都有了相当大的改变观。
Hashtable也是Java1中一个有用的容器类库。它的基本目标是实现两个或多个对象之间进行关联。举一个现实生活中的例子,比如我们说美国白宫时,指的就是在美国华盛顿的总统办公大楼,为什么一说到美国白宫,总统办公大楼呢?这是我们人为的对“美国白宫”和总统办公大楼进行了关联,本来“美国白宫”就是四个普通的文字,现在却有了不同的含义。在Java中我们就可以用String定义一个内容为“美国白宫”的对象变量,在定义一个总统大楼的对象变量,把它们进行关联,这就是Hashtable的用意。通过使用pub(Object key,Object value)方法把两个对象进行关联,需要时用get(Object key)取得与key关联的值对象。还可以查询某个对象的索引值等等。值得说明的这里的get方法查找一个对象时与Vector中的get方法在内部实现时有很大不同,在一个Hashtable中查找一个键对象要比在一个Vector中快的多。这是因为Hashtable使用了一种哈希表的技术(在数据结构中有具体讲解),在Java每个对象缺省都有一个通过Object的hashCode()方法获得的哈希码,Hashtable就是利用这个哈希实现快速查找键对象的。
Java1容器类库设计的另一个重大失误是竟然没有对容器进行排序的工具。比如你想让Vector容器中的对象按字典顺序进行排序,你就要自己实现。
虽然Java1中的容器类库如此简陋,却也使Java程序员在当时编程时省力不少,那些容器类也被大量用到,正所谓无可奈何,没得选择。
可能是Java在其成长过程一直被漂亮的光环笼照着,所以它的缺点也被人们忽略了,幸好,在Java2中容器类库设计者对以前的拙劣设计进行了大刀阔斧的整改,从而使Java变得更加完美。