2006 年 10 月 23 日
本文为 db4o 之旅系列文章的第一篇,介绍了面向对象数据库 db4o 的基本特性,并且与传统关系型数据库以及 OR 映射技术做了比较分析,读者可以体验到 db4o 的全新的面向对象存储的理念,并且给出了性能测试数据。
前言
业界对持久存储领域的追求从未停止过,为了更方便、更轻易地用对象表达我们的思维,开源领域和商业领域都涌现了许多新技术, ORM 的出现恰恰说明了这点。最近一年,业界也在反思,到底 ORM 给我们带来的是便利还是麻烦。矛头指向大名鼎鼎的 Hibernate ,纷纷议论其性能问题,大家似乎要达成这样的共识:“在业务逻辑复杂的地方用 SP ,而一般的 CRUD 还是 Hibernate ”,就连全球知名的 BearingPoint 也有类似看法。下面一个简单的例子,说明了传统 ORM 工具的弊端。让我们考虑一个简单的 Student 对象如清单1:
清单1. Student 类
public class Student {
private String name;
private int age;
public String getName(){
return name;
}
public int getAge(){
return age;
}
}
考虑下面这个场景:找到“年龄小于 20 岁的所有学生”?
使用 ORL 实现如清单2:
清单2. ORL 实现
String oql = "select * from student in AllStudents where student.age <20";
OQLQuery query = new OQLQuery(oql);
Object students = query.execute();
使用 JDOQL 实现如清单3:
清单3. JDOQL 实现
Query query = persistenceManager.newQuery(Student.class, "age <20");
Collection students = (Collection)query.execute();
上面的方法都存在一些普遍问题:
现代集成开发环境不会检查内嵌字符串的语义和语法错误。在上面所有查询语句中, age 字段和数值 20 都被认为是数字类型,但是没有一个 IDE 或编译器能检查其实际正确性。假如开发者混淆了查询代码-―比如,改变了 age 字段的名字或类型,将导致――上面所有的查询语句在运行时报错,而不会在编译时提示。
现代灵敏开发技术鼓励不断进行重构来维持清楚和与时俱进的类模型,以便准确重现不断演进的域模型。假如查询代码难于维护,它会延迟决定重构的时间并不可避免的引入低质量代码。
所有列出的查询都直接用 Student 类的私有成员 age,而不是使用它的公共接口 student.getAge(),因此他们都破坏了面向对象封装规则,违反接口和实现应该分离的面向对象法则。
所有的查询都非 100% 的原生。
既然存在如此多的问题, 为什么不直接使用纯面向对象数据库呢?有些开发者可能会说:“它缺乏数学模型的支持, 还不够成熟”。的确, RDBMS 发展了几十年才有今天的成就,已经非常完善了。而技术的革新是无止境的, 故步自封的永远都跟不上变化的脚步。
让我们来简单回顾一下对象数据库的发展史(资料来源于 Wiki 百科全书):“面向对象数据库系统”这一术语第一次出现于 1985 年。闻名的研究项目包括:Encore-Ob/Server ( 布朗大学), EXODUS(Wisconsin 大学), IRIS (惠普), ODE ( Bell 实验室), ORION (MCC ) ,Vodak (GMD-IPSI)和 Zeitgeist (Texas Instruments)。其中以 ORION 项目发表的论文数为最多。 MCC 的 Won Kim 将这些论文中最有价值的一部分汇编成书并由 MIT 出版社出版。对象数据库治理系统为面向对象编程语言增加了持久的概念。最早的商品化 ODBMS 出现在 1986 年,是 Servio 公司(现在的 GemStone 公司)和 Ontos 公司推出的。后来(九十年代) Object Design ( ODI )、 Versant 、 Objectivity 、 O2 Technology 、 Poet 、 Ibex 、 UniSQL 和 ADB MATISSE 等公司也加入了这个开拓行列。
而今天,一家来自加州硅谷的开源面向对象数据库公司 db4objects 为我们带来了db4o, 一款性能卓越的纯面向对象数据库,也是我们这篇和后续文章将会介绍的主角。
db4o 为我们带来的是这样一种面向对象的查询方式:
100% 的原生 查询语言应能用实现语言( Java 或 C# )完全表达,并完全遵循实现语言的语义。
100% 的面向对象 查询语言应可运行在自己的实现语言中,答应未经优化执行普通集合而不用自定义预处理。
100% 的类型安全 查询语言应能完全获取现代 IDE 的特性,比如语法检测、类型检测、重构,等等。