DBM与GDBM与跨平台代码研究
关键字:
DBM: UNIX系统的数据库,使用hash保存非结构化数据。它不支持SQL。
GDBM:DBM的GNU版本。
跨平台C语言代码:具有跨平台特性的C语言代码。
1. 简介
符合X/Open技术规范的UNIX版本自备了一个数据库。但这个数据库不符合ANSI标准的SQL技术规范(不支持SQL语句)。它只是一个存储检索数据的例程。
dbm、gdbm适合存储静态的,索引化的数据结构。它在创建数据项时非常慢,但检索数据项时非常快。
本文给出了dbm、gdbm各自的函数简要说明,最后给出了能够兼容DBM、GDBM两个不同数据库的C代码编写建议。
2. dbm
dbm使用两个数据文件,扩展名为”.pag”和”.dir”。但对数据库的操作返回值只有一个。注意:不要使用读写函数直接操作数据文件,应该使用dbm提供的数据操作函数访问数据。
2.1.
数据结构
数据、索引都使用以下结构保存:
typedef
struct {
char *dptr;
int dsize;
} datum;
数据库的访问结构(等同于FILE):
typedef
struct {int dummy[10];} DBM;
2.2.
函数简介
#include <ndbm.h>
/*打开数据库*/
DBM *dbm_open(const char *filename, /*数据库文件名(两个文件,后缀不同)*/
int
file_open_flags, /*与open函数相同,文件打开标志*/
mode_t
file_mode /*与open函数相同,文件打开模式*/
);
成功时返回DMB类型指针,失败返回NULL
/*存储数据*/
int dbm_store(DBM *database_descriptor, /*前面打开数据库操作返回的结构*/
datum
key, /*检索数据的关键字*/
datum
content, /*用于保存数据的结构*/
int
store_mode /*如果为dbm_insert,则数据存在时操作会失败, 如果dbm_replace,则覆盖已经存在的数据*/
);
如果数据库打开方式为“dbm_insert”,而保存时该key对应的数据已经存在,则返回1;
如果出现其他错误,返回一个负数;
操作成功,返回0;
/*检索数据*/
datum dbm_fetch(DBM *database_descreiptor, /*dbm_open返回的数据结构*/
datum
key /*检索使用的关键字*/
);
如果找到,则返回结构dptr和dsize分别赋值为数据指针和数据大小,如果没找到,则dptr赋值为NULL。
返回的datum结构中包含指向记录数据的指针,数据记录仍然在dbm内部某个存储区,如果需要,应把它拷贝到其他变量中。
/*关闭数据库*/
void dbm_close(DBM *database_descriptor); /*dbm_open返回的数据结构*/
/*其他函数简介*/
int dbm_delete(DBM
*database_descriptor,datum key); /*删除索引为key的数据*/
操作成功返回0;
int dbm_error(DBM *database_descriptor); /*对数据库进行简单测试。没有错误返回0。*/
没有错误返回0;
dbm_firstkey(),dbm_nextkey()一般成对使用,用于检索数据库中全部数据。
例如:
for(key=dbm_firstkey(db_ptr);key.dptr;key=dbm_nextkey(db_prt));
3. gdbm
gdbm使用一个数据文件,与dbm不同。注意:不要使用读写函数直接操作数据文件,应该使用gdbm提供的数据操作函数访问数据。
3.1.
数据结构
数据、索引都使用以下结构保存(与dbm相同):
typedef
struct {
char *dptr;
int dsize;
} datum;
数据库的访问结构(等同于FILE):
typedef
struct {int dummy[10];} *GDBM_FILE;
3.2.
函数简介
#include <gdbm.h>
/*打开数据库*/
GDBM_FILE *gdbm_open(
char
*name; /*用于保存数据库路径文件名*/
int block_size; /*设置内存与磁盘直接io传递数据的单位,最小512字节*/
int
read_write; /*可设置为:GDBM_READER、GDBM_WRITER、
GDBM_WRCREATER、GDBM_NEWDB*/
int mode; /*文件打开模式。与chmod(2)、open(2)相似*/
):
成功返回GDBM_FILE类型指针,否则返回NULL。
/*存储数据*/
int gdbm_store(GDBM_FILE *database_descriptor, /*前面打开数据库操作返回的结构*/
datum
key, /*检索数据的关键字*/
datum
content, /*用于保存数据的结构*/
int
store_mode /*如果为gdbm_insert,则数据存在时操作会失败, 如果gdbm_replace,则覆盖已经存在的数据*/
); /*与DBM相同*/
如果一个只读打开的数据库调用了这个函数,则返回-1;
如果数据库以GDBM_INSTERT方式打开,且保存的数据关键字已经存在,那么返回1;
其他情况返回0(操作成功);
注意:gdbm的存储数据大小没有限制,这与dbm、ndbm不同。
/*检索数据*/
datum gdbm_fetch(GDBM_FILE *database_descreiptor, /*gdbm_open返回的数据结构*/
datum
key /*检索使用的关键字*/
); /*与DBM相同*/
如果返回值的dptr字段为NULL,则没有找到数据;
注意:gdbm自动分配dptr的存储空间(使用malloc(3C)),但不会自动释放这个空间。释放空间的责任交给了程序员完成。
/*关闭数据库*/
void gdbm_close(GDBM_FILE *database_descriptor);
/*gdbm_open返回的数据结构*/
/*其他函数简介*/
int gdbm_exist(GDBM_FILE dbf,datum key); /*检查数据库中是否存在key对应的数据*/
返回true表示找到数据,返回false表示数据不存在。
int gdbm_delete(GDBM_FILE *database_descriptor,datum
key); /*删除索引为key的数据*/
返回0表示操作成功,返回-1表示没有找到key对应的数据。
char *gdbm_strerror(gdbm_error errno); /*把错误代号转换为英文字符串。*/
返回可打印的错误描述字符串。
int gdbm_setopt(GDBM_FILE dbf, int option,
int value, int size); /*设置已经打开的数据库的参数,可以设置系统内部cache大小、设置快速模式(此功能已过时)、打开或关闭中央空闲数据块存储池。*/
返回0表示设置操作成功,返回-1表示操作失败。
int gdbm_fdesc(dbf); /*多用户共享时,为了给数据库文件加锁,设置已打开的数据库的标志。*/
key=gdbm_firstkey(dbf)
nextkey=gdbm_nextkey(dbf,key); /*与dbm相似,用于访问所有数据。*/
例如:
key
=
gdbm_firstkey(dbf);
while(key.dptr)
{
nextkey
= gdbm_nextkey(dbf,key);
… /*某些循环中的处理操作*/
key
= nextkey;
}
4. 研究:代码如何同时兼容dbm、gdbm
针对不同系统,有的使用dbm(ndbm),有的使用gdbm。为了使数据库访问的C代码具有更好的跨平台能力,我们需要对代码进行部分修改,同时,需要针对不同平台写不同的配置文件。这样,我们的数据库操作代码就拥有了更强的平台适应性。
具体方法如下:
1.
首先,我们编写一个平台相关的Makefile文件。
例如,Red Hat Linux 6.1使用了dbm库,而Red Hat
Linux 9.0使用的使gdbm库,这时,Red Hat Linux 6.1的编译文件命名为my_dbm.make,Red Hat Linux 9.0的编译、安装文件命名为my_gdbm.make。
平台1:支持DBM的Makefile文件,在My_dbm.make我们需要写如下代码:
DBMLIB = -ldbm
平台2:支持gdbm的Makefile文件,在RH_linux_9.0.make我们需要写如下代码:
DBMLIB = -lgdbm
2.
然后,编写不同头文件。
例如,我们需要编写两个配置文件,分别命名为my_dbm.h、my_gdbm.h,把不同的定义包含在其中。
平台1:支持DBM的配置文件,在My_dbm.h我们需要写如下代码:
#define NDBM
#include <ndbm.h>
平台2:支持gdbm的配置文件,在my_gdbm.h我们需要写如下代码:
#define GDBM
#include <gdbm.h>
3.
让用户选择,把不同的配置文件拷贝到一个相同名字的配置文件,给出一个与平台无关的编译、安装脚本。
例如,用户查找系统配置资料,得知当前系统只支持DBM,那么用户需要把my_dbm.make拷贝为代码跟目录的Makefile,把my_dbm.h拷贝为config.h文件。
4.
修改数据库操作代码,使两套(或更多)数据库操作函数同时存在。
例如:修改代码,把头文件定义从原来的
#include <dbm.h> /*或者 #include <gdbm.h> */
修改为
#include “config.h”
对所有与数据库操作相关的函数加入条件编译语句。
#ifdef DBM
DBM *mydb; /*DBM,GDBM数据库操作指针类型不同!*/
dbm_fetch( … ); /*其他函数类似,注意某些函数参数个数不同!*/
#endif
#ifdef
GDBM
GDBM_FILE
*mydb; /*为了操作一致,我们选择相同的变量名字。*/
gdbm_fetch(
… ); /*其他函数类似*/
#endif
现在,可以说马上就要大功告成了。但是,别忘了给出说明文档README,告诉用户如何才能使用你代码中的平台适应能力(现在只有你自己知道这个特性)。这个README文档中必须包含:
1.
如何确定自己平台的使用的数据库
—— 可以使用man gdbm,man dbm;
2.
与平台相关的编译、安装文件拷贝到哪个目录的Makefile文件;
3.
与平台相关的头文件拷贝到哪个目录的config.h文件;
4.
如何编译、安装、使用你的代码;
前面是对C代码跨平台编程的一点尝试。大多数平台相关特性都可以使用前面提到的方法完成。这里也可以看出,C语言代码必须完成多套函数,在编译期根据平台特性,选择适合自己平台的部分编译、安装。它与JAVA代码的跨平台概念完全不同。