对于数据系统表的主键选择不是什么大不了的事,可能对于一些朋友来说,这非常容易,可是却不是如此的简单,对于某些应用来说,自动加1字段就可以了,但是对于某些系统来说,选择自动加1 的方式会带来很大的麻烦,在此种方法的解决上,基本上大多数网友都选择了GUID做为主键,但是选择GUID做为主键的方式有一个缺点:大家都知道GUID是一个128位的整数(32*4),他占用的存诸空间是整数的四倍! 在查询效率方面会不会有很大的影响呢?在这方面,Jimmy Nilsson做了很深的研究(请参见他的著名的文章”The Cost of GUIDS as Primary Keys” http://lists.sqlmagcom/t?ctl=CFBD:83A5C),国内有很多朋友对GUID和comb方式进行了比较,但是大多数是在sql平台上做的,对于GUID字段的支持只有Access和sql 支持,其他的数据库可能并不支持这种方式,所我对这种方式进行了如下的测试.
对于不支持GUID字段的数据库,唯一的方式是对GUID值转化成字符串,也就是说最少需要32*8字节来存GUID(他的转化方式是将GUID的十六进制形式转化为了’0..9’和’A...F’,Base64方法需要更少的存储空间,但是由于BASE64里面即包含大写字每也包含小写字每,所以不适宜表达GUID).我的测试里面包含了四项 1.自动加1字段,2.GUID字符串,3 comb字符串,4.将comb后六个字节放在前面,方便字符串的比较,特别是做主键的时候.
在Jimmy Nilsson The Cost of GUIDS as Primary Keys里对GUID的生成做了详细的说明:
“The algorithm for generating GUIDs doesn’t use the MAC address of the network card in recent Windows versions anymore.Instead ,it just creates a random value.In theory,this presents a risk of getting duplicate GUIDs,but,in practice,it shouldn’t be a problem”
“The reason for excluding the use of the MAC address is that it not only couples users to GUIDs,but some network cards don’t use unique MAC address.”
对于这个情况,Jimmy Nilsson还分别在nt 4+sql 7 和 windows 2000+ sql 2000上做了实验,实验证明确实如此,在GUID的16位随机数当中,有15.5位是随机的,怎么出来个15.5?是这样的,如果你按照半个字节来数的话,第13位,也就是第7位的上半个字节是固定的.
{43A6162C-308A-4112-86F8-6E6B6B76FC6E}
也就是这个示例当中的第三组4112中的第一个字符4是固定的, 他代表16进制的4,即0100,所以是半个字节.他代表Microsoft.
在我们这个实验中,,用GUID的方法肯定会慢,但是慢多少呢?2,3,4理应该是效率一至的,呵呵,你敢确定你的结论吗? Let’s try!
先把算法贴出来吧:
常量定义单元,定义了一个时间的基准值
//********************************************************************
//
// Name : Sinoprise Function Library For Delphi
//
//Author : Shuguang Yin
//Create : 2005-11-15
//
// Copyright (c) 2005 : Sinoprise Technology Lab
// Official WebSite : http://www.sinoprise.com
// Sinoprise Technology Community : http://www.winux.cn
//
//********************************************************************
//
//Unit Name : SConstUnit
//
//Function :
//
//********************************************************************
unit SConstUnit;
interface
uses dateutils;
var
spdelib_base_datetime :TDateTime;
implementation
initialization
spdelib_base_datetime := EncodeDateTime(2000,1,1,0,0,0,0);
finalization
end.
当然,你直接给数据值也行,因为在delphi里TDateTime就是double类型.这只是个人习贯而以.
定义系统服务单元:提供了系统的comb算法:
//********************************************************************
//
// Name : Sinoprise Function Library For Delphi
//
//Author : Shuguang Yin
//Create : 2005-11-15
//
// Copyright (c) 2005 : Sinoprise Technology Lab
// Official WebSite : http://www.sinoprise.com
// Sinoprise Technology Community : http://www.winux.cn
//
//********************************************************************
//
//Unit Name : SSystemUnit
//
//Function : The System Functions
//
//********************************************************************
unit SSystemUnit;
interface
uses Windows,ActiveX,SysUtils,Dateutils;
const Cardinal_Length = sizeof(Cardinal);
type
SSystem = class
//取得一个经过转化的GUID,详见:Jimmy Nilsson的'The Const of GUIDs as Primary Keys'
class Function GetCombGUID():TGUID;overload;
class Function GetCombGUID(guid:TGUID):TGUID;overload;
//从comb guid中得到日期和时间
class Function GetDateTimeFromCombGuid(guid:TGUID):TDateTime;
//根据给定的字符串分割符 ,格式化GUID的字符串
class Function GetGuidString(guid:TGUID;beginSymbol:string='{';
endSymbol:string='}';partitionSymbol:string='-'):string;
class Function GetGuidString2(guid:TGUID;beginSymbol:string='{';
endSymbol:string='}';partitionSymbol:string='-'):string;
end;
implementation
uses SConvertUnit,SConstUnit;
{ SSystem }
class function SSystem.GetCombGUID: TGUID;
begin
if CoCreateGUID(result) = S_OK
then begin
result := GetCombGUID(result);
end
else begin
raise Exception.Create('Create GUID Err!');
end;
end;
class function SSystem.GetCombGUID(guid: TGUID): TGUID;
var
dtm : TDateTime;
days,seconds,tmp : longint;//32 bit
begin
dtm := Now();
dtm := dtm - spdelib_base_datetime;
days := trunc(dtm);
//应该*1000000000(10个0),但这样会可能发生溢出
//如果采用int64,则会给下面的移位转换带来麻烦
//所以这里采用了1000000000(9个0)
//这里的算法是采用的是Jimmy Nilsson的'The Const of GUIDs as Primary Keys'
//算法,对于实时性要求不太高的系统来说,可以采用3/3制,即
//3个字节存放日期,3个字节存放时间,这里是2/4制
seconds := trunc(( dtm - days ) * 1000000000);
//高位在前
//整数部分(日期部分)
tmp := days and $FF;
guid.D4[3] := byte(tmp);
tmp := (days shr 8);
guid.D4[2] := byte(tmp);
//小数部分(时间部分)
tmp := seconds and $FF000000;
tmp := tmp shr 24;
guid.D4[4] := byte(tmp);
tmp := seconds and $00FF0000;
tmp := tmp shr 16;
guid.D4[5] := byte(tmp);
tmp := seconds and $0000FF00;
tmp := tmp shr 8;
guid.D4[6] := byte(tmp);
tmp := seconds and $000000FF;
guid.D4[7] := byte(tmp);
Result := guid;
end;
class function SSystem.GetDateTimeFromCombGuid(guid: TGUID): TDateTime;
var
days,seconds : longint;//32 bit
begin
days := guid.D4[2];
days := days shl 8;
days := days + guid.D4[3];
days := days + trunc(spdelib_base_datetime);
seconds := guid.D4[4];
seconds := seconds shl 8;
seconds := seconds + guid.D4[5];
seconds := (seconds shl 8) + guid.D4[6];
seconds := (seconds shl 8) + guid.D4[7];
result := seconds / 1000000000;
result :=days + result;
end;
class function SSystem.GetGuidString(guid: TGUID; beginSymbol, endSymbol,
partitionSymbol: string): string;
begin
//Get a guid string like this : {43A6162C-308A-4112-86F8-6E6B6B76FC6E}
Result := GUIDToString(guid);
Result := beginSymbol + Copy(Result,2,8)
+ partitionSymbol + Copy(Result,11,4)
+ partitionSymbol + Copy(Result,16,4)
+ partitionSymbol + Copy(Result,21,4)
+ partitionSymbol + Copy(Result,26,12) + endSymbol;
end;
class function SSystem.GetGuidString2(guid: TGUID; beginSymbol, endSymbol,
partitionSymbol: string): string;
begin
//Get a guid string like this : {43A6162C-308A-4112-86F8-6E6B6B76FC6E}
Result := GUIDToString(guid);
Result := beginSymbol + Copy(Result,26,8)
+ partitionSymbol + Copy(Result,34,4)
+ partitionSymbol + Copy(Result,16,4)
+ partitionSymbol + Copy(Result,2,4)
+ partitionSymbol + Copy(Result,6,4)
+ Copy(Result,11,4)+ Copy(Result,21,4)+ endSymbol;
end;
end.
这里有两点要说明
1. 在delphi中,日期时间有表示不是整数,这和c系列(c,c++,c#,java)是有区别的,当然这也和操作系统有区别,在windows和unix中日期时间都是整数,这也在用delphi做项目时有了不少的麻烦,因为在delphi将系统时间转化成delphi的格式时进行了除法运算,损失了数据的精度,所以在计算两个日期之间的分钟之差时会有误差,这确实是一个大问题,但是今天终于见到了delphi的这种日期时间格式的一个方便的用处,省得我自已算了.
2. 在delphi中所有的类名前都加”T”,意为Type,呵呵,有点类似于MFC中的”C”,意为”class”,在这里,我的命名方法是在前面加”S”,为了和delphi的本身类库区分,意为:” structure”,当然,如果你认为是”Sinoprise”的首字母,我也不反对.
上面是comb的算法