分享
 
 
 

Object Pascal中String类型的内幕探讨

王朝delphi·作者佚名  2006-01-08
窄屏简体版  字體: |||超大  

在Object Pascal中,String(准确的说是AnsiString)是一种可变长度的字符串,通过PChar(AString)可以将其转换为与Windows API相兼容的字符指针类型。事实上,String类型就是一个指针,你可以用Sizeof去读取它的大小,不论字符串的实际长度是多少,Sizeof(AString)永远是4。String与一般的Null-Terminated字符指针不同的是,String还要保留另外的一部分空间,用于记录字符串长度和引用计数等信息。String类型在内存中的确切格式如下:

(4字节)分配大小+(4字节)引用计数+(4字节)字串长度+(不定长)字符数组+(1字节)$0结束字符

为了验证这一点,我们可以在程序中添加一个作用域为private的String变量,在程序中动态改变它的长度和内容,同时观察它的分配大小和长度发生了什么变化。另外,为了观察引用计数的变化,只有在两个字符串互相复制的时候才能体现出来,我们在程序中也要实现这一点。

请新建一个Application,在窗体上放置一个Edit,一个ListBox和三个Button。其中,Edit用来改变字符串的内容;ListBox用来记录跟踪信息;三个按钮分别用于观察字符串的当前状况,观察字符串的引用计数变化情况和清空列表内容。

在Form的声明中添加一个变量:

type

TForm1=class(TForm)

...

private

s : string;

end;

添加三个按钮的事件处理如下:

procedure TForm1.Button1Click(Sender: TObject);

var

psz : PChar;

pdw : PDWORD;

dw1, dw2, dw3 : DWord;

begin

s := Edit1.Text;

psz := PChar(s);

pdw := PDWORD(psz);

Dec(pdw);Dec(pdw);Dec(pdw);

dw1 := pdw^;

Inc(pdw);dw2 := pdw^;

Inc(pdw);dw3 := pdw^;

ListBox1.Items.Add( Format('[Current]Size:%d, Ref:%d, Len:%d',

[dw1,dw2,dw3]) );

end;

procedure TForm1.Button2Click(Sender: TObject);

var

psz : PChar;

pdw : PDWORD;

dw1, dw2, dw3 : DWord;

s2 : string;

p1, p2 : Pointer;

begin

s := Edit1.Text;

psz := PChar(s);

pdw := PDWORD(psz);

Dec(pdw);Dec(pdw);Dec(pdw);

dw1 := pdw^;

Inc(pdw);dw2 := pdw^;

Inc(pdw);dw3 := pdw^;

ListBox1.Items.Add( Format('[Before assign]Size:%d, Ref:%d, Len:%d',

[dw1,dw2,dw3]) );

s2 := s;

p1 := Pointer(PChar(s));

p2 := Pointer(PChar(s2));

ShowMessage(Format('p1=%p,p2=%p',[p1,p2]));

psz := pChar(s);

pdw := PDWORD(psz);

Dec(pdw);Dec(pdw);Dec(pdw);

dw1 := pdw^;

Inc(pdw); dw2 := pdw^;

Inc(pdw); dw3 := pdw^;

ListBox1.Items.Add( Format('[After assign]Size:%d, Ref:%d, Len:%d',

[dw1,dw2,dw3]) );

s2 := s2 + 'Another string';

p1 := Pointer(PChar(s));

p2 := Pointer(PChar(s2));

ShowMessage(Format('p1=%p,p2=%p',[p1,p2]));

psz := pChar(s);

pdw := PDWORD(psz);

Dec(pdw);Dec(pdw);Dec(pdw);

dw1 := pdw^;

Inc(pdw); dw2 := pdw^;

Inc(pdw); dw3 := pdw^;

ListBox1.Items.Add( Format('[After COW]Size:%d, Ref:%d, Len:%d',

[dw1,dw2,dw3]) );

end;

procedure TForm1.Button3Click(Sender: TObject);

begin

ListBox1.Items.Clear;

end;

如果你对指针的概念比较清楚的话,上面的代码是不难理解的。下面是该程序的输出结果:

[Current]Size:22, Ref:5, Len:5

[Before Assign]Size:22, Ref:2, Len:5

[After Assign]Size:22, Ref:3, Len:5

[After COW]Size:22, Ref:2, Len:5

观察上述结果,可以得出几个结论:

1.“分配大小”和“字串长度”之间存在着一种固定的数量关系,即分配大小=字串长度+17。为什么会有这种关系?请你再看一看String类型的内存分布:(4字节)分配大小+(4字节)引用计数+(4字节)字串长度+(不定长)字符数组+(1字节)$0结束字符,4+4+4+(strlen)+1,应该是13+(strlen)才对,也就是说应该还有4字节的空间,其用途尚不清楚。值得一提的是,如果你将字符串清空,那么Len的结果可能不是你所想象的0,而是一个让你大吃一惊的数字。

2.因为分配大小和字串长度都是用4字节来表示的,而且String类型是动态分配内存,所以字符串最大可能的长度应该是2^32-17个字节。

3.在拷贝字符串的时候,Object Pascal并不是把字符串简单的复制一份,而是采取了引用计数的方法,将两个字符串指向同一个内存空间,同时引用计数加1。当字符串变量被清除的时候,引用计数减1,如果引用计数已经减为0,表明该字符串可以真正被清除了。显然,这种方法比复制整个字符串的效率要高。

4.在给字符串赋值的时候,Object Pascal首先会检查字符串的引用计数是否为1。如果是,按照一般的方法直接赋值即可;否则,就说明有两个以上字符串指向同一个地址,这种情况就复杂多了。Object Pascal使用的是Copy-on-Write机制(COW),为当前字符串另外开辟一个缓冲区,将新内容拷入;同时,原来的字符串引用计数要减一。

5.知道了String的内存布局,我们也就知道了PChar(str)的意义了。不过,使用PChar的同时也就丢失了String的动态增长和引用计数的功能,所以一定要小心,另外要注意PChar长度的计算和字符串长度一定要同步,否则会出问题。比如,下面的代码就不能正常工作:

var

str : string;

begin

SetLength(str,256);

GetWindowDirectory(PChar(str),256);

str := str + ‘\win.ini’;

end;

这样的结果是不正确的。之所以不正确,是因为SetLength将字符串长度设成了256,而PChar计算的长度只到第一个$0为止。正确的方法应该是:

SetLength(str,256);

GetWindowsDirectory(PChar(str),256);

SetLength(str,StrLen(PChar(str)));

str := setr + ‘\win.ini’;

说明:上面的程序是在Delphi 5下测试通过的。Borland并不保证String的内存结构在以后的Delphi版本中会保持不变,所以,上述例子只是作为测试用,实际的程序中不应该这样使用String,谨此说明。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有