6.0 文件结构
汇编源文件被分成了几个部分。这些部分是code,data,未初始化data,constants,resource和relocations,资源部分是资源文件创建的,后面会有更多的讨论。Relocation部分对我们不重要(它包含了使PE-loader可以在内存的不同的位置装载入程序的信息)。重要的部分是code,data,未初始化data和constants。可能你已经猜到,code部分包含了代码。Data装有数据,并有读写权限。整个data部分被包括在exe文件并可以用数据初始化。
未初始化data在启动时没有内容,甚至没有包括在exe文件本身。它只是由Windows“分配”的一部分内存。这部分也有读写权限。Constants和data部分一样,但只读。虽然这部分可用作常熟,但把常熟定义在包含文件中更简单也更快捷,并用作直接数值。
6.1 Section indicators(部分代表符)
在你的源文件(*.asm)中,你可以用部分标识符定义部分:
.code;code部分由此开始
.data;data部分由此开始
.data?;未初始化data 部分由此开始
.const;constants部分由此开始
可执行文件(*.exe,*.dll和其他)是(在win32中)可移植执行格式(PE),我不会详细的讨论它但是有几点是重要的。部分(Sections)用一些属性定义在PE头中:
Section名,RVA,offset,原始大小,虚拟大小和标志。Rva(相对虚拟地址)是将要装入的section部分相对内存地址。这里相对的意思是相对于程序载入的基地址。这个地址也在PE头中,但可以由PE-loader改变(使用relocation部分)。Offset是初始化数据所在的exe文件本身的原始offset。虚拟大小是程序在内存中将达到的大小。标志是读/写/可执行等。
3. 2例子
这有一个示例程序:
.data
Number1 dd 12033h
Number2 dw 100h,200h,300h,400h
Number3 db "blabla",0
.data?
Value dd ?
.code
mov eax, Number1
mov ecx, offset Number2
add ax, word ptr [ecx+4]
mov Value, eax
这个程序不能编译但没关系。
在你的汇编程序中,你放入“部分”中的所有东西都会进入exe文件而且当程序被载入内存时,位于某个内存地址。在上面的data部分,有3个标签:Number1, Number2, Number3。这些标签会保存它们在程序中的offset因而你可以在你的程序中使用它们来指示位置。
DD直接把一个dword放在那,DW是Word而DB是byte。你也可以用db放字符串,因为它实际上是一串byte值。在例子中,data部分会变成内存中的这样:
33,20,01,00,00,01,00,02,00,03,00,04,62,6c,61,62,6c,61,00(均为十六进制值)
(每个值位一byte)
我给其中的一些数字上了色。Number1指向byte 33所在的内存地址,Number2指向红色00的位置,Number3是绿色的62。现在,如果你在你的程序中这么写:
mov eax, Number1
它实际意为:
mov ecx, dword ptr[12033h所在的内存地址]
但这样:
mov ecx, offset Number1
意为:
mov ecx, 12033h所在的内存地址
在第一个例子中,ecx会得到Number1的内存地址的值。在第二个中,ecx会称为内存地址(offset)本身。下面的两个例子有相同的效果:
(1)
mov ecx, Number1
(2)
mov ecx, offset Number1
mov ecx, dword ptr [ecx] ( or mov ecx, [ecx])
现在让我们回到前面的例子中:
.data
Number1 dd 12033h
Number2 dw 100h,200h,300h,400h
Number3 db "blabla",0
.data?
Value dd ?
.code
mov eax, Number1
mov ecx, offset Number2
add ax, word ptr [ecx+4]
mov Value, eax
标签可以使用像Number1,Number2和Number3等值,但它启动时包含0。因为它在未初始化data部分。这样的优点是,你在.data?中定义的所有东西不在可执行文件中而在内存中。
.data?
ManyBytes1 db 5000 dup (?)
.data
ManyBytes2 db 5000 dup (0)
(5000dup意为:5000个副本。值db 4,4,4,4,4,4,4和值db 7dup(4)一样)
ManyBytes1不会在文件本身,只是5000个预分配在内存中的字节。但Manybytes2会在可执行文件中使文件变大5000个字节。虽然你的文件会包含5000个零,但并没有什么用。
Code部分被汇编(翻译为原始代码)并放入可执行文件中去(当然载入后在内存中)。