摘要:我想各位读者应该对於 Linux 上的动态函式库的架构有了进一步的了解,笔者根据自己电脑 Linux 的记忆体配置画了下面的架构图,相信会让有心了解整个运作的人,有了更清楚的一个印象。
结束语
最後,我想各位读者应该对於 Linux 上的动态函式库的架构有了进一步的了解,笔者根据自己电脑 Linux 的记忆体配置画了下面的架构图,相信会让有心了解整个运作的人,有了更清楚的一个印象。
在这张图中,我们所执行的程序是由记忆体 0x08048000 开始载入的,而所用到的动态函式库则是在记忆体位置 0x40000000 开始载入,以笔者的电脑为例,动态函式库载入的记忆体映射情况大略为
40000000-40001000 /usr/share/locale/en_US/LC_MESSAGES/SYS_LC_MESSAGES
40001000-40002000 /usr/share/locale/en_US/LC_MONETARY
40002000-40003000 /usr/share/locale/en_US/LC_TIME
40003000-4000b000 /lib/libnss_files-2.1.2.so
4000b000-4000c000 /lib/libnss_files-2.1.2.so
4000c000-400f7000 /lib/libc-2.1.2.so
400f7000-400fb000 /lib/libc-2.1.2.so
400fb000-400ff000 0
400ff000-40111000 /lib/ld-2.1.2.so
40111000-40112000 /lib/ld-2.1.2.so
40112000-4011b000 /lib/libnss_nisplus-2.1.2.so ......┅(more)
若我们程序透过 malloc 配置动态的记忆体,则会配置在标示为 “Free Space”的记忆体空间中,程序所用到的堆叠(Stack) 是由 0xbfffffff 开始,往下延伸。
而在记忆体位置 0xc0000000 以上,则是属於 Kernel Mode 的部分,这部份包含了Linux Kernel 的 Image 以及我们之後所动态载入的模组。
文章到此正式结束了,读者若有任何的问题或是这篇文章有任何疏漏的部份,欢迎各位可以来信指教,谢谢各位。。。^_^My E-Mail: hlchou@mail2000.com.tw
注一:(http://www.cuspy.com/~mcculley/mapself/)笔者在写这篇文章时,在一个网页上看到一个很有意思的记忆体区块拷贝效率比较,我们知道在Linux下面如果要把记忆体区块由 A 拷贝到 B,我们除了可以使用memcpy来完成以外,还可以透过mmap来开启档案/proc/self/mem,来完成拷贝记忆体区块的目的。举个例子来说,如果我们要把记忆体区块由A拷贝到B共 chunksize 个bytes,可以透过如下的写法
memcpy(B, A, chunksize);
透过 mmap 来做的话,可以藉由以下的写法
int self;
self = open("/proc/self/mem", O_RDONLY);
B = mmap(B, chunksize, PROT_READ | PROT_WRITE,
MAP_PRIVATE | MAP_FIXED, self, (off_t)A);
也就是透过 Linux 提供给每个 Process 的记忆体装置档案 mem,来完成记忆体的拷贝动作。
不过,虽然我们可以有这两种方法可以选择,可是遇到要拷贝记忆体时,却不免会遇到要选择何种方式来实做的问题,因此该网页的作者写了一个小程序来测试这两种方式的优缺点,首先在 Linux 上每个记忆体的 Page 大小为 512bytes,因此测试时就是利用 512 bytes为单位来逐渐增加测试的记忆体区块大小。每个阶段都有一个固定的记忆体区块大小,与两个内容不同的记忆体区块作为拷贝时的来源端,每一个循环都会先拷贝一个来源端到目的的记忆体区块中,再比较内容,若相同,则拷贝另一个来源端的资料到目的的记忆体区块中,再比较内容,如此重复10000 次(表示共拷贝了 20000 次到目的记忆体区块中),藉此来比较 memcpy 与 mmap 在执行记忆体区块拷贝时的效率。
如下表(笔者电脑配备: PII 350,64MB RAM)
memcpy mmap
512 0.14 0.23
1024 0.26 0.35
2048 0.51 0.59
4096 1.00 1.06
8192 2.56 2.10
16384 5.67 4.55
32768 11.71 8.96
65536 23.63 17.75
我们不难发现当记忆体区块为 512、1024、2048、4096 时,memcpy 都胜过mmap。不过当拷贝的记忆体区块越来越大时,mmap 明显表现的相当有效率,像最後测试的记忆体区块大小为 65536 bytes,mmap 相较於 memcpy所花的时间少了约 6 秒钟。
由此我们可以了解到,如果在 Linux 上我们所撰写的系统需要使用较大的记忆体区块拷贝时,透过 mmap 来作或许是一个不错的选择。