剖析Linux病毒原型&#30340

一、介绍

写这篇文章的目的主要是对最近写的一个Linux病毒原型代码做一个总结，同时向对这方面有兴趣的朋友做一个简单的介绍。阅读这篇文章你需要一些知识，要对ELF有所了解、能够阅读一些嵌入了汇编的C代码、了解病毒的基本工作原理。

二、 ELF Infector (ELF文件感染器)

为了制作病毒文件，我们需要一个ELF文件感染器，用于制造第一个带毒文件。对于ELF文件感染技术，在Silvio Cesare的《UNIX ELF PARASITES AND VIRUS》

一文中已经有了一个非常好的分析、描述，在这方面我还没有发现可以对其进行补充的

地方，因此在这里我把Silvio Cesare对ELF Infection过程的总结贴出来，以供参考：

The final algorithm is using this information is.

* Increase p_shoff by PAGE_SIZE in the ELF header

* Patch the insertion code (parasite) to jump to the entry point

(original)

* Locate the text segment program header

* Modify the entry point of the ELF header to point to the new

code (p_vaddr + p_filesz)

* Increase p_filesz by account for the new code (parasite)

* Increase p_memsz to account for the new code (parasite)

* For each phdr who's segment is after the insertion (text segment)

* increase p_offset by PAGE_SIZE

* For the last shdr in the text segment

* increase sh_len by the parasite length

* For each shdr who's section resides after the insertion

* Increase sh_offset by PAGE_SIZE

* Physically insert the new code (parasite) and pad to PAGE_SIZE, into

the file - text segment p_offset + p_filesz (original)

在Linux病毒原型中所使用的gei - ELF Infector即是根据这个原理写的。在

附录中你可以看到这个感染工具的源代码: g-elf-infector.c

g-elf-infector与病毒是独立开的，其只在制作第一个病毒文件时被使用。我简单介

绍一下它的使用方法，g-elf-infector.c可以被用于任何希望--将二进制代码插入到

指定文件的文本段，并在目标文件执行时首先被执行--的用途上。g-elf-infector.c

的接口很简单，你只需要提供以下三个定义：

* 存放你的二进制代码返回地址的地址，这里需要的是这个地址与代码起始

地址的偏移，用于返回到目标程序的正常入口

#define PARACODE_RETADDR_ADDR_OFFSET 1232

* 要插入的二进制代码（由于用C编写，所以这里需要以一个函数的方式提供）

void parasite_code(void);

* 二进制代码的结束（为了易用，这里用一个结尾函数来进行代码长度计算）

void parasite_code_end(void);

parasite_code_end应该是parasite_code函数后的第一个函数定义，通常应该如下表示

void parasite_code(void)

{

...

}

void parasite_code_end(void) {}

在这里存在一个问题，就是编译有可能在编译时将parasite_code_end放在parasite_code

地址的前面，这样会导致计算代码长度时失败，为了避免这个问题，你可以这样做

void parasite_code(void)

{

...

}

void parasite_code_end(void) {parasite_code();}

有了这三个定义，g-elf-infector就能正确编译，编译后即可用来ELF文件感染

三、病毒原型的工作过程

1 首先通过ELF Infector将病毒代码感染到一个ELF文件，这样就创造了第一

个带毒文件，后续的传播就由它来完成。

2 当带毒文件被执行时，会首先跳到病毒代码开始执行。

3 病毒代码开始发作，在这个原型里，病毒会直接开始传播。

4 病毒遍历当前目录下的每一个文件，如果是符合条件的ELF文件就开始感染。

5 病毒的感染过程和ELF Infector的过程类似，但由于工作环境的不同，代码的实现也是有较大区别的。

6 目前传染对ELF文件的基本要求是文本段要有剩余空间能够容纳病毒代码，如果无法满足，病毒会忽略此ELF。对于被感染过一次的ELF文件，文本段将不会有剩余的空间，因此二次感染是不会发生的。

7 病毒代码执行过后，会恢复堆栈和所有寄存器（这很重要），然后跳回到真正的可执行文件入口，开始正常的运行过程。

上面对病毒原型的工作过程的介绍也许显得千篇一律了，和我们早就熟知的关于病毒的一些介绍没有什么区别？是的，的确是这样，原理都是类似的，关键是要看实现。下面我们就将通过对一些技术问题的分析来了解具体的实现思路。

四、关键技术问题及处理

1 ELF文件执行流程重定向和代码插入

在ELF文件感染的问题上，ELF Infector与病毒传播时调用的infect_virus思路是一样的：

* 定位到文本段，将病毒的代码接到文本段的尾部。这个过程的关键是要熟悉

ELF文件的格式，将病毒代码复制到文本段尾部后，能够根据需要调整文本段长度改变

所影响到的后续段(segment)或节(section)的虚拟地址。同时注意把新引入的文本段部

分与一个.setion建立关联，防止strip这样的工具将插入的代码去除。还有一点就是要

注意文本段增加长度的对齐问题，见ELF文档中的描述：

p_align

As ``Program Loading'' later in this part describes, loadable

process segments must have congruent values for p_vaddr and

p_offset, modulo the page size.

* 通过过将ELF文件头中的入口地址修改为病毒代码地址来完成代码重定向：

/* Modify the entry point of the ELF */

org_entry = ehdr-e_entry;

ehdr-e_entry = phdr[txt_index].p_vaddr + phdr[txt_index].p_filesz;

2 病毒代码如何返回到真正的ELF文件入口

方法技巧应该很多，这里采用的方法是PUSH+RET组合：

__asm__ volatile (

...

"return:\n\t"

"push $0xAABBCCDD\n\t" /* push ret_addr */

"ret\n"

::);

其中0xAABBCCDD处存放的是真正的程序入口地址，这个值在插入病毒代码时由感染程

序来填写。

3 堆栈和寄存器的恢复

病毒代码必须保证运行前、后的堆栈和寄存器内容完全相同，这通过增加额外的代码

来完成。

在进入时：

__asm__ volatile (

"push %%eax\n\t"

"push %%ecx\n\t"

"push %%edx\n\t"

::);

退出时：

__asm__ volatile (

"popl %%edx\n\t"

"popl %%ecx\n\t"

"popl %%eax\n\t"

"addl $0x102c, %%esp\n\t"

"popl %%ebx\n\t"

"popl %%esi\n\t"

"popl %%edi\n\t"

"popl %%ebp\n\t"

"jmp return\n"

要注意上面的代码是根据特定的编译器、编译选项来调整的，在不同的环境下如果重

新编译病毒程序，可能还需要做一些调整。

4 字符串的使用

write(1, "hello world\n", 12);

在病毒代码中这样对一个字符串直接引用是不可以的。这是对字符串的使用是一个绝

对地址引用，病毒代码在进入到一个新的宿主内后，这一绝对地址的内容是无法得到

保证的，因此在病毒代码内应该使用相对地址或间接地址进行字符串访问。

下面是Silvio Cesare的《UNIX ELF PARASITES AND VIRUS》中的一个解决办法，利用

了缓冲区溢出中shellcode的编写技术：

In x86 Linux, some syscalls require the use of an absolute address pointing to initialized data. This can be made relocatable by using a common trick used

in buffer overflow code.

jmp A

pop %eax ; %eax now has the address of the string

. ; continue as usual

call B

.string \"hello\"

By making a call directly proceeding the string of interest, the address of

the string is pushed onto the stack as the return address.

但是在编写这个linux病毒原型代码时，我并没有使用这个方法，我尽力使代码使用

C语言的语法：

char tmpfile[32] = {'/','t','m','p','/','.','g','v','i','r','u','s','\0'};

#ifndef NDEBUG

char err_type[32] = {'f','i','l','e',' ','t','y','p','e',' ','n','o','t',' ',

's','u','p','p','o','r','t','e','d','\n','\0'};

char luck[32] = {'B','e','t','t','e','r',' ','l','u','c','k',' ',

'n','e','x','t',' ','f','i','l','e','\n','\0'};

#endif

在这里将字符串以字符数组的形式出现，编译之后的代码是这样：

...

movb $47, -8312(%ebp)

movb $116, -8311(%ebp)

movb $109, -8310(%ebp)

movb $112, -8309(%ebp)

movb $47, -8308(%ebp)

movb $46, -8307(%ebp)

movb $103, -8306(%ebp)

movb $118, -8305(%ebp)

movb $105, -8304(%ebp)

movb $114, -8303(%ebp)

movb $117, -8302(%ebp)

movb

&#21078;&#26512;Linux&#30149;&#27602;&#21407;&#22411;&#30340