加密数据最重要的是密匙的设计而并不是算法的细节,一个好的加密程序的安全性应只与它的密匙有关,而与它的算法无关,但话又说回,如果算法不好,这将会给破译者制造很多机会。由于密匙的设计要涉及到许多深奥的数学问题,所以在这里我们不予讨论密匙的设计。
接下来,我们将围绕着怎样设计好一个的加密软件来讨论以下几个问题,如大家有不同的看法或更好的建议欢迎一同讨论,我的E-Mail 是 liuwenbin_1@sohu.com
一、算法:
目前的加密软件五花八门,什么算法都有,但大部分都不是采用公开算法。而是软件作者自行设计的。这些算法可以说大部分是非常脆弱的,只能用来防一般的用户,有的软件则使用了非常简单的算法,如果以为隐瞒自己算法的细节,就可瞒天过海那就大错特错了,破译者稍具密码学知识就可轻易破解它。而根本用不着反汇编。从表面上看, 被各种加密软件加密过的文件好像效果都差不多,就是把源文件的内容转换成乱码,这就是所谓的密文,但如果的密文与源文件的对应关系非常明显的话,那么破译者可能一眼就可识破,下面给出一段源程序,使用16位密匙算法(只是为了说明问题,所以使用的算法非常简单),
void Encrypt(LPSTR buffer/*字符的缓冲*/, char Password[]/*密码*/)
{
UINT PWLen=strlen(Password); // 密码的长度
UINT BYTELen=strlen(buffer); // 缓冲的大小
UINT i=0;
int j=-1;
for (; i<BYTELen; i++)
{
if (j==PWLen-1) j=-1; // 生成密匙种子
buffer[i]=(~buffer[i])^Password[j++]; // 逐个加密字符
}
TRACE0 ("Encrpyt OK!");
}
以上算法稍做修改就可在自己的软件中实现,且速度非常的快,其特点是密码越长生成的密文越混乱,且加密与解密使用相同的算法。但它只使用了"密文混乱"并未使用"密文扩散"(加密的基本技术其实就是"混乱"与"扩散"的组合,"混乱"指用另外一个字符来代替原来的字符,"扩散" 指打乱文件中字符的存储位置),如算法只使用了以上两种方法中的其中一种可以说是不够安全的,所以生成的密文要同时应用 "混乱"与"扩散"。我们将修改源程序,使它也具有"扩散"的功能。程序修改如下 :
void Encrypt(LPSTR buffer/*字符的缓冲*/, char Password[]/*密码*/)
{
UINT PWLen=strlen(Password); // 密码的长度
UINT BYTELen=strlen(buffer); // 缓冲的大小
UINT i=0;
int j=-1;
LPSTR tempbuffer=new char[BYTELen];
memcpy(tempbuffer, buffer, BYTELen); // 复制到临时缓冲
for (i=0; i<BYTELen; i++)
tempbuffer[i]=buffer[BYTELen-i-1]; // 打乱字符的位置
for (i=0; i<BYTELen; i++)
{
if (j==PWLen-1) j=-1; // 生成密匙种子
buffer[i]=(~tempbuffer[i])^Password[j++]; // 逐个加密字符
}
delete tempbuffer;
TRACE0 ("Encrpyt OK!");
}
修改后,算法的安全性稍微有点提高(注意:解密算法也有点变化了,把两个循环的位置对换过来,就是相应的解密算法),但还是非常脆弱的。因为它含有一个非常大的漏洞,就是生成的密文不是真正的乱码,而是有规律的,或是不随机的。为了更好的说明问题我们举个实例。
///////////////////////////////////////////////////////////////////////////////////////////
char teststr []="abcdefg"; // hex(十六进制): 61 62 63 64 65 66
Encrypt(teststr, "aa"); //调用
MessageBox(NULL, dd, "encrypt", MB_OK);
//最后得出的密文为:"橒汑滭" hex: 98 F8 9A FA 9C FC
这似乎不能说明什么问题,因为明文与密文好像没什么对应关系,且确实是一串乱码。
好,我们再举个例子:
///////////////////////////////////////////////////////////////////////////////////////////
char teststr[]="aaaaaa"; // hex: 61 61 61 61 61 61
Encrypt(teststr, "aa");
MessageBox(NULL, dd, "encrypt", MB_OK);
//最后得出的密文为:"櫒櫒櫒" hex: 99 A8 99 A8 99 A8
这回好像有点头目了,因为最起码密文是有规律性的,且前一个循环并未起任何作用,因为所有字符都是相同的,所以使用"扩散"等于浪费时间,且可一眼看出密码很可能是两位数(由teststr[i]=teststr[2i],可判定密匙重复了3次且每隔一个字符重复一次)。假设破译者得到了加密算法的源代码,那么不排除他们利用"选择明文攻击法"或穷举法在一分钟内破解它。如破译者完全不清楚源代码,他们也完全可通过举例分析法攻击。为了解决这个Bug,我们需要用到随机的密匙。源程序修改如下:
void Encrypt(LPSTR buffer/*字符的缓冲*/, char Password[]/*密码*/)
{
UINT PWLen=strlen(Password); // 密码的长度
UINT BYTELen=strlen(buffer); // 缓冲的大小
UINT i=0;
int j=-1;
if (PWLen==0) return;
LPSTR tempbuffer=new char[BYTELen];
memcpy(tempbuffer, buffer, BYTELen); // 复制到临时缓冲
srand(CTime::GetCurrentTime().GetSecond()+CTime::GetCurrentTime().GetMinute())
//生成随机密匙种子
for (i=0; i<BYTELen; i++)
tempbuffer[i]=buffer[BYTELen-i-1]; // 打乱字符的位置
for (i=0; i<BYTELen; i++)
buffer[i]=(~tempbuffer[i]+i)^Password[rand()%PWLen/*随机密匙*/]; // 逐个加密字符
delete tempbuffer;
TRACE0 ("Encrpyt OK!");
}
通过修改算法,使得密文变得更随机一点,且密码相同时所生成的密文可相同也可不同。不管怎么说其安全性确实提高了,尽管它还是存在着类似的Bug,这个 Bug 虽不容易发现,但它可能是致命的,这就是密文周期性的重复。好了,留给各位读者自行去研究吧。
二、验证密码:
在程序中加入密码验证的功能,使得软件使用更方便,更符合现代软件的要求,但这也给破译者制造了非常好的机会,破译者可以通过中断调试软件如Soft-ICE 来动态查看堆栈变量,从而可方便快速的捕捉存储密码的缓冲区,使用这种方法比穷举法高明多了。所以有许多软件在解密没有加入密码验证的功能,这样做虽然会提高安全性,但却给用户带来不便,因为一旦输错密码,就会破坏源文件,使得用户在每次解密时要备份密文文件,所以会在软件的易用性上大打折扣,而另外一个缺点是破译者可利用错误的密码所生成的乱码,来查找算法的漏洞,如算法不好的话,很容易会被破译者通过逆向分析来找出相应的解密算法。这似乎非常矛盾。其实对这一问题要根据具体需要而定,但如你掌握了反跟踪技术,那么就可以靠它来逃过调试工具的跟踪,但这往往是非常困难的事,不是一两句话可以说清的,所以在这里我们也不予讨论。有兴趣我们可以一块来研究。
三、速度:
有一些软件使用的算法非常好,但速度却非常慢,特别是加密大文件时,其速度是相当缓慢的,这对用户来说是无法忍受的,所以我们在设计自己的程序时一定要把速度问题加于足够重视,算法的速度与复杂度不是相斥的。打个比方,目前流行的加密算法 blowfish是一款具有高度安全性的公开加密算法,其速度是非常快的,但算法也非常复杂(有兴趣的朋友可在网上下载该算法的源代码看看)。现在的文件是越做越大,如不在这方面下功夫的话,那么设计出来的软件念经的人才能忍受。好了,讲了那么多废话,也该讲一点实际的东西了。怎样才能使一个算法具备有相当的速度呢?我们可以观察上面的程序,其中最耗时的当然是两个for 循环,如果字符的大小为1M,那么字符的长度BYTELen为1,000,000 。也就是说需要循环2,000,000 次(每个循环各有1,000,000次),按照以上的算法在80586 处理器中执行应该不会超过两秒,当然前提条件是起码要有2M 以上的内存空间(包括虚拟内存),如有非常充足的内存空间,那么可在一秒内完成。如此快的速度是要内存开销的(完全可以做到不用太多的内存开销就可获得相同的速度,这就要看你的编程功力了),如你为了节省内存而在循环体中加入new 语句,程序修改为
// 假设知道BYTELen=1000000, buffer为一个空字符指针
for (i=0; i<BYTELen; i++)
{
buffer = new char[1];
if (j==PWLen-1) j=-1;
buffer[i]=(~tempbuffer[i])^Password[j++];
delete buffer;
}
没错,如你还在程序中加入后台操作功能,这丝毫不会对系统造成什么影响。但它的速度慢得如同死机一般,所以千万记住不要在大循环体中申请内存,和使用一些非常耗时的函数,要尽量采用直接对位的操作。
总结:
以上几点都是我们在设计自己的加密软件中必须要考虑的问题,除此之外还有最重要的一点就是密匙,上面那个例子就算把加密算法设计的天依无缝也是脆弱的,16位的密匙实在太短了,我认为最起码要达到64位才算是安全的,去实现它?这就靠各位的努力了。
综合以上几点,可得出测试一款加密软件的好坏的方法,下面将列出:
1. 用压缩软件(如:WinZip等)压缩被加密过的文件(源文件用相同的字符组成能更好的说明问题),如不可压缩或压缩比率趋向于零,说明算法很好,如可以压缩且压缩比率基本与源文件差不多说明算法是差的。
2. 用二进制分析工具分别打开源文件和密文文件,比较它们的对应关系和查看密文是否是绝对随机的。
3. 测试算法的速度,加密一个大文件(越大越好),如执行中占用内存少,速度快且均匀,说明算法适合加密任何类型的文件。如执行速度快,但占用内存大,需频繁借用硬盘作为虚拟内存(顺便提一下,这也是一个很大的 Bug,因为虚拟内存的使用,使得用户无法知道,明文在什么时候被写入过硬盘),这说明该算法优化较差,且不适合加密大文件。如执行的速度如同死机一般,那么只能用它来加密一些文本文件或小文件。