MD5 (Message Digest Algorithm 5 信息—摘要算法5 ) 的一些体会
一、若我们定义一个函数 ,原型为:
String MD5 ( Information info)
其中Information 表示任意长度的信息,注意是任意长度的。
实现这个函数的最终要求:
1、对于不同的输入信息,产生的返回值 结果相同 且必须唯一
2. 改算法不可逆转,也就是就算拥有 返回结果和算法细节,也不可能推导出输入的初始信息。
下面是MD5算法对一些特定值产生的返回值:
md5 ("") = d41d8cd98f00b204e9800998ecf8427e
md5 ("a") = 0cc175b9c0f1b6a831c399e269772661
md5 ("abc") = 900150983cd24fb0d6963f7d28e17f72
md5 ("message digest") = f96b697d7cb7938d525a2f31aaf161d0
md5 ("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b
md5("abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz0123456789")
=d174ab98d277d9f5a5611c2c9f419d9f md5("12345678901234567890123456789012345678901234567890123456789012345678901234567890") = 57edf4a22be3c955ac49da2e2107b67a
对于第二个要求,就是说,给你 一个 32位的字符串d41d8cd98f00b204e9800998ecf8427e,如果不事先告诉你,那你一辈子都别想得出它的输入信息是 一个空白字符。
二、一些典型的应用。
1. 对一段信息(message)产生信息摘要(message-digest),以防止被篡改。比如,在unix下有很多软件在下载的时候都有一个文件名相同,文件扩展名为.md5的文件,在这个文件中通常只有一行文本,大致结构如:
md5 (tanajiya.tar.gz) = 0ca175b9c0f726a831d895e269332461
这就是tanajiya.tar.gz文件的数字签名。md5将整个文件当作一个大文本信息,通过其不可逆的字符串变换算法,产生了这个唯一的md5信息摘要。如果在以后传播这个文件的过程中, 无论文件的内容发生了任何形式的改变(包括人为修改或者下载过程中线路不稳定引起的传输错误等),只要你对这个文件重新计算md5时就会发现信息摘要不相同,由此可以确定你得到的只是一个不正确的文件。
2.防止抵赖。这需要有第三方权威机构的参与。A 写了个文件,权威机构对改文件用MD5算法产生摘要信息做好记录。若以后A说这文件不是我写的,权威机构只需对改文件重新产生摘要信息跟记录在册的摘要信息进行比对,相同的话,就证明是A写的了。这就是所谓的“数字签名”了。
3. 加密信息。比如在unix系统中用户的密码就是以md5(或其它类似的算法)经加密后存储在文件系统中。当用户登录的时候,系统把用户输入的密码计算成md5值,然后再去和保存在文件系统中的md5值进行比较,进而确定输入的密码是否正确。通过这样的步骤,系统在并不知道用户密码的明码的情况下就可以确定用户登录系统的合法性。这不但可以避免用户的密码被具有系统管理员权限的用户知道,而且还在一定程度上增加了密码被破解的难度。