各位好,16BIT ALPHA运算终于整理出来了,如有不对之处,欢迎大家批评指教。怎么样?还算谦虚吧?好了,言归正传,特效显示中ALPHA融合是应用最多的一种,在D3D中可用到硬件加速,ALPHA融合要比2D下简捷许多。鄙人一直搜索2D下的各种特效运算,现将所见过当中较好的ALPHA运算拿出来,同大家一起分享,如果各位大侠有更好的算法,千万别忘了告诉我。附:源码,编译需DX6或以上SDK,VC,DXGuide。
下面要介绍的是无限量级ALPHA查表算法,为什么说是无限量级?因为你可以随便设定ALPHA级数。在介绍16位算法之前我们最好先来看看8位查表算法:
建立一个256*256大小的表,每单元为一个颜色索引值;
用给定的ALPHA值初始化表;
查表计算。
其中表初始化就是将所有可能出现的源点和目标点的组合预先计算好,具体做法是根据调色板及源点和目标点的颜色索引值分离出R、G、B值,分别计算后再从调色板中取出与计算结果最符合的颜色索引值存入表内。
融合计算时只需将源点和目标点的颜色索引值作为查找表的下标,找到相应的表单元即可。算法原码在TONY COX的FAQ有。
16位算法基本原理同8位一样,但不需要建216*216的表,而是建立两个?28*28的表。计算时将低字节和高字节分开计算,为什么可以分开计算下面我们来证明一下:
以565方式为例,设源点颜色值为R1G11 G12B1,R1G11为高字节,G12B2为低字节。同样目标点颜色值设为R2G21 G22B2,ALPHA值为A,最大级数为M,则融合公式为:
R = (A*R1+(M-A)*R2)/M
G1G2 = (A*G11G12+(M-A)*G21G22)/M
B = (A*B1+(M-A)*B2)/M
[RG1G2B] = 211*R+25*G1G2+B
= 211*(A*R1+(M-A)*R2)/M +
25*(A*G11G12+(M-A)*G21G22)/M +
(A*B1+(M-A)*B2)/M
= 28*(A*23*R1+(M-A)*23*R2)/M +
25*(A*(23*G11+G12)+(M-A)*(23*G21+G22))/M +
(A*B1+(M-A)*B2)/M
= 28*(A*(23*R1+G11)+(M-A)*(23*R2+G21))/M +
(A*(25*G12+B1)+(M-A)*(25*G22+B2))/M
=28*(A*[R1G11]+(M-A)*[R2G21])/M +
(A*[G12B1]+(M-A)*[G22B2])/M
该死的上下标!看出来没有?啊?前半部为高字节,后半部为低字节,哈————
于是由高低字节计算无关性可引申为n位运算无关性,接下来该知道怎么建立查找表了吧?还不知道?不要问我,自已慢慢想吧。我再也不想敲半个上下标了。
接下来是32级ALPHA运算,此法原理较简单,将一个颜色字拓展为一个双字,用32位寄存器来计算,例如:RRRRRGGGGGGBBBBB拓展为00000RRRRR000000GGGGGG00000BBBBB,运算完后再还原为一个字即可。为什么是32级而不是64级?因为2的5次方是32,不论是555还是565,各颜色平均最多只能再拓展5位,32是此法的最大级数。当然小于32级是没问题的。影响本法效率的关键在于字到双字的拓展。其实R、G、B谁先谁后无关紧要,最最要紧的是迅速展开与还原。以565为例:
展开: (wRGB¦wRGB<<16)&0Xf81f07e0 //1111,1000,0001,1111,0000,0111,1110,0000
还原: (dwRGB>>16)¦dwRGB
比较两法,第一种方法较适合ALPHA值固定的情形,如《二战特种兵》中德士兵的可视区。至于ALPHA渐进变动情形下的效率,运算区域越大,第一种方法优势越大。具体对比未仔细做,各位可自己去做比较。