图象目标提取算法的比较
在图象自动识别过程中,提取识别目标是正确识别的关键步骤。本文介绍两种图象处理方法,并对他们在目标提取中作用进行比较。
在一般的图象识别过程中,总是首先对图象的灰度、色彩等图象特征进行统计分析,找出识别要素之间的图象关系,进行图象的处理和过滤,比如二值化方式中的灰度域值。由于在图象生成过程中,环境的因素对图象质量产生影响,如光照、阴影等的作用,使产生的图象在明暗和对比度方面有较大变化,因此,一个确定的灰度域值不可能适合所有的环境情况,怎么样来产生一个变化的域值针对不同的图象进行处理,是目标提取的关键所在。
本文就灰度直方图和视觉神经元两个方面来探讨目标和背景的区分方法,本文的图象处理是基于灰度图象进行的,因此对于彩色图象,首先应转换成灰度图象。灰度直方图是对灰度图象的象素进行统计,确定图象的分布曲线。视觉神经元是定义图象中的每一个象素占用一个传感神经元,通过神经元的刺激函数传导图象。在一般的图象处理中,可以多种方式混合使用,以达到目标提取满意为准则。
本文以铁路货运车厢号码自动识别系统的图象目标提取过程为案例,对图象目标提取过程进行分析。
一、 灰度直方图法
对于样本图象,如图:
图1
进行灰度统计,如图:
图2
从直方图中可以看出,背景灰度和目标灰度的界线灰度,图象处理的目的就是要自动找出图象目标的这个界线(灰度域值)。按照视觉单元原理,进行灰度处理,形成新的灰度统计曲线,如图:
图3
中的绿色曲线为灰度处理后的灰度直方图,根据图象处理原则(目标灰度不变),两条曲线的相交点就是要寻找的目标灰度域值。最后形成目标图象的灰度直方图:
图4
和目标图象。
图5
在灰度处理过程中首先要注意的是算法一定要满足目标灰度不变的原则,否则,取得的灰度域值不能代表目标的域值。
二、 流体动力法(视觉神经元)
本算法的原理来自《视觉神经系统与分布式推理理论》一书,在其基础上进行简化处理针对灰度图象,利用灰度作为神经元的输入初始量,模拟液体从高向低流动的原理,对图象单元进行迭代处理,逐渐使灰度向低递减,当系统总流动量小于某一个界限值时,认为系统没有流动而达到稳定,此时,根据象素的剩余灰度值,可以确定目标象素。
在流动过程中,边界初值设置为0,象素液面只减少,不增加是为了加快流动速度,一般只需迭代5次,图象变化就很少了,此时的目标也就比较突出了。
设置目标边缘值为0,是为了环式封闭区域的流动。背景象素总是趋向于0方向流动,目标区域则由于边缘阻尼的作用,趋向0的速度缓慢。
取灰度图象,如图:
图6
计算边缘象素,如图:
图7
3次迭代流动后的灰度比较,如图:
图8
最终的目标图象:
图9
两种方法对同一张图片进行操作,从最终目标图象效果来看,都能够达到识别目标提取的目的,两种方法对对比度较小的图象处理有一定的差别,普遍来讲,流体方式优于,灰度直方图方式。这里是经验之谈,欢迎大家提出更好的方法进行交流。
(Email:ch2zh1@163.net)