怎样抓取图片上的文字?OCR?太麻烦了,识别率也太差。紫光文通有一款名叫“慧视”屏幕图像文字识别系统的软件可以帮你轻松搞定。这款软件不仅能对数码相机拍摄下来的图片资料进行识别,而且能直接对电脑屏幕上的网页及PDF格式的文件资料进行识别。
安装的过程很简单,两分钟时间就安装好了。这时在我电脑右下角的横条上显示出了清华紫光紫色的Logo,再双击它,右上方就弹出了一个小横条,上面有很多标志。我选中了一个眼睛的标志(我听文通的工作人员介绍过,这就是“慧视”的标志,用它去对要识别的内容进行圈点),就出现了一只手带一个红十字,我对网页上的文字随便圈点了一下,就弹出了一个灰色的对话框,上面有“识别图像、识别文字、输出内码”三项内容,“识别图像”栏下有浅色底、深色底及自动选项三个选择,用户可以根据自己的需要来选择;识别文字下有简体中文、繁体中文、纯英文三个选项,人们一般常用的是简体中文,只要点击它就可以识别成简体了。这些选择好后,点击确认,一会儿就在一个文本框里出现了识别出来的文字。
我在网页上试了很多次,识别的效果都特别好。对于那些不能直接COPY的文字,用“慧视”是最方便不过了,省去了文字的输入过程,感觉又快又方便。还有,我原来对PDF格式的文件也很头痛,有一些东西需要摘下来用,但苦于不能COPY,经常是需要另开一个WORD窗口,照着上面的资料一个字一个字地敲进去,很耗费时间和精力,除了这样又找不到一个更为行之有效的方法。现在有了“慧视”,这个难题就迎刃而解了。对倾斜变形的图像和文字,“慧视”也一样能进行识别,如果发现有错误的地方,直接用软件附带的“小灵鼠”手写软件,点击右上方有手写板的标志就可以用鼠标修改了。
随着软件技术的发展,各种屏幕抓取软件应运而生,而且功能越来越强大。由Structu Rise公司开发的Kleptomania 与一般的屏幕抓取软件具有极大的不同之处,更具有独到之处。
一、 文字和图形的抓取
Kleptomania是一个小巧的屏幕抓取程序,它与普通的屏幕抓取软件的最大不同之处在于它通过OCR技术,来识别所截取的屏幕图形中的文字,其强大的功能使得用户不仅可以抓取一般的字处理系统和网页中出现的文字(这些文字常常可以通过复制到剪贴板的方法获得),而且可以抓取图形乃至任何运行程序运行过程中出现在屏幕上的文字。其安装和设置方法如下: 1) 下载并安装完成之后,运行该软件,软件自动建立字库索引。此后在系统托盘中,将会出现一个十字性图标。
参考资料:http://www.yesky.com/418/217418.shtml