如今,搜索引擎已经成为互联网上最重要的应用之一,但是在图像搜索方面,目前的搜索引擎都需要为在Web上浏览过的图像建立索引信息,为图像加注释,才能够进行图像分析和判别。不但在搜索时候很难对图片给出一个精确的定义,而且搜索结果也非常的不精确。
目前互联网上的图像搜索引擎主要通过下面两种常用的方法对图片进行筛选和搜索:
1 基于图像的外部信息
即根据图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息等外部信息进行检索,这是目前图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,但这取决于文件名或路径名的描述程度。
2 基于图像内容特征描述
这是一种语义层次的匹配。需要人工对图像的内容(如物体、背景、构成、颜色特征等)进行描述并分类,给出描述词。检索时,将主要在这些描述词中搜索你的检索词。这种查询方式是比较准确的,一般来讲可以获得较好的查准率。但需人工参与,劳动强度大,因而限制了可处理的图像数量,并且需要一定的规范和标准,效果取决于人工描述的精确度。
而这两种搜索方式事实上还是通过对图片的语言描述来进行筛选和搜索的,但是人类的语言描述能力与自身的知觉感官之间仍然存在着无法逾越的鸿沟。很多存在于我们大脑中的事物都很难用言语具体地表达。即便我们可以清晰地刻画一些简单的场景,现有的搜索引擎也很难支持具有修饰词的查询任务。也许我们能够很容易的通过现有的搜索引擎找到有关“海滩”的图片,但它能够精确地找出“傍晚的海滩”的吗?更甚至是“傍晚的带有波浪的并且沙滩上有椰子树的海滩”?当然,他能找到图片,但是提供于我们的往往是成千上万的答案,使用者往往有沙里找米的感觉。面对诸如此类的问题,现有的搜索引擎可以说是无力应对。
因此,对于图片搜索来说,最终的解决方案还是由用户直接提供一幅已经存在的图片,然后由搜索引擎自动对这幅图片的图象特征进行分析,并提供给用户最符合这些特征的图片。通过这种检索方式,再加上目前图象搜索引擎的语言描述筛选,就真正能做到对图象的精确和直观的搜索。但是目前互联网上已经推出应用的图象搜索引擎中,还没有一个能真正达到这种功能。
现在,新一代的图像搜索引擎――Impressio――即将问世,它采用了全新的用于多媒体信息的检索方式。通过对现有媒体形式的特征研究,它可以很轻易的实现图片、音乐乃至电影内容的图象检索甚至语义识别。它采用当前学术界最先进的基于视觉内容的多媒体信息检索技术,使其可以精确地从用户提供的图片样本中提取出用户真正感兴趣的视觉特征乃至语义特征,并以此特征作为检索的标准,从而挖掘出用户真正希望得到的图片。
Impressio的推出将可以为我们解决很多领域的问题,如专业图纸类查询(建筑结构设计图、房地产规划图)、文化类服务(历史博物馆、艺术博物馆的多媒体资料归类、查询)、数字图书馆(图片、音乐、生物影像、影视记录以及电台广播记录的自动分类及查询)、电子商务(商品自动归类及查询)、教育(课件支撑库的自动分类及查询)、家庭娱乐(个人影集归类及搜索)、智能识别(人类特征识别)、新闻业(政客演讲、相关新闻图片搜索)、多媒体目录服务(黄页、旅游地理信息)、交通管制(车牌识别)、医学(通过医学影像的自动病理识别)等等……,所以让Impressio市场化变得刻不容缓。