分享
 
 
 

结合XML的数据检索技术

王朝other·作者佚名  2006-01-09
窄屏简体版  字體: |||超大  

网络检索无处不在!无论是显而易见的搜索引擎,还是论坛、网上购物目录等,都频繁地使用网络检索。因此,我们这里的“网络检索”定义为用户通过网络提交一定的检索条件(如关键词信息)到服务器上的检索应用中,并获取和呈现检索应用所返回的结果。

检索方式

一般来说,当检索的结果集过大时(经常出现非常大的情况),采取分页数据显示的策略,即每次返回结果集中的小部分数据,通过类似“上一页”、“下一页”的操作来查看更多的结果。用户的期望是提交的检索能够很快得到响应,而且进行“上一页”、“下一页”的操作时也能够很快得到响应。因此,问题的关键在于根据用户提供的记录起始位置和需要记录数量来获取每一次所需要使用的结果数据。目前存在一些使用较多的方式。

1) 用户提交的检索条件每次都被重新执行,然后获取检索结果集的一个子集。用户的检索条件被保存在Cookie、Session或者HTML的表单隐藏元素(“<input type=hidden value=条件>”)中。由于检索操作需要对服务器和数据库资源的大量使用,因此,每次执行检索无疑会增加这种负担,降低检索应用的效率。

2) 将全部的检索结果取出放到一个大的对象中,该对象实现了对记录的各种操作。同时如果将该对象缓存在服务器上,那么以后的翻页操作都不需要重新执行检索条件而直接从该对象中获取结果的子集。然而,将全部检索结果保存到对象中的操作本身就比较复杂,而且如果结果集很大,则意味着缓存该对象需要占用大量宝贵的服务器资源。同时,首次结果的显示速度可能不会令人满意。

3) 一次获取“几页”的结果子集并保存到对象中并缓存起来,如果用户的“下一页”操作超出了当前对象提供的数据,则再次执行检索条件,获取满足条件的“又几页”并保存到同一个对象中。出现这种情况的考虑是,用户在使用检索时,可能只会查看最开始的一些记录,而很少进行到相对后面的记录。从这种意义上看,不失为一种比较好的方式。但如果移动到未缓存的记录时,又必须重新执行查询,同时降低结果显示的速度。

4) 在首次执行检索时,先将全部能够唯一确定每条记录的编号(如主键)保存到对象中并缓存起来,以后对每一页的请求首先在缓存的主键对象中找出满足条件的主键集合,再重新建立查询语句(使用IN关键字)取得该页需要的记录,这样能够准确定义每次需要的检索范围,从而也只是取得所需要的数据。当然,如果某个表不存在这种唯一编号或者主键就无法进行。

5) 在一些检索应用中,如论坛的帖子显示,可以用一个公共的缓存区来保存部分的帖子,当用户请求某一页时执行的查询仅仅取得帖子的主键,根据这些主键到公共缓存区中去取得记录。如果对应主键的记录不存在,则使用该主键查询出记录同时保存该记录到公共缓存区。这种方式适用于多个用户检索的结果大部分相同的情况,正如论坛帖子的显示。

6) 如果是在J2EE体系结构中,使用EJB的Finder方法也可以返回对象的集合,而这样的一个对象封装了每条记录的数据。但是,大量对象的生成和存在于服务器内存中无疑也是对服务器资源的巨大消耗。因此,对于存在大量记录的结果集使用实体Bean来代表每条记录会耗尽系统资源而且实际上并不能够获得太多的好处。

网络检索的关键在于检索的执行效率、网络传输速度和结果集的使用方式。综合来看,网络检索的模式都是通过提供的检索条件,来构建一个能够被数据库使用的、优化的SQL查询语句,由数据库执行并返回记录集,再根据这些记录集来生成显示页面。

因此,在中间层及数据层,我们着重考虑如何高效地生成每次所需的结果数据;在表示层,即面向用户的层面则需要提供友好、方便的显示和操作界面。

实现机制

从各种检索方式使用的效率来说,结果集对象的缓存是可行的。在JDBC2.0中,支持可滚动的结果集,能够任意取得结果集的一个子集。同时,可以指定能够被缓存的返回记录数量,这样就不需要一次返回全部的记录(对分页操作来说,该项功能具有实际的意义),当需要新的记录时,再到数据库中取得并替换掉缓存中的旧记录。然而,各个数据库厂商对JDBC2.0中的结果集以各自不同的方式实现,因此,效率各不相同。Oracle在这方面是做得比较完善的。

检索操作的具体流程为:用户通过检索页面(如search.jsp)构建检索的条件(包括输入关键词、选择范围等),提交后到检索处理程序(如SearchServlet),分析用户提交的数据并且构建一个合理的SQL查询语句;由检索执行程序(如LocalEngine)来执行该SQL查询语句,同时将执行返回的结果集进行缓存,并重新定向到检索结果页面(如searchresult.jsp);由检索结果页面提交请求到结果处理程序(如SearchResultServlet)来获取所需的数据,格式化并显示信息。

图1:检索序列图

网络检索的关键在于两个方面:检索的执行和结果的显示。如果从用户的角度来考虑,比较关心的是检索的准确性、结果界面的友好性及检索响应速度。

XML结合数据绑定的结果显示

XML在数据表现和数据交换方面优势使其发展潜力巨大。但是直接呈现XML数据给用户并不是最好的模式,需要利用浏览器的功能来完善数据的显示。一种有效传输XML的方式是利用MSXML解释器中的XMLHTTP对象,它允许你打开一个到服务器上的HTTP连接,发送一些数据和取回一些数据,并且所有的这一切都是在很少的几段脚本中就能够实现。使用XMLHTTP对象通常是进行XML数据交换,但其他格式的数据也是允许的。在作这一系列事情时,不需对当前网页进行重加载,用户甚至不知道后台在作些什么,网页不用重新刷新就已经获取了新的数据。

将客户端的请求发送到服务器后,通过XMLHTTP对象可以接受返回的数据。利用数据岛(Data Island)将我们返回的XML数据嵌入到页面中去。扩展标记语言XML使用标准的方式来描述和交换结构化数据;XML的数据以开放的、基于文本的格式进行描述,并通过标准HTTP协议传输。XML本身的特性决定了它天生就是一种灵活强大的数据源对象(DSO)。IE4.0使用JAVA APPLET来实现XML DSO;IE5.0支持Data Island,用户可以直接用<XML>标记定义的数据作为DSO。

数据绑定(Data Binding)并不是一个新概念,IE 4.0就已对其给予了丰富的支持。但是,数据绑定并未受到应有的重视,许多开发者似乎更加愿意使用服务器端脚本(Server Script)的方法。然而实际上,无论是在动态网页的代码实现方面,还是在动态网页的工作效率方面,数据绑定的效率都比后者更高。

可绑定的HTML元素共分为两大类:单值对象(Single-valued Consumer)和表对象(Tabular Consumer)。单值对象显示DSO提供的当前记录的某一个域,而表对象中的每行元素则分别对应一条记录中不同的域,并以此为模板重复显示数据集中的每条记录。数据显示对象既可以在设计时绑定到DSO,也可以在运行时动态绑定。

利用数据绑定,减轻了服务器的负担。服务器应用程序可以专注于数据的产生,而数据的显示和操作由客户端脚本来完成。由于不需要刷新页面,我们能够将结果记录总数、当前页码等信息保存在客户端,并且根据这些信息来生产总页数、分页显示的代码。

结果集缓存的检索

利用JDBC2.0的特性,我们可以更加自由地操作结果集对象,移动游标向前、向后以及指向任意位置(将ResultSet的类型设置为TYPE_SCROLL_INSENSITIVE或TYPE_SCROLL_SENSITIVE),同时能够指定一次取得记录的数量。检索应用的类图如下:

图6:检索操作类图

ResultHelper:用于检索操作的帮助类。通过该类来执行检索、获取记录总数、获取结果集的XML数据。

QueryProperties:生成实际执行的、完整的数据库操作SQL语句。

QueryBean:进行实际的数据库操作,提供对结果集的使用操作。该类也实现HttpSessionBindingListener接口,当不再需要该类的缓存数据时,能够关闭数据库连接。使用Iterator模式。

PageGlobals:检索操作的公共变量,如默认页面大小、默认开始页面、默认缓存时间等。

总结

实际使用的情况表明,结果集的缓存和XML数据绑定能够大大提高检索和显示的效率。

在服务器端,不需要使用JSP来生成检索结果页面,结果数据以XML来表示,能够提供给任何类型的客户端使用,而不仅仅局限于浏览器(类似于Web服务的概念);在网络传输方面,每次只是传递需要的XML,很大程度上减少了传输的数据量;客户端使用XMLHTTP对象来实现数据提交到服务器,形成一种后台操作的形式,“安静”地从服务器上取得数据;采用数据绑定的形式来呈现数据,生成网页的效率明显地提高了,而且编程工作量少,使用灵活。

采用XML技术、数据绑定的方式来完成高效的检索结果呈现,在编程实现方面会带来一定的复杂性,但是,复杂的工作是高效率的代价,可以根据实际情况来决定采用的方式。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有