jsp/SERVLET上载的难点
1、支持任意格式、任意数量的文件上载;2、上载控制的实现;3、表单信息的取得;4、“即插即用”的应用方法;我个人认为,制约通用 上载组件的实现主要是这四个难点。
JSP/SERVLET上传的原理
JSP/SERVLET文件 上载是通过ServletInputStream类来实现的,ServletInputStream类是Java.io.InputStream的一个扩展抽象类,实质上也是一个输入流,通过ReadLine方法从Request端一行一行读取,可见,JSP/SERVLET上载根本上是用流来实现的,理解了这个就不难理解整个 上载的原理。ServletInputStream实现文件 上载必须采用HTTP POST或者HTTP PUT协议,HTTP GET协议只能传递很少的数据,是不能实现文件上载的。
下面我们来看一下上传的数据流的结构,首先要在BROWSER端给出一个请求,我们的请求如下(文件名为test1.jsp):
<%@ page contentType="text/Html; charset=GBK" %
<html
<head
<title文件上载</title
</head
<body
<form action="test2.jsp" enctype="MULTIPART/FORM-DATA" method=post
说明一: <input type="text" name="eXPlain1" /
<br /
说明二: <input type="text" name="explain2" /
<br /
请选择上载文件1 <input type="file" name="file1" /
<br /
请选择上载文件2 <input type="file" name="file2" /
<br /
说明三: <input type="text" name="explain3" /
<br /
<input type="submit" value=" 上载 " /
</form
</body
</html
显示如下:
说明一:
说明二:
请选择上载文件一:
请选择上载文件二:
说明三:
在上载请求页中混杂了表单的三个输入框,及两个上载文件,当然输入框可以更多、更杂,可以有选择框、单选及多选按钮,待上传的文件也可以有三个、四个或所需要的更多。
action="test2.jsp"表示表单将提交到"test2.jsp",另外注重表单属性中必须要有这句:enctype="MULTIPART/FORM-DATA",enctype指定 Form 输入资料的编码方式,“method”属性必须为“post”,这样表单才能提交大量数据,也表示本表单的数据传递将用流操作,“method=get”表示数据将通过地址栏进行传递,虽然方便快捷,但只适合很少的数据量。
响应端“test2.jsp”页面如下:
<%@ page contentType="text/html; charset=GBK" %
<html
<head
<title文件上载</title
</head
<body
<jsp:useBean id="upBean" scope="page" class="com.upload.UpBean"/
<%
upBean.doUpload(request);
out.println("上载已完成,请查看输出文件");
%
</body
</html
test2.jsp收到请求后,调用一个java bean执行doUpload(request)操作,本操作将完成流(unicode格式)的接收并不做任何处理地将流顺序写入一个文本文件里,读写操作中用了一个缓冲区byte[] readByte,用了一个ServletInputStream 的一个方法readLine(byte[] b, int off,int len)方法读取流,请大家注重,ServletInputStream 流的read Line方法是一次读入指定大小的行,java bean (UpBean.java)代码如下:
[code]package com.upload;
import java.io.*;
import javax.servlet.*;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.ServletInputStream;
public class UpBean {
public void doUpload(HttpServletRequest req) throws ServletException, IOExcept
ion{
//首先定义一个文本文件
File file = new File("out.txt");
//readCount 记录从输入流中实际读取的字符数
int readCount;
//输入流缓冲区
byte[] readByte = new byte[1024];
//初始化输入流
ServletInputStream servletInputStream = req.getInputStream();
//初始化一个输出流(到文件)
FileOutputStream fileOutputStream = new FileOutputStream(file);
//循环从读取输入流中读取字节
readCount = servletInputStream.readLine(readByte, 0,readByte.length);
while(readCount != -1){
fileOutputStream.write(readByte,0,readCount);
readCount = servletInputStream.readLine(readByte, 0, 1024);
}
//关闭文件流
fileOutputStream.flush();
}
}[/code]
为了便于我们阅读流,上载的两个文件为两个简单的文本文件(有格式的文件,不便于直接分析):one.txt及two.txt,文件内容如下,实验时请建立对应文本文件,内容请直接copy以下所示:
one.txt:
one
one one
one one one
two.txt
two
two two
two two two
都预备好以后,我们就可以运行了,运行时请注重,文本部分及文件部分最好不要出现汉字,或其他双字符集字符,尽量采用英文,因为接收是采用的Unicode字符集,我们未对输入做任何处理。 我们在三个输入框输入的字符为,说明一:explain1;说明二:explain2;说明三:explain3,out.txt接收到如下字符:
-----------------------------7d2623a3e0286
Content-Disposition: form-data; name="explain1"
explain1
-----------------------------7d2623a3e0286
Content-Disposition: form-data; name="explain2"
explain2
-----------------------------7d2623a3e0286
Content-Disposition: form-data; name="file1"; filename="C:\test\one.txt"
Content-Type: text/plain
one
one one
one one one
-----------------------------7d2623a3e0286
Content-Disposition: form-data; name="file2"; filename="C:\test\two.txt"
Content-Type: text/plain
two
two two
two two two
-----------------------------7d2623a3e0286
Content-Disposition: form-data; name="explain3"
explain3
-----------------------------7d2623a3e0286--
可以很明显的看到,out.txt被“-----------------------------7d2623a3e0286”分成了五 节,即表单的每个输入部分都对应一节,结尾部分是“-----------------------------7d2623a3e0286--”,刚好比开始的一段字符在最后多出两个“-”, 每节的第一行是输入内容的说明“Content-Disposition: form-data”,“name="explain1"”表示 上载请求项的name,文本输入部分仅这两个说明,假如输入的是文件还用两项说明:“filename="C:\test\one.txt"”,表示输入源,基于ms-windows的ie上载带有完整的路径,netscape及其他浏览器可能只有一个文件名;还有一项是关于输入格式的“Content-Type:text/plain”;表示输入格式是文本类型,假如我们上载的是bmp文件则为“Content-Type: image/bmp”,Word文件为“application/msword”...,说明的下面紧接着是一个空行,然后下面才是我们所需的内容。
仔细分析未加修改的输入流格式,有助于我们实现文件与输入文本的准确分离。
通过以上的分析可以看出,准确分离上载的文件及文本信息需要以下要素:1、数据段分割符、结束符(比分割符多出两个“-”);2、输入文本及上载的文件区分标志(文本为“name=”,文件为“filename=”);3、编码格式,可以通过HttpServletRequest 类getCharacterEncoding() 方法取得。4、表单文本部分名称及内容,名称为“name=”后面的字符,内容为该段第三行及以后的内容;5、文件名称及内容,名称为“filename=”后面的字符,内容为该段第三行及以后的内容。
下面我们将讨论输入流的分离。
程序实现分析
我们首先画出程序实现的主体结构图,请注重判定文件标志(indexOf("filename=")0),与判定文本标志(indexOf("name=")0)的顺序,当(indexOf("filename=")0)成立时,(indexOf("name=")0)一定也是成立的,所以判定文件要在判定文本前。
分离文件及输入文本,为完整保存上载的文件信息及输入的文本信息,本程序建立了两个类:public class FileInfo 、public class InputField,及两个线性表private ArrayList upFilesList、private ArrayList inputFieldList,用于动态增加文件信息及文本信息,定义如下:
FileInfo.java(记录上载文件信息)
package com.upload;
public class FileInfo {
private String fileName;
private boolean validFlag;
private String filePath;
private long fileSize;
//设置文件信息
//上载文件是否有效标志
public void setValidFlag(boolean validFlag){
this.validFlag = validFlag;
}
//文件名
public void setFileName(String filename){
this.fileName = filename;
}
//存贮路径