Tomcat的中文處理(二):
上篇我们介绍了tomcat是怎么对接收到字符进行编码的,现在我们来看当向客户端写html文档的时候到底发生了什么?
tomcate在向客户端写出数据的時候,使用的是response的输出流來实现的。但是jsp是怎樣使用response的流的呢?
在使用JSP内含對象out輸出的時候,out是一個JspWriter实现类的对象实例,JspWriterImpl(ServletResponse response, int sz, boolean autoFlush)是一个该类的构造函数,其使用到了response,在JspWriterImpl内部还有一个java.io.Writer对象实例的引用,在使用JspWriter(JSP的out对象)写出数据的时候,会调用如下的函数来初始化
protected void initOut() throws IOException
{
if(out == null)
{
out = response.getWriter();/////////初始化 java.io.Writer對象
}
}来初始化该内部对象的。
然后在jspWriter的各个输出数据的函数的实现中就是調用上面的java.io.Writer對象的方法的。
所以不论是jsp或者是servlet,对客户端写出html的時候,都是通过response.getWriter();来得到的字符流或者由getOutputStream()得到2进制流的。
一個response存在一個字符流,也存在一個2進制流,但是在同一時刻只能打開使用一個流的。至於兩者的關係,我們在後面介紹。Jsp的out對象就是response的字符流的。
同樣的request也存在一個字符流和一個2進制流,但是在同一時刻只能打開使用一個流的。
response的两个流的关系
我们来考察response的实现类的getOutputStream()和getWriter函数的实现:
public ServletOutputStream getOutputStream() throws IOException
{
。。。。。。。。。。。。。。。。。。。。。
stream = createOutputStream();///创建response的2进制的输出流
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
return stream;
}
public PrintWriter getWriter() throws IOException
{
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
ResponseStream newStream = (ResponseStream)createOutputStream();////////创建2进制流
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
OutputStreamWriter osr = new OutputStreamWriter(newStream, getCharacterEncoding());
writer = new ResponseWriter(osr, newStream);///得到response的字符输出流
。。。。。。。。。。。。。。。。。。。。。。。。。。
}
}
显然,我们的字符流就是从2进制流转化而来的
还有两个函数要注意:
public String getCharacterEncoding()//////response的编码,默认是ISO-8859-1的
{
if(encoding == null)//////////////////////////////////如果没有指定编码
{
return "ISO-8859-1";
} else
{
return encoding;
}
}
public void setContentType(String type);设置response的类型和编码
{
。。。。。。。。。。。。。
encoding = RequestUtil.parseCharacterEncoding(type);////////得到指定的编码
if(encoding == null)
{
encoding = "ISO-8859-1";//////////////////////////如果沒有指定编码方式
}
} else
if(encoding != null)
{
contentType = type + ";charset=" + encoding;
}
}
好了,现在我们知道了在写出字符的时候使用的response的字符流(不管是jsp或者servlet),也就是使用的OutputStreamWriter osr = new OutputStreamWriter(newStream, getCharacterEncoding());
注意的是newStream是response的2进制流的实现。
所以我们还得看看OutputStreamWriter的实现:
考察OutputStreamWriter的源代碼,他有一個StreamEncoder 类型的对象,就是依靠他來转换编码的;
StreamEncoder是由sun公司提供的,它有一个
public static StreamEncoder forOutputStreamWriter(OutputStream outputstream, Object obj, String s)來得到StreamEncoder对象实例。
对于jsp,servlet来说在构造他的时候 outputstream参数是response的2进制流,obj是OutputStreamWriter对象,s就是编码方式的名字。其实得到是一個StreamEncoder的子类的对象实例,
return new CharsetSE(outputstream, obj, Charset.forName(s1)); CharsetSE是StreamEncoder的子类。
他有一个如下的函数来实现编码转换的:
void implWrite(char ac[], int i, int j)throws IOException /////// ac是要輸出String的char數組
{
CharBuffer charbuffer = CharBuffer.wrap(ac, i, j);
。。。。。。。。。。。。。。。。。。。。。。。
CoderResult coderresult = encoder.encode(charbuffer, bb, false);/////bb是ByteBuffer,存放编码后的byte缓冲区
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
writeBytes();///////////////////////////////將bb转化到byte数组写入到response的2进制流中
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
}
至此,我们了解了tomcat背后的编码转换过程