网络数据流的java处理 - 王朝网络宽屏版

郭洪锋 (ghf_emai@sohu.com)该文章对编写客户服务器应用的Java程序员有所帮助,可以解决程序在对方出现故障的时候继续稳定运行.

前言：java程序要处理很多的网络数据，网络数据发送和接收以及数据流的处理是java程序要非凡关注的方面，随着java的发展，这些方法也越来越得到重视和加强。本文从几个方面解释了java正确处理网络数据流的要素，这些也是java程序员必须了解的基本的知识。

1：庞大的java流处理

首先，之所以说java流的庞大，是因为java中的流处理比其他语言的流处理在内容上多的多。

java流在处理上分为字符流和字节流。字符流处理的单元为2个字节的Unicode字符，分别操作字符、字符数组或字符串，而字节流处理单元为1个字节，操作字节和字节数组。

Java内用Unicode编码存储字符，字符流处理类负责将外部的其他编码的字符流和java内Unicode字符流之间的转换。而类InputStreamReader和OutputStreamWriter处理字符流和字节流的转换。字符流（一次可以处理一个缓冲区）一次操作比字节流（一次一个字节）效率高。

对应不同的流，需要不同的流构建器或流过滤实现。java目前依然在逐渐增加其流处理方法，虽然java类库的创作人员可以列举出很多理由来说明这要做的优点，但我还是觉得java开始变得向其他语言一样复杂起来。

2：网络数据流的收发

java对网络数据的发送和接收处理，也借用了一般流处理的方法。我们知道，在几乎其他所有语言中，网络数据的收发在利用类似send（或write）和recv（或read）的方法时并没有明显的流处理。但是java和这些语言的收发方法有较大区别，要借助流才可以完成：

.......

sock = new Socket(addr, port);

OutputStream os = sock.getOutputStream();

InputStream is = sock.getInputStream();

os.write(byte[] b);

is.read(byte[] b);

这些方法总给人一种不太舒适的感觉。不过从Jdk1.4开始弥补了这一点。JDK1.4中新增加了新的I/O流处理，在缓冲区治理、可伸缩网络和文件IO、字符集支持、正规表达式匹配方面做了新的处理。其中缓冲区治理和通道（Channel）概念则是对网络数据流的收发处理支持的强化。缓冲区治理中ByteBuffer类更好的支持了网络数据流处理。在网络连接中，通道代表了sockets的连接。基于这些新的IO处理，以上代码可以改写为：

......

ByteBuffer bytebuf = ByteBuffer.allocate(2048); // 创建一个指定大小的缓冲区

InetSocketAddress isa = new InetSocketAddress(hostname,port);

sc = SocketChannel.open(); // 建立一个socket通道

sc.connect( isa);// 建立一个socket连接

…

sc.write(bytebuf); // 发送数据

…

sc.read(bytebuf); // 接收数据

这样的程序似乎要流畅的多。

3：java对网络数据流的处理

java程序对网络数据流的处理要关注四个基本方面：数据流的编码，字节顺序，数据格式对应和取数。这是四个不同的问题，但是都影响到网络数据的正确接收。

3.1 网络数据流的解码和编码

网络数据流的编码和解码主要针对流中出现的字符串。网络数据流中的字符串均为原始的字节流形式。

要正确接收网络数据流中的字符串，首先要知道该字符串的编码方案。然后才可以调用解码的方法获得java能够熟悉的Unicode编码字符串。可以用如下代码处理网络数据流中字符串的编码和解码：

// 获得编码对象，即网络对等方的熟悉的字符串编码。

Charset charset = Charset.forName("???"); // ???为对等方的编码名，java必须支持。

// 生成编码器和解码器对象。

CharsetDecoder decoder = charset.newDecoder();

CharsetEncoder encoder = charset.newEncoder();

.......

// 对从网络数据流中获得的字节流解码取得java字符串

CharBuffer charbuf = decoder.decode(bytebuff);

.......

// 将java字符串编码成指定编码的字节流，以便网络发送

Bytebuffbytebuff = encoder.encode(CharBuffer.wrap("Test String");

.......

3.2 网络数据流的字节顺序

目前的字节顺序有两类：BIG_ENGIAN和LITTLE_ENDIAN。