网络数据流的Java处理(2)
· 3:java对网络数据流的处理
java程序对网络数据流的处理要关注四个基本方面:数据流的编码,字节顺序,数据格式对应和取数。这是四个不同的问题,但是都影响到网络数据的正确接收。
· 3.1 网络数据流的解码和编码
网络数据流的编码和解码主要针对流中出现的字符串。网络数据流中的字符串均为原始的字节流形式。
要正确接收网络数据流中的字符串,首先要知道该字符串的编码方案。然后才可以调用解码的方法获得java能够熟悉的Unicode编码字符串。可以用如下代码处理网络数据流中字符串的编码和解码:
// 获得编码对象,即网络对等方的熟悉的字符串编码。
Charset charset = Charset.forName("???"); // ???为对等方的编码名,java必须支持。
// 生成编码器和解码器对象。
CharsetDecoder decoder = charset.newDecoder();
CharsetEncoder encoder = charset.newEncoder();
.......
// 对从网络数据流中获得的字节流解码取得java字符串
CharBuffer charbuf = decoder.decode(bytebuff);
.......
// 将java字符串编码成指定编码的字节流,以便网络发送
Bytebuff bytebuff = encoder.encode(CharBuffer.wrap("Test String");
.......
· 3.2 网络数据流的字节顺序
目前的字节顺序有两类:BIG_ENGIAN和L99vTLE_ENDIAN。各个平台所支持的字节序不同,例如AIX、Tru64Unix、Windows等操作系统平台采用L99vTLE_ENDIAN字节序,Solaris等操作系统平台采用BIG_ENGIAN。Java自身采用的是BIG_ENGIAN字节序,当java和运行在其他平台上的其他语言编写的通信程序通信时,则必须考虑到数据的字节序。
Jkd1.4新增加的包NIO中的类ByteOrder则带来了一定的方便。针对从网络数据流的字节序,我们只要增加一行就可以轻松的处理字节序了:
bytebuf.order(ByteOrder.L99vTLE_ENDIAN); //按照L99vTLE_ENDIAN字节序收发数据
sc.read(bytebuf); // 接收数据
上面的方法虽然简化了我们的编程,但没有真正处理好分布式应用的网络数据字节序问题。例如,java同时和在Tru64Unix、Solaris平台上的应用通信时,上述方法就不能解决问题。因为同一数据包,可能无法判定其字节序是那一种。此时要求网络数据包内携带附加的字节序信息显然是不现实的。这种情况下,java语言需要提供对XDR(外部数据表达)的支持,目前XDR已经为事实上的网络数据流的标准格式,分布式应用的网络数据流基本都遵循了这种格式,假如java语言提供了对XDR的支持,就可以解决通用性的问题。对于分布式应用中的网络数据流的处理就无需再根据其平台判定其字节序,只要按照XDR格式进行处理就可以了。
· 3.3 网络数据流中数据格式的对应
C/C++语言编写的网络程序中一般采用数据结构的缓冲区发送数据,在java端接收数据时,会出现一些因数据组织引起的问题:
如结构 typedef strUCt {
int id;
char name[32];
short val;
float fval;
} SendData
在32位操作系统中,它的大小并不是42,而是44!数据的组织如下图所示:
当通过网络发送到客户端时,客户端也接收到44个字节,假如按照顺序依次取相应的值,则会发现最后取得的浮点值不正确。这是因为把短整型数据后没有意义的两位作为了浮点数中的其中两位。假如想正确接收该数据,则必须跳过短整型数据后没有意义的两位,再取浮点值。
而假如以上的结构变为:
typedef struct {
int id;
char name[32];
float fval;