网络机器人Java编程指南
分類: 图书,计算机/网络,程序设计,Java Java Script J2EE,
作者: 美.希顿 著 童兆丰 李纯 刘润杰 译
出 版 社: 电子工业出版社
出版时间: 2002-7-1字数: 700000版次: 1页数: 420印刷时间: 2002/07/01开本:印次:纸张: 胶版纸I S B N : 9787505377400包装: 平装内容简介
这是一本研究如何实现具有Web访问能力的网络机器人的书。该书从Internet编程的基本原理出发,深入浅出、循序渐进地阐述了网络机器人程序Spider、Bot、Aggregator的实现技术,并分析了每种程序的优点及适用场合。本书提供了大量的有效源代码,并对这些代码进行了详细的分析。通过本书的介绍,你可以很方便地利用这些技术,设计并实现网络蜘蛛或网络信息搜索器等机器人程序。
读者对象:适合于具有一定Java编程基础的软件开发人员阅读,也可供Web开发人员作为技术参考资料使用。
目录
目 录
第1章 Java套接字编程技术
套接字家族
网络编程
Java I/O编程技术
代理的问题
Java中的套接字编程
客户端套接字
服务器套接字
小结
第2章 分析超文本传输协议
地址格式
使用套接字进行HTTP编程
Bot包的HTTP类组
实现细节
小结
第3章通过HTTPS访问加密站点
HTTP与HTTPS
通过Java使用HTTPS
HTTP用户认证
安全访问
实现细节
小结
第4章解析HTML
使用HTML
Bot关心的标签
需要特殊处理的HTML
使用Bot类解析HTML
使用Swing类解析HTML
Bot包HTML解析例子
实现细节
小结
第5章发送表单
使用表单
用于普通发送的Bot类
实现细节
小结
第6章解释数据
CSV文件的结构
QIF文件的结构
XML文件格式
小结
第7章探索Cookie
分析Cookie
用于Cookie处理的Bot类
实现细节
小结
第8章编写Spider程序
网站的结构
Spider程序的结构
构造Spider程序
小结
第9章编写大型Spider程序
多线程
用Java实现多线程
线程同步
使用数据库
高性能的Spider程序
实现细节
小结
第10章编写Bot程序
构造典型的Bot程序
使用CatBot程序
CatBot实例
实现细节
小结
第11章编写Aggregator程序
在线汇总与离线汇总
构造底层Bot
构造气象Aggregator程序
小结
第12章负责任地使用Bot程序
与网站协商
Web站点管理员的措施
负责任的Spider程序
实现细节
小结
第13章Bot程序的未来
Internet信息的传送
理解XML
传送XML数据
Bot和SOAP
小结
附录ABot包
附录B各种与HTTP相关的字符
附录C故障诊断
附录D 安装Tomcat系统
附录E在Windows下编译实例
附录F在Unix下编译实例
附录G重新编译Bot包
术语表