作者 Elango Sundaram
概要
许多机构都使用微软Excel表格作为信息交换的方式,众多的非专业编程人员、商业分析师和项目经理都能熟练的运用该技术。而使用Java从Excel文档中分析、搜集、巩固数据的能力则证明是很有用途的。Jakarta POI(Poor Obfuscation Implementation,无困惑实现)使得程序员能够迅速完成这些任务。POI可以用来完成在纯Java中处理基于微软OLE(对象链接和嵌入)技术的文件格式到复合文档格式(如Microsoft Excel,Microsoft Word等软件使用的格式)的交换。本文对POI进行了剖析并说明了如何使用Java读写Microsoft Excel 文档,还提供了一个使用POI API的有趣实例。
正文
无论你手头上的资料是资产平稳表、下载的帐户信息、帐单还是工资条,它们都可能最终输入Microsoft Excel备用。即使不是专业IT人士,人们也会得心应手的使用Excel这一数据交换技术。Jakarta POI API对Java程序员来说是一个实现轻松访问微软文档格式的妙方。Jakarta POI中最成熟的API就是HSSF(Horrible Spreadsheet Format)API,它用来访问Excel文档。
在本文中,我将带您一起领略创建和读取Excel文档,以及使用字体和单元格样式的各个步骤——这一切都在Java中完成。
POI 术语表
下面列出了和POI相关的关键术语:
l POIFS (Poor Obfuscation Implementation File System): 读、写OLE到复合文档格式的API组。
l HSSF (Horrible Spreadsheet Format): 读写Microsoft Excel的API。
l HDF (Horrible Document Format): 读写Microsoft Word 97的API。
l HPSF (Horrible Property Set Format): 读取属性设定的API。
创建Excel文档
Jakarta OPI能够用来程式化的创建Excel文档,主要步骤如下:
l 创建文件 workbook: HSSFWorkbook workbook = new HSSFWorkbook();
l 在 workbook中创建一个名为“Java Excels”的工作表worksheet: HSSFSheet sheet = workbook.createSheet(“Java Excels”);
l 在表sheet中创建新行row:HSSFRow row = sheet.createRow((short)0);
l 在行row总创建单元格cell:HSSFCell cell = row.createCell((short)0);
l 在单元格内置入内容:cell.setCellValue(“Have a Cup of XL”);
l 将workbook写入文件:workbook.write(fileOutputStream);
从Excel文档中读取数据
在这个例子中,您将看到如何从Excel文档中读取数值。
让我们想象一个将要用到的Excel表格:
Employee Name
Specialization
Designation
Anbu
Programming
Senior Programmer
Jason
Banking Industry
Business Analyst
Ramesh
Databases
DBA
MackyB
Accounting
Delivery Head
读取Excel表的关键步骤:
l 创建一个对Excel文档的引用:HSSFWorkbook workbook= new HSSFWorkbook(new FileInputStream(fileToBeRead));
l 表的引用:缺省情况下,对Excel文档中的第一个表的引用标识为“0”:HSSFSheet sheet = workbook.getSheetAt(0);一个表也可以通过它的名字来引用。我们假设这个表格的名字为“Sheet1”。它可以被这样引用:HSSFSheet sheet = workbook.getSheet(“Sheet1”);
l 引用行:HSSFRow row = sheet.getRow(0);
l 引用行中的一个单元格:HSSFCell cell = row.getCell((short)0);
l 取得单元格中的数据值:cell.getStringCellValue();
实例:
现在假设我们想要得到一个Jar文件中所有公开方法和数据成员的信息,所有这些信息能够汇集到一个单独文件的表中最好。我们期望在表的第一列看到类的名称,第二列是字段,第三列为方法,每一列的头行都示以红色。
程序要完成如下动作:
l 解压缩Jar文件
l 读取Jar文件中所有的类文件代码
l 装载这些类
l 通过反射机制,得到方法和字段的名称
l 使用Jakarta POI将类的方法和字段等信息写入Excel表中
现在我们集中关注使用Jakarta POI最有意思的几步:
l 创建一个新的Excel文档:workbook = new HSSFWorkbook();
l 在Excel文档中创建一个工作表并为此表命名:sheet = workbook.createSheet(“Java Class Info”);
l 设置头三列的宽度:sheet.setColumnWidth((short)0, (short)1000);
l 创建头行:HSSFRow row = sheet.createRow((short)0);
l 创建字体和单元格的样式:
HSSFFont font = workbook.createFont();
Font.setColor(HSSFFont.COLOR_RED);
Font.setBoldWeight(HSSFFont.BOLDWEIGHT_BOLD);
//create the style
HSSFCellStyle cellStyle = workbook.createCellStyle();
cellStyle.setFont(font);
l 使用单元格样式:
HSSFCell cell = row.createCell((short) 0);
cell.setCellStyle(cellStyle);
cell.setCellType(HSSFCell.CELL_TYPE_STRING);
cell.setCellValue(“Class Name”);
l 输出文件:
FileOutputStream fOut = new FileOutputStream(outputFile);
//Write the Excel sheet
workbook.write(fOut);
fOut.flush();
//Done deal. Close it.
fOut.close();
总结
如本文所示,Java开发者无需再在面对Excel表格时畏缩不前了。我们能够轻松对付Excel文档。喝上一杯咖啡,把Excel置于脑后。
关于作者
Elango Sundaram是一位资深的Java程序员,致力于研究分布式计算体系、基于代理的技术和面向对象方法论。他拥有弗吉尼亚科技大学的硕士学位并撰写过Distributed computing using Jini和Websphere Studio Application Developer Tail Plug-in (for WSAD 4.0)。
参考文献
本文源代码的下载:
http://www.javaworld.com/javaworld/jw-03-2004/poi/jw-0322-poi.zip
Jakarta POI 站点:
http://jakarta.apache.org/poi/
更多关于POI, 请参考 "It's POI-fect," Tony Sintes (JavaWorld, May 2002):
http://www.javaworld.com/javaworld/javaqa/2002-05/01-qa-0503-excel3.html
更多Java工具 , 请浏览 JavaWorld 开发工具版:
http://www.javaworld.com/channel_content/jw-tools-index.shtml 更多开源工具, 请参考Erik Swenson's Open Source Profile 专栏: