通用上载组件的原理及实现

1/5/2008来源:Java教程人气:4588


  jsp/SERVLET上载的难点
  1、支持任意格式、任意数量的文件上载;2、上载控制的实现;3、表单信息的取得;4、“即插即用”的应用方法;我个人认为,制约通用 上载组件的实现主要是这四个难点。
  
  JSP/SERVLET上传的原理
  JSP/SERVLET文件 上载是通过ServletInputStream类来实现的,ServletInputStream类是java.io.InputStream的一个扩展抽象类,实质上也是一个输入流,通过ReadLine方法从Request端一行一行读取,可见,JSP/SERVLET上载根本上是用流来实现的,理解了这个就不难理解整个 上载的原理。ServletInputStream实现文件 上载必须采用HTTP POST或者HTTP PUT协议,HTTP GET协议只能传递很少的数据,是不能实现文件上载的。
  
  下面我们来看一下上传的数据流的结构,首先要在BROWSER端给出一个请求,我们的请求如下(文件名为test1.jsp):
  <%@ page contentType="text/Html; charset=GBK" %>
  <html>
  <head>
  
  <title>文件上载</title>
  </head>
  <body>
  <form action="test2.jsp" enctype="MULTIPART/FORM-DATA" method=post>
  说明一: <input type="text" name="eXPlain1" />
  <br />
  说明二: <input type="text" name="explain2" />
  <br />
  请选择上载文件1 <input type="file" name="file1" />
  <br />
  请选择上载文件2 <input type="file" name="file2" />
  <br />
  说明三: <input type="text" name="explain3" />
  <br />
  <input type="submit" value=" 上 载 " />
  </form>
  </body>
  </html>
  显示如下:
  
  说明一:
  
  说明二:
  
  请选择上载文件一:
  
  请选择上载文件二:
  
  说明三:
  
  在上载请求页中混杂了表单的三个输入框,及两个上载文件,当然输入框可以更多、更杂,可以有选择框、单选及多选按钮,待上传的文件也可以有三个、四个或所需要的更多。
  
  action="test2.jsp"表示表单将提交到"test2.jsp",另外注重表单属性中必须要有这句:enctype="MULTipART/FORM-DATA",enctype指定 Form 输入资料的编码方式,“method”属性必须为“post”,这样表单才能提交大量数据,也表示本表单的数据传递将用流操作,“method=get”表示数据将通过地址栏进行传递,虽然方便快捷,但只适合很少的数据量。
  
  响应端“test2.jsp”页面如下:
  
  <%@ page contentType="text/html; charset=GBK" %>
  <html>
  <head>
  <title>文件上载</title>
  </head>
  <body>
  <jsp:useBean id="upBean" scope="page" class="com.upload.UpBean"/>
  <%
  upBean.doUpload(request);
  out.PRintln("上载已完成,请查看输出文件");
  %>
  </body>
  </html>
  
  test2.jsp收到请求后,调用一个java bean执行doUpload(request)操作,本操作将完成流(unicode格式)的接收并不做任何处理地将流顺序写入一个文本文件里,读写操作中用了一个缓冲区byte[] readByte,用了一个ServletInputStream 的一个方法readLine(byte[] b, int off,int len)方法读取流,请大家注重,ServletInputStream 流的read Line方法是一次读入指定大小的行,java bean (UpBean.java)代码如下:
  
  [code]package com.upload;
  
  import java.io.*;
  import javax.servlet.*;
  import javax.servlet.http.HttpServletRequest;
  import javax.servlet.ServletInputStream;
  
  public class UpBean {
  
  public void doUpload(HttpServletRequest req) throws ServletException, IOExcept
  ion{
  //首先定义一个文本文件
  File file = new File("out.txt");
  //readCount 记录从输入流中实际读取的字符数
  int readCount;
  //输入流缓冲区
  byte[] readByte = new byte[1024];
  //初始化输入流
  ServletInputStream servletInputStream = req.getInputStream();
  //初始化一个输出流(到文件)
  FileOutputStream fileOutputStream = new FileOutputStream(file);
  //循环从读取输入流中读取字节
  readCount = servletInputStream.readLine(readByte, 0,readByte.length);
  
  while(readCount != -1){
  fileOutputStream.write(readByte,0,readCount);
  readCount = servletInputStream.readLine(readByte, 0, 1024);
  }
  //关闭文件流
  fileOutputStream.flush();
  }
  }[/code]
  
  为了便于我们阅读流,上载的两个文件为两个简单的文本文件(有格式的文件,不便于直接分析):one.txt及two.txt,文件内容如下,实验时请建立对应文本文件,内容请直接copy以下所示:
  
  one.txt:
  
  one
  one one
  one one one
  
     two.txt
  two
  two two
  two two two
  
  都预备好以后,我们就可以运行了,运行时请注重,文本部分及文件部分最好不要出现汉字,或其他双字符集字符,尽量采用英文,因为接收是采用的Unicode字符集,我们未对输入做任何处理。 我们在三个输入框输入的字符为,说明一:explain1;说明二:explain2;说明三:explain3,out.txt接收到如下字符:
  
  -----------------------------7d2623a3e0286
  Content-Disposition: form-data; name="explain1"
  
  explain1
  -----------------------------7d2623a3e0286
  Content-Disposition: form-data; name="explain2"
  
  explain2
  -----------------------------7d2623a3e0286
  Content-Disposition: form-data; name="file1"; filename="C:\test\one.txt"
  Content-Type: text/plain
  
  one
  
  one one
  one one one
  -----------------------------7d2623a3e0286
  Content-Disposition: form-data; name="file2"; filename="C:\test\two.txt"
  Content-Type: text/plain
  
  two
  two two
  two two two
  -----------------------------7d2623a3e0286
  Content-Disposition: form-data; name="explain3"
  
  explain3
  -----------------------------7d2623a3e0286--
  可以很明显的看到,out.txt被“-----------------------------7d2623a3e0286”分成了五 节,即表单的每个输入部分都对应一节,结尾部分是“-----------------------------7d2623a3e0286--”,刚好比开始的一段字符在最后多出两个“-”, 每节的第一行是输入内容的说明“Content-Disposition: form-data”,“name="explain1"”表示 上载请求项的name,文本输入部分仅这两个说明,假如输入的是文件还用两项说明:“filename="C:\test\one.txt"”,表示输入源,基于ms-windows的ie上载带有完整的路径,netscape及其他浏览器可能只有一个文件名;还有一项是关于输入格式的“Content-Type:text/plain”;表示输入格式是文本类型,假如我们上载的是bmp文件则为“Content-Type: image/bmp”,Word文件为“application/msword”...,说明的下面紧接着是一个空行,然后下面才是我们所需的内容。
  
  仔细分析未加修改的输入流格式,有助于我们实现文件与输入文本的准确分离。
  通过以上的分析可以看出,准确分离上载的文件及文本信息需要以下要素:1、数据段分割符、结束符(比分割符多出两个“-”);2、输入文本及上载的文件区分标志(文本为“name=”,文件为“filename=”);3、编码格式,可以通过HttpServletRequest 类getCharacterEncoding() 方法取得。4、表单文本部分名称及内容,名称为“name=”后面的字符,内容为该段第三行及以后的内容;5、文件名称及内容,名称为“filename=”后面的字符,内容为该段第三行及以后的内容。
  
  下面我们将讨论输入流的分离。
  
  程序实现分析
  我们首先画出程序实现的主体结构图,请注重判定文件标志(indexOf("filename=")>0),与判定文本标志(indexOf("name=")>0)的顺序,当(indexOf("filename=")>0)成立时,(indexOf("name=")>0)一定也是成立的,所以判定文件要在判定文本前。
  
  分离文件及输入文本,为完整保存上载的文件信息及输入的文本信息,本程序建立了两个类:public class FileInfo 、public class InputField,及两个线性表private ArrayList upFilesList、private ArrayList inputFieldList,用于动态增加文件信息及文本信息,定义如下:
  
  FileInfo.java(记录上载文件信息)
  
  package com.upload;
  
  public class FileInfo {
  private String fileName;
  private boolean validFlag;
  private String filePath;
  private long fileSize;
  
  //设置文件信息
  //上载文件是否有效标志
  public void setValidFlag(boolean validFlag){
  
  this.validFlag = validFlag;
  }
  //文件名
  public void setFileName(String filename){
  this.fileName = filename;
  }
  //存贮路径