Flex中实现对ZIP文件的解析

By Minidxer | January 24, 2009

要实现对ZIP文件的解析,首先我们需要来了解一下ZIP文件的数据结构。
简单的说,一个 ZIP 文件的普通格式由三个部分组成: 压缩源文件数据区+压缩源文件目录区+压缩源文件目录结束标志。



1、压缩源文件数据区
在这个数据区中每一个压缩的源文件/目录都是一条记录,记录的格式如下:
[文件头+ 文件数据 + 数据描述符]
a、文件头结构
组成   长度
文件头标记 4 bytes (0×04034b50)
解压文件所需 pkware 版本 2 bytes
全局方式位标记 2 bytes
压缩方式 2 bytes
最后修改文件时间 2 bytes
最后修改文件日期 2 bytes
CRC-32校验 4 bytes
压缩后尺寸 4 bytes
未压缩尺寸 4 bytes
文件名长度 2 bytes
扩展记录长度 2 bytes
文件名 (不定长度)
扩展字段 (不定长度)
b、文件数据
c、数据描述符
组成  长度
CRC-32校验 4 bytes
压缩后尺寸 4 bytes
未压缩尺寸 4 bytes
这个数据描述符只在全局方式位标记的第3位设为1时才存在(见后详解),紧接在压缩数据的最后一个字节后。这个数据描述符只用在不能对输出的 ZIP 文件进行检索时使用。例如:在一个不能检索的驱动器(如:磁带机上)上的 ZIP 文件中。如果是磁盘上的ZIP文件一般没有这个数据描述符。
2、压缩源文件目录区
在这个数据区中每一条纪录对应在压缩源文件数据区中的一条数据
组成   长度
目录中文件文件头标记 4 bytes (0×02014b50)
压缩使用的 pkware 版本 2 bytes
解压文件所需 pkware 版本 2 bytes
全局方式位标记 2 bytes
压缩方式 2 bytes 10
最后修改文件时间 2 bytes 12
最后修改文件日期 2 bytes 14
CRC-32校验 4 bytes 18
压缩后尺寸 4 bytes 22
未压缩尺寸 4 bytes 26
文件名长度 2 bytes 28
扩展字段长度 2 bytes 30
文件注释长度 2 bytes 32
磁盘开始号 2 bytes 34
内部文件属性 2 bytes 36
外部文件属性 4 bytes 38
局部头部偏移量 4 bytes 42
文件名 (不定长度) 46
扩展字段 (不定长度)
文件注释 (不定长度)
3、压缩源文件目录结束标志
组成   长度
目录结束标记 4 bytes (0×06054b50)
当前磁盘编号 2 bytes 4
目录区开始磁盘编号 2 bytes 6
本磁盘上纪录总数 2 bytes 8
目录区中纪录总数 2 bytes 10
目录区尺寸大小 4 bytes 12
目录区对第一张磁盘的偏移量 4 bytes 16
ZIP 文件注释长度 2 bytes 20
ZIP 文件注释 (不定长度)
下面是实现代码:

  1. <?xml version="1.0" encoding="utf-8"?>
  2. <mx:Window xmlns:mx="http://www.adobe.com/2006/mxml" title="分析ZIP文件" layout="vertical" width="500" height="300" 
  3. creationComplete="init();">
  4. <mx:Script>
  5. <![CDATA[
  6. import flash.filesystem.*;
  7. import flash.utils.ByteArray;
  8. import flash.events.Event;
  9. private var bytes:ByteArray = new ByteArray();
  10.  
  11. //定义用来存储文件标头中元数据的变量 variables for reading fixed portion of file header
  12. private var fileName:String = new String();
  13. private var flNameLength:uint;
  14. private var xfldLength:uint;
  15. private var offset:uint;
  16. private var compSize:uint;
  17. private var uncompSize:uint;
  18. private var compMethod:int;
  19. private var signature:int;
  20. private var k:int;
  21. //定义用来表示 .zip 文件的 File (zfile) 和 FileStream (zStream) 对象,并指定将从中提取文件的 .zip 文件的位置(桌面目录
  22. //下名为“HelloAIR.zip” 的文件)。
  23. // File variables for accessing .zip file
  24. private var zfile:File = File.desktopDirectory.resolvePath("HelloAIR.zip");
  25. private var zStream:FileStream = new FileStream();
  26. private function init():void
  27. {
  28.     var screenBounds:Rectangle = Screen.mainScreen.bounds;   
  29.         nativeWindow.x = (screenBounds.width - nativeWindow.width) / 2;
  30.         nativeWindow.y = (screenBounds.height - nativeWindow.height) / 2;   
  31. }
  32. private function readout():void
  33. {
  34.     zStream.open(zfile, FileMode.READ);
  35.     bytes.endian = Endian.LITTLE_ENDIAN;
  36.     while (zStream.position < zfile.size)
  37.     {
  38.             //前 30 个字节组成了第一个文件标头的固定大小部分。
  39.         // read fixed metadata portion of local file header
  40.         zStream.readBytes(bytes, 0, 30);
  41.         bytes.position = 0;       
  42.         signature = bytes.readInt();       
  43.         // 再没有可提取的文件, quit
  44.         if (signature != 0x04034b50)//文件开始标记
  45.         {               
  46.             break;
  47.         }
  48.        
  49.         bytes.position = 8;
  50.         compMethod = bytes.readByte(); // store compression method (8 == Deflate)压缩算法 通常是8,没压缩的是0
  51.         offset = 0;// stores length of variable portion of metadata
  52.         bytes.position = 26; // offset to file name length
  53.         flNameLength = bytes.readShort();// store file name
  54.         trace("flNameLength="+flNameLength);
  55.         offset += flNameLength; // add length of file name
  56.         bytes.position = 28;// offset to extra field length
  57.         xfldLength = bytes.readShort();
  58.         trace("xfldLength="+xfldLength);
  59.         offset += xfldLength;// add length of extra field
  60.         // 接下来程序将读取文件标头的可变长度部分,以将该部分的字节数存储在 offset 变量中。
  61.         zStream.readBytes(bytes, 30, offset);
  62.        
  63.         bytes.position = 30;
  64.         fileName = bytes.readMultiByte(flNameLength,"gbk"); // read file name
  65.        
  66.         taFiles.text += fileName + "\n"; // write file name to text area
  67.         bytes.position = 18;
  68.         compSize = bytes.readUnsignedInt(); // store size of compressed portion
  69.         taFiles.text += "\tCompressed size is: " + compSize + '\n';
  70.         bytes.position = 22; // offset to uncompressed size
  71.         uncompSize = bytes.readUnsignedInt(); // store uncompressed size
  72.         taFiles.text += "\tUncompressed size is: " + uncompSize + '\n';
  73.         //将文件的其余部分按照压缩后大小所指定的长度读入 ,未压缩的长度会等于压缩的,所以长度是对的
  74.         zStream.readBytes(bytes, 0, compSize);
  75.         if (compMethod == 8) // if file is compressed, uncompress
  76.         {
  77.             bytes.uncompress(CompressionAlgorithm.DEFLATE);
  78.         }
  79.         outFile(fileName, bytes);       
  80.     } // end of while loop
  81.     var flen:int=0;
  82.     var externlen:int=0;
  83.     var showlen:int=0;
  84.     while (zStream.position < zfile.size)//目录开始标记为0x02014b50
  85.     {
  86.         if(signature != 0x02014b50)
  87.         break;
  88.         bytes.position = 10;
  89.         compMethod = bytes.readByte();       
  90.         bytes.position = 28;
  91.         flen= bytes.readByte();
  92.         trace("bytes.path len:"+flen);
  93.         zStream.readBytes(bytes, 0, 46-30);
  94.         bytes.position = 0;
  95.         externlen=bytes.readByte();
  96.         trace("bytes.externlen len:"+externlen);
  97.         bytes.position = 2;
  98.         showlen=bytes.readByte();
  99.         trace("bytes.showlen len:"+showlen);
  100.         zStream.readBytes(bytes, 0, flen+externlen+showlen);
  101.         if((zStream.position+30)<zfile.size){
  102.         zStream.readBytes(bytes, 0, 30);
  103.         bytes.position = 0;       
  104.         signature = bytes.readInt();
  105.         }else{                       
  106.         break;
  107.         }
  108.     }
  109.     zStream.readBytes(bytes, 0, 22);
  110.     bytes.position = 0;       
  111.     signature = bytes.readInt();
  112.     if(signature == 0x06054b50){//目录结束标志
  113.         bytes.position = 20;
  114.         showlen=bytes.readByte();
  115.         trace("bytes.show len="+showlen);
  116.         zStream.readBytes(bytes, 22, showlen);
  117.         bytes.position = 22;       
  118.         fileName=bytes.readMultiByte(showlen,"gbk");               
  119.         taFiles.text+="\n注释:"+fileName;
  120.     }   
  121. } // end of init() method
  122.  
  123. private function outFile(fileName:String, data:ByteArray):void
  124. {
  125.     var outFile:File = File.desktopDirectory; // dest folder is desktop
  126.     outFile = outFile.resolvePath(fileName); // name of file to write
  127.     var outStream:FileStream = new FileStream();
  128.     // open output file stream in WRITE mode
  129.     outStream.open(outFile, FileMode.WRITE);
  130.     // write out the file
  131.     outStream.writeBytes(data, 0, data.length);
  132.     // close it
  133.     outStream.close();
  134. }
  135.  
  136. private function selectTextFile(root:File):void
  137.     {
  138.         taFiles.text="";
  139.         var txtFilter:FileFilter = new FileFilter("Zip", "*.Zip;*.zip");
  140.         root.browseForOpen("Open", [txtFilter]);
  141.         root.addEventListener(Event.SELECT, fileSelected);
  142.     }
  143.     private function fileSelected(event:Event):void
  144.     {
  145.         msg.text="读文件:"+event.target.nativePath;
  146.     }
  147. // The application code goes here
  148. ]]>
  149. </mx:Script>
  150. <mx:Label id="msg" text="只是测试了不包含子目录的几个文件压缩的zip"/><mx:Button label="文件" click="selectTextFile(zfile)" />
  151. <mx:TextArea id="taFiles" width="320" height="150"/>
  152. <mx:Button label="分析" click="readout()" />
  153.  
  154. </mx:Window>

Topics: Adobe其他 | No Comments » | Tags: ,

Search Posts