2009-04-18 84 views
2

我正在研究my other question的解决方案,该解决方案正在读取PNG的'zTXt'块中的数据。我尽可能在文件中查找块,并阅读zTXt的关键字。我无法阅读zTXt的压缩部分。我从来没有使用过DeflateStream对象,并且遇到了一些麻烦。在读取时,它似乎期望长度参数处于“未压缩”字节。然而,就我而言,我只知道'压缩'字节中数据的长度。为了有希望解决这个问题,我把需要解压缩的所有数据放到MemoryStream中,然后用DeflateStream“读取并结束”。现在,这只是一个很好的例外,除了它会抛出一个InvalidDataException,并显示消息“块长度与其补码不匹配”。现在我不知道这是什么意思。可能会出现什么问题?如何在文件的一部分上使用DeflateStream?

对于ID(“zTXt”),块的格式为4个字节,数据长度为32位的大端,数据,最后是我现在忽略的CRC32校验和。

zTXt块的格式首先是一个以空字符结尾的字符串(字符串作为关键字),然后一个字节用于压缩方法(始终为0,DEFLATE方法),其余数据为压缩文本。

我的方法需要一个新鲜的FileStream,并返回一个包含zTXt关键字和数据的字典。

这里现在是怪物:

public static List<KeyValuePair<string, string>> GetZtxt(FileStream stream) 
{ 
    var ret = new List<KeyValuePair<string, string>>(); 
    try { 
     stream.Position = 0; 
     var br = new BinaryReader(stream, Encoding.ASCII); 
     var head = br.ReadBytes(8); // The header is the same for all PNGs. 
     if (!head.SequenceEqual(new byte[] { 0x89, 0x50, 0x4E, 0x47, 0x0D, 0x0A, 0x1A, 0x0A })) return null; // Not a PNG. 
     while (stream.Position < stream.Length) { 
      int len; // Length of chunk data. 
      if (BitConverter.IsLittleEndian) 
       len = BitConverter.ToInt32(br.ReadBytes(4).Reverse().ToArray(), 0); 
      else 
       len = br.ReadInt32(); 

      char[] cName = br.ReadChars(4); // The chunk type. 
      if (cName.SequenceEqual(new[] { 'z', 'T', 'X', 't' })) { 
       var sb = new StringBuilder(); // Builds the null-terminated keyword associated with the chunk. 
       char c = br.ReadChar(); 
       do { 
        sb.Append(c); 
        c = br.ReadChar(); 
       } 
       while (c != '\0'); 
       byte method = br.ReadByte(); // The compression method. Should always be 0. (DEFLATE method.) 
       if (method != 0) { 
        stream.Seek(len - sb.Length + 3, SeekOrigin.Current); // If not 0, skip the rest of the chunk. 
        continue; 
       } 
       var data = br.ReadBytes(len - sb.Length - 1); // Rest of the chunk data... 
       var ms = new MemoryStream(data, 0, data.Length); // ...in a MemoryStream... 
       var ds = new DeflateStream(ms, CompressionMode.Decompress); // ...read by a DeflateStream... 
       var sr = new StreamReader(ds); // ... and a StreamReader. Yeesh. 
       var str = sr.ReadToEnd(); // !!! InvalidDataException !!! 
       ret.Add(new KeyValuePair<string, string>(sb.ToString(), str)); 
       stream.Seek(4, SeekOrigin.Current); // Skip the CRC check. 
      } 
      else { 
       stream.Seek(len + 4, SeekOrigin.Current); // Skip the rest of the chunk. 
      } 
     } 
    } 
    catch (IOException) { } 
    catch (InvalidDataException) { } 
    catch (ArgumentOutOfRangeException) { } 
    return ret; 
} 

一旦被解决,我需要编写将这些zTXt块到文件的功能。所以希望我能理解一旦解决这个问题,DeflateStream是如何工作的。

非常感谢!

回答

5

毕竟这一次,我终于找到了问题。数据采用zlib格式,与仅使用DEFLATE相比,存储的数据多一点。如果我在获取压缩数据之前刚刚读取了2个额外的字节,则该文件会被正确读取。

请参阅this feedback page。 (我没有提交那个。)

我想知道现在。这两个字节的值分别是0x78和0x9C。如果我发现其他值,我应该假设DEFLATE会失败?

+3

http://www.faqs.org/rfcs/rfc1950.html描述了ZLib格式。第一个字节0x78称为CMF,值表示CM = 8,CINFO = 7。CM = 8表示窗口大小高达32K的“放气”压缩方法。这是gzip和PNG使用的方法。 CINFO = 7表示32K窗口大小。 0x9C被称为FLG,值表示FLEVEL = 2,CHECK = 28。解压缩时不需要FLEVEL中的信息;它在那里表明再压缩是否值得。 CHECK被设置为任何需要的值,使得CMF * 256 + FLG是31的倍数。 – 2009-05-28 10:13:30

相关问题