11.3. 使用二进制数据记录格式

struct 模块提供了 pack()unpack() 函数,用于处理不定长度的二进制记录格式。下面的例子展示了在不使用 zipfile 模块的情况下,如何循环遍历一个 ZIP 文件的所有头信息。Pack 代码 "H""I" 分别代表两字节和四字节无符号整数。"<" 代表它们是标准尺寸的小端字节序:

  1. import struct
  2. with open('myfile.zip', 'rb') as f:
  3. data = f.read()
  4. start = 0
  5. for i in range(3): # show the first 3 file headers
  6. start += 14
  7. fields = struct.unpack('<IIIHH', data[start:start+16])
  8. crc32, comp_size, uncomp_size, filenamesize, extra_size = fields
  9. start += 16
  10. filename = data[start:start+filenamesize]
  11. start += filenamesize
  12. extra = data[start:start+extra_size]
  13. print(filename, hex(crc32), comp_size, uncomp_size)
  14. start += extra_size + comp_size # skip to the next header