开发者

Python struct.unpack() 用法及常见错误详解

开发者 https://www.devze.com 2025-06-06 09:26 出处:网络 作者: 极客不孤独
目录一、函数语法二、格式字符串详解三、使用示例示例 1:解析整数和浮点数示例 2:解析字符串示例 3:解析混合类型四、关键注意事项五、常见错误struct.unpack() 是 python 中用于将二进制数据(字节序列)解析为 P
目录
  • 一、函数语法
  • 二、格式字符串详解
  • 三、使用示例
    • 示例 1:解析整数和浮点数
    • 示例 2:解析字符串
    • 示例 3:解析混合类型
  • 四、关键注意事项
    • 五、常见错误

      struct.unpack() 是 python 中用于将二进制数据(字节序列)解析为 Python 数据类型的函数,通常与 struct.pack() 配对使用。它根据指定的格式字符串(format string)解析字节流,并返回一个包含解析结果的元组。

      一、函数语法

      struct.unpack(format, buffer)
      • format:格式字符串,定义数据的解析规则(字节顺序、数据类型、数量等)。
      • buffer:包含二进制数据的缓冲区(如 bytesbytearray 或支持缓冲协议的对象)。

      返回值:包含解析后数据的元组。

      二、格式字符串详解

      格式字符串由两部分组成:

      字节顺序/对齐字符(可选):

      字符含义大小端
      @本地顺序(默认)系统依赖
      =本地标准大小系统依赖
      <小端(Little-Endian)低位在前
      >大端(Big-Endian)高位在前
      !网络顺序(大端)RFC 标准

      数据类型字符(必选):

      字符C 类型Python 类型字节数
      x填充字节跳过字节1
      ccharbytes (长度1)1
      bsigned charint1
      Bunsigned charint1
      ?_Boolbool1
      hshortint2
      Hunsigned shortint2
      iintint4
      Iunsigned intint4
      llongint4
      Lunsigned longint4
      qlong longint8
      Qunsigned long longint8
      ffloatfloat4
      ddoublefloat8
      schar[]bytes长度见下文
      pPascal 字符串bytes1+长度
      Pvoid*int系统依赖

      特殊用法

      特殊用法

      • s:需指定长度,如 10s 表示解析 10 字节的字符串。
      • 数字前缀:3I 表示连续解析 3 个无符号整数。

      三、使用示例

      示例 1:解析整数和浮点数

      import struct
      # 二进制数据:小端顺序 (<) + int (i) + float (f)
      buffer = b'\x01\x00\x00\x00\xcd\xcc\x8cjs@'
      data = struct.unpack('<ifXRXoXx', buffer)  # 解析1个int和1个float
      print(data)  # 输出: (1, 7.000000476837158)

      示例 2:解析字符串

      # 数据:大端 (>) + 4字节字符串 (4s)
      buffer = b'ABCD'
      data = struct.unpack('>4s', buffer)
      print(data)  # 输出: (b'ABCD',)

      示例 3:解析混合类型

      # 数据:小端 (<) + short (h) + 3字节字符串 (3s) + float (f)
      buffer = b'\x01\x00XYZ\x00\x00\x80?'
      data = struct.unpack('<h3sf', buffer)
      print(data)  # 输出: (1, b'XYZ', 1.0)

      示例 4:跳过填充字节

      # 格式: 小端 (<) + char (c) + 填充1字节 (x) + int (i)
      buffer = b'A\x00\x02\x00\x00\x00'
      data = struct.unpack('<cx i', buffer)
      print(data)  # 输出: (b'A', 2)

      示例 5:解析数组

      php
      # 解析3个连续的 unsigned short (H)
      buffer = b'\x01\x00\x02\x00\x03\x00'
      data = struct.unpack('<3H', buffer)
      print(data)  # 输出: (1, 2, 3)

      四、关键注意事项

      缓冲区长度必须匹配

      使用 struct.calcsize(format) 验证格式字符串所需的字节数:

      fmt = '<2i f'
      buffer = b'\x00' * struct.calcsize(fmt)  # 创建匹配长度的缓冲区

      字节顺序至关重要

      大端/小端错误会编程导致解析数值异常:

      # 错误示例:大端数据用小端解析
      buffer = b'\x00\x00\x00\x01'  # 大端表示的整数 1
      struct.unpack('<I', buffer)   # 错误!解析为 16777216 (0x01000000)

      字符串处理

      s 类型返回 bytes 对象,需用 .decode() 转为字符串:

      data = struct.unpack('5s', b'Hello')[0]
      print(data.decode('utf-8'))  # 输出: 'Hello'

      内存对齐问题

      默认格式 @ 会按本地对齐方式插入填充字节。使用 = 或标准顺序(</>)避免对齐。

      五、常见错误

      • struct.error: unpack requires a buffer of X bhttp://www.devze.comytes

      缓冲区长度与格式字符串不匹配。

      • 解析指针类型 (P)

      结果依赖平台(32/64位),通常应避免使用。

      通过合理设计格式字符串,struct.unpack() 可高效处理二进制协议(如网络数据、文件格式)。

      到此这篇关于Python struct.unpack() 用法详解的文章就介绍到这了,更多相关Python struct.unpack() 用法内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)!

      0

      精彩评论

      暂无评论...
      验证码 换一张
      取 消

      关注公众号