我的开发环境是 MIPS_4ke,调试器是 Multi 2000 v4 + SlingShot + EJTAG。

昨天在调试程序的时候调试到这样一段程序:

UI8 * pDest = g_pStreamBuffer;
if (*(UI32*)pDest != 0x000001BE) {
  return;
}
pDest += 10;
if (*(UI32*)pDest != 0x000001B5) {
  return;
}

调试器跟踪到第二个 (UI32)pDest 时发生错误,调试器拒绝继续调试。开始百思不得其解,因为第一个(UI32)pDest正常地得到了所需要的结果。后来想明白,原来是对齐的问题。MIPS从内存中读取一个UI32时必须在4字节边界开始读取,而上面的操作执行了 pDest += 10之后,pDest就不再位于4字节的边界上,因此执行第二个 (UI32)pDest访问时发生了CPU异常。于是我做了下面的这个函数:

UI32 getUI32(UI8 * pSrc)
{
   return (
            (((UI32)(* pSrc   )) << 24) |
            (((UI32)(*(pSrc+1))) << 16) |
            (((UI32)(*(pSrc+2))) <<  8) |
            (((UI32)(*(pSrc+3)))      )
           );
}

这样就能够从任意地址读取四个字节了。

另外,Multi的编译器指令中有一个 pack 指令,该指令能够指定定义结构时的最小的对齐字节数。例如正常情况下进行下列定义时,各个成员所占定义如下所示:

typedef struct {
    UI32 a;        // 4 bytes
    UI8  b;        // 1 byte + 3 bytes padding
    UI32 c;        // 4 bytes
}

由于第三个成员 c 为 UI32,CPU在读取c时需要在4字节边界上对齐,因此成员b后面就留下了三个padding字节。如果这样写即可避免该问题。

#pragma pack(1)
typedef struct {
    UI32 a;        // 4 bytes
    UI8  b;        // 1 byte
    UI32 c;        // 4 bytes
}
#pragma pack()

但是这样一来,CPU读取c的时候为什么不会产生异常?其实编译器作了特殊的处理,它将读取c的指令分解成两条,第一条在前一个边界上读取c的前三个字节,第二条在后一个边界上读取c的最后一个字节,因此不会产生异常。