对齐问题引发的调试失败
我的开发环境是 MIPS_4ke,调试器是 Multi 2000 v4 + SlingShot + EJTAG。
昨天在调试程序的时候调试到这样一段程序:
UI8 * pDest = g_pStreamBuffer;
if (*(UI32*)pDest != 0x000001BE) {
return;
}
pDest += 10;
if (*(UI32*)pDest != 0x000001B5) {
return;
}
调试器跟踪到第二个 (UI32)pDest 时发生错误,调试器拒绝继续调试。开始百思不得其解,因为第一个(UI32)pDest正常地得到了所需要的结果。后来想明白,原来是对齐的问题。MIPS从内存中读取一个UI32时必须在4字节边界开始读取,而上面的操作执行了 pDest += 10之后,pDest就不再位于4字节的边界上,因此执行第二个 (UI32)pDest访问时发生了CPU异常。于是我做了下面的这个函数:
UI32 getUI32(UI8 * pSrc)
{
return (
(((UI32)(* pSrc )) << 24) |
(((UI32)(*(pSrc+1))) << 16) |
(((UI32)(*(pSrc+2))) << 8) |
(((UI32)(*(pSrc+3))) )
);
}
这样就能够从任意地址读取四个字节了。
另外,Multi的编译器指令中有一个 pack 指令,该指令能够指定定义结构时的最小的对齐字节数。例如正常情况下进行下列定义时,各个成员所占定义如下所示:
typedef struct {
UI32 a; // 4 bytes
UI8 b; // 1 byte + 3 bytes padding
UI32 c; // 4 bytes
}
由于第三个成员 c 为 UI32,CPU在读取c时需要在4字节边界上对齐,因此成员b后面就留下了三个padding字节。如果这样写即可避免该问题。
#pragma pack(1)
typedef struct {
UI32 a; // 4 bytes
UI8 b; // 1 byte
UI32 c; // 4 bytes
}
#pragma pack()
但是这样一来,CPU读取c的时候为什么不会产生异常?其实编译器作了特殊的处理,它将读取c的指令分解成两条,第一条在前一个边界上读取c的前三个字节,第二条在后一个边界上读取c的最后一个字节,因此不会产生异常。