一、内存对齐的原因
大部分的参考资料都是如是说的:
平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
二、对齐规则
每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。比如32位系统默认对齐系数是 4, 64位的则可以达到 8.
程序员可以通过预编译命令
1
|
|
来改变这一系数,其中的n就是指定的“对齐系数”。
另外,可以通过GCC提供的 __attribute__
扩展机制取消对齐优化。
规则:
数据成员对齐规则:结构(struct)或联合(union)的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员的对齐按照
#pragma pack
指定的数值和这个数据成员自身长度中,比较小的那个进行。结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照
#pragma pack
指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。
三、试验
下面通过一例子的说明这个规则
编译器:GCC4.6.3, (g++)
操作系统:Ubuntu 12, Windows 7
1 2 3 4 5 6 |
|
在GCC中,各类型的大小如下:
1 2 3 4 5 6 |
|
注解:在32位系统,n=4
相当于:
1 2 3 4 5 6 7 8 |
|
最后整体对齐,按4圆整,故:
1
|
|
注解:在64位系统,默认的对齐系数为8
1 2 3 4 5 6 |
|
最后整体对齐,按8圆整,故:
1
|
|
注解:C++允许在结构体中定义static变量,静态变量分配在同一的静态存储区,不包含在结构体大小中。
如下:
1 2 3 4 5 6 7 8 9 |
|
该结构体的大小仍为 20.
在标准C,似乎并没有这种用法。