struct 内存对齐

C/C++ 中 struct 的内存对齐

struct 内存对齐
Photo by Brett Jordan / Unsplash

struct 的内存结构

在学习 Objective-C Blocks 的时候,有这样一段代码:

struct __main_block_impl_0 {
  struct __block_impl impl;
  struct __main_block_desc_0* Desc;
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock;
    impl.Flags = flags;
    impl.FuncPtr = fp;
    Desc = desc;
  }
};
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {

        printf("Block\n");
    }

static struct __main_block_desc_0 {
  size_t reserved;
  size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
int main(int argc, const char * argv[]) {
    void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    return 0;
}

我对类似 (__block_impl *)blk 这样的类型转换很是不解,为啥能把一个 __main_block_impl_0 类型转成 __block_impl 类型呢?后来深入研究后才想起来,这原来是利用的 struct 的内存结构和内存对齐。

struct 是一种简单的数据结构,能够把各种不同类型的数据聚合在一起。

在 C/C++ 中,struct 的数据结构具有内存连续性的特点。这意味着 struct 中所有的成员在内存中存储的位置是连续的。但连续并不代表它们是紧挨着的。例如下面这个 struct,打印一下各个成员的内存地址:

struct S {
    short s;
    int i;
    double d;
};

int main() {
    S s = {};
    cout << &s << endl;
    cout << &s.s << endl;
    cout << &s.i << endl;
    cout << &s.d << endl;
    cout << sizeof(s) << endl;
}

// output:
// 0x16f9771c0
// 0x16f9771c0
// 0x16f9771c4
// 0x16f9771c8
// 16

struct 的起始地址和其第一个成员的地址一致,都是 0x16f9771c0 。第二个成员 i 为 int 类型,需要占用 4 个字节,地址相对于 struct 起始地址偏移了 4 个字节。第三个成员 d 是 double 类型,需要占用 8 个字节,地址相对于 struct 起始地址偏移了 8 个字节。而 d 是 struct 最后一个成员,地址偏移量 8 个字节加上本身占用了 8 个字节,加一起正好等于 struct 占用的全部内存大小。

struct 各成员的内存地址偏移是有一定规律的,这个规律称为内存对齐

为什么需要内存对齐

内存对齐是为了提高内存的访问速度,减少 CPU 访问内存的次数。CPU 访问内存时并不是一个字节一个字节地访问,而是以字长(word size)为单位访问。例如 32 位 CPU 的字长是 4 个字节,其访问内存的单位也是四个字节。

以上面的 struct S 为例,如果不进行内存对齐,而是让成员之间首尾紧挨在一起的话,那么其内存结构是这样的:

总共占用 2 + 4 + 8 = 14 个字节。在已知 struct 起始地址,也就是上图中位置为 0 的地址的情况下,CPU 想要访问成员 i 的话需要跨两个字长,也就是需要两次访问。访问结束后将两次访问的数据拼在一起才能得到成员 i 的完整数据。

但如果进行内存对齐的话,结构体的内存结构是这样的:

其中黑色块是为了内存对齐而偏移的字节,其中不存储成员数据。这时候访问成员 i 的话,就只需要一次访问就能够获取成员 i 的全部数据了。

因此进行内存对齐能够有效减少内存访问次数,提高性能。但这也是个典型的空间换时间的场景,因为中间有很多填充字节并没有存储真实数据。

内存对齐的规则

如果一个变量的内存地址正好位于它长度的整数倍,就被称作自然对齐

struct 内存对齐原则:

  • struct 的起始地址要能被其成员中最宽(占用字节数最多)的基本数据类型整除;
  • struct 的大小(size)也要能被其成员中最宽的基本类型整除;
  • struct 中每个成员的地址相对于 struct 起始地址的偏移必须是自然对齐的。

前面定义的 struct S 就符合这些规则。首先 short 类型的成员 s 的起始地址偏移量为 0,是第一个成员。第二个成员 i 是 int 类型,需要 4 个字节,因此自然对齐需要的偏移量是 4。最后一个成员 d 需要 8 个字节,偏移量为 8,恰好紧挨着成员 i 的尾巴,符合自然对齐。成员都自然对齐后,struct 所需总字节数为 16,能够被 8 整除。实例 s 的内存起始地址为 0x16f9771c0,转成十进制就是 6167163328,也能被 8 整除。

利用偏移量访问成员变量

struct Person
{
    int citizenship;
    int age;
};

int main() {
    int *age;
    int *city;
    auto temp = Person { 10, 11};
    auto person = &temp;
    city = (int *)person;
    size_t offset = offsetof(Person, age);
    age = (int *)((unsigned long)city + (unsigned long)offset);
//    age = city + offset / sizeof(int);
    cout << *city << endl;
    cout << *age << endl;
    cout << sizeof(Person) << endl;
    return 0;
}

// output:
// 10
// 11
// 8

上面代码中分别利用了 citizenship 和 age 的偏移量间接通过地址访问了 Person 的成员变量。

💡
注意指针的算数运算。pointer++ 并不代表将地址 pointer 加 1 个字节,而是加 sizeof(int) * 1 个字节。计算的时候可以将十六进制的地址转成 unsigned long 或者加偏移量的同时除以 sizeof(int)

Read more

2025 关税危机中学到的投资经验

2025 关税危机中学到的投资经验

充足的现金流很重要 好的买入机会不会每天都出现,但当它出现的时候,你最好还有筹码可以投入。 有些人手里握不住钱,一有闲钱就赶紧买入基金、股票,生怕错过了机会,让钱白搭手里。市场是疯狂的、充满变数的,尤其是在特朗普上台后,一句话就可能让股市涨停或跌停。那些专业的理财投资机构尚不能预测市场,何况我们这些散户呢。在不稳定的市场中,我们要学习巴菲特,备好现金,耐心等待买入(抄底)机会。 不要提前打光子弹 美股标普 500 指数从 2 月中旬到 3 月中旬累计跌了约 10%。如果这时候你觉得已经跌了很多,可以 all in 抄底了,那么你就会错过 4 月上旬的那次狂跌——一周跌了约 10%。没有人能预测市场,除了此刻的股市指挥家特朗普。散户们能学到的经验就是「永远不要提前打光子弹」,你以为的谷底其实只是个半山腰。 相信自己,保持耐心 在美股大跌的时段里,小红书、v2ex

By Gray
SwiftUI 页面导航最佳实践

SwiftUI 页面导航最佳实践

通过全局 Router 1. 定义一个全局 Router 对象,维护页面跳转类型和参数。 @Observable final class Router { public enum Destination: Codable, Hashable { case pageA(models: [Model]) case pageB } var navPath = NavigationPath() func navigate(to destination: Destination) { navPath.append(destination) } func navigateBack() { navPath.removeLast() } func navigateToRoot() { navPath.removeLast(navPath.count) } } 枚举 Destination 可以指

By Gray
碎碎念——投资,不确定性沟通定语

碎碎念——投资,不确定性沟通定语

投资理财 最近因为关税的冲击,美股正在经历一波大跌行情。我个人比较看好纳斯达克,也在一直定投纳斯达克。我是长期主义者,没有精力和时间在短期波动中挣钱,只想在下跌调整中「进货」。 定投分左侧定投和右侧定投。左侧定投是在下跌的过程中定投,而右侧定投是在上涨的过程中定投。左侧定投无法确认底部在哪里,需要源源不断往里投入金钱(行内成为「子弹」);右侧定投无法确认反弹是诱多还是形势已经逆转。我采用的是左侧定投,大跌大加,小跌小加,反弹时停止定投。不论采用哪种定投,殊途同归,都是尽量降低投资成本。 目前网上看衰美股的声音不少,不少人因为恐慌割肉卖出股票。但我们要知道目前美国仍旧是世界第一大国,消费潜力巨大,大型科技公司(苹果、英伟达等)的基本面并没有出现大问题。只是因为特朗普的「量子态」关税政策,导致市场恐慌抛售。我们无需担心纳斯达克、标普指数从此一蹶不振。恰恰相反,现在是买入美股的绝佳时机。苹果、英伟达等大型公司的 PE 值已经降到了合理位置,只要不买妖股,不投机,只关注纳斯达克、标普指数,只买大型公司股票,迟早会取得丰厚盈利的。

By Gray
怀念小时候吃过的食物

怀念小时候吃过的食物

前两天下班骑车回家的路上听到了路旁有人在讨论泡馍。他们口中的泡馍应该是类似西安羊肉泡馍之类的食物。但是我却想起来了小时候吃的不一样的泡馍以及其他吃食。 不一样的泡馍 小时候我们那里普遍比较贫穷,家家户户除了过年过节基本上很难吃到大块肉。小孩子饭量时小时大,中午吃的饭,半晌就又饿了。家里有大葱或者豆糁的话,可以拿着一个馍就着就吃了。整根的葱是最下馍的,葱白部分甜又辣,葱叶里面会有像鼻涕一样的粘液,要把它挤出来才下得嘴吃。豆糁是黄豆的发酵产物,煮熟的大豆加盐发酵几天,黏丝丝的时候团成球,放到发黑就能吃了。吃的时候从球上掰下来几小块就行。豆糁是咸的,因而也能下饭。不过最妙的吃法是将豆糁和鸡蛋一起炒。鸡蛋的香气和豆糁稍微发臭的味道混在一起,形成一种独特的香味。像北京的臭豆腐一样,闻着臭,吃着香。 如果家里没葱没豆糁了,馍又很干,那泡馍就是解决饿肚子的绝好办法。将干硬的馍掰成几瓣,不能太碎小,放到瓷碗里。倒入炒菜的肉味王佐料,或者是平时攒下来的方便面调料。再提溜着暖水瓶,倒进去冒着热气的水。当然香油是少不了的,拿着油光光的瓶子,滴进去几滴喷香的香油。最后用大碗盖住,或者干脆啥也不盖,静等

By Gray