1.4 内存编址和寻址、内存对齐_嵌入式Linux与物联网软件开发：C语言内核深度解析-QQ阅读男生科幻网

上QQ阅读APP看书，第一时间看更新

1.4 内存编址和寻址、内存对齐

1.4.1 内存编址方法

上面我们讲了内存的单位，以及内存的逻辑模型，这节我们会更加详细地介绍这个逻辑模型。内存在逻辑上就是一个一个的格子，这些格子可以用来装东西（里面装的东西就是数据），每个格子有一个编号，这个编号就是内存地址，这个内存地址（一个数字）和这个格子的空间（实质是一个内存空间）是一一对应且永久绑定的。这就是内存的编址方法。

在程序运行时，计算机中CPU实际只认识内存地址，而不关心这个地址所代表的空间怎么分布（硬件设计保证了只要按照这个地址就一定能找到这个格子，这就涉及了内存单元的两个重要概念——地址和空间。那么问题也就来了，我们究竟以多大空间来划分一个格子，并绑定一个地址呢？）。

1.4.2 关键：内存编址是以字节为单位

前面一直提到内存地址，那么我们究竟以多大的内存空间来划分绑定一个地址？答案是：我们以一个字节为基本单元对整个内存进行划分，并且一一绑定地址。常说的一个个内存空间指的就是内存单元。由此可见一个内存单元就是一个字节。如果把内存比喻为一栋大楼，那么这个楼里面的一个一个房间就是一个一个内存单元，每个房间的编号就好比内存单元地址。32根地址线可以找到多大的内存空间？每根线有两种状态，要么是0，要么是1，所以32根有2的32次幂种状态，每种状态对应一个地址，就有2的32次幂个地址。而内存以字节编址，一个地址对应一个字节，那就有2的32次幂个字节（B），我们把它换算成G，也就是4GB内存，大于4GB内存，对于CPU来说将无法寻址。这就好比你只有一个木桶，哪怕你身边有再多大江大河，但你还是只能装一桶水……

232÷（1024×1024×1024）=232÷230=22=4(G)

注意：1024=210

计算内存大小时，2的10次幂是1024，不是数学上的1000。所以1GB=1024MB,1MB=1024KB, 1KB=1024B，因此232=4GB

在讲内存位宽的时候我们就提到了内存编址，无论是多少位的内存，都是以字节为单位进行内存编址的。下面是64位位宽内存的编址，表示在一定时间（时间指的是一个时钟周期，不需要了解）内所能传送数据的位数是64位，也就是8个内存单元，所以我们把8个单元画成一排。

64位内存模型

1.4.3 内存和数据类型的关系

现在搞清楚了内存单元的划分，我们有必要讨论一下C语言中的基本数据类型：char、short、int、long、float、double。在C语言中，数据类型的本质表示一个内存格子的长度和解析方法。也就是在定义变量时，到底需要给这个变量分配多大空间，按照什么样的方式去解析该空间。用int和char类型定义一个变量时，其分配的空间大小自然是不同的。

当然，在32位系统中定义变量最好用int，这样效率高，因为32位系统中很多硬件本身都是32位的，配合定义的int型变量在内存中恰好分配4个字节，使得软件和硬件对于数据的处理非常契合，这样的工作效率自然就高。32位的硬件配置天生就适合定义32位的int型变量。千万不要单纯地认为定义char型变量由于分配了更少的内存空间，所以效率就更高，因此我们一直强调写程序时要尽量配合硬件特点。

在很多32位系统环境下，当定义bool类型变量时，我们基本都是用int来替代。虽然bool型只需要一个位，但是我们定义一个整型替代时，看似浪费了31个bit，但是好处是效率会高很多。对于现代计算机来说，内存还是很充足的，浪费31个bit并不是一个很大的问题。特别提示一点，int（整型）这个“整”字体现在它和CPU本身的数据位宽是一样的，如32位的CPU，整型就是32位，int就是32位。

问题：实际编程时，节省内存和提高效率到底谁重要？

回答：很多年前内存很贵，因此内存都很少，那时候写代码以省内存为主。现在随着半导体技术的发展，内存变得很便宜了，现在的机器都是高配，不在乎省一点内存，而效率和用户体验变成了关键。所以现在写程序大部分都是以效率为重。

1.4.4 内存对齐

什么是内存对齐，首先这是一个硬件问题。因为是逻辑模型，前面我们为了便于大家理解，在画内存逻辑图的时候并没有体现内存单元的对齐。但此时我们为了分析内存对齐，就需要画出内存的这个特性。内存对齐其实也很好理解。

32位内存模型，单元格中的数是单元格编号。

假设我们现在要在C语言中用int a；定义一个int类型变量，在内存中就必须分配4个字节来存储这个a的数据。下面有两种不同的内存分配思路和策略。

第一种：0 1 2 3对齐访问

第二种：1 2 3 4或者2 3 4 5或者3 4 5 6非对齐访问

内存的对齐访问不是逻辑的问题，而是硬件的问题。从硬件角度来说，对于32位的内存，0 1 2 3这四个单元本身逻辑上就有相关性，四个组合起来当作一个int，在硬件上就是合适的，效率就高。对齐访问更符合硬件规律，所以效率更高；非对齐访问因为和硬件本身不搭配，所以效率不高。因为兼容性的问题，通常硬件也都提供非对齐访问，但是效率要低很多。一般来说，除了直接使用汇编外，使用高级语言编写程序的时候，内存空间分配都会自动对齐。

本周热推：

Python深度学习与项目实战 Java Web程序设计 Processing互动编程艺术 JavaScript入门经典（第7版）Java Web动态网站开发（第2版·微课版）