计算机定点数表示原理与应用实践-嵌云网-嵌入式AI开发资源站

计算机定点数表示原理与应用实践

LoLegends西罗

1. 定点数表示基础概念

计算机内部所有数据都是以二进制形式存储和处理的，但现实世界中的数值有整数、小数、正数、负数等多种形态。定点数（Fixed-point Number）就是用来表示这些数值的一种基本方法。所谓"定点"，指的是小数点的位置在存储格式中是固定不变的。

在早期的计算机系统中，定点数几乎是数值表示的唯一选择。虽然现代计算机更多使用浮点数进行科学计算，但定点数在嵌入式系统、金融计算、数字信号处理等领域仍然广泛应用。理解定点数的工作原理，是掌握计算机数据表示的基础。

定点数主要分为两大类：无符号定点数和有符号定点数。无符号定点数只能表示非负数，而有符号定点数则可以表示正数、负数和零。这两种表示法在计算机组成原理中都有其特定的应用场景和优势。

2. 无符号定点数表示

2.1 纯整数表示

最简单的定点数表示就是无符号整数。假设我们有一个8位的存储空间，可以表示的无符号整数范围是0到255（即2^8-1）。这种表示方法中，小数点被固定在最低位的右侧。

例如，二进制数1101.000（小数点固定在第4位）在8位无符号定点表示中就是00001101（前面补零）。这种表示法的优点是实现简单、运算速度快，特别适合表示自然数或不需要负数的场景。

注意：在硬件实现中，无符号定点数的加减乘除运算都可以直接使用ALU的整数运算单元完成，不需要额外的处理电路。

2.2 定点小数表示

无符号定点数也可以用来表示纯小数。这时小数点被固定在最高位的左侧。例如，8位无符号定点小数可以表示的范围是0到1-2^-8（即0.99609375），精度为2^-8。

这种表示法在数字信号处理中很常见。比如音频采样值通常就是0到1之间的小数。使用8位定点表示时，数值0.5会被存储为10000000（二进制），0.25为01000000，以此类推。

3. 有符号定点数表示

3.1 原码表示法

原码(Sign-Magnitude)是最直观的有符号数表示方法：最高位表示符号（0为正，1为负），其余位表示数值的绝对值。例如，8位原码表示中：
+5 = 00000101
-5 = 10000101

原码的优点是符合人类阅读习惯，但存在两个问题：

零有两种表示：+0(00000000)和-0(10000000)
加减运算复杂，需要判断符号位

3.2 反码表示法

反码(Ones' Complement)改进了原码的运算问题：正数的反码与原码相同，负数的反码是对其绝对值的原码按位取反。例如：
+5 = 00000101
-5 = 11111010

反码解决了加减运算的统一处理问题，但仍然存在+0(00000000)和-0(11111111)两种零表示。在早期的计算机如CDC 6600中就使用反码表示。

3.3 补码表示法

补码(Two's Complement)是现代计算机最常用的有符号数表示方法。正数的补码与原码相同，负数的补码是其反码加1。例如：
+5 = 00000101
-5 = 11111011

补码的优势非常明显：

零只有一种表示(00000000)
加减运算可以统一处理
硬件实现简单

在8位补码表示中，范围是-128(10000000)到+127(01111111)。最高位既是符号位，也是数值位，这使得补码能够比原码和反码多表示一个负数。

4. 定点数的运算

4.1 加减运算

补码表示的定点数加减法最为简单，可以直接使用加法器完成：

加法：直接按位相加，忽略最高位的进位
减法：A-B = A + (-B)，即加上B的补码

例如计算5-3：
5 = 00000101
-3 = 11111101
结果：00000010（即2），最高位进位被丢弃

重要技巧：判断溢出可以通过比较符号位变化。如果两个正数相加结果为负，或两个负数相加结果为正，则发生了溢出。

4.2 乘法运算

定点数乘法比加法复杂得多。原码乘法的步骤：

计算两个操作数绝对值的乘积
根据符号位确定结果符号

补码乘法的Booth算法更为高效：

将乘数和被乘数扩展为双倍字长
根据乘数最低两位决定操作（加被乘数、减被乘数或不变）
算术右移部分积和乘数
重复n次（n为位数）

4.3 除法运算

定点数除法通常使用恢复余数法或不恢复余数法：

初始化：将除数左移n位，被除数放入余数寄存器
余数减去除数，根据结果符号决定商位和下一步操作
重复n次得到n位商

5. 定点数的精度与溢出处理

5.1 精度问题

定点数的精度由小数点的位置决定。例如Q7.8格式表示7位整数和8位小数，其精度为2^-8。在DSP应用中常见的Q格式有：

Q15.16：32位定点，范围约±32768，精度2^-16
Q31.32：64位定点，极大范围和精度

选择适当的Q格式需要在动态范围和精度之间权衡。例如音频处理常用Q1.31格式，牺牲范围换取高精度。

5.2 溢出处理

定点运算容易发生溢出，常见处理方法：

饱和处理：超过最大值取最大值，小于最小值取最小值
模处理（回绕）：忽略溢出位，结果在范围内循环
异常处理：触发中断或异常，由软件处理

在嵌入式系统中，饱和处理最为常见，因为它避免了灾难性的结果突变。例如数字音频中，饱和处理产生的削波失真比回绕产生的噪声更容易接受。

6. 定点数的实际应用

6.1 嵌入式系统

在资源受限的嵌入式系统中，浮点运算单元往往不可用或太耗资源。定点数运算只需要整数ALU即可完成，大大节省硬件成本。例如：

电机控制中的PID算法
传感器数据采集与处理
低功耗物联网设备

6.2 数字信号处理

DSP处理器通常有专门的定点运算指令和硬件加速器。例如：

音频编解码（MP3、AAC）
图像处理（JPEG压缩）
通信系统（调制解调）

在这些应用中，定点数的确定性和可预测性比浮点数更有优势。

6.3 金融计算

金融领域对数值精度有严格要求，但不需要很大的动态范围。定点数特别适合表示货币值，可以避免浮点数带来的舍入误差。例如：

股票交易系统
税务计算
加密货币

7. 定点数与浮点数的比较

虽然现代CPU主要优化了浮点运算性能，但定点数仍有其不可替代的优势：

硬件成本：定点运算只需要整数ALU，而浮点需要专用FPU
确定性：定点运算结果完全可预测，浮点数可能因优化产生微小差异
功耗：定点运算功耗通常低于浮点运算
速度：在无FPU的系统中，定点运算快得多

当然，浮点数在科学计算、3D图形等需要大动态范围的场景中更为适合。在实际系统设计中，经常需要混合使用定点和浮点表示法。

8. 定点数编程实践

8.1 C语言中的定点数

虽然没有标准的定点数类型，但可以通过整数类型和移位操作模拟：

c复制typedef int32_t q15_16_t; // Q15.16格式

q15_16_t float_to_q15_16(float f) {
    return (q15_16_t)(f * 65536.0f);
}

float q15_16_to_float(q15_16_t q) {
    return (float)q / 65536.0f;
}

q15_16_t q15_16_mult(q15_16_t a, q15_16_t b) {
    int64_t tmp = (int64_t)a * b;
    return (q15_16_t)(tmp >> 16);
}

8.2 优化技巧

尽量使用2的幂次方作为缩放因子，这样乘除可以用移位实现
合理安排运算顺序，减少中间结果的位数扩展
使用内联汇编或编译器内置函数利用硬件加速
对于常用值（如0.5、0.25等），预先计算并存储为定点数

8.3 常见错误

忘记处理溢出情况
混淆不同Q格式的数值
在需要精度的地方过早右移
忽略运算过程中的中间值范围扩展

我在实际项目中发现，良好的命名约定可以避免很多错误。例如使用q15_16_value这样的变量名明确表示其格式，比简单的int value要安全得多。