LQR控制算法：原理、实现与工程应用-嵌云网-嵌入式AI开发资源站

LQR控制算法：原理、实现与工程应用

香香甜甜圈

1. LQR控制算法概述

线性二次调节器（Linear Quadratic Regulator，LQR）是现代控制理论中最为经典和实用的状态反馈控制方法之一。作为一名从事嵌入式控制系统开发多年的工程师，我经常在各种实际项目中应用LQR算法，从无人机飞控到工业机械臂，都能看到它的身影。

1.1 LQR的核心思想

LQR的核心可以用一个简单的驾驶场景来理解：想象你正在高速公路上驾驶汽车，需要保持在车道中央行驶。这个过程中你需要平衡两个相互矛盾的需求：

快速纠正偏离（对应状态误差最小化）
保持驾驶平稳（对应控制能量最小化）

LQR的精妙之处在于，它通过数学方法自动找到了这两个需求之间的最优平衡点。与传统的PID控制相比，LQR具有以下显著优势：

多变量统一处理：能自然处理多输入多输出(MIMO)系统的耦合关系
性能可量化：通过代价函数明确量化控制目标
稳定性保证：闭环系统具有天然的稳定性
参数整定科学：避免了PID那种"试凑"式的调参

1.2 LQR的数学基础

LQR建立在状态空间模型之上，系统动态描述为：

code复制ẋ(t) = Ax(t) + Bu(t)

其中：

x(t) ∈ Rⁿ是状态向量
u(t) ∈ Rᵐ是控制输入
A ∈ Rⁿˣⁿ是系统矩阵
B ∈ Rⁿˣᵐ是输入矩阵

LQR的目标是设计状态反馈控制律u(t) = -Kx(t)，使得以下二次型代价函数最小化：

code复制J = ∫[xᵀQx + uᵀRu]dt

Q和R分别是状态和控制输入的权重矩阵，它们决定了我们对"状态误差"和"控制能量"的重视程度。

2. LQR的详细数学推导

2.1 代价函数的构建

让我们深入理解代价函数J的物理意义。这个积分函数包含两个关键部分：

状态惩罚项xᵀQx：
- Q是半正定矩阵(Q≥0)
- 该项惩罚状态偏离平衡点的程度
- 对角线元素Qᵢᵢ对应状态xᵢ的惩罚权重
控制惩罚项uᵀRu：
- R是正定矩阵(R>0)
- 该项惩罚控制能量消耗
- 对角线元素Rⱼⱼ对应控制输入uⱼ的惩罚权重

在实际工程中，Q和R的选择遵循以下原则：

希望严格控制的状态变量对应较大的Q值
昂贵或受限的执行器对应较大的R值

2.2 最优控制问题的求解

为了求解这个优化问题，我们引入哈密顿函数和协态变量λ(t)：

构造哈密顿函数：

code复制H = 1/2(xᵀQx + uᵀRu) + λᵀ(Ax + Bu)

最优性条件：
- 状态方程：∂H/∂λ = ẋ = Ax + Bu
- 协态方程：-∂H/∂x = λ̇ = -Qx - Aᵀλ
- 控制方程：∂H/∂u = 0 ⇒ Ru + Bᵀλ = 0
最优控制律：
从控制方程可得：
```
code复制u* = -R⁻¹Bᵀλ
```

2.3 黎卡提方程的推导

这里出现了一个关键问题：最优控制u*依赖于协态λ，而λ又与状态x相关。为了建立直接的状态反馈，我们假设存在线性关系：

code复制λ(t) = Px(t)

将这个假设代入前述方程，经过一系列推导（对λ=Px求导并代入状态和协态方程），我们最终得到连续时间代数黎卡提方程(ARE)：

code复制AᵀP + PA - PBR⁻¹BᵀP + Q = 0

这个矩阵方程的解P是一个对称正定矩阵，它包含了系统的最优控制信息。有了P之后，最优反馈增益矩阵K可以表示为：

code复制K = R⁻¹BᵀP

在实际工程中，我们通常使用MATLAB的lqr函数或Python的control.lqr函数来求解这个方程，避免了手动求解的复杂性。

3. LQR的工程实现

3.1 Simulink仿真实现

让我们以直流电机速度控制为例，展示LQR的实际应用。电机参数如下：

电阻R=2.0Ω
电感L=0.5H
转矩常数Kt=0.02N·m/A
反电动势常数Ke=0.02V·s/rad
转动惯量J=0.002kg·m²
摩擦系数B=0.0001N·m·s/rad

状态空间模型为：

code复制A = [-R/L  -Ke/L
      Kt/J  -B/J]
B = [1/L
     0]

在Simulink中搭建模型的步骤如下：

创建状态空间模块：
- 使用State-Space模块，填入A,B,C,D矩阵
- C = [0 1]（输出为转速ω）
- D = 0

设计LQR控制器：

matlab复制Q = diag([0, 100]);  % 重视转速误差
R = 1;               % 控制能量权重
K = lqr(A, B, Q, R);

实现状态反馈：
- 使用Gain模块实现u = -Kx
- 添加前馈增益Nbar消除稳态误差：
```
matlab复制Nbar = -1/(C*inv(A-B*K)*B);
```
构建完整系统：
- 参考输入通过Nbar缩放后加入
- 状态反馈信号相减
- 使用Scope观察转速和电流响应

3.2 权重矩阵的选择技巧

选择合适的Q和R矩阵是LQR设计中最具挑战性的部分。以下是几种实用的方法：

Bryson法则：

code复制Qᵢᵢ = 1/(最大允许xᵢ)²
Rⱼⱼ = 1/(最大允许uⱼ)²

这种方法提供了良好的归一化起点。

闭环极点配置法：
先确定期望的闭环极点位置，然后调整Q和R直到获得接近的极点配置。
迭代调整法：
- 从Q=I, R=ρI开始(ρ是标量)
- 逐步调整ρ直到获得满意的响应
- 然后微调Q的对角线元素

3.3 实际工程中的注意事项

状态可测性：
- LQR需要所有状态变量可测量
- 对于不可测状态，需要设计状态观测器
执行器饱和：
- 理论上的最优控制可能要求超出执行器能力的控制输入
- 实际实现时需要加入饱和限制
模型不确定性：
- LQR性能依赖于模型的准确性
- 对于参数变化大的系统，考虑鲁棒控制或自适应控制
离散化实现：
- 数字控制器需要离散化处理
- 使用c2d函数转换连续模型为离散模型
- 求解离散黎卡提方程(DARE)

4. LQR的进阶应用

4.1 积分增强型LQR

为了消除稳态误差，可以在状态向量中加入误差积分项：

code复制xₙ₊₁ = ∫(r - y)dt

增广后的系统矩阵变为：

code复制Ã = [A   0
     -C  0]
B̃ = [B
     0]

然后针对增广系统设计LQR，得到的控制律自然包含积分项。

4.2 输出调节器问题

当输出y=Cx而非全部状态需要调节时，可以修改代价函数为：

code复制J = ∫(yᵀQy + uᵀRu)dt = ∫(xᵀCᵀQCx + uᵀRu)dt

这相当于使用Q̃ = CᵀQC。

4.3 跟踪问题

对于参考信号跟踪，可以采用前馈-反馈复合控制：

code复制u = -Kx + Nbar·r

其中Nbar的计算如前所述，或者使用误差积分方法。

5. 与其他控制方法的比较

5.1 LQR vs PID

多变量处理：
- PID：需要为每个输入-输出对单独设计，难以处理耦合
- LQR：自然处理多变量耦合
参数整定：
- PID：依赖经验和试凑
- LQR：基于系统模型和明确的目标函数
性能保证：
- PID：无法保证全局最优
- LQR：保证代价函数最小化

5.2 LQR vs MPC

计算复杂度：
- LQR：离线计算，在线简单矩阵乘法
- MPC：在线优化，计算量大
约束处理：
- LQR：难以显式处理约束
- MPC：可以显式处理各种约束
适用场景：
- LQR：适用于线性无约束或软约束系统
- MPC：适用于有复杂约束的非线性系统

6. 实际应用案例

6.1 倒立摆控制

倒立摆是经典的LQR应用案例。系统状态通常包括：

小车位置x
小车速度ẋ
摆杆角度θ
摆杆角速度θ̇

LQR能够很好地平衡"保持摆杆直立"和"限制小车移动"这两个相互矛盾的目标。

6.2 四旋翼无人机

四旋翼有6个自由度（位置x,y,z和姿态ϕ,θ,ψ），通过4个电机控制，是典型的欠驱动系统。LQR可以：

解耦姿态和位置控制
处理多变量耦合
平衡响应速度与能量消耗

6.3 柔性机械臂

对于带有柔性模态的机械臂，LQR可以：

同时控制刚体运动和抑制振动
通过调整Q矩阵权重平衡运动速度和振动抑制

7. 常见问题与调试技巧

7.1 系统不稳定

可能原因：

模型不准确（A,B矩阵错误）
Q或R选择不当
状态不可观

解决方法：

验证模型准确性
尝试增大R或减小Q
检查状态可观性

7.2 响应过慢

可能原因：

Q权重太小
R权重太大

解决方法：

增大Q中对关键状态的权重
减小R值

7.3 控制输入饱和

可能原因：

执行器能力不足
R权重太小

解决方法：

增加执行器能力
增大R值
加入饱和补偿

8. 从理论到实践的思考

在实际工程中应用LQR时，有几个关键点需要特别注意：

模型准确性：LQR的性能高度依赖于系统模型的准确性。在建模阶段投入足够的时间是值得的。
状态估计：对于不可直接测量的状态，需要设计合适的状态观测器。卡尔曼滤波器是常见选择。
实时性考虑：在资源受限的嵌入式系统中，矩阵运算可能需要优化。可以考虑预先计算K矩阵，或者使用定点数运算。
鲁棒性测试：在仿真阶段充分测试系统在不同工况和参数变化下的表现，确保足够的鲁棒性。
渐进式实现：可以先在仿真环境中验证，然后逐步过渡到实物测试，降低风险。

LQR控制算法：原理、实现与工程应用

1. LQR控制算法概述

1.1 LQR的核心思想

1.2 LQR的数学基础

2. LQR的详细数学推导

2.1 代价函数的构建

2.2 最优控制问题的求解

2.3 黎卡提方程的推导

3. LQR的工程实现

3.1 Simulink仿真实现

3.2 权重矩阵的选择技巧

3.3 实际工程中的注意事项

4. LQR的进阶应用

4.1 积分增强型LQR

4.2 输出调节器问题

4.3 跟踪问题

5. 与其他控制方法的比较

5.1 LQR vs PID

5.2 LQR vs MPC

6. 实际应用案例

6.1 倒立摆控制

6.2 四旋翼无人机

6.3 柔性机械臂

7. 常见问题与调试技巧

7.1 系统不稳定

7.2 响应过慢

7.3 控制输入饱和

8. 从理论到实践的思考

内容推荐