拉格朗日松弛

拉格朗日（拉格朗日）松弛 / 对偶是整数规划、组合优化中常用的一种分解与定界技术：将一批“难”约束对偶化到目标里，在保留的“易”可行集上求子问题，并通过对乘子的优化得到对原问题目标值的界。全文记号自成体系（(IP)、、拉格朗日对偶 (LD) 等）；公式旁编号 (12.x) 等仅便于本文内交叉指代。若需与经典专著对照，可参见 Wolsey (1998) 等。

适用于什么问题

当整数规划或混合整数规划可写成「一组相对 简单且结构化 的约束与非退化可行域」加上一组「书写冗长或使模型难解 耦合约束」时，常可把后者松弛进目标并转而重复求解，再配合乘子优化或其它迭代给出 原问题上界或下界（极大或极小情形而定）、或为分支定界供可行松弛。典型：设施选址 / 选址分配中与耦合有关的切割容量约束、旅行商中的海量子回路不等式（在理论上可先松弛后对迭代）、车辆路由中与装载耦合的大规模耦合不等式写不进紧凑 MILP 时的定性近似边界。不适用：难约束不可剥离且无法在去掉它们之后仍能高效求解子问题的情形；或子问题本身仍为 NP-hard 且没有比原来更简单时才慎用单独 LR。

1. 拉格朗日松弛介绍

1.1 原问题：易约束与难约束

考虑整数规划原问题。若把约束区分为相对容易与困难的两部分，可写为（极大化原问题，便于后文叙述）：

若只保留与非负整数，问题往往容易（结构简单、可分解、或便于求解）。
一旦加入，问题可能变得极难（如 TSP 中大量子圈消除约束）。

若直接删去难约束，可行域过大，上界/下界很松，缺少对“违反难约束的惩罚”。

1.2 用可行集写成的等价形式

令

并设为条相对复杂的约束。则原问题可写为：

1.3 拉格朗日松弛问题

对任意非负乘子向量（），将以惩罚项形式并入目标，得到拉格朗日松弛子问题：

记为，其中为在乘子下该子问题的最优值。直观上，衡量“难约束的松弛量”：在可行时该项非负，乘上对目标产生奖罚；常被解释为影子价格 / 对偶变量 / 拉格朗日乘子（依上下文）。

2. 松弛性质与上界

2.1 拉格朗日松弛的定界

定理：对任意，问题是原问题 (IP) 的松弛（relaxation）。

证明（满足松弛的两项常见条件）：

可行域
原 (IP) 的可行解满足且，即位于。而仅要求，不再显式要求，故在的取值范围上，松弛问题的可行域是原可行域的超集（或理解为：先放宽难约束、再以罚项在目标中体现）。
目标值比较（对 (IP) 的任一可行解）
因且，有，故
即在同一上，松弛问题的目标不低于原目标。

推论（定界，极大化原问题）：对任意，的最优值给原 (IP) 的最优值一个上界：

为了得到尽量紧的上界，自然希望在上最小化。这就引出下一节的拉格朗日对偶。

3. 拉格朗日对偶问题

3.1 对偶 (LD) 的写法

为求“最好的”乘子，定义拉格朗日对偶问题：

等式难约束的情形：若难约束在模型中写为，则乘子不再限制符号，，对偶为

在一定条件下，求解 (LD) 可得到紧的上界，个别情形下还可由此恢复原 (IP) 的最优解（见下述最优性条件）。

3.2 最优性条件：何时的解就是 (IP) 的解

设，并存在满足：

是的最优解；
（原难约束可行）；
互补松弛：对所有，若则。

则是原 (IP) 的最优解。

证明思路（要点）：由 (1) 有

由 (3) 得，故

由 (2) 得对 (IP) 可行，故。结合弱对偶/对偶界有，在适当条件下可推出与最优性。

注：难约束全部为等式时 (3) 常自动更自然；若某的最优解已经满足 (IP) 的全体约束，它往往也是 (IP) 的最优解之一。

4. 应用：无容量设施选址 (UFLP) 的拉格朗日松弛

4.1 集合、参数与变量

：潜在设施下标；：客户下标。
：开放设施的固定费用；：将客户全部分配到时产生的收益（也可理解为“净收益”，即已扣除相应成本后的量，视建模习惯而定）。
决策：是否开设施；为客户由满足的需求比例；需求约束保证每个客户恰好被完全满足（无容量时可用比例全分给某一设施等解释）。

原 (IP)：

4.2 松弛 (12.3)：

对每条需求约束引入乘子，将 (12.3) 对偶到目标。目标中增加

整理得等价目标为（相当于将 (12.3) 的罚项展开后合并同类项）：

拉格朗日松弛（保留 (12.4)(12.5)）为：

4.3 按设施分解

(12.9) 按可分离为每个一个子问题。总目标

其中

闭式解（对固定的）：

若，则，目标为。
若，为最大化，在且下，可对每个独立将取到使最大的或。在“若开设施，则对客户要么全给、要么不给”的{0,1} 指派解释下，得到

（若仍允许为上的连续分配，闭式需按该子问题结构另写；上式对应二元指派型 UFLP 子问题常见闭式。）

5. 数值算例

取个客户、个设施。

固定费（本例取下列数值，便于手算）：

收益矩阵（）：

给定一组乘子，则

有效收益的矩阵为：

设施为例：第 2 列中正分量为第行的与第行的。若，则子问题贡献

对所有比较后，可得到一组在下最优的。例如取、、；、；其余为时，总贡献与常数项相加得

即该下松弛目标值为（作为原问题目标的一个上界候选，仍需求解 (LD) 以改进）。

6. 拉格朗日对偶的加强（与凸包表述）

在有限个极点的假设下，可写为在极点上的极大。对偶界可展开为

引入标量上界 (12.16) 可写成线性规划（对）：

其对偶给出（在凸组合权重下）的等价形式，并可几何解释为在上与的交上极大化。常见结论可概括为：

与凸包等价的对偶界（常称 Lagrangian dual 的“凸包解释”）
。
即对偶界相当于在难约束与的凸包上作线性（实为连续）优化；在常见设定下，该界不弱于仅在的线性松弛上作 LP 所得之界（具体依赖的 -表述等）。
有完美凸包多面体时：若的凸包有显式线性不等式表示，则可写为在与上极大的联合问题。

对偶函数形状：是凸的逐段线性函数；即在其图像上求最小值。若仅有一个乘子分量，可想象为：若干条仿射直线（各对应某个极点下的子问题值）的上包络，整体呈折线。下图为一维的示意：细线为各分量的线性部分，粗线为，所求为在大致最低点处取得。

一维对偶函数：仿射分量的上包络（逐段线性的凸）与的示意

7. 如何求解拉格朗日松弛（次梯度法）

7.1 极小化“极大族仿射”的凸函数

考虑逐段线性凸函数的极小，一般可写为

拉格朗日对偶的求值

与 (12.28)–(12.29) 同构（是若干以为自变量的仿射函数的逐点最大）。因此 (LD) 的求解与对一般的的极小属同一类凸—非光滑优化。

7.2 与上包络的“线性化”（引入辅助标量）

在有限项时，(12.28)–(12.29) 可等价写成在与上的线性目标与线性不等式，即上境图 (epigraph) 技巧：

与 §6 中 (12.17)–(12.18) 的写法为同一思想。对在极点集上取时，可同样用把“”变形成带的凸约束；若很大，在算法上往往不显式枚举全部不等式，而用次梯度或割平面逐步逼近。

7.3 次梯度的定义

对凸函数，称向量是在处的一个次梯度（subgradient），若

当在处可微时，次梯度与梯度相同：。对 (12.31) 的，在固定下求解子问题得最优解时，有

可视为在处的一个次梯度（在为逐点取极大的凸函数时，这是常用的取法）。

7.4 投影次梯度迭代（对偶乘子更新）

在上投影次梯度更新（分量取非负）：

初始化：，。
当时循环：
- 解，得最优解；
- 计算次梯度：；
- 取步长（见下节）；
- 乘子更新（向非负正交象限投影）这里为按分量取；
- 。
结束（常配合启发式可行化、对偶/原始界记录等工程技巧）。

该框架与 (12.30) 一致：在每一迭代用当前的松弛值与次梯度信息沿非光滑意义下的下降方向试探。收敛性需对的假设与步长规则作约束，经典非光滑优化中已有多种充分条件，此处不展开证明。

7.5 步长的常用取法

递减步长
要求且（）。例：。
几何衰减
，其中，为初值参数。
Polyak 型步长（若可估计最优对偶值的近似）
其中为的某估计（如分支定界中已知的最好原始可行解所对应目标值、或其与对偶界配合得到的对偶间隙相关标量，依实现而定；Polyak 原式依赖该估计的精度与符号约定。）

实现时还需数值截断、最大迭代数、对偶/原始隙监控与重启动等，以稳定的搜索。

备忘

（可在此补：枝定界/分支中拉格朗日界的使用、与 Dantzig–Wolfe / Benders 的对比、Gurobi 中相应接口、bundle/割平面替代次梯度的情形等。）

基础启发式（Simple Heuristics）

元启发式（Metaheuristics）

拉格朗日松弛

适用于什么问题

1. 拉格朗日松弛介绍

1.1 原问题：易约束与难约束

1.2 用可行集写成的等价形式

1.3 拉格朗日松弛问题

2. 松弛性质与上界

2.1 拉格朗日松弛的定界

3. 拉格朗日对偶问题

3.1 对偶 (LD) 的写法

3.2 最优性条件：何时的解就是 (IP) 的解

4. 应用：无容量设施选址 (UFLP) 的拉格朗日松弛

4.1 集合、参数与变量

4.2 松弛 (12.3)：

4.3 按设施分解

5. 数值算例

6. 拉格朗日对偶的加强（与凸包表述）

7. 如何求解拉格朗日松弛（次梯度法）

7.1 极小化“极大族仿射”的凸函数

7.2 与上包络的“线性化”（引入辅助标量）

7.3 次梯度的定义

7.4 投影次梯度迭代（对偶乘子更新）

7.5 步长的常用取法

备忘

拉格朗日松弛 ​

适用于什么问题 ​

1. 拉格朗日松弛介绍 ​

1.1 原问题：易约束与难约束 ​

1.2 用可行集 写成的等价形式 ​

1.3 拉格朗日松弛问题 ​

2. 松弛性质与上界 ​

2.1 拉格朗日松弛的定界 ​

3. 拉格朗日对偶问题 ​

3.1 对偶 (LD) 的写法 ​

3.2 最优性条件：何时 的解就是 (IP) 的解 ​

4. 应用：无容量设施选址 (UFLP) 的拉格朗日松弛 ​

4.1 集合、参数与变量 ​

4.2 松弛 (12.3)： ​

4.3 按设施 分解 ​

5. 数值算例 ​

6. 拉格朗日对偶的加强（与凸包表述） ​

7. 如何求解拉格朗日松弛（次梯度法） ​

7.1 极小化“极大族仿射”的凸函数 ​

7.2 与上包络的“线性化”（引入辅助标量 ） ​

7.3 次梯度的定义 ​

7.4 投影次梯度迭代（对偶乘子更新） ​

7.5 步长 的常用取法 ​

备忘 ​

拉格朗日松弛

适用于什么问题

1. 拉格朗日松弛介绍

1.1 原问题：易约束与难约束

1.2 用可行集写成的等价形式

1.3 拉格朗日松弛问题

2. 松弛性质与上界

2.1 拉格朗日松弛的定界

3. 拉格朗日对偶问题

3.1 对偶 (LD) 的写法

3.2 最优性条件：何时的解就是 (IP) 的解

4. 应用：无容量设施选址 (UFLP) 的拉格朗日松弛

4.1 集合、参数与变量

4.2 松弛 (12.3)：

4.3 按设施分解

5. 数值算例

6. 拉格朗日对偶的加强（与凸包表述）

7. 如何求解拉格朗日松弛（次梯度法）

7.1 极小化“极大族仿射”的凸函数

7.2 与上包络的“线性化”（引入辅助标量）

7.3 次梯度的定义

7.4 投影次梯度迭代（对偶乘子更新）

7.5 步长的常用取法

备忘