Skip to content

拉格朗日松弛

拉格朗日(拉格朗日)松弛 / 对偶是整数规划、组合优化中常用的一种分解与定界技术:将一批“难”约束对偶化到目标里,在保留的“易”可行集上求子问题,并通过对乘子 的优化得到对原问题目标值的界。全文记号自成体系((IP)、、拉格朗日对偶 (LD) 等);公式旁编号 (12.x) 等仅便于本文内交叉指代。若需与经典专著对照,可参见 Wolsey (1998) 等。

适用于什么问题

当整数规划或混合整数规划可写成「一组相对 简单且结构化 的约束与非退化可行域 」加上一组「书写冗长或使模型难解 耦合约束 时,常可把后者松弛进目标并转而重复求解 ,再配合乘子优化或其它迭代给出 原问题上界或下界(极大或极小情形而定)、或为分支定界供可行松弛。典型:设施选址 / 选址分配中与耦合有关的切割容量约束、旅行商 中的海量子回路不等式(在理论上可先松弛后对 迭代)、车辆路由中与装载耦合的大规模耦合不等式写不进紧凑 MILP 时的定性近似边界。不适用:难约束不可剥离且无法在去掉它们之后仍能高效求解子问题的情形;或子问题本身仍为 NP-hard 且没有比原来更简单时才慎用单独 LR。


1. 拉格朗日松弛介绍

1.1 原问题:易约束与难约束

考虑整数规划原问题。若把约束区分为相对容易与困难的两部分,可写为(极大化原问题,便于后文叙述):

  • 若只保留 与非负整数,问题往往容易(结构简单、可分解、或便于求解)。
  • 一旦加入 ,问题可能变得极难(如 TSP 中大量子圈消除约束)。

若直接删去难约束 ,可行域过大,上界/下界很松,缺少对“违反难约束的惩罚”。

1.2 用可行集 写成的等价形式

并设 条相对复杂的约束。则原问题可写为:

1.3 拉格朗日松弛问题

对任意非负乘子向量 ),将 以惩罚项形式并入目标,得到拉格朗日松弛子问题:

记为 ,其中 为在乘子 下该子问题的最优值。直观上, 衡量“难约束的松弛量”:在可行时该项非负,乘上 对目标产生奖罚; 常被解释为影子价格 / 对偶变量 / 拉格朗日乘子(依上下文)。


2. 松弛性质与上界

2.1 拉格朗日松弛的定界

定理:对任意 ,问题 是原问题 (IP) 的松弛(relaxation)。

证明(满足松弛的两项常见条件):

  1. 可行域
    原 (IP) 的可行解满足 ,即位于 。而 仅要求 ,不再显式要求 ,故在 的取值范围上,松弛问题的可行域是原可行域的超集(或理解为:先放宽难约束、再以罚项在目标中体现)。

  2. 目标值比较(对 (IP) 的任一可行解
    ,有 ,故

    即在同一 上,松弛问题的目标不低于原目标。

推论(定界,极大化原问题):对任意 的最优值 给原 (IP) 的最优值 一个上界:

为了得到尽量紧的上界,自然希望在 上最小化 。这就引出下一节的拉格朗日对偶。


3. 拉格朗日对偶问题

3.1 对偶 (LD) 的写法

为求“最好的”乘子,定义拉格朗日对偶问题:

等式难约束的情形:若难约束在模型中写为 ,则乘子不再限制符号,,对偶为

在一定条件下,求解 (LD) 可得到紧的上界,个别情形下还可由此恢复原 (IP) 的最优解(见下述最优性条件)。

3.2 最优性条件:何时 的解就是 (IP) 的解

,并存在 满足:

  1. 的最优解;
  2. (原难约束可行);
  3. 互补松弛:对所有 ,若

是原 (IP) 的最优解。

证明思路(要点):由 (1) 有

由 (3) 得 ,故

由 (2) 得 对 (IP) 可行,故 。结合弱对偶/对偶界有 ,在适当条件下可推出 与最优性。

注:难约束全部为等式时 (3) 常自动更自然;若某 的最优解已经满足 (IP) 的全体约束,它往往也是 (IP) 的最优解之一。


4. 应用:无容量设施选址 (UFLP) 的拉格朗日松弛

4.1 集合、参数与变量

  • :潜在设施下标;:客户下标。
  • :开放设施 的固定费用;:将客户 全部分配到 时产生的收益(也可理解为“净收益”,即已扣除相应成本后的量,视建模习惯而定)。
  • 决策: 是否开设施 为客户 满足的需求比例;需求约束 保证每个客户恰好被完全满足(无容量时可用比例 全分给某一设施等解释)。

原 (IP):

4.2 松弛 (12.3):

对每条需求约束引入乘子 ,将 (12.3) 对偶到目标。目标中增加

整理得等价目标为(相当于将 (12.3) 的罚项展开后合并同类项):

拉格朗日松弛(保留 (12.4)(12.5))为:

4.3 按设施 分解

(12.9) 按 可分离为每个 一个子问题。总目标

其中

闭式解(对固定的 ):

  • ,则 ,目标为
  • ,为最大化,在 下,可对每个 独立将 取到使 最大的 。在“若开设施 ,则对客户 要么全给 、要么不给”的{0,1} 指派解释下,得到

(若仍允许 上的连续分配,闭式需按该子问题结构另写;上式对应二元指派型 UFLP 子问题常见闭式。)


5. 数值算例

个客户、 个设施。

固定费(本例取下列数值,便于手算):

收益矩阵 ):

给定一组乘子 ,则

有效收益 的矩阵为:

设施 为例:第 2 列 中正分量为第 行的 与第 行的 。若 ,则子问题贡献

对所有 比较 后,可得到一组在 下最优的 。例如取 ;其余为 时,总贡献与常数项相加得

即该 下松弛目标值为 (作为原问题目标的一个上界候选,仍需求解 (LD) 以改进 )。


6. 拉格朗日对偶的加强(与凸包表述)

有限个极点 的假设下, 可写为在极点上的极大。对偶界可展开为

引入标量 上界 (12.16) 可写成线性规划(对 ):

其对偶给出(在凸组合权重 下)的等价形式,并可几何解释为在 上与 的交上极大化 。常见结论可概括为:

  • 与凸包等价的对偶界(常称 Lagrangian dual 的“凸包解释”)

    即对偶界相当于在难约束与 的凸包 上作线性(实为连续)优化;在常见设定下,该界不弱于仅在 的线性松弛上作 LP 所得之界(具体依赖 -表述等)。

  • 有完美凸包多面体时:若 的凸包有显式线性不等式表示 ,则 可写为在 上极大 的联合问题。

对偶函数形状: 是凸的逐段线性函数; 即在其图像上求最小值。若仅有一个乘子分量,可想象为:若干条仿射直线(各对应某个极点 下的子问题值)的上包络,整体呈折线。下图为一维 的示意:细线为各分量的线性部分,粗线为 ,所求为 在大致最低点处取得。

一维对偶函数:仿射分量的上包络(逐段线性的凸 )与  的示意


7. 如何求解拉格朗日松弛(次梯度法)

7.1 极小化“极大族仿射”的凸函数

考虑逐段线性凸函数 的极小,一般可写为

拉格朗日对偶的求值

与 (12.28)–(12.29) 同构( 是若干以 为自变量的仿射函数的逐点最大)。因此 (LD) 的求解与对一般的 的极小属同一类凸—非光滑优化。

7.2 与上包络的“线性化”(引入辅助标量

在有限项 时,(12.28)–(12.29) 可等价写成在 上的线性目标与线性不等式,即上境图 (epigraph) 技巧:

与 §6 中 (12.17)–(12.18) 的写法为同一思想。对 在极点集 上取 时,可同样用 把“”变形成带 的凸约束;若 很大,在算法上往往不显式枚举全部不等式,而用次梯度或割平面逐步逼近。

7.3 次梯度的定义

对凸函数 ,称向量 处的一个次梯度(subgradient),若

处可微时,次梯度与梯度相同:。对 (12.31) 的 ,在固定 下求解子问题得最优解 时,有

可视为 处的一个次梯度(在 为逐点取极大的凸函数时,这是常用的取法)。

7.4 投影次梯度迭代(对偶乘子更新)

上投影次梯度更新(分量取非负):

  1. 初始化:
  2. 时循环:
    • ,得最优解
    • 计算次梯度:
    • 取步长 (见下节);
    • 乘子更新(向非负正交象限投影)这里 为按分量取
  3. 结束(常配合启发式可行化、对偶/原始界记录等工程技巧)。

该框架与 (12.30) 一致:在每一迭代用当前 的松弛值 与次梯度信息沿非光滑意义下的下降方向试探 。收敛性需对 的假设与步长规则作约束,经典非光滑优化中已有多种充分条件,此处不展开证明。

7.5 步长 的常用取法

  1. 递减步长
    要求 )。例:

  2. 几何衰减
    ,其中 为初值参数。

  3. Polyak 型步长(若可估计最优对偶值的近似)

    其中 的某估计(如分支定界中已知的最好原始可行解所对应目标值、或其与对偶界配合得到的对偶间隙相关标量,依实现而定;Polyak 原式依赖该估计的精度与符号约定。)

实现时还需数值截断、最大迭代数、对偶/原始隙监控与重启动等,以稳定 的搜索。


备忘

(可在此补:枝定界/分支中拉格朗日界的使用、与 Dantzig–Wolfe / Benders 的对比、Gurobi 中相应接口、bundle/割平面替代次梯度的情形等。)

个人笔记