minf(x),x∈Rn
s.t.
gi(x)≤0,i=1,2,3,...,m
hi(x)=0,i=1,2,3,...,q
为了求解上述问题,我们引入拉格朗日函数:
L(x,λ,v)=f(x)+∑λigi(x)+∑vihi(x)
原问题等价于 <===> 求解目标:
xminλ,vmaxL(x,λ,v)
s.t.
λ≥0
重要
为什么需要增加约束λ≥0?
当拉格朗日函数未满足为零的强制约束时所对应的增广拉格朗日函数的实际约束必须满足:
当违反约束条件时,即x不在可行域内: L(x,α,β)→+∞ ,
当满足约束条件时,即x在可行域内: L(x,α,β)=f(x)
现在原问题即可转为:
xminλ,vmaxL(x,λ,v)s.t.λ≥0
在数学中,一个集合 C 被称为凸集,如果对于集合中的任意两个点 x 和 y,连接这两点的直线段完全包含在 C 中。
用数学语言表达:
若对于任意 x,y∈C 和任意 λ∈[0,1],都有:
λx+(1−λ)y∈C
这称为凸组合,意思是沿着直线走不会离开集合。
可视化举例:

非凸集

凸集

凸函数与凹函数
凸函数 (Convex Function)
凹函数 (Concave Function)
注
区别和联系
- 图像形状:
- 凸函数:碗口朝上(U 形)。
- 凹函数:碗口朝下(倒 U 形)。
- 二阶导数:
- 凸:f′′(x)≥0(曲率非负)。
- 凹:f′′(x)≤0(曲率非正)。
- 关系:如果 f(x) 是凸函数,那么 −f(x) 是凹函数,反之亦然。
对偶函数定义为:
q(λ,v)=xmin[f(x)+i=1∑mλigi(x)+j=1∑pvjhj(x)]
即:
q(λ,v)=xminL(x,λ,v)
对偶问题是:
λ,vmaxq(λ,v)s.t.λ≥0
注
我们可以清楚看到maxq(λ,v)是关于λ, v的线性函数,则它既是凸函数也是凹函数
展开后为:
λ,vmax(xminL(x,λ,v))s.t.λ≥0
原问题:
xminλ,vmaxL(x,λ,v)s.t.λ≥0
对偶问题和原问题之间的关系
重要
λ,νmaxL(x,λ,ν)≥L(x,λ,ν)≥xminL(x,λ,ν)
A(x)=λ,νmaxL(x,λ,ν)≥L(x,λ,ν)≥xminL(x,λ,ν)=I(λ,ν)
A(x)≥I(λ,ν)
A(x)≥xminA(x)≥λ,νmaxI(λ,ν)≥I(λ,ν)
P∗=xminA(x)≥λ,νmaxI(λ,ν)=D∗
即原问题的解集是对偶问题的解的超集
“拉格朗日对偶问题”如何直观理解?“KKT条件” “Slater条件” “凸优化”打包理解