凸函数
若 f(x) 为区间 I 上的上凸函数,则对于任意 x1,x2∈I 且 λ∈[0,1] 有:
f(λx1+(1−λ)x2)≥λf(x1)+(1−λ)f(x2)
下面证明若在区间 I 上有 f′′(x)≤0,则 f(x) 在 I 上为上凸函数。
当 x1=x2 或 λ=0,1 时显然成立。
当 x1=x2 且 λ∈(0,1) 时,不失一般性,令 x1<x2 且 a=λx1+(1−λ)x2,注意到:
{a−x1=(λ−1)(x1−x2)>0a−x2=λ(x1−x2)<0
将 a 代入定义式,即证:
λ(f(a)−f(x1))≥(1−λ)(f(x2)−f(a))
根据拉格朗日中值定理 ∃ξ1∈(x1,a),ξ2∈(a,x2) 得到:
f(a)−f(x1)f(x2)−f(a)=(a−x1)f′(ξ1)=(1−λ)(x2−x1)f′(ξ1)=(x2−a)f′(ξ2)=λ(x2−x1)f′(ξ2)
代入原不等式后得到:
λ(1−λ)(x2−x1)f′(ξ1)≥(1−λ)λ(x2−x1)f′(ξ2)
根据 f′′(x)≤0,有 f′(ξ1)≥f′(ξ2),得证。由上面的过程可以知道,若 f′′(x) 不恒为 0,且 λ∈{0,1},则仅当 x1=x2 时等号才能成立。
Jensen 不等式
若 f(x) 为区间 I 上的上凸函数,则对于任意 xi∈I 满足 ∑i=1nλi=1,λi∈[0,1] 有:
f(i=1∑nλixi)≥i=1∑nλif(xi)
取等条件为 x1=x2=⋯=xn 即平均值的函数值大于等于函数值的平均值,对于下凸函数不等号方向相反。
当 n=1,2 时根据定义显然成立,设 n=k 时成立,则 n=k+1 时有:
f(i=1∑nλixi)=f(i=1∑kλixi+λk+1xk+1)
利用 n=2 时的情况:
f(i=1∑kλixi+λk+1xk+1)=f((1−λk+1)i=1∑k1−λk+1λixi+λk+1xk+1)≥(1−λk+1)f(i=1∑k1−λk+1λixi)+λk+1f(xk+1)
取等条件为 xk+1=∑i=1k1−λk+1λixi;易知 ∑i=1kλi=1−λk+1,则 ∑i=1k1−λk+1λi=1,根据归纳假设有:
(1−λk+1)f(i=1∑k1−λk+1λixi)+λk+1f(xk+1)≥(1−λk+1)i=1∑k1−λk+1λif(xi)+λk+1f(xk+1)=i=1∑k+1λif(xi)
取等条件为 x1=x2=⋯=xk,结合上一步的取等条件,因此当 x1=x2=⋯=xk+1 时两不等号可以同时取等。