凸函数

f(x)f(x) 为区间 II 上的上凸函数,则对于任意 x1,x2Ix_1,x_2\in Iλ[0,1]\lambda \in[0,1] 有:

f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2)f(\lambda x_1+(1-\lambda)x_2)\ge \lambda f(x_1)+(1-\lambda)f(x_2)

下面证明若在区间 II 上有 f(x)0f''(x)\le 0,则 f(x)f(x)II​ 上为上凸函数。

x1=x2x_1=x_2λ=0,1\lambda =0,1 时显然成立。

x1x2x_1\ne x_2λ(0,1)\lambda\in(0,1) 时,不失一般性,令 x1<x2x_1<x_2a=λx1+(1λ)x2a=\lambda x_1+(1-\lambda)x_2 即证:

λ[f(a)f(x1)](1λ)[f(x2)f(a)]\lambda[f(a)-f(x_1)]\ge (1-\lambda)[f(x_2)-f(a)]

根据拉格朗日中值定理 ξ1(x1,a),ξ2(a,x2)\exist\xi_1\in(x_1,a),\xi_2\in(a,x_2) 将得到的式子代入原不等式后得到:

λf(ξ1)(ax1)(1λ)f(ξ2)(x2a)\lambda f'(\xi_1)(a-x_1)\ge (1-\lambda)f'(\xi_2)(x_2-a)

即:

λ(1λ)(x2x1)f(ξ1)(1λ)λ(x2x1)f(ξ2)\lambda(1-\lambda)(x_2-x_1)f'(\xi_1)\ge (1-\lambda)\lambda (x_2-x_1)f'(\xi_2)

根据 f(x)0f''(x)\le 0,有 f(ξ1)f(ξ2)f'(\xi_1)\ge f'(\xi_2),得证。

Jensen 不等式

f(x)f(x) 为区间 II 上的上凸函数,则对于任意 xiIx_i\in I 满足 i=1nλi=1,λi[0,1]\sum_{i=1}^n \lambda_i = 1,\lambda_i\in [0,1] 有:

f(i=1nλixi)i=1nλif(xi)f(\sum_{i=1}^n\lambda_ix_i)\ge \sum_{i=1}^n\lambda_if(x_i)

取等条件为 x1=x2==xnx_1=x_2=\dots=x_n 即平均值的函数值大于等于函数值的平均值,对于下凸函数不等号方向相反。这里就不讨论 f(x)f(x) 是一次函数或者常函数这种特殊情况了。

n=1,2n=1,2 时根据定义显然成立,设 n=kn=k 时成立,则 n=k+1n=k+1 时有:

f(i=1nλixi)=f(i=1kλixi+λk+1xk+1)f(\sum_{i=1}^n\lambda_ix_i)=f(\sum_{i=1}^k\lambda_i x_i+\lambda_{k+1}x_{k+1})

利用 n=2n=2 时的情况:

f(i=1kλixi+λk+1xk+1)=f[(1λk+1)i=1kλi1λk+1xi+λk+1xk+1](1λk+1)f(i=1kλi1λk+1xi)+λk+1f(xk+1)\begin{aligned} f(\sum_{i=1}^k\lambda_i x_i+\lambda_{k+1}x_{k+1})&=f[(1-\lambda_{k+1})\sum_{i=1}^k\frac{\lambda_i}{1-\lambda_{k+1}}x_i+\lambda_{k+1}x_{k+1}]\\ &\ge (1-\lambda_{k+1})f(\sum_{i=1}^k\frac{\lambda_i}{1-\lambda_{k+1}}x_i)+\lambda_{k+1}f(x_{k+1})\\ \end{aligned}

取等条件为 xk+1=i=1kλi1λk+1xix_{k+1}=\sum_{i=1}^k\frac{\lambda_i}{1-\lambda_{k+1}}x_i;易知 i=1kλi=1λk+1\sum_{i=1}^k \lambda_i=1-\lambda_{k+1},则 i=1kλi1λk+1=1\sum_{i=1}^k\frac{\lambda _i}{1-\lambda_{k+1}}=1,根据归纳假设有:

(1λk+1)f(i=1kλi1λk+1xi)+λk+1f(xk+1)(1λk+1)i=1kλi1λk+1f(xi)+λk+1f(xk+1)=i=1k+1λif(xi)\begin{aligned} (1-\lambda_{k+1})f(\sum_{i=1}^k\frac{\lambda_i}{1-\lambda_{k+1}}x_i)+\lambda_{k+1}f(x_{k+1})&\ge (1-\lambda_{k+1})\sum_{i=1}^k\frac{\lambda _i}{1-\lambda_{k+1}}f(x_i)+\lambda_{k+1}f(x_{k+1})\\ &=\sum_{i=1}^{k+1}\lambda_if(x_i) \end{aligned}

取等条件为 x1=x2==xkx_1=x_2=\dots=x_k,结合上一步的取等条件,因此当 x1=x2==xk+1x_1=x_2=\dots=x_{k+1}​​ 时两不等号可以同时取等。

这里我没有证明也不知道取等条件是否唯一,只是阐述一下等号经过两次操作后也是可以取到的。

均值不等式

对于 nn 元均值不等式 (xi>0)(x_i> 0) 有:

1ni=1nxi(i=1nxi)1n\frac{1}{n}\sum_{i=1}^nx_i\ge(\prod_{i=1}^n x_i)^{\frac{1}{n}}

两边取对数,有:

ln(1ni=1nxi)1ni=1nlnxi\ln(\frac{1}{n}\sum_{i=1}^nx_i)\ge\frac{1}{n}\sum_{i=1}^n\ln x_i

易得 f(x)=lnxf(x)=\ln x 为区间 (0,+)(0,+\infin) 的上凸函数,取 λi=1n\lambda_i=\frac{1}{n} 即可用 Jensen 不等式证明。