简介
若随机变量 X 服从超几何分布,记作 X∼H(N,n,M),则有:
P(X=k)=(nN)(kM)(n−kN−M),k=0,1,…,n
为了避免讨论边界情况,这里假设 (mn)=0,m>n,所以上面的 k 直接取遍 0∼n,这样不符要求的概率为 0,并不会对结论造成影响。在期望和方差公式之前,首先给出一些组合数的公式及证明。
- 组合数与某个数相乘的公式,一个常见的 trick,可以将变量乘组合数转化为常量乘组合数:
x(xn)=xx!(n−x)!n!=n(x−1)!(n−x)!(n−1)!=n(x−1n−1)
-
范德蒙德卷积:
i=0∑k(in)(k−im)=(kn+m)
这可以用二项式定理来证明:
[xk](1+x)n(1+x)m[xk](1+x)n+m=i=0∑k(in)(k−im)=(kn+m)
-
期望的线性性质:
对于随机变量 X,Y 都有 E(X+Y)=E(X)+E(Y),我的理解是本质上为全概率公式:
E(X+Y)=x∑y∑(x+y)P(X=x,Y=y)=x∑xy∑P(X=x,Y=y)+y∑yx∑P(X=x,Y=y)=x∑xP(X=x)+y∑yP(Y=y)=E(X)+E(Y)
注意这个不要求 X,Y 独立。
用这两个公式就可以开始推导了。
期望
如果记 p=NM,那么其形式上和二项分布的期望相同,即 E(X)=np,下面是推导过程:
E(X)=x=0∑nxP(X=x)=x=1∑nx(nN)(xM)(n−xN−M)=(nN)Mx=1∑n(x−1M−1)(n−xN−M)=(nN)M(n−1N−1)=MN!n!(N−n)!(n−1)!(N−n)!(N−1)!=nNM
方差
这个形式相较于二项分布的 D(X)=np(1−p) 就比较丑了,对于 X∼H(N,n,M) 来说,有 D(X)=nNMN(N−1)(N−n)(N−M),这也能看出来推导过程肯定不是那么简单的。
D(X)=E(X2)−E2(X)=E(X(X−1))+E(X)−E2(X)=x=2∑nx(x−1)(nN)(xM)(n−xN−M)+nNM−n2N2M2=(nN)M(M−1)x=2∑n(x−2M−2)(n−xN−M)+nNM−n2N2M2=M(M−1)(n−2)!(N−n)!(N−2)!N!n!(N−n)!+nNM−n2N2M2=M(M−1)N(N−1)n(n−1)+nNM−n2N2M2=nNM[N−1(M−1)(n−1)+1−NnM]=nNMN(N−1)N(M−1)(n−1)+N(N−1)−nM(N−1)=nNMN(N−1)(N−M)(N−n)
本质上是连用两次组合数和变量乘积的性质。