第四章:随机变量的数字特征
本章主要讨论描述随机变量某种特征的常数。
数学期望
设离散型随机变量 X 的取值为 x1,x2,…,xn,对应的概率为 p1,p2,…,pn,则称随机变量 X 的数学期望为:
E(X)=k=1∑∞xk⋅pk
对于连续型随机变量,类似有:
E(X)=∫−∞∞xf(x)dx
简称期望。
「随机变量的函数的期望」
设 X 是离散型随机变量,Y=g(x) 是 X 的函数,分布律满足 P(X=xk)=pk,则 Y 的期望为:
E(Y)=E[g(X)]=k=1∑∞g(xk)⋅pk
连续型类似有:
E(Y)=E[g(X)]=∫−∞∞g(x)f(x)dx
所以,我们在求 E(Y) 时,不必算出 Y 的分布律或概率密度,只需使用 X 的分布律或概率密度。
「性质」
- 若 C 是常数,E(C)=C.
- 若 C 是常数,E(CX)=CE(X).
- E(X+Y)=E(X)+E(Y).
- 若 X,Y 相互独立,E(XY)=E(X)E(Y).
方差
「定义」
设 X 是随机变量,方差:
D(X)=Var(X)=E{[X−E(X)]2}
而标准差为
σX=D(X)=Var(X)
把期望的公式代入,对于离散型随机变量:
D(X)=k=1∑∞[xk−E(X)]2pk
连续型随机变量:
D(X)=∫−∞∞[x−E(X)]2f(x)dx
「期望和方差的关系」
D(X)=E(X2)−[E(X)]2
「切比雪夫不等式」
设随机变量 X 具有数学期望 E(X)=μ 和方差 D(X)=σ2,则对任意正数 ϵ,都有:
P{∣X−μ∣≥ϵ}≤ϵ2σ2
用于在不知道分布,只知道方差和期望时,估计这种概率的界限,但是精度比较粗糙。
这个公式说明:偏离均值较大的概率不会太高。
「性质」
-
若 C 是常数,D(C)=0.
-
若 C 是常数,D(CX)=C2⋅D(X).
-
D(X+Y)=D(X)+D(Y)+2E{[X−E(X)][Y−E(Y)]},
当 X,Y 独立时,有 D(X+Y)=D(X)+D(Y)
-
D(X)=0⟺P{X=E(X)}=1.
协方差和相关系数
「定义」
设 X 和 Y 是两个随机变量,协方差:
Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}
而相关系数为
ρXY=D(X)D(Y)Cov(X,Y)
ρXY 衡量 X 与 Y 的线性相关程度,范围为 [−1,1]。
「性质」
协方差描述的是两个变量是否同向或反向变化,但数值大小依赖变量的单位。
- Cov(X,Y)=Cov(Y,X).
- Cov(aX,bY)=ab⋅Cov(X,Y).
- Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z).
相关系数是在协方差基础上进行标准化,反映两个变量之间的线性关系强弱和方向,数值范围在 -1 到 1 之间。
- ∣ρXY∣≤1.
- ∣ρXY=1∣⟺ 存在常数 a,b 使 P{Y=a+bX}=1.
- 当 ρXY=0 时,X 和 Y 不相关,但不一定独立。
「与二维正态分布」
从正态密度函数出发,二维正态分布的密度为:
f(x,y)=2πσXσY1−ρ21exp(−2(1−ρ2)1Q(x,y))
其中 Q(x,y) 是一个二次型:
Q(x,y)=(σX2(x−μX)2−2ρσXσY(x−μX)(y−μY)+σY2(y−μY)2)
这里面的常数 ρ 就是相关系数。
常见分布
离散型分布:
分布名称 | 参数 | 分布律 | 期望 E[X] | 方差 Var(X) | 记号 |
---|
伯努利分布 | p | P(X=1)=p P(X=0)=1−p | p | p(1−p) | Bern(p) |
二项分布 | n,p | P(X=k)=(kn)pk(1−p)n−k | np | np(1−p) | Bin(n,p) |
几何分布 | p | P(X=k)=(1−p)k−1p | p1 | p21−p | Geom(p) |
泊松分布 | λ>0 | P(X=k)=k!λke−λ | λ | λ | Poisson(λ) |
超几何分布 | N,M,n | P(X=k)=(nN)(kM)(n−kN−M) | nNM | nNM⋅(1−NM)⋅N−1N−n | H(N,M,n) |
连续型分布:
分布名称 | 参数 | 概率密度函数 | 期望 E[X] | 方差 Var(X) | 记号 |
---|
均匀分布 | [a,b] | f(x)=b−a1,x∈[a,b] | 2a+b | 12(b−a)2 | U(a,b) |
指数分布 | λ>0 | f(x)=λe−λx,x≥0 | λ1 | λ21 | Exp(λ) |
正态分布 | μ,σ2 | f(x)=2πσ21exp(−2σ2(x−μ)2) | μ | σ2 | N(μ,σ2) |
例题
若 Y=aX+b,则:
E(Y)=aE(X)+b,D(Y)=a2D(X)