第五章:大数定律及中心极限定理
本章主要讨论大数定律及中心极限定理。
大数定律
大数定律是概率论中的一个重要定理,样本均值随着样本容量的增加而趋近于总体均值的性质。
「弱大数定律」
设 X1,X2,…,Xn 是独立同分布的随机变量,数学期望 E(Xk)=μ,则对于任意 ϵ>0,有:
P(n1k=1∑nXk−μ>ϵ)→0(n→∞)
通俗的说,就是当样本容量 n 趋近于无穷大时,样本均值 n1∑k=1nXk 会以概率收敛到总体均值 μ。
「伯努利大数定律」
设 fA 是 n 次独立重复试验中事件 A 发生的频率,p 是事件 A 的概率,则对于任意 ϵ>0,有:
P(nfA−p<ϵ)→1(n→∞)
中心极限定理
大数定律关注的是:Xˉn 最终会接近 μ,而中心极限定理要解决的是:Xˉn 附近是怎样波动的?
简单来说,结论为:不管原始变量是什么分布,平均值的分布都会近似正态。
预先定义:对于随机变量 X 有均值 μ 和方差 σ2,则标准化变量 Z=σX−μ.
「独立同分布的中心极限定理」
设随机变量 X1,X2,…,Xn 独立同分布,数学期望 E(Xk)=μ,方差 D(Xk)=σ2,
则当 n→∞ 时:标准化变量满足
Zn=σn(Xˉn−μ)=n⋅σ∑Xn−n⋅μ∼N(0,1)
或改写为:
Xˉn∼N(μ,nσ2)
也就是说,算术平均值 Xˉn,在 n 充分大时,服从均值为 μ,方差为 nσ2 的正态分布。
「Lyapunov 定理」
比我们前面学的“独立同分布”版本更一般化,适用于不完全相同分布的情形。
设 X1,X2,…,Xn 独立同分布,数学期望 E(Xk)=μk,方差 D(Xk)=σk2,总方差为 sn2=∑k=1nσk2,
若存在 δ>0 使得当 n→∞ 时:
n→∞limsn2+δ1i=1∑nE[∣Xi−μi∣2+δ]→0
则结论与独立同分布的中心极限定理相同:标准化变量满足
Zn=snk=1∑nXk−k=1∑nμk∼N(0,1)
例题
例题中常用的主要是第一个定理,独立同分布的中心极限定理。
计算器在进行加法时,将每个加数舍入最靠近它的整数,设所有舍入误差相互独立且在 (−0.5,0.5) 上服从均匀分布。
- 将 1500 个数相加,问误差综合的绝对值超过 15 的概率是多少?
- 最多可有几个数相加使得误差总和的绝对值小于 10 的概率不小于 0.90.
Xk 表示第 k 个数的误差,Xk∼U(−0.5,0.5),则 E(Xk)=0,D(Xk)=121.
设 X=∑k=11500Xk,则根据中心极限法则,
Z=1500⋅121X−1500×0∼N(0,1)
所以概率:
P(∣X∣>15)=1−P∣Z∣≤1500⋅12115=1−2Φ(1500⋅12115)−1=0.1802