4种常见分布
二项分布
P(x=k)=Cnkpk(1−p)n−k : n次独立实验,每次成功概率为p, 成功k次为止
- 期望 E=np
- 方差 Var=np(1−p)
- 累计概率密度函数 F(x<=k)=∑x=0kCnkpk(1−p)n−k
应用场景:
- 质量控制
- 可靠性
- 调查抽样
在某些情况下可以被其他分布近似:
- p ->0, n -> ∞ , 可以用泊松分布近似
- p <=0.5 , np >5, or p >0.5 , nq >5, 可以用正态分布近似
泊松分布
P(x=k)=k!exp(−λ)λk ,记为x∼π(λ), λ指事件发生次数的平均值
描述单位时间内随机事件(概率不变)发生的次数的概率分布
- 期望 E=λ
- 方差 Var=λ
- X+Y∼π(λ1+λ2)
应用场景:
- 如某一服务设施在一定时间内受到的服务请求的次数
- 电话交换机接到呼叫的次数
- 汽车站台的候客人数
- 机器出现的故障数
指数分布
p(T=t)=λexp(−λt)
其中 λ>0 是分布的参数,即每单位时间发生该事件的次数
用来分析独立的事件发生的间隔的概率分布,比如两个游客进入机场的时间间隔(如果大概率间隔超过1个小时,机场人员就可以幸福摸鱼了)
- 期望 E=λ1
- 方差 Var=λ21
- 无记忆性(超级好的性质):P(T>s+t∣T>t)=P(T>s)
应用场景
正态分布
P(x)=2πσ21exp(2σ2−(x−μ)2)
Beta分布
p(x∣λ1,λ2,w1,w2)=w2−w11Γ(λ1)λ2Γ(λ1+λ2)(w2−w1x−w1)λ1−1(1−w2−w1x−w1)λ2−1
Beta分布
是用来描述概率的概率分布(十分拗口),因为概率是[0,1]的,所以Beta分布
的取值范围也是[0,1], 对概率进行建模。
通常情况下,w1=0,w2=1, 那么p(x∣λ1,λ2)=Γ(λ1)Γ(λ2)Γ(λ1+λ2)xλ1−1(1−x)λ2−1
Beta函数B(α,β)=∫01xa−1(1−x)dx=Γ(α+β)Γ(α)Γ(β)
Beta分布:
f(x)=B(α,β)1xα−1(1−x)β−1,0<x<1
Beta分布和二项分布的概率密度函数形式上非常相似,区别在于二项分布对实验成功次数进行建模,Beta分布是对成功概率进行建模,分析成功概率的概率(还是很拗口)
- 期望 E=α+βα
- 方差 Var=(α+β)2(α+β+1)αβ
应用场景: