泊松分布(Poisson distribution),又稱波哇松分布、卜瓦松分布,是一種重要的離散型分布。
若隨機變量 X 服從參數(shù)為λ的泊松分布,其中 λ > 0,則記為X~π(λ),或記為X~Possion(λ) 。在泊松分布中,λ是唯一的參數(shù),它既是數(shù)學(xué)期望也是方差1。
泊松分布可作為二項分布的極限而得到。若二項分布的試驗次數(shù)n很大,二項分布的概率p很小,且乘積 λ=np比較適中,則事件出現(xiàn)的次數(shù)的概率可以用泊松分布來逼近2。
1837年,法國數(shù)學(xué)家西莫恩·德尼·泊松(Siméon-DenisPoisson)首次提出泊松分布的概念3。
泊松分布在實際中有著廣泛的應(yīng)用,它常與單位時間或單位面積及單位產(chǎn)品上的計數(shù)過程相聯(lián)系4,例如汽車站臺的候客人數(shù)、機器出現(xiàn)的故障數(shù)、DNA序列的變異數(shù)等。
定義
泊松分布是一種重要的離散型分布。如果離散型隨機變量 X 可取一切非負(fù)整數(shù)值,且有
則稱 X 服從參數(shù)為 λ 的泊松分布,其中 λ > 0,記為
,或記為
。泊松分布的平均值 m= λ,方差
= λ 25。
與二項分布的聯(lián)系
在二項分布的伯努利試驗中,如果試驗次數(shù)n很大,二項分布的概率p很小,且乘積 λ=np比較適中,則事件出現(xiàn)的次數(shù)的概率可以用泊松分布來逼近2。在這種條件下,將較難計算的二項分布近似為泊松分布去計算較為方便25。
泊松定理指出,在獨立試驗中,以代表事件 A 在試驗中出現(xiàn)的概率,它與試驗總數(shù)有關(guān)。如果
,當(dāng)
時,二項分布的極限為泊松分布6。下面給出證明。
記 ,
為二項分布,則:
對給定的,有:
及
因此:
泊松分布公式為:
其中是泊松分布的參數(shù)6。
性質(zhì)
方差與期望
在泊松分布中,唯一的參數(shù)既是數(shù)學(xué)期望也是方差。推導(dǎo)如下:
設(shè)隨機變量 ,則
這表明泊松分布的數(shù)學(xué)期望就是參數(shù)
。
又因為
由此得的方差為
也就是說,泊松分布的方差與數(shù)學(xué)期望均為。
可加性
兩個獨立且服從泊松分布的隨機變量,其和仍然服從泊松分布。即若且
,則
。
特征函數(shù)
泊松分布的特征函數(shù)為。
其他性質(zhì)
(1)泊松分布是一種描述和分析稀有事件的概率分布。要觀察到這類事件,樣本含量必須很大18。
(2)是泊松分布所依賴的唯一參數(shù)。
值愈小,分布愈偏倚,隨著
增大,分布趨于對稱18。
(3)當(dāng)=20時分布泊松分布接近于正態(tài)分布;當(dāng)
=50時,可以認(rèn)為泊松分布呈正態(tài)分布。 在實際工作中,當(dāng)
20時就可以用正態(tài)分布來近似地處理泊松分布的問題18。
參數(shù)估計
最大似然估計
對于泊松分布,假設(shè)有n個觀測值,它們都是獨立同分布的隨機變量,服從參數(shù)為
的泊松分布。泊松分布的似然函數(shù)為:
為了簡化計算,通常對似然函數(shù)取對數(shù):
關(guān)于求導(dǎo)并令其等于 0,可以得到最大似然估計值:
即泊松分布的參數(shù)的最大似然估計值就是觀測樣本的均值7。
貝葉斯估計
由貝葉斯公式知,在給定事件的情況下,事件A的條件概率
與事件在給定事件
發(fā)生的條件下的條件概率
的關(guān)系如下:
結(jié)合全概率公式,貝葉斯公式可以進一步表示為:
貝葉斯估計的步驟如下:
1. 給定先驗分布