版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

P值

百度百科
原創(chuàng)
全球最大中文百科全書
收藏

定義

P值是指在一個(gè)概率模型中,統(tǒng)計(jì)摘要(如兩組樣本均值差)與實(shí)際觀測數(shù)據(jù)相同,或甚至更大這一事件發(fā)生的概率。換言之,是檢驗(yàn)假設(shè)零假設(shè)成立或表現(xiàn)更嚴(yán)重的可能性。P值若與選定顯著性水平(0.05或0.01)相比更小,則零假設(shè)會(huì)被否定而不可接受,然而這并不直接表明原假設(shè)正確。P值是一個(gè)服從正態(tài)分布的隨機(jī)變量,在實(shí)際使用中因樣本等各種因素存在不確定性,產(chǎn)生的結(jié)果可能會(huì)帶來爭議。1

意義

發(fā)展史

R·A·Fisher(1890-1962)作為一代假設(shè)檢驗(yàn)理論的創(chuàng)立者,在假設(shè)檢驗(yàn)中首先提出P值的概念。他認(rèn)為假設(shè)檢驗(yàn)是一種程序,研究人員依照這一程序可以對某一總體參數(shù)形成一種判斷。也就是說,他認(rèn)為假設(shè)檢驗(yàn)是數(shù)據(jù)分析的一種形式,是人們在研究中加入的主觀信息。當(dāng)時(shí)這一觀點(diǎn)遭到了Neyman-Pearson的反對,他們認(rèn)為假設(shè)檢驗(yàn)是一種方法,決策者在不確定的條件下進(jìn)行運(yùn)作,利用這一方法可以在兩種可能中作出明確的選擇,而同時(shí)又要控制錯(cuò)誤發(fā)生的概率,這兩種方法進(jìn)行長期且痛苦的論戰(zhàn)。雖然Fisher的這一觀點(diǎn)同樣也遭到了現(xiàn)代統(tǒng)計(jì)學(xué)家的反對,但是他對現(xiàn)代假設(shè)檢驗(yàn)的發(fā)展作出了巨大的貢獻(xiàn)。

Fisher的具體做法是:

假定某一參數(shù)的取值;

選擇一個(gè)檢驗(yàn)統(tǒng)計(jì)量(例如z 或Z 統(tǒng)計(jì)量) ,該統(tǒng)計(jì)量的分布在假定的參數(shù)取值為真時(shí)應(yīng)該是完全已知的;

從研究總體中抽取一個(gè)隨機(jī)樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值計(jì)算概率P值(或者觀測)的顯著水平,即在假設(shè)為真時(shí)的前提下,檢驗(yàn)統(tǒng)計(jì)量大于或等于實(shí)際觀測值的概率2;

若P<0.01,說明是較強(qiáng)的判定結(jié)果,拒絕假定的參數(shù)取值;若0.01<P<0.05,說明較弱的判定結(jié)果,拒絕假定的參數(shù)取值;若P>0.05,說明結(jié)果更傾向于接受假定的參數(shù)取值。

可是,那個(gè)年代,由于硬件的問題,計(jì)算P值并非易事,人們就采用了統(tǒng)計(jì)量檢驗(yàn)方法,也就是我們最初學(xué)的t值和t臨界值比較的方法。統(tǒng)計(jì)檢驗(yàn)法是在檢驗(yàn)之前確定顯著性水平α,也就是說事先確定了拒絕域。但是,如果選中相同的,所有檢驗(yàn)結(jié)論的可靠性都一樣,無法給出觀測數(shù)據(jù)與原假設(shè)之間不一致程度的精確度量,即:只要統(tǒng)計(jì)量落在拒絕域,假設(shè)的結(jié)果都是一樣,即結(jié)果顯著。但實(shí)際上,統(tǒng)計(jì)量落在拒絕域不同的地方,實(shí)際上的顯著性有較大的差異。因此,隨著計(jì)算機(jī)的發(fā)展,P值的計(jì)算不再是個(gè)難題,成為最常用的統(tǒng)計(jì)指標(biāo)之一。

計(jì)算方法

為理解P值的計(jì)算過程,用Z表示檢驗(yàn)的統(tǒng)計(jì)量,ZC表示根據(jù)樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值3。

左側(cè)檢驗(yàn)

P值是當(dāng)時(shí),檢驗(yàn)統(tǒng)計(jì)量小于或等于根據(jù)實(shí)際觀測樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率,即P值

右側(cè)檢驗(yàn)

P值是當(dāng)時(shí),檢驗(yàn)統(tǒng)計(jì)量大于或等于根據(jù)實(shí)際觀測樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率,即P值

雙側(cè)檢驗(yàn)

P值是當(dāng)時(shí),檢驗(yàn)統(tǒng)計(jì)量大于或等于根據(jù)實(shí)際觀測樣本數(shù)據(jù)計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量值的概率,即P值

內(nèi)容資源由項(xiàng)目單位提供