克魯斯卡爾-沃利斯檢驗(yàn)(Kruskal-Wallis test)亦稱“K-W檢驗(yàn)”、“H檢驗(yàn)”等。用以檢驗(yàn)兩個(gè)以上樣本是否來(lái)自 同一個(gè)概率分布的一種非參數(shù)方法。被檢驗(yàn)的幾個(gè)樣本必須是獨(dú)立的或不相關(guān)的。與此檢驗(yàn)對(duì)等的參數(shù)檢驗(yàn)是單因素方差分析,但與之不同的是,K-W檢驗(yàn)不假設(shè)樣本來(lái)自正態(tài)分布。它的原假設(shè)是各樣本服從的概率分布具有相同的中位數(shù),原假設(shè)被拒絕意味著至少一個(gè)樣本的概率分布的中位數(shù)不同于其他樣本。此檢驗(yàn)并未識(shí)別出這些差異發(fā)生在哪些樣本之間以及差異的大小1。
基本介紹克魯斯卡爾-沃利斯檢驗(yàn)是一種秩檢驗(yàn),是威爾科克遜檢驗(yàn)的推廣, 用于多個(gè)連續(xù)型獨(dú)立樣本的比較。方差分析(ANOVA)程序關(guān)注的是,幾個(gè)總體的均值是否相等。數(shù)據(jù)是間隔測(cè)量尺度或比率測(cè)量尺度的數(shù)據(jù)。另外還要假定這些總體服從正態(tài)概率分布,并且有相等的標(biāo)準(zhǔn)差。如果數(shù)據(jù)是順序測(cè)量尺度的和(或)總體不服從正態(tài)分布會(huì)怎樣呢?W.H.克魯斯卡爾(Kruskal)和W.A.沃利斯(Wallis)于1952年提出了僅僅要求順序(排序)測(cè)量尺度數(shù)據(jù)的非參數(shù)檢驗(yàn)。不需要對(duì)總體分布形態(tài)做任何假定。該檢驗(yàn)被稱為克魯斯卡爾-沃利斯單因素秩方差分析(Kruskal-Wallis one-way analysis of variance by ranks)。
為了利用克魯斯卡爾-沃利斯檢驗(yàn),從總體中抽取的樣本必須是獨(dú)立的。例如,從三個(gè)組(經(jīng)理、員工、管理人員)中抽取樣本,并且進(jìn)行訪談。一組人員(如經(jīng)理)的回答決不能影響其他兩組的回答。
為了計(jì)算克魯斯卡爾-沃利斯檢驗(yàn)統(tǒng)計(jì)量:①合并所有的樣本;②將合并后的樣本值從低到高排序;③將排序后的值用秩代替,從最小值1開始。
要應(yīng)用方差分析技術(shù),我們假定: (1) 總體都服從正態(tài)分布; (2) 這些總體有相等的標(biāo)準(zhǔn)差;(3) 樣本是獨(dú)立抽取的。如果這些假定都滿足,我們可以利用F分布作為檢驗(yàn)統(tǒng)計(jì)量。如果這些假定不能被滿足,我們應(yīng)用不依賴于分布的克魯斯卡爾-沃利斯檢驗(yàn)2。
檢驗(yàn)步驟假設(shè)有m個(gè)相互獨(dú)立的簡(jiǎn)單隨機(jī)樣本(X1,…,Xni) (i=1,…, m)2。
檢驗(yàn)步驟:
1)將各樣本全部 個(gè)觀測(cè)值按遞增順序排成一 列;
2)以Ri(i=1,…,m)表示第 i個(gè)樣本的ni個(gè)觀測(cè)值X1,…,Xni在此排列中的秩的和;
3) 計(jì)算統(tǒng)計(jì)量
假如各樣本有r個(gè)相同數(shù)據(jù),設(shè)t1(i=1,…,r)是各樣本的第i個(gè)公共觀測(cè)值在全部N觀測(cè)值中出現(xiàn) 的次數(shù),則計(jì)算如下修正統(tǒng)計(jì)量
(當(dāng)N充分大時(shí)H及H′近似服從
分布,自由度v=m-1);
4)對(duì)于 給定的顯著性水平α和自由度v= m-1,由附表2查出分布上側(cè)分位數(shù)
當(dāng)
(或
)時(shí),認(rèn)為m個(gè)樣本不全來(lái)自同 一總體(無(wú)齊一性),否則可以利用
概率積分表(附表1)計(jì)算檢驗(yàn)的擬合優(yōu)度 (參見“擬合優(yōu)度
檢驗(yàn)”)。
|| || 附表1 x2概率積分的p值p=P{x2≥c} (υ——自由度)
(續(xù))
|| ||
當(dāng)υ≥45時(shí),使用近似公式:
其中υp,是N(0,1) 的雙側(cè)分位數(shù)2。
|| || 附表2 X2分布上側(cè)分位數(shù)X2n,υ(1≤υ≤45)
(續(xù))
|| ||
(續(xù))
|| ||
(續(xù))
|| ||
本詞條內(nèi)容貢獻(xiàn)者為:
任毅如 - 副教授 - 湖南大學(xué)