在抽樣分布理論中,來(lái)自正態(tài)總體的統(tǒng)計(jì)量中,以三大重要分布為代表的一些精確的抽樣分布,它們的應(yīng)用很廣,但為數(shù)不多。 在其他情況下,總體為非正態(tài)總體或者總體的分布未知時(shí),抽樣分布都不易導(dǎo)出,或?qū)С鲞^(guò)于復(fù)雜而難于應(yīng)用。文章利用大樣本的方法,結(jié)合Slutsky定理,研究了來(lái)自一般總體的幾個(gè)統(tǒng)計(jì)量,推出了它們的漸近分布。
概念在樣本量無(wú)限增大時(shí),統(tǒng)計(jì)量X(X1,X2,...XN)的極限分布作為抽樣分布的一種近似,這種極限分布常稱為漸近分布。統(tǒng)計(jì)推斷的理論與方法貫穿于現(xiàn)代統(tǒng)計(jì)中,抽樣分布理論是進(jìn)行統(tǒng)計(jì)推斷的基礎(chǔ)。 在抽樣分布理論中,已導(dǎo)出的χ2分布,t分布,F(xiàn)分布等,它們以來(lái)自正態(tài)總體、抽樣分布的精確性、應(yīng)用的廣泛性、為數(shù)不多尤為重要。 但在其他情況下,總體為非正態(tài)總體或者總體的分布未知時(shí),抽樣分布都不易導(dǎo)出,或?qū)С鲞^(guò)于復(fù)雜而難于應(yīng)用,這迫使人們?nèi)で笃浣品植肌?利用大樣本的方法,結(jié)合Slutsky定理,研究了總體是一般分布或者分布未知情況下的幾種統(tǒng)計(jì)量A12、 B2及其函數(shù)等,推出了它們的漸近分布。
基于一般分布總體的統(tǒng)計(jì)量的漸近分布在抽樣分布理論中,正態(tài)總體是實(shí)際中經(jīng)常用到的一個(gè)總體,來(lái)自該總體的分布,χ2分布,t分布,F(xiàn)分布等一批精確分布,應(yīng)用非常廣泛,但為數(shù)不多。 相對(duì)于正態(tài)總體來(lái)說(shuō),總體為非正態(tài)總體或者總體的分布未知時(shí),要求抽樣分布的精確分布是非常不容易的,或?qū)С鲞^(guò)于復(fù)雜而難于應(yīng)用。
在總體為任意分布或者分布未知的情況下,利用大樣本方法,并結(jié)合Slutsky等引理,可以得到一些統(tǒng)計(jì)量的漸近分布。 而且這些方法具有可推廣的意義,只要能構(gòu)造合適的函數(shù),就可以得到更多的抽樣分布,以便進(jìn)行進(jìn)一步的統(tǒng)計(jì)推斷。1
應(yīng)用基于短期資料的重慶風(fēng)速極值漸進(jìn)分布分析采用統(tǒng)計(jì)方法推算極值風(fēng)速的誤差主要來(lái)自3個(gè)方面:樣本選取、模型選取和參數(shù)估計(jì)。年最大風(fēng)速最初被認(rèn)為服從極值II型,后來(lái)更多的研究表明極值風(fēng)速取極值I型更好。研究發(fā)現(xiàn),極值風(fēng)速的有界性,與前2種極值分布的右部尾部長(zhǎng)度(up—per taillength)無(wú)限長(zhǎng)的特性相違背,而與極值III型分布右部尾部長(zhǎng)度有限長(zhǎng)的特性符合,因而選取極值III型分布最合適。采用跨閾法(Peak Over nresh—old,POT)選取樣本的廣義跨閾分布GPD模型(GeneralizedParato Distribution)能較好地彌補(bǔ)樣本不足給參數(shù)估計(jì)帶來(lái)的困難,同時(shí)給出較好的風(fēng)速估計(jì)心。
利用重慶市沙坪壩區(qū)1990—1999年間的短期風(fēng)速資料來(lái)進(jìn)行年最大風(fēng)速的極值分布分析。首先分別采用極值I型(Gumbel)分布、極值II型(Frechet)分布和極值III型(reverse weibuu)分布擬合年最大風(fēng)速的極值分布,而后選取1990一1994年問(wèn)各月最大風(fēng)速作為樣本,使樣本容量擴(kuò)大為60個(gè)來(lái)擬合最大風(fēng)速的月極值的漸進(jìn)分布。依據(jù)最小二乘法的原理、矩法和變量替換法分別對(duì)3種極值分布函數(shù)進(jìn)行參數(shù)估計(jì),通過(guò)參數(shù)估計(jì)優(yōu)良性指標(biāo),比較短期風(fēng)速資料下的年最大風(fēng)速的分布函數(shù)與月極值漸進(jìn)分布函數(shù)的擬合效果,從得到的4組12個(gè)分布函數(shù)中選取較好的一種極值分布函數(shù)作為年最大風(fēng)速的極值分布函數(shù)。最后通過(guò)與GPD的參數(shù)估計(jì)指標(biāo)及風(fēng)速估計(jì)結(jié)果比較分析,得到短期風(fēng)速資料下重慶年最大風(fēng)速極值的最優(yōu)漸進(jìn)分布。
極值Ⅲ型(reverse weibull)分布給出了最佳的擬合優(yōu)度和極值風(fēng)速估計(jì)值且對(duì)于缺少長(zhǎng)期風(fēng)速觀測(cè)資料的地區(qū),采用對(duì)有限的短期資料進(jìn)行月最大風(fēng)速的分析來(lái)擬合該地區(qū)的風(fēng)速極值漸進(jìn)分布,效果明顯優(yōu)于采用年最大風(fēng)速記錄。從某種意義上來(lái)說(shuō)樣本容量的提高,使抽樣誤差減小了。2
重慶地面氣溫與風(fēng)速年極值的漸近分布?xì)庀笠貥O值作為氣候隨機(jī)變量在數(shù)學(xué)意義上是不穩(wěn)定的,但它們隨時(shí)間變化過(guò)程在概率上卻是穩(wěn)定的。因此,氣象要素極值的分布可能用分布函數(shù)去模擬,從而為氣象極端事件出現(xiàn)概率的預(yù)測(cè)提供理論依據(jù)和數(shù)據(jù)參考。分布函數(shù)的具體形式因隨機(jī)變量的特性而異,試驗(yàn)表明:某些氣象要素極值,例如氣溫極值和風(fēng)速極值的漸近分布,能以很高的擬合精度遵循三參數(shù)韋伯分布或耿貝爾分布。故選用三參數(shù)韋伯分布和耿貝爾分布作為已知分布函數(shù),擬合重慶地面最高氣溫和最大風(fēng)速年極值的漸近分布。用重慶40年(1951 —1990)的地面最高氣溫年極值資料和30年(1956 —1990 )的最大風(fēng)速年極值資料,其中最大風(fēng)速年極值有些年份無(wú)記錄值,故只有30 年作為樣本容量,對(duì)擬合參數(shù)進(jìn)行估計(jì),并通過(guò)比較表征參數(shù)估計(jì)優(yōu)良性的指標(biāo),選取較好的一種作為重慶地面最高氣溫和最大風(fēng)速年極值的漸近分布函數(shù)。
利用重慶1951—1990年40年間的地面最高氣溫年極值和1956—1990年間地面最大風(fēng)速年極值記錄,用韋伯分布和耿貝爾分布分別對(duì)它們進(jìn)行擬合實(shí)驗(yàn),并對(duì)其中的參數(shù)進(jìn)行估算。計(jì)算了擬合標(biāo)準(zhǔn)差、擬合相對(duì)偏差、柯?tīng)柲缏宸驍M合適度,從中選出這三個(gè)值較小的分布模式作為假設(shè)分布,然后通過(guò)統(tǒng)計(jì)檢驗(yàn),最后確定出重慶地面最高氣溫和最大風(fēng)速年極值應(yīng)遵循的漸近分布。
從統(tǒng)計(jì)檢驗(yàn)可以發(fā)現(xiàn):重慶地區(qū)的最大風(fēng)速年極值的漸近分布的擬合效果比最高氣溫年極值漸近分布的擬合效果差,其檢驗(yàn)統(tǒng)計(jì)量比最高氣溫年極值的大。主要原因如下:(1)受資料來(lái)源的限制,最大風(fēng)速年極值的樣本容量比最高氣溫年極值的樣本容量小。我國(guó)大部分測(cè)站只有解放以后的氣象資料,而且最大風(fēng)速年極值有些缺記錄,風(fēng)速漏報(bào)等原因而造成樣本容量小。(2)最大風(fēng)速年極值受各種因素的影響如風(fēng)的陣性、測(cè)站位置、周邊環(huán)境、儀器和安裝方法的更新、觀測(cè)時(shí)制的改變、站址的改變(重慶站在我們所取資料的時(shí)段內(nèi)曾有陳家坪和沙坪壩站址的轉(zhuǎn)換)等原因都可能使觀測(cè)序列發(fā)生改變,這些變化不是實(shí)際氣候變化的反映,因而破壞了資料的均一性,而使其變化更不規(guī)則,不穩(wěn)定,即其均一性欠佳。特別是當(dāng)風(fēng)速大于20M/S 時(shí),出現(xiàn)的機(jī)率很小。(3)風(fēng)速測(cè)量?jī)x器的觀測(cè)準(zhǔn)確度遠(yuǎn)小于溫度觀測(cè)。所有這些都會(huì)使最大風(fēng)速年極值的漸近分布的擬合效果比最高氣溫年極值漸近分布的擬合效果差。重慶地面最高氣溫年極值的漸近分布用韋伯分布或耿貝爾分布均可,但用韋伯分布擬合更精確。3
本詞條內(nèi)容貢獻(xiàn)者為:
王強(qiáng) - 副教授 - 西南大學(xué)