估計(jì)問(wèn)題有的是對(duì)特殊分布族的某個(gè)參數(shù)函數(shù)的估計(jì),例如Bernoulli分布的概率p的估計(jì)問(wèn)題,也有一些是對(duì)廣泛的分布族
中分布F的某個(gè)特征的估計(jì)問(wèn)題,例如分布F的均值、方差或分布函數(shù)在某一點(diǎn)的函數(shù)值
的估計(jì)問(wèn)題。對(duì)于分布的特征均值
或分布函數(shù)在
的函數(shù)值也可寫(xiě)成如下的形式:
在上述的表示中,如果將分布本身看作為一個(gè)“參數(shù)”,那么要估計(jì)的分布的特征也是“參數(shù)”的函數(shù)。所以一般的可以考慮下列形式的特征的估計(jì)問(wèn)題:
這里的分布族可以是較為廣泛的分布族
,例如
。
式(1)中的h也稱為參數(shù)函數(shù)g的核(kernel),k稱為核的階(order)。
對(duì)于以為核的參數(shù)函數(shù)
, 一個(gè)基于樣本
的簡(jiǎn)單的無(wú)偏估計(jì)是
,但它只使用了樣本的前幾個(gè)觀測(cè),為了利用所有的觀測(cè),一個(gè)自然的做法是對(duì)稱化1。
定義 基于樣本的統(tǒng)計(jì)量
稱為U-統(tǒng)計(jì)量(U statistics),h也稱為統(tǒng)計(jì)量的核。(2)中的
表示對(duì)
中取k個(gè)元素的排列
求和1。
(1)以h為核的U-統(tǒng)計(jì)量是h對(duì)應(yīng)的參數(shù)函數(shù)的無(wú)偏估計(jì)。
(2)由于對(duì)的任一個(gè)排列
成立
所以不妨只考慮關(guān)于其變量為對(duì)稱的核h,即h滿足條件
對(duì)
的任一個(gè)排列
成立。
(3)對(duì)于對(duì)稱的k階核h,其U-統(tǒng)計(jì)量可寫(xiě)為
(4)U-統(tǒng)計(jì)量關(guān)于的任一排列
是不變的,所以它是只依賴于樣本順序統(tǒng)計(jì)量的函數(shù)1。
統(tǒng)計(jì)量(statistic)是指樣本的已知函數(shù),其作用是把樣本中有關(guān)總體的信息匯集起來(lái),是數(shù)理統(tǒng)計(jì)學(xué)中一個(gè)重要的基本概念。常用統(tǒng)計(jì)量有樣本矩、次序統(tǒng)計(jì)量、U統(tǒng)計(jì)量和秩統(tǒng)計(jì)量等。其中U統(tǒng)計(jì)量是W.霍夫丁于1948年引進(jìn)的。統(tǒng)計(jì)量的充分性和完全性是兩個(gè)重要概念,充分性是費(fèi)希爾在1925年引進(jìn)的,內(nèi)曼和P.R.哈爾莫斯在1949年嚴(yán)格證明了一個(gè)判定統(tǒng)計(jì)量充分性的方法,叫做因子分解定理。統(tǒng)計(jì)量的分布叫做抽樣分布,它的研究是數(shù)理統(tǒng)計(jì)中的重要課題。對(duì)一維正態(tài)總體,有三個(gè)重要的抽樣分布,即分布、
分布和
分布。其中
分布是F.赫爾梅特于1875年在研究正態(tài)總體的樣本方差時(shí)得到的;
分布是英國(guó)統(tǒng)計(jì)學(xué)家W.S.戈塞特(筆名“學(xué)生”)于1908年提出的;
分布是費(fèi)希爾在20世紀(jì)20年代提出的2。