Var(x)定義為概率密度函數(shù)f的二階矩,給出了x的方差。方差(英語:Variance),應(yīng)用數(shù)學(xué)里的專有名詞。在概率論和統(tǒng)計學(xué)中,一個隨機(jī)變量的方差描述的是它的離散程度,也就是該變量離其期望值的距離。一個實(shí)隨機(jī)變量的方差也稱為它的二階矩或二階中心動差,恰巧也是它的二階累積量。這里把復(fù)雜說白了,就是將各個誤差將之平方(而非取絕對值,使之肯定為正數(shù)),相加之后再除以總數(shù),透過這樣的方式來算出各個數(shù)據(jù)分布、零散(相對中心點(diǎn))的程度。繼續(xù)延伸的話,方差的正平方根稱為該隨機(jī)變量的標(biāo)準(zhǔn)差(此為相對各個數(shù)據(jù)點(diǎn)間)。
定義設(shè)X為服從分布F的隨機(jī)變量, 如果E[X]是隨機(jī)變數(shù)X的期望值(平均數(shù)μ=E[X])
隨機(jī)變量X或者分布F的方差為:
這個定義涵蓋了連續(xù)、離散、或兩者都有的隨機(jī)變量。方差亦可當(dāng)作是隨機(jī)變量與自己本身的協(xié)方差(或協(xié)方差):
方差典型的標(biāo)記有Var(X),
, 或是{\displaystyle \sigma ^{2}},其表示式可展開成為:
上述的表示式可記為"平方的期望減掉期望的平方"。
離散隨機(jī)變量如果隨機(jī)變量X是具有概率質(zhì)量函數(shù)的離散概率分布x1?p1,...,xn?pn,則:
此處 是其期望值, i.e.
當(dāng)X為有N個相等概率值的平均分布:
N個相等概率值的方差亦可以點(diǎn)對點(diǎn)間的方變量表示為:
連續(xù)型隨機(jī)變量如果隨機(jī)變量X是連續(xù)分布,并對應(yīng)至概率密度函數(shù)f(x),則其方差為:
此處 是一期望值,
且此處的積分為以X為范圍的x定積分(definite integral)
如果一個連續(xù)分布不存在期望值,如柯西分布(Cauchy distribution),也就不會有方差(不予定義)。
特性方差不會是負(fù)的,因?yàn)榇畏接嬎銥檎幕驗(yàn)榱悖?/p>
一個常數(shù)隨機(jī)變量的方差為零,且當(dāng)一個資料集的方差為零時,其內(nèi)所有項目皆為相同數(shù)值:
方差不變于定位參數(shù)的變動。也就是說,如果一個常數(shù)被加至一個數(shù)列中的所有變量值,此數(shù)列的方差不會改變:
如果所有數(shù)值被放大一個常數(shù)倍,方差會放大此常數(shù)的平方倍:
兩個隨機(jī)變量合的方差為:
此數(shù)Cov(., .)代表協(xié)方差。
對于 N個隨機(jī)變量的總和:
在樣本空間Ω上存在有限期望和方差的隨機(jī)變量構(gòu)成一個希爾伯特空間: L(Ω, dP),不過這里的內(nèi)積和長度跟協(xié)方差,標(biāo)準(zhǔn)差還是不大一樣。 所以,我們得把這個空間“除”常變量構(gòu)成的子空間,也就是說把相差一個常數(shù)的 所有原來那個空間的隨機(jī)變量做成一個等價類。這還是一個新的無窮維線性空間, 并且有一個從舊空間內(nèi)積誘導(dǎo)出來的新內(nèi)積,而這個內(nèi)積就是協(xié)方差1。
一般化如果X是一個向量其取值范圍在實(shí)數(shù)空間R,并且其每個元素都是一個一維隨機(jī)變量,我們就把X稱為隨機(jī)向量。隨機(jī)向量的方差是一維隨機(jī)變量方差的自然推廣,其定義為E[(X? μ)(X? μ)],其中μ = E(X),X是X的轉(zhuǎn)置。這個方差是一個非負(fù)定的方陣,通常稱為協(xié)方差矩陣。
如果X是一個復(fù)數(shù)隨機(jī)變量的向量(向量中每個元素均為復(fù)數(shù)的隨機(jī)變量),那么其方差定義則為E[(X? μ)(X? μ)],其中X是X的共軛轉(zhuǎn)置向量或稱為埃爾米特向量。根據(jù)這個定義,方差為實(shí)數(shù)。
本詞條內(nèi)容貢獻(xiàn)者為:
閆曉東 - 副教授 - 中央民族大學(xué)信息工程學(xué)院