捕獲再捕獲抽樣是用于生態(tài)學(xué)以及估計(jì)野生動(dòng)物總體數(shù)量的一種抽樣方法。其基本方法是從總體中抽取一個(gè)樣本,做上記號(hào)以后放回總體,使之與原總體的單位均勻地混合,經(jīng)過(guò)適當(dāng)?shù)臅r(shí)間,再?gòu)闹谐槿∫粋€(gè)樣本。根據(jù)已做記號(hào)與未做記號(hào)的比率來(lái)推斷總體的數(shù)量1。
基本介紹捕獲-再捕獲這一類抽樣方法最初起源于對(duì)野生動(dòng)物的調(diào)查,方法的步驟是:先抽取一定的樣本,把這些單元做上記號(hào),然后放回總體,使其與原總體的單元進(jìn)行混合;再抽取一個(gè)樣本,以觀察其中做記號(hào)單元所占的比例,對(duì)總體單元數(shù)進(jìn)行估計(jì)。
捕獲再捕獲抽樣應(yīng)用場(chǎng)合:總體單元數(shù)N是未知的,是需要估計(jì)的目標(biāo)。如估計(jì)一個(gè)池塘中魚的數(shù)量,一個(gè)森林中鳥類的數(shù)量,群眾集會(huì)的參加人數(shù)等。
關(guān)于捕獲再捕獲抽樣有很多模型,下面討論其中的直接抽樣法與逆抽樣方法2。
相關(guān)知識(shí)捕獲-再捕獲(capture-recapture)技術(shù)是現(xiàn)在廣為應(yīng)用的技術(shù),這是一種跨越概率抽樣與非概率抽樣的抽樣技術(shù),“跨越”一詞是說(shuō)這種技術(shù)超出概率抽樣與非概率抽樣的理論而又兼具兩種抽樣技術(shù)的特點(diǎn)。一方面,概率抽樣一般基于有限總體規(guī)模,而且總體規(guī)模N已知,一旦總體的大小N本身無(wú)法知曉,諸如樣本容量、抽樣比之類的指標(biāo)就無(wú)法得到,從而抽樣設(shè)計(jì)以及估計(jì)量的計(jì)算都將無(wú)法進(jìn)行,而捕獲-再捕獲技術(shù)恰恰超越了這一點(diǎn),“竟然”可以用來(lái)估計(jì)總體規(guī)模的大小。另一方面,在進(jìn)行捕獲-再捕獲的抽樣設(shè)計(jì)過(guò)程中的許多步驟,比如兩次抽樣的容量大小以及估計(jì)總體大小的前提的假定,雖然都有研究人員的經(jīng)驗(yàn)判斷成分滲透在內(nèi),卻一般都能給出估計(jì)的誤差大小,這一點(diǎn)顯然超出了非概率抽樣的范疇。
捕獲-再捕獲技術(shù)的產(chǎn)生已有很長(zhǎng)的一段時(shí)間,最初用于魚類和野生動(dòng)物總量的估計(jì),又推廣到流行病學(xué)問題的研究中,現(xiàn)今已經(jīng)成為一種在很多領(lǐng)域都有廣泛應(yīng)用的調(diào)查與分析手段。在生態(tài)學(xué)中,捕獲-再捕獲方法多被稱為彼得森方法或林肯方法,因?yàn)楸说蒙?894年用做記號(hào)的魚做過(guò)一些相關(guān)的研究工作,但這個(gè)方法真正被用于大規(guī)模的漁業(yè)研究則是由達(dá)爾在1917年實(shí)施的。1930年,林肯又巧妙地把這個(gè)方法用于估計(jì)鴨子總體的大小并獲得了很大成功,隨后薩卡和戴明繼續(xù)將這種方法發(fā)揚(yáng)光大,并在出生死亡率和估計(jì)現(xiàn)時(shí)人口總數(shù)等題目的研究上取得了引人注目的成就.薩卡和戴明的有關(guān)論文被公認(rèn)為是將捕獲-再捕獲技術(shù)應(yīng)用到人類健康領(lǐng)域的劃時(shí)代成果?,F(xiàn)今,應(yīng)用捕獲-再捕獲技術(shù)的場(chǎng)合幾乎無(wú)所不在,前提是只要能得到待研究總體的兩個(gè)小規(guī)模子總體的單元名單2。
直接抽樣法該方法首先從研究的數(shù)量N未知的總體中抽取一個(gè)隨機(jī)樣本,設(shè)樣本量為t,將這些樣本單元做上記號(hào)后放回總體,經(jīng)過(guò)適當(dāng)?shù)臅r(shí)間以后,這些樣本就與原總體均勻地混合在一起,很顯然,這時(shí)做記號(hào)的數(shù)量占總體數(shù)量的比例為t/N=P,這里t是已知的,N是未知的,而P是待估計(jì)的,這就需要通過(guò)第二次抽樣來(lái)估計(jì),假設(shè)第二次抽樣的樣本量為n,而其中有記號(hào)的單元數(shù)為s,我們可以通過(guò)圖1表示這一關(guān)系。
P的估計(jì)量為 ,將這一估計(jì)量代人前面的公式,可以得到N的估計(jì)量為
顯然,n要足夠大,才能使得
,而且這里
并不是N的無(wú)偏估計(jì)量。
的數(shù)學(xué)期望為
但當(dāng)?shù)谝淮螛颖玖縯和第二次樣本量n都足夠大時(shí),
就會(huì)逐漸變小,因此通常
是略有高估的,
的方差估計(jì)為
在大樣本的情況下,估計(jì)量
也近似正態(tài)分布,可以利用正態(tài)分布做出一定置信度下的置信區(qū)間2。
逆抽樣法在直接抽樣法中提到,當(dāng)s=0時(shí),就無(wú)法對(duì)總體N作出估計(jì),并且小比例抽樣很容易出現(xiàn)這樣的問題,為了避免這種情況的出現(xiàn),一種方法是加大第一次抽樣的數(shù)目,另一種方法就是霍爾丹提出的逆抽樣的方法.這種方法在第二次抽樣時(shí),并不對(duì)n的數(shù)量作出規(guī)定,而是一直抽到曾做過(guò)記號(hào)的單元數(shù)達(dá)到s個(gè)為止,假設(shè)這時(shí)的樣本量為n,那么P的估計(jì)量p仍為s/n,因此N的估計(jì)量仍為
這與直接抽樣法不同的是,逆抽樣中s是預(yù)先規(guī)定的,而n是一個(gè)隨機(jī)變量,這時(shí) 的方差估計(jì)為2
本詞條內(nèi)容貢獻(xiàn)者為:
劉軍 - 副研究員 - 中國(guó)科學(xué)院工程熱物理研究所