版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

Y-STR位點(diǎn)分析技術(shù):魔鬼現(xiàn)形記,人類遺傳資源與陳年積案

科普中國創(chuàng)作培育計(jì)劃
原創(chuàng)
科普中國創(chuàng)作培育計(jì)劃運(yùn)營團(tuán)隊(duì)賬號(hào):創(chuàng)作者培育計(jì)劃作品發(fā)布等
收藏

近年來,“白銀案”、“南醫(yī)大案”等一系列影響惡劣的陳年積案得以告破。這些案件的共同特點(diǎn)是兇手作案手法兇殘、毫無人性,但它們又存在年代久遠(yuǎn),直接證據(jù)缺失等諸多困難。在最新技術(shù)的幫助下,警方的不懈努力終于得到回報(bào)。藏在每個(gè)人遺傳基因中的“特質(zhì)”,讓任何一點(diǎn)蛛絲馬跡都無所遁形,科學(xué)的光芒最終還是照亮了這世上最黑暗的角落。

作者:生物學(xué)博士 譚艷秋

大顯神通的Y-STR位點(diǎn)

STR(short tandem repeat,STR)位點(diǎn)是人類基因組內(nèi)含有的短片段重復(fù)序列,是人類基因組的重要組成之一1。在人類基因組計(jì)劃(Human Genome Project, HGP)開展之前,染色體上的STR區(qū)域是一個(gè)在研究領(lǐng)域內(nèi)被忽視的角落。彼時(shí)科學(xué)家們都把目光集中于人類基因(gene)——這一顯而易見具有重要功能的DNA片段。

人類的基因是以DNA片段中的起始密碼子(ATG)至終止密碼子(TAG、TAA、TGA)為標(biāo)志性序列(圖一),是DNA長鏈中負(fù)責(zé)編碼成蛋白質(zhì)的部分。相比之下,STR雖然也位于人類DNA上,也具有明顯的堿基結(jié)構(gòu)(如圖一中“TCAT”重復(fù)結(jié)構(gòu)域1),但它的主要功能并不明確,因而在很長一段時(shí)間內(nèi)并未得到研究人員的重視。

rId7

圖一:人染色體上的基因及非基因區(qū)域分布情況。其中基因區(qū)域包含蛋白編碼區(qū)、編碼區(qū)前的AGGA-TATA-GC區(qū)及、編碼區(qū)后的poly(A)區(qū),及基因因進(jìn)化突變而形成的假基因區(qū)和基因片斷區(qū)。非基因區(qū)包括短片段、中度和高度重復(fù)序列。

生物信息學(xué)分析結(jié)果顯示,全部人類基因組含有2.91兆堿基對(duì),共有約3.9萬個(gè)蛋白質(zhì)編碼序列(即基因),平均每個(gè)基因大小約為2.7萬個(gè)堿基,僅占全部基因組的1.5%左右。而相比之下,STR位點(diǎn)則占全基因組的3%左右,遍布于各染色體之間,幾乎每隔幾個(gè)基因就會(huì)出現(xiàn)一個(gè)STR位點(diǎn),且?guī)缀跛腥嘶蚪M的相應(yīng)位置都存在STR位點(diǎn)。

說白了,STR同樣是我們?nèi)祟惢蚪M中的遺傳信息,只不過它蘊(yùn)含的信息一直沒有得到解讀。如今,我們僅僅讀懂了它的極小一部分,然而,正是這極小的部分,構(gòu)成了利用Y-STR序列進(jìn)行命案追蹤的核心。

STR位點(diǎn)分析的原理

STR位點(diǎn)存在的生理學(xué)意義尚不得而知。它們既不涉及到任何蛋白的合成,也不參與到細(xì)胞任何生理學(xué)進(jìn)程。因此,不同人群中重復(fù)次數(shù)各異的STR位點(diǎn)也不會(huì)受到環(huán)境壓力所篩選(如突變后導(dǎo)致個(gè)體對(duì)環(huán)境的適應(yīng)能力變差而在進(jìn)化中被逐漸淘汰等)。在人類繁衍過程中,各種突變版本都得以被完整的保留下來。

有趣的是,在這些不同重復(fù)次數(shù)的版本中,親緣關(guān)系較近的人群(如父母和子女)STR位點(diǎn)的重復(fù)次數(shù)比較一致,而親緣關(guān)系較遠(yuǎn)的人群STR位點(diǎn)的重復(fù)次數(shù)則存在很大差異。這種有趣的規(guī)律很快被科研人員所關(guān)注,并首先在確定不同個(gè)體的親緣關(guān)系方面加以應(yīng)用。

近幾年,隨著測(cè)序技術(shù)的發(fā)現(xiàn),研究人員僅需獲取少量人體DNA樣本如血液、毛發(fā)或口腔表皮細(xì)胞等就可以通過基因測(cè)序技術(shù)獲得某個(gè)STR位點(diǎn)的詳細(xì)序列信息。因此,當(dāng)人們掌握了某一家族中所有人的STR位點(diǎn)序列信息,就可以根據(jù)STR位點(diǎn)的重復(fù)次數(shù)進(jìn)行比對(duì)、排列,從序列一致性角度重新評(píng)價(jià)這些人的親緣關(guān)系。以上便是利用STR位點(diǎn)信息確定不同個(gè)體親緣關(guān)系的基本原理。

rId8

圖二: STR位點(diǎn)的遺傳規(guī)律。如圖,第一代雙親各有兩個(gè)含有不同重復(fù)次數(shù)的STR位點(diǎn)STR1及STR2,經(jīng)遺傳逐漸融入了來自于其他家族的STR位點(diǎn)特征,至第二代及第三代獲得來自第一代父母雙方STR位點(diǎn)的概率為100%,而至第四代獲得來自第一代父母雙方STR位點(diǎn)的概率則為50%。因此隨著親緣關(guān)系漸遠(yuǎn),STR位點(diǎn)的一致性會(huì)有所降低。

值得注意的是,在圖二中,第四代子女僅有50%的概率與第一代雙親具有相同的STR位點(diǎn),而第五代子女則將有25%的機(jī)會(huì)與第一代雙親具有相同的染色體。因此僅通過分析這兩個(gè)STR位點(diǎn)可以獲得的親緣關(guān)系信息是十分有限的。甚至在很多如親子鑒定、個(gè)體識(shí)別、司法鑒定、交通事故鑒定等重要領(lǐng)域,兩個(gè)STR位點(diǎn)僅能準(zhǔn)確鑒定兩代以內(nèi)的親緣關(guān)系。

所幸,在人類的每一條染色體中均有數(shù)個(gè)可供鑒定的STR位點(diǎn),研究人員可以通過增加對(duì)各個(gè)染色體上STR位點(diǎn)的檢測(cè),大大地提高STR鑒定的準(zhǔn)確范圍。2011年美國國家標(biāo)準(zhǔn)學(xué)會(huì)專門頒布了一份細(xì)胞STR鑒定國家標(biāo)準(zhǔn)(ANSI/ATCC ASN-0002-2011)2。規(guī)范并詳細(xì)記錄了15個(gè)常用的STR位點(diǎn)在染色體上的分布位置及序列特征(圖三)。

rId9

圖三: 15個(gè)常用的STR位點(diǎn)在人染色體中的位置分布情況3。如圖為人22條常染色體及性染色體(X染色體和Y染色體)及其常用STR位點(diǎn)分布。染色體的編號(hào)是根據(jù)人類細(xì)胞遺傳學(xué)命名的國際體制(ISCN)決定的。

這些STR位點(diǎn)所能提供的序列信息不僅涵蓋了親緣關(guān)系較近的人群,還可對(duì)某人種、民族、地域中的人群關(guān)系進(jìn)行大致劃分,使這些模糊而不準(zhǔn)確的主觀數(shù)據(jù)在基因水平上首次得以明確劃分。

Y-STR位點(diǎn)分析技術(shù)的建立

在STR位點(diǎn)檢測(cè)技術(shù)的發(fā)展過程中,研究人員逐漸發(fā)現(xiàn)男性獨(dú)有的Y染色體STR位點(diǎn)分布及遺傳特點(diǎn)具有區(qū)別于其它常染色體的獨(dú)特性。在正常的人體細(xì)胞內(nèi)共有23對(duì)染色體,其中前22對(duì)為常染色體,屬于男女共有,而第23對(duì)較為特殊,被稱作性染色體。性染色體包括一個(gè)較長的X染色體及一個(gè)較短的Y染色體。女性含有兩條相同的X染色體,而男性則含有一條X染色體和一條Y染色體(圖三)。

與利用常染色體STR位點(diǎn)的序列相比,母系遺傳并不會(huì)介入到Y(jié)染色體上STR位點(diǎn)的進(jìn)化中去,使得這些Y-STR位點(diǎn)序列信息得以涵蓋親緣關(guān)系更久遠(yuǎn)、群體更大的男性群體。此外,排除母系遺傳的干擾后,利用分析Y染色體上的STR位點(diǎn)也可以大大提高親緣關(guān)系較近的人群STR位點(diǎn)數(shù)據(jù)的可靠性。

簡單來說,罪案尋兇過程中,不管犯罪分子如何狡猾,總會(huì)在現(xiàn)場(chǎng)留下若干蛛絲馬跡。目前的DNA檢測(cè)技術(shù)已經(jīng)相當(dāng)完善而高效,一點(diǎn)點(diǎn)身體組織痕跡就足以讓警方采集到可供分析的DNA數(shù)據(jù)。不過,獲取了罪犯的DNA,并不代表找到罪犯。畢竟目前來說收集個(gè)人遺傳信息涉及到公民的隱私權(quán),很難在大范圍內(nèi)推廣。

但有些特殊人群,例如刑事犯罪人員,他們的DNA數(shù)據(jù)是需要收集并報(bào)備的。經(jīng)過若干年的努力,我國警方已經(jīng)初步建成了具有一定規(guī)模的DNA數(shù)據(jù)庫。通過計(jì)算機(jī)技術(shù)對(duì)數(shù)據(jù)庫人員與疑案嫌疑人的DNA進(jìn)行Y-STR位點(diǎn)比對(duì),警方即便不能確定嫌疑人本身,也很容易找到嫌疑人的父系親屬,即便他們的親緣關(guān)系可能相當(dāng)遠(yuǎn)。

只要家族中有一名男性成員和警方DNA數(shù)據(jù)庫中的嫌疑人Y-STR位點(diǎn)比對(duì)成功,警方就能確定嫌疑人來自哪個(gè)家族,余下的案件偵破工作自然是水到渠成。白銀案和南醫(yī)大案的偵破都是通過這樣的方式才得以實(shí)現(xiàn)。這就好比釣魚變成了撒網(wǎng),警方從茫茫人海中找尋到犯罪分子的概率瞬間增大了數(shù)百倍。

除了罪案分析,Y-STR位點(diǎn)分析技術(shù)還有哪些應(yīng)用

2001年,斯坦福大學(xué)的皮特·昂德希爾(Peter Underhill)教授利用Y-STR位點(diǎn)分析的方法4,分析了12000個(gè)來自中國等東亞地區(qū)、大洋洲、西伯利亞、東南亞、中亞的男性個(gè)體Y-STR位點(diǎn)序列,并發(fā)現(xiàn)他們的Y-STR序列特征可劃分為M89、M130和YAP三個(gè)突變類型,而這三個(gè)突變型都是由M168這一共同祖先繁衍變異得來的,后者與非洲人口的Y-STR序列特征不謀而合,最終從基因的角度驗(yàn)證了人類起源的“走出非洲”假說。

參考資料:

1 Butler J, Gaithersburg. Forensic DNA Typing. Science & Technology 2013; 11 suppl 1:1050-1050.

2 Sittampalam GS, Coussens NP, Brimacombe K et al. Authentication of Human Cell Lines by STR DNA Profiling Analysis -- Assay Guidance Manual: PubMed 2004.

3 Lubbock. Methods for Authentication of Human Cell Cultures and Tissues, Texas Cancer Cell Repository Biorepository Core Laboratory, Cancer Center, Texas Tech University Health Sciences Center School of Medicine, 2017.

4 Ke Y, Su B, Song X et al. African Origin of Modern Humans in East Asia: A Tale of 12,000 Y Chromosomes. Science 2001; 292:1151-1153.

內(nèi)容資源由項(xiàng)目單位提供