版權歸原作者所有,如有侵權,請聯(lián)系我們

基因王國之二:靈感的碰撞——從基因到基因組

中國科普博覽
原創(chuàng)
中國科協(xié)、中科院攜手“互聯(lián)網(wǎng)+科普”平臺,深耕科普內容創(chuàng)作
收藏

出品:科普中國

作者:李雷

監(jiān)制:中國科普博覽

在《基因王國之一》中我們正式為大家介紹了基因,相信很多人也意識到,原來科學家眼里的基因和我們普通人日常說的基因其實不大一樣,而且在不同語境下,基因可能也有不一樣的含義。

盡管目前基因有很多定義和理解,但我們這里盡可能采用在學術界相對通用的認知,基因就是傳統(tǒng)定義的可以翻譯成多肽之類的標準片段,而基因組則是整個DNA上的遺傳序列。

你肯定會好奇一個問題,人體到底有多少基因呢?今天,我可以大體告訴你一個數(shù)字,大概是兩萬到兩萬五千個基因。

不過,這個數(shù)字可不是那么容易得出的。為了得到這個數(shù)字,人類發(fā)起了一場全世界的大合作,也就是和曼哈頓計劃、阿波羅計劃并列的二十世紀三大工程之一——人類基因組計劃。

人類基因組計劃的圖標

(圖片來源:wiki)

面對巨大挑戰(zhàn),全人類并肩作戰(zhàn)

在桑格等人開發(fā)出DNA測序技術之后,人們開始大量使用這種技術來對基因序列進行檢測。不過,這個檢測的速度是很慢的。

首先,如何大量獲取DNA就是一個難題,比如我們一個正常細胞只有一套DNA,這個含量是p克(皮克,萬億分之一克,也就是10^-12克)級別的。這是什么概念呢?不考慮人體的腸道微生物和食物里的DNA,我們一個人正常情況下全身所有的DNA加起來也就是幾十克,而進行測序,必須有大量的DNA,所以往往需要收集很多細胞。

這里多虧了一位叫做穆利斯的科學家,他創(chuàng)造性地建立了一種可以在體外(也就是實驗室里)直接以原有的DNA為模板來大量擴增DNA的辦法。這種辦法只需要一小部分DNA作為模板,然后加上聚合酶、引物(大家可以理解為引導的DNA,分別位于DNA的兩側,一般很短)以及ATGC堿基混合物,接下來就可以在儀器上快速地把DNA以指數(shù)的速度復制出來。

這套技術有一個大家更熟悉的名字,叫聚合酶鏈式反應,也就是PCR。

PCR流程

(圖片來源:wiki)

不過,難題還沒解決。要知道,PCR技術一次性的擴增的長度有限,往往是數(shù)百個堿基,而桑格開發(fā)的第一代基因測序技術,也一次性只能讀取幾百個堿基序列,在當時,成本大概是幾十美元左右。

大家可以算一下,如果每次只能檢測幾百個,要想研究明白人類基因組的30億堿基對,耗時估計需要幾十年,成本更是幾十億才可能完成全部的序列檢測。

這在當時,無論是哪個實驗室或者哪個組織,都是無法完成的巨大挑戰(zhàn)。這種情況下,只能由國際合作來共克困難了。

于是,中、美、英、法、日、德六個國家一起發(fā)起了人類基因組計劃,這個計劃預計耗時十多年、花費30億美元來完成對人類基因組的總體測序。我國是最晚加入這個計劃的,承擔了人類基因組計劃的1%。

花開兩朵,各表一枝

在人類基因組計劃進行的同時,新技術也在不斷誕生??茖W界從不乏敢于創(chuàng)新者,以文特爾為代表的另一群科學家,決定放棄人類基因組計劃采取的辦法,他們采用了一種創(chuàng)新的技術,那就是鳥槍法。這個名稱其實很通俗,意思就是“拿著槍對著一群鳥開槍”。

兩種方法的背后,代表著不同的測序理念。

我們把人類基因組比作一條由ATGC組成的長長線條,第一代測序的辦法就是把人類基因組分成一段一段的,大家各自完成每一段基因組的序列讀取,這也是人類基因組計劃采用的主要策略。

而文特爾則認為,壓根沒必要這么做!干脆把人類基因組完全打碎成更小的片段,直接測每一段的序列,最后通過強大的計算辦法來將其組合起來,舉個極其簡單的例子,如果有三段結果,ATGC,TGCG,CGTA,那么根據(jù)數(shù)學計算,可以將這三段組合成ATGCGTA這樣的更長序列,當然,實際過程要遠比這個復雜。

鳥槍法測序示意圖

(圖片來源:nature)

于是,在2001年,兩個團隊幾乎同時完成了人類基因組的組裝,正式奠定了人類基因組的基本信息。

孰優(yōu)孰劣?可沒這么簡單!

這里,我們需要指出幾個問題。

首先,這兩種技術并沒有絕對的優(yōu)劣之分,雖然現(xiàn)在學術界往往把桑格的技術稱為一代測序技術,把文特爾他們采用的技術稱為二代測序技術的雛形,因為這種策略將在二代測序中大顯身手。但是兩種技術實際上各有千秋,一代測序技術盡管慢,但是準確度非常高,被稱為測序金標準。而文特爾的技術速度快、成本低,但是準確度要低一些,并且后來的二代測序技術中既有基因組碎片化的過程,更有高通量橋式邊合成邊測序這種關鍵技術。

其次,當時并不是嚴格意義上的各自獨立,在人類基因組計劃進行中,科學家們會把階段性成果發(fā)布出來共享,彼此之間技術也在互相交融發(fā)展。

最后,這次大規(guī)模的合作,其實也是兩種測序技術的互相印證過程,也為二代測序的崛起奠定了基礎。

在完成了人類基因組計劃之后,生命科學迅速進入了新的時代,借助著新技術,人類很快實現(xiàn)了對許多生物的測序,小鼠、大鼠、獼猴、水稻、小麥等等,至今,已經(jīng)有上萬種生物實現(xiàn)了基因組測序,這些資源,極大地方便了科學家們對于生命醫(yī)學的研究。

不過,基因組是完美版本嗎?為什么還有不斷進行的基因組研究呢?稍微劇透一下,在下回中,我們將會來聊一聊基因組的研究。

編輯:孫晨宇

內容資源由項目單位提供