中文精品久久久久国产不卡,丁香六月久久婷婷开心

10月9日，歐洲中部時間11時45分（北京時間17時45分），瑞典皇家科學院決定將2024年諾貝爾化學獎的一半授予大衛(wèi)·貝克（David Baker），以表彰他在“計算蛋白質(zhì)設計”方面的貢獻，并將另一半授予戴密斯·哈薩比斯（Demis Hassabis）和約翰·M·詹伯（John M. Jumper），以表彰他們在“蛋白質(zhì)結(jié)構(gòu)預測”方面的貢獻。

David Baker，1962年出生于美國華盛頓州西雅圖。1989年獲美國加州大學伯克利分校博士學位?，F(xiàn)為美國西雅圖華盛頓大學教授。

Demis Hassabis，1976年出生于英國倫敦。2009年獲得英國倫敦大學學院博士學位。Google DeepMind首席執(zhí)行官。

John M. Jumper，1985年出生于美國阿肯色州小石城。2017年獲得美國伊利諾伊州芝加哥大學博士學位。Google DeepMind高級研究科學家。

諾貝爾獎官方表示，2024年諾貝爾化學獎的主題是蛋白質(zhì)——生命中巧妙的化學工具。大衛(wèi)·貝克成功完成了幾乎不可能的任務，構(gòu)建了大量全新的蛋白質(zhì)。德米斯·哈薩比斯和約翰·朱姆珀開發(fā)了一種人工智能模型，解決了一個50年來的難題：預測蛋白質(zhì)的復雜結(jié)構(gòu)。這些發(fā)現(xiàn)具有巨大的潛力。

生命的多樣性證明了蛋白質(zhì)作為化學工具的驚人能力。它們控制并驅(qū)動所有化學反應，這些反應共同構(gòu)成了生命的基礎。蛋白質(zhì)還作為激素、信號物質(zhì)、抗體以及不同組織的構(gòu)建模塊發(fā)揮作用。

“今年獲得認可的發(fā)現(xiàn)之一是關(guān)于構(gòu)建非凡的蛋白質(zhì)；另一個則實現(xiàn)了一個50年來的夢想：從氨基酸序列預測蛋白質(zhì)結(jié)構(gòu)。這兩項發(fā)現(xiàn)為未來開辟了廣闊的可能性，”諾貝爾化學委員會主席Heiner Linke說道。

蛋白質(zhì)通常由20種不同的氨基酸組成，這些氨基酸可以被視為生命的構(gòu)建模塊。2003年，大衛(wèi)·貝克成功利用這些模塊設計出一種與任何其他蛋白質(zhì)不同的新蛋白質(zhì)。從那時起，他的研究團隊創(chuàng)造了一個又一個富有想象力的蛋白質(zhì)，包括可用于藥物、疫苗、納米材料和微小傳感器的蛋白質(zhì)。

下文全面介紹基于AI的蛋白質(zhì)預測工具——alphafold的發(fā)展過程。

撰文 | 郭貝一、郭曉強

來源 | 《科學》雜志

基于神經(jīng)網(wǎng)絡原理構(gòu)建的人工智能工具AlphaFold實現(xiàn)對蛋白質(zhì)三維結(jié)構(gòu)的精準預測，解決困擾生命科學60年的難題。這一突破推動基礎研究快速發(fā)展的同時，還有望在新藥研發(fā)和疾病治療等多個領(lǐng)域發(fā)揮重要作用。

蛋白質(zhì)是生命活動的物質(zhì)基礎，亦可看作生命的存在形式。蛋白質(zhì)擁有廣泛的生物學功能，包括結(jié)構(gòu)組分（膠原蛋白）、催化功能（酶）、調(diào)節(jié)作用（激素）、物質(zhì)運輸（血紅蛋白）、機械收縮（肌動蛋白）、機體免疫（抗體）等，進而參與幾乎所有生命過程，如分子水平的DNA復制和轉(zhuǎn)錄、蛋白質(zhì)翻譯、物質(zhì)與能量代謝等，以及細胞層面的精卵融合、細胞增殖和分化、細胞凋亡和壞死、細胞衰老和細胞通信等，其重要性不言而喻。

盡管蛋白質(zhì)種類多樣，但它們都是由20種基本氨基酸組成，區(qū)別在于不同的氨基酸排列順序，這一特征稱為一級結(jié)構(gòu)，亦稱初級結(jié)構(gòu)，但這種線性結(jié)構(gòu)需經(jīng)過充分折疊形成空間三維結(jié)構(gòu)，亦稱高級結(jié)構(gòu)。結(jié)構(gòu)決定功能是許多學科的基本原則，生命科學也不例外，因此蛋白質(zhì)結(jié)構(gòu)研究在生命科學領(lǐng)域占據(jù)舉足輕重的位置[1]。

蛋白質(zhì)結(jié)構(gòu)研究

1819年，構(gòu)成蛋白質(zhì)的第一種氨基酸亮氨酸分離成功，1936年最后一個氨基酸蘇氨酸成功鑒定，前后跨越100多年，這說明了蛋白質(zhì)研究的艱巨性。

1953年，英國生物化學家桑格（F.Sanger）借助新出現(xiàn)的各種氨基酸和多肽分離方法和自己創(chuàng)造的氨基酸顯色反應，確定了胰島素兩條多肽鏈的氨基酸序列，1955年又確定二硫鍵位置，獲得1958年諾貝爾化學獎。

1957年，英國生物化學家肯德魯（J.C. Kendrew）借助X-射線晶體衍射技術(shù)首次確定肌紅蛋白三維結(jié)構(gòu)，兩年后他的同事佩魯茨（M.F. Perutz）確定血紅蛋白三維結(jié)構(gòu)，兩人分享1962年諾貝爾化學獎。通過這兩項諾貝爾獎也可看出蛋白質(zhì)結(jié)構(gòu)研究的重要性，從成果取得到獲獎只有3~5年。與此對應，作為分子生物學里程碑成果的DNA雙螺旋結(jié)構(gòu)解析則等待了9年（如提前認可，富蘭克林的悲劇可能就可避免）。

蛋白質(zhì)結(jié)構(gòu)研究一直是諾貝爾化學獎青睞的對象，至今已頒發(fā)十余次獎項，既包括重要蛋白（或復合物）的解析，也包括新技術(shù)或新方法的突破，因此該領(lǐng)域長期來看是生命科學前沿和焦點。

蛋白質(zhì)結(jié)構(gòu)研究與諾貝爾化學獎

隨著許多蛋白質(zhì)結(jié)構(gòu)被解析，科學界考慮將這些信息進行存檔以便利科研人員使用。1971年，在美國冷泉港實驗室舉辦的一次蛋白質(zhì)晶體學研討會上，由布魯克海文國家實驗室漢密爾頓（W. Hamilton）倡導建立蛋白質(zhì)數(shù)據(jù)庫（Protein Data Bank, PDB），最初只包含7種蛋白質(zhì)結(jié)構(gòu)信息，是生命科學領(lǐng)域第一個開放獲取的數(shù)字資源。磁共振波譜和冷凍電鏡等新技術(shù)的發(fā)明和完善，大大加快了蛋白質(zhì)結(jié)構(gòu)解析的步伐，PDB內(nèi)信息也得到了快速增長，2014年突破了10萬種。然而這一數(shù)量相比已知的上億種蛋白質(zhì)顯得微不足道，因此研究人員開始嘗試用理論方法直接由初級結(jié)構(gòu)獲取高級結(jié)構(gòu)信息[2]。

蛋白質(zhì)結(jié)構(gòu)預測

1961年，美國生物化學家安芬森（C.B. Anfinsen）借助核糖核酸酶變性-復性實驗得出結(jié)論：蛋白質(zhì)初級結(jié)構(gòu)決定高級結(jié)構(gòu)（安芬森定律）。安芬森定律清晰地說明蛋白質(zhì)空間結(jié)構(gòu)并非隨機形成，而是根植于氨基酸的線性順序，該定律成為蛋白質(zhì)結(jié)構(gòu)預測的理論基礎。安芬森在1972年諾貝爾獎獲獎感言中提出一個愿景：將來有一天僅從氨基酸序列就能預測任何蛋白質(zhì)三維結(jié)構(gòu)。從蛋白質(zhì)初級結(jié)構(gòu)預測高級結(jié)構(gòu)的過程較為復雜，是結(jié)構(gòu)生物學和理論生物學領(lǐng)域最具挑戰(zhàn)性的課題，它吸引了眾多科研人員前赴后繼嘗試解決這一難題。

蛋白質(zhì)結(jié)構(gòu)預測主要有兩種策略，基于模板建模（template-based modeling, TBM）和無模板建模（template-free modeling, FM）[3]。TBM又稱同源建模，它利用新蛋白質(zhì)初級結(jié)構(gòu)與PDB中已有三維結(jié)構(gòu)蛋白質(zhì)的氨基酸序列比對結(jié)果為基礎構(gòu)建模型，并進一步完善，準確性取決于新蛋白質(zhì)和PDB中蛋白質(zhì)的進化距離，如果PDB缺乏新蛋白類似結(jié)構(gòu)域的已知結(jié)構(gòu)，則無法生成準確模型。FM又稱從頭計算方法，利用能量函數(shù)計算氨基酸空間相互作用，最終從所有可能結(jié)構(gòu)中選取最佳形式，依靠分子動力學模擬獲得蛋白質(zhì)折疊方式，該法對小分子量蛋白質(zhì)結(jié)構(gòu)預測還算準確，但隨著蛋白質(zhì)復雜性增加逐漸變得無能為力。

1994年，美國計算生物學家莫爾特（J. Moult）和菲德利斯（K. Fidelis）為推動蛋白質(zhì)結(jié)構(gòu)預測領(lǐng)域的快速發(fā)展，啟動了蛋白質(zhì)結(jié)構(gòu)預測關(guān)鍵評估（Critical Assessment of Structure Prediction, CASP）活動，這是兩年舉辦一次的競賽或選拔賽，旨在評選蛋白質(zhì)結(jié)構(gòu)建模中的最新和最佳技術(shù)。組織者向參與者提供目標蛋白質(zhì)的氨基酸序列，據(jù)此預測蛋白質(zhì)結(jié)構(gòu)，與此同時還采取實驗方法獲取蛋白質(zhì)結(jié)構(gòu)，最終將二者進行對比獲得全局距離測試（global distance test, GDT）評分。為保證結(jié)果客觀性，整個過程為雙盲，即參與者和評審員互不知曉。GDT是百分制，用于評判結(jié)構(gòu)預測的精準度，超過90分則非常理想，達到實驗數(shù)據(jù)級別。在第一屆競賽中，對在已知數(shù)據(jù)庫有類似模板的蛋白質(zhì)的理論預測尚算完美，但對無模板的則堪稱災難，GDT得分只有20分。即使到2016年第12屆競賽也只升高到40分，與預期還有極大差距，以至莫爾特悲觀地認為，有生之年這個問題可能都難以解決，但不久人工智能（artificial intelligence, AI）技術(shù)的加入，問題得到了完美的答案。

人工智能發(fā)展

智能，又稱智力，是人類所特有的復雜認知能力并在此基礎上進行學習形成概念、理解和應用邏輯以及推理等。AI則是利用計算機或機器人模擬人類智能完成一系列復雜任務的過程，如推理等。

1950年，英國數(shù)學家圖靈（A.M. Turing）在論文“計算機和智能”中首次討論建造智能機器和測試智能的方式，賦予機器借鑒人腦信息加工、理性設計和科學決策的能力，奠定了AI的理論基礎。1956年，在美國達特茅斯舉辦的學術(shù)會議上，麥卡錫（J. McCarthy）首次提出AI一詞，并相信將來會制造出像人類思考和推理的機器。在隨后的時間里，AI取得了一系列重要進展，特別是進入21世紀以來更是突飛猛進，智能水平日趨強大，這里重點介紹機器學習（machine learning, ML）。

機器學習是人工智能的分支，主要基于數(shù)據(jù)進行算法開發(fā)和研究，通過學習已有數(shù)據(jù)而推廣到新數(shù)據(jù)，從而可在無明確指令情況下執(zhí)行任務，進一步發(fā)展出更高級的深度學習（deep learning, DL），可在盡量減少人工干預的前提下實現(xiàn)對非結(jié)構(gòu)化數(shù)據(jù)（如文本或圖像）的學習，在視覺加工、語言處理和語音識別等領(lǐng)域得到了廣泛應用。

深度學習的研究歷史可追溯到1943年，美國神經(jīng)生理學家麥卡洛克 (W. S. McCulloch)和年輕邏輯學家皮茨（W. H. Pitts）構(gòu)建出第一個基于模擬人腦的神經(jīng)網(wǎng)絡（neural network）模型，它可以基于神經(jīng)元的活動特性進行簡單的邏輯運算。神經(jīng)網(wǎng)絡由多層結(jié)構(gòu)組成，包含輸入層、一個或多個隱藏層和輸出層。只有三層的稱為基本神經(jīng)網(wǎng)絡，三層以上的為深度神經(jīng)網(wǎng)絡，是深度學習的基礎。

經(jīng)過后續(xù)發(fā)展和完善，神經(jīng)網(wǎng)絡逐漸成為諸多AI設計的基礎，人們開始嘗試應用于蛋白質(zhì)結(jié)構(gòu)預測。比如2016年出現(xiàn)的循環(huán)幾何網(wǎng)絡 (recurrent geometric network, RGN) 和后續(xù)發(fā)展的神經(jīng)能量模型和優(yōu)化（neural energy modeling and optimization, NEMO）等，這些方法取得了初步成功。

天才少年

哈薩比斯（D. Hassabis）出生于英國倫敦，童年就展現(xiàn)出過人天賦。4歲時，哈薩比斯就能熟練掌握國際象棋技巧并戰(zhàn)勝父親和叔叔，13歲成為國際象棋大師，并在國際比賽中與成年人對弈。哈薩比斯還表現(xiàn)出與年齡不相稱的邏輯運算天賦，8歲時應用電腦進行游戲編程，隨著年齡增長，他決定將計算機應用于更高級的智力比拼，因此希望從事人工智能方面的工作。17歲時，他設計并編程了銷量數(shù)百萬、屢獲殊榮的游戲《主題公園》。

1994年，哈薩比斯進入劍橋大學學習，3年后以年級第一名的成績獲得計算機學士學位。1998年，哈薩比斯創(chuàng)立電子游戲公司Elixir Studios，先后創(chuàng)作出《共和國：革命》、《邪惡天才》等多款暢銷游戲。

哈薩比斯和江珀[4]

2005年，哈薩比斯在游戲領(lǐng)域證明自己的能力后，決定研究人腦機制以證明AI的巨大潛力，因此重返學術(shù)界，進入倫敦大學學院攻讀認知神經(jīng)科學博士學位，主要研究記憶和健忘的分子機制。哈薩比斯發(fā)現(xiàn)大腦海馬區(qū)損傷會導致健忘癥，并減弱聯(lián)想功能和情景記憶，這項成果被《科學》周刊列為2007年十大科學突破之一。2009年，哈薩比斯獲得博士學位后，前往美國哈佛大學和麻省理工學院開展博士后研究，進一步充實自己的知識。

2010年，哈薩比斯等人在倫敦創(chuàng)立人工智能公司Deepmind，將公司使命定義為解決“智能問題”，繼而使用人工智能“解決其他一切問題”。哈薩比斯擔任公司首席執(zhí)行官（CEO），將自己在神經(jīng)科學和機器學習方面的知識與計算機科學相結(jié)合，致力于構(gòu)建新型人工智能機器。DeepMind的快速發(fā)展引起科技巨頭谷歌的注意，并于2014年以超過65億美元價格被谷歌收購，哈薩比斯仍擔任DeepMind的CEO。

哈薩比斯認為圍棋是機器學習的理想挑戰(zhàn)目標，他們開發(fā)成功AlphaGo，在2015年以50比分擊敗歐洲圍棋冠軍，第二年再以41比分擊敗世界冠軍李世石（Lee Sedol），證明了AlphaGo的強大能力。AlphaGo的成功也榮膺2016年《科學》周刊評選的年度十大進展之一。

人機對戰(zhàn)的巨大成功促使哈薩比斯決定進一步挑戰(zhàn)自身，這次不再關(guān)注游戲，而是生物學問題。哈薩比斯利用AI解決生物學問題的想法由來已久，但苦于找不到理想切入點而遲遲未能啟動，蛋白質(zhì)結(jié)構(gòu)預測無疑是一個最佳選擇。DeepMind為此成立了一個開展蛋白質(zhì)結(jié)構(gòu)預測的小團隊，由于蛋白質(zhì)空間結(jié)構(gòu)的形成主要通過折疊（fold）方式完成，該團隊開發(fā)的人工智能系統(tǒng)被命名為AlphaFold。

AlphaFold的首次突破

AlphaFold采用深度學習基礎上的FM 預測策略，共三個系統(tǒng)。首先是建模系統(tǒng)，利用神經(jīng)網(wǎng)絡和強大運算能力基于能量最低原理預測蛋白質(zhì)內(nèi)各氨基酸殘基之間的空間距離，產(chǎn)生一系列結(jié)構(gòu)片段（類似二級結(jié)構(gòu)），初步組裝出三維結(jié)構(gòu)；其次是優(yōu)化系統(tǒng)，對建模結(jié)構(gòu)進行再計算的重復操作以提升精確度；最后是輸出系統(tǒng)，產(chǎn)生最終三維結(jié)構(gòu)。

2018年，AlphaFold參與了第13屆CASP競賽，牛刀初試就技壓群雄，毫無爭議地榮膺冠軍寶座，復雜蛋白GDT平均達到60分，成功預測出給定的43種蛋白質(zhì)中的25種，第二名僅預測出3種[6]。這項成就使哈薩比斯的工作第三次榮膺《科學》周刊評選的年度十大進展之一。

AlphaFold盡管較傳統(tǒng)方法有較大突破，但仍存在諸多不足，如預測結(jié)果精確度尚待提高，距離90分以上（完美預測）仍有較大差距；預測結(jié)構(gòu)平均分辨率為0.66納米（大于0.3納米僅顯示蛋白質(zhì)鏈輪廓），與實驗方法所得最佳分辨率0.1納米（原子半徑尺度，這種程度下可清晰展示單個原子位置）也存在上升空間。

DeepMind公司決定改進AlphaFold系統(tǒng)，但經(jīng)過6個月嘗試后卻遠遠未達預期，不得不開始重新調(diào)整思路，首先進行人事變動。

江珀（J.M. Jumper）出生于美國阿肯色州小石城，2007年在范德比爾特大學獲得理學學位，隨后在獎學金資助下進入劍橋大學攻讀理論凝聚態(tài)物理學博士學位，但不久發(fā)現(xiàn)對此并無太大興趣，因此選擇退學并加入一家從事蛋白質(zhì)結(jié)構(gòu)計算機模擬的公司，工作中逐漸對理論生物學產(chǎn)生濃厚興趣。2011年，江珀重新回到學校，進入芝加哥大學跟隨著名理論化學家弗里德 (K.F. Freed)和索斯尼克（T.R. Sosnick）攻讀理論化學博士，將機器學習策略用于蛋白質(zhì)動力學研究。2017年，江珀畢業(yè)獲得博士學位，獲悉Deepmind公司正在開展蛋白質(zhì)結(jié)構(gòu)預測方面研究，投遞申請后很快得到答復，當年10月加入公司，成為蛋白質(zhì)結(jié)構(gòu)預測小組的重要成員。

在AlphaFold遲遲未能取得進一步突破之時，哈薩比斯意識到江珀在蛋白質(zhì)物理和機器學習方面跨學科背景的重要性，他們進行了深入交流，最終達成共識，采用新思路改進原有設計。2018年7月，江珀被提拔為AlphaFold項目主管，全面負責總體工作。

AlphaFold2再度完善

江珀帶領(lǐng)年輕團隊對AlphaFold最初版本進行了重新梳理，在此基礎上展開全面調(diào)整和改進，對每個細節(jié)給予挖掘以期達到盡善盡美。比如，他們引入空間立體結(jié)構(gòu)和進化理念、整合已有蛋白質(zhì)結(jié)構(gòu)的詳細信息如原子半徑和鍵角等、完善機器有效學習策略以利于從有限數(shù)據(jù)中提取最大信息，特別是拋棄傳統(tǒng)算法的束縛，更強調(diào)空間靠近而非線性相鄰等。沒有任何一種改進對最終結(jié)果有決定性影響，但正是這些奇妙新想法的完美結(jié)合，才最終實現(xiàn)真正意義的突破。

AlphaFold改進系統(tǒng)（亦稱AlphaFold2）分為三個操作進程。第一進程，通過查詢多個蛋白質(zhì)的氨基酸序列數(shù)據(jù)庫構(gòu)建輸入序列的多序列比對集（multisequence alignment, MSA）（MSA表征）。MSA的基本邏輯是同一功能蛋白質(zhì)由于進化緣故，氨基酸序列會出現(xiàn)較大差異（如人肌紅蛋白和鴿子肌紅蛋白只有25%的氨基酸序列相同），但基本結(jié)構(gòu)高度相似，據(jù)此作為結(jié)構(gòu)預測的基礎。同時，通過查詢蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫構(gòu)建輸入序列各氨基酸空間相互關(guān)系的矩陣（成對表征）。第二進程，上述兩組信息（進化信息和空間信息）在一個編碼器（evoformer）上進行處理，得出一個粗略的結(jié)構(gòu)假設，然后返回最初狀態(tài)進行測試和完善（該過程稱為迭代），要求結(jié)構(gòu)假設同時滿足MSA表征和成對表征，且二者之間相互交流，共同糾正和改進最初假設結(jié)構(gòu)的不足。第三進程是輸出蛋白質(zhì)三維結(jié)構(gòu)。

AlphaFold2基于神經(jīng)網(wǎng)絡的深度學習模型[7]

深度學習過程中，研究者使用PDB中已有的17萬種蛋白質(zhì)結(jié)構(gòu)信息進行訓練。AlphaFold2反復將預測結(jié)果與真實結(jié)構(gòu)進行對比，使二者之間逐漸接近，最終使系統(tǒng)吸收并完全掌握蛋白質(zhì)折疊原理。AlphaFold2還能對預測結(jié)構(gòu)給出可信程度，類似于考試估分，數(shù)值越高意味著與真正結(jié)構(gòu)差距越小。AlphaFold2成功的另一因素是DeepMind強大的運算能力，這是絕大多數(shù)學術(shù)團體和小公司都難以達到的目標。

2020年，AlphaFold2在第14屆CASP競賽上進一步大殺四方，在給定預測蛋白質(zhì)中GDT平均得分92.4，遠超所有競爭對手；對高難度蛋白預測GDT平均得分87，比第二名高出25分。2021年7月15日，詳細描述AlphaFold2內(nèi)容的論文在《自然》周刊在線發(fā)表[7]，至今引用近萬次。Deepmind不久還公布算法供全球研究人員免費使用。這項成就被《科學》周刊評選為2021年度十大科學突破之首，蛋白結(jié)構(gòu)預測也成為《自然-方法學》2021年度方法[8]。

AlphaFold2的發(fā)展和應用

AlphaFold2解決了蛋白質(zhì)結(jié)構(gòu)預測問題，目前雖無法做到盡善盡美，但大多數(shù)情況下對非結(jié)構(gòu)解析專業(yè)的普通研究者而言已經(jīng)足夠。尤為重要的是，當研究人員獲得感興趣蛋白質(zhì)序列時能夠在幾天甚至幾小時內(nèi)獲得完美結(jié)構(gòu)信息，而不再需要數(shù)月甚至數(shù)年時間和數(shù)百萬美元的花費，對生命科學研究而言，就是難以置信的突破。

當然，AlphaFold2有不足之處，比如，對內(nèi)在無序結(jié)構(gòu)（它們在相分離等多個過程發(fā)揮重要作用）的預測效果較差。因為最初的設計目標是對單個蛋白質(zhì)結(jié)構(gòu)進行預測，但蛋白質(zhì)發(fā)揮作用時往往是以復合物或小分子結(jié)合狀態(tài)存在，為此，Deepmind公司和其他研究團隊又開發(fā)出其他版本作為補充，如AlphaFold Multimer和RosettaTTAFold等。

AlphaFold2已展示出強大的蛋白質(zhì)結(jié)構(gòu)預測能力，2021年完成人類所有蛋白質(zhì)的結(jié)構(gòu)預測；2022年7月，獲得2億多種蛋白質(zhì)的預測結(jié)構(gòu)，并已進入數(shù)據(jù)庫供免費使用[9,10]。Deepmind公司最近推出AlphaFold3版本，可高準確度和高精度預測蛋白質(zhì)復合物、蛋白質(zhì)-核酸、蛋白質(zhì)與小分子配體等三維結(jié)構(gòu)[11]，進一步加大適用范圍。

在基礎研究領(lǐng)域，原來研究新蛋白功能需要依賴于X-射線衍射或冷凍電鏡，高昂的費用和技術(shù)門檻使大多數(shù)實驗室望而卻步，目前該問題得到了有效解決。聯(lián)合AlphaFold2和冷凍電鏡成功解析核孔復合物結(jié)構(gòu)這一成果對理解細胞核內(nèi)外物質(zhì)進出機制具有重要意義。

在應用研究領(lǐng)域，現(xiàn)代藥物研發(fā)很大程度上依賴于蛋白質(zhì)結(jié)構(gòu)信息，但諸多感興趣藥物靶點蛋白尚未用實驗方法解析出來，結(jié)構(gòu)預測的突破無疑解決了這一瓶頸，必將極大推動新藥研發(fā)進程。蛋白質(zhì)人工設計如抗體和疫苗篩選是一個重要領(lǐng)域，傳統(tǒng)方法是先設計出多種組合后，通過實驗進行反復驗證，過程繁瑣耗時，但通過蛋白質(zhì)結(jié)構(gòu)預測則會大大縮短研究周期。

深遠影響

蛋白質(zhì)結(jié)構(gòu)預測的突破可歸因于天時、地利和人和的共同結(jié)果。天時上，高速發(fā)展的人工智能和層出不窮的新方法是AlphaFold的理論基礎，PDB中快速增加的蛋白質(zhì)結(jié)構(gòu)是深度學習的材料基礎；地利上，背靠谷歌公司強大的運算能力；人和上，公司聚集了一批富有朝氣和探索精神的年輕人，以及哈薩比斯與江珀卓越的領(lǐng)導才能和創(chuàng)新能力，成功也就水到渠成。

近年來，AI在如火如荼地快速發(fā)展，取得一系列重大突破，如ChatGPT、Sora等，其智能程度逐漸提升，正在改變著人類的生活方式和科研的研究模式。AlphaFold無疑是優(yōu)秀代表之一，可看作是AI發(fā)展的一個縮影。

AlphaFold解決了困擾生命科學多年的一個重大難題，并有望為其他生物學問題解決提供借鑒。大數(shù)據(jù)已成為當前科學發(fā)展的重要特征，如基因組測序結(jié)果和海量論文等，借助AI工具解決生命科學問題已成為一個重要方向。AlphaFold成功的另一層意義在于激勵年輕人要敢于挑戰(zhàn)自我。

AlphaFold2的成功也為哈薩比斯和江珀兩位科學家?guī)肀姸嗫茖W榮譽。他們先后分享威利生物醫(yī)學科學獎 (2022年)、生命科學突破獎（2023年）、蓋爾德納國際獎（2023年）、拉斯克基礎醫(yī)學研究獎（2023年）等[12]，也將是近幾年諾貝爾自然科學類獎的熱門人選。

致謝：本文獲得周耀旗老師重要建議，在此表示誠摯的感謝。

參考文獻

[1] Sklar J. QnAs with Demis Hassabis and John M. Jumper: Winners of the 2023 Albert Lasker Basic Medical Research Award. Proc Natl Acad Sci USA 2023, 120(39):e2313816120.

[2] Rothman JE. Starting at Go: Protein structure prediction succumbs to machine learning. Proc Natl Acad Sci USA, 2023, 120(39):e2311128120.

[3] Kuhlman B, Bradley P. Advances in protein structure prediction and design. Nat Rev Mol Cell Biol, 2019, 20(11):681-697.

[4] Zhou Y, Litfin T, Zhan J. 3 = 1 + 2: how the divide conquered de novo protein structure prediction and what is next? Natl Sci Rev, 2023, 10(12):nwad259..

[5] Jumper J, Hassabis D. The Protein Structure Prediction Revolution and Its Implications for Medicine: 2023 Albert Lasker Basic Medical Research Award. JAMA. 2023, 330(15):1425-1426.

[6] Senior AW, Evans R, Jumper J, et al. Improved protein structure prediction using potentials from deep learning.Nature. 2020, 577(7792):706-710.

[7] Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold. Nature, 2021, 596(7873):583-589.

[8] Marx V. Method of the Year: protein structure prediction. Nat Methods, 2022, 19(1):5-10.

[9] Thornton JM, Laskowski RA, Borkakoti N. AlphaFold heralds a data-driven revolution in biology and medicine. Nat Med, 2021, 27(10):1666-1669.

[10] Borkakoti N, Thornton JM. AlphaFold2 protein structure prediction: Implications for drug discovery. Curr Opin Struct Bio, 2023, 78: 102526.

[11] Abramson J, Adler J, Dunger J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 630(8016): 493-500.

[12] Sosnick TR. AlphaFold developers Demis Hassabis and John Jumper share the 2023 Albert Lasker Basic Medical Research Award. J Clin Invest, 2023, 133(19):e174915.

特別提示

1. 進入『返樸』微信公眾號底部菜單“精品專欄“，可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關(guān)注公眾號，回復四位數(shù)組成的年份+月份，如“1903”，可獲取2019年3月的文章索引，以此類推。

版權(quán)說明：歡迎個人轉(zhuǎn)發(fā)，任何形式的媒體或機構(gòu)未經(jīng)授權(quán)，不得轉(zhuǎn)載和摘編。轉(zhuǎn)載授權(quán)請在「返樸」微信公眾號內(nèi)聯(lián)系后臺。

2024化學諾獎接力青睞AI，蛋白質(zhì)結(jié)構(gòu)預測新工具獲一半獎項

2024化學諾獎接力青睞AI，蛋白質(zhì)結(jié)構(gòu)預測新工具獲一半獎項