馮·諾依曼曾說:“四個參數(shù)就能擬合出一頭大象,五個參數(shù)就能讓大象的鼻子動起來!”這話意在批評對數(shù)據(jù)的盲目擬合,強(qiáng)調(diào)物理圖像的重要性。而另一方面,AI憑借海量參數(shù)在科學(xué)領(lǐng)域大顯身手,大規(guī)模計算有望產(chǎn)生遠(yuǎn)超經(jīng)驗范式的理論歸納能力。是追求化繁為簡,還是承認(rèn)多者異也?這兩種截然相反的研究思路,恰好貫穿了物理有機(jī)化學(xué)近百年的歷程。
繪圖:青騎士
撰文 | 鄭超(中國科學(xué)院上海有機(jī)化學(xué)研究所研究員)
前情提要:在上篇文章《一場勉強(qiáng)通過的答辯,讓化學(xué)翻過“最黑暗的篇章”》中,從威廉米到范特霍夫和阿倫尼烏斯,物理化學(xué)家經(jīng)過近半個世紀(jì)的探索,終于在化學(xué)動力學(xué)的迷宮中找到了一條路線圖,開創(chuàng)了利用物理圖像支撐數(shù)學(xué)方程、研究化學(xué)反應(yīng)的范式?;瘜W(xué)反應(yīng)是復(fù)雜的,那么描述化學(xué)反應(yīng)的數(shù)學(xué)方程應(yīng)該具有怎樣的形式呢?
化繁為簡:線性自由能關(guān)系
阿倫尼烏斯公式給出了溫度對反應(yīng)速率常數(shù)的影響規(guī)律,是化學(xué)動力學(xué)發(fā)展史上的一座里程碑。然而溫度終究只是影響化學(xué)反應(yīng)的外部因素,想細(xì)致刻畫和深入理解化學(xué)反應(yīng),特別是紛繁復(fù)雜的有機(jī)反應(yīng)的動力學(xué)特征,還是要從物質(zhì)的微觀結(jié)構(gòu)和反應(yīng)進(jìn)程的細(xì)節(jié)等內(nèi)因著手。化學(xué)反應(yīng)是由原子外層電子的重新排布引起的,而電子的運(yùn)動遵循量子力學(xué)。雖然量子力學(xué)的理論大廈已經(jīng)在20世紀(jì)20年代建立起來,但是化學(xué)反應(yīng)的復(fù)雜性給它的應(yīng)用造成了巨大的障礙。正如量子力學(xué)奠基人之一狄拉克(P. A. M. Dirac)所言:全部化學(xué)所包含的數(shù)學(xué)規(guī)律已經(jīng)完全清楚,困難只是在于應(yīng)用這些規(guī)律所得出的方程無法求解。以英國人英戈爾德(C. K. Ingold)和魯賓遜(R. Robinson)為代表的有機(jī)化學(xué)家沒有“束手待斃”。他們吸收了量子力學(xué)中關(guān)于原子共享外層電子形成化學(xué)鍵的基本思想,在20世紀(jì)30年代構(gòu)建出一種定性理論,用點、線和箭頭組成的“圖案”描述有機(jī)反應(yīng)中的電子轉(zhuǎn)移;同時與有機(jī)化學(xué)的傳統(tǒng)觀念相銜接,用諸如誘導(dǎo)效應(yīng)、共軛效應(yīng)和位阻效應(yīng)等形象的語言,概括有機(jī)分子結(jié)構(gòu)對于反應(yīng)活性和選擇性的影響。“運(yùn)用之妙,存乎一心”。盡管對初學(xué)者而言,理解并接受這套形式邏輯可能頗費(fèi)躊躇,但是在有機(jī)化學(xué)“武林高手”眼中,以此為基礎(chǔ)演繹出的“反應(yīng)機(jī)理(reaction mechanism)”足以在紙面上解讀一切有機(jī)反應(yīng)。
L. P. Hammett (1894~1987)
然而,依靠形象化語言定義的概念往往是含混模糊的。無論是誘導(dǎo)效應(yīng)、共軛效應(yīng),還是位阻效應(yīng),它們的物理本質(zhì)都是電磁相互作用。在分子世界中劃分出林林總總“效應(yīng)”的依據(jù)和目的,只是為了方便人類化學(xué)家的理解和使用。能否找到一條途徑,把模糊但是對人類友好的概念定量化,用遠(yuǎn)比量子力學(xué)簡單的數(shù)學(xué)方程來關(guān)聯(lián)分子結(jié)構(gòu)和反應(yīng)性質(zhì)呢?幾乎與英戈爾德和魯賓遜的工作同時,在大西洋對岸,美國哥倫比亞大學(xué)的哈米特(L. P. Hammett)展示了一種化繁為簡的可能性。他通過巧妙的理論設(shè)計將相互糾纏的復(fù)雜影響因素解耦,僅用一元線性函數(shù)就解決了一系列典型有機(jī)反應(yīng)的動力學(xué)問題!
哈米特是一位少有的關(guān)心有機(jī)化學(xué)問題的物理化學(xué)家,他最重要的貢獻(xiàn)就是聯(lián)通這兩門差異極大的化學(xué)二級學(xué)科。1940年哈米特出版了《物理有機(jī)化學(xué):反應(yīng)速率、平衡和機(jī)理》,開啟了這個新興領(lǐng)域的研究熱潮。哈米特發(fā)明了一種酸度函數(shù),用來表征普通pH值無法衡量的濃酸溶液的酸性強(qiáng)弱。哈米特酸度函數(shù)的基礎(chǔ)是一組含有不同取代基的苯胺分
不同取代基的苯甲酸的電離過程:
(16)
(16)式中左右兩側(cè)分別是引入取代基X所造成的化學(xué)反應(yīng)r的活化吉布斯自由能的變化,和化學(xué)平衡a的反應(yīng)吉布斯自由能的變化。這便是物理有機(jī)化學(xué)的一條重要法則——線性自由能關(guān)系。它預(yù)言(在一些情況下)原料分子的結(jié)構(gòu)變化,如引入取代基X,對于化學(xué)反應(yīng)熱力學(xué)(平衡)和動力學(xué)(速率)的影響是成比例的。哈米特方程是線性自由能關(guān)系最重要的實例。
線性自由能關(guān)系不是能夠從第一性原理導(dǎo)出的嚴(yán)格結(jié)論,而是一條經(jīng)驗規(guī)則。盡管如此,它仍然具有十分重要的意義。正如哈米特本人所指出的:線性自由能關(guān)系的存在帶來一個令人欣慰的事實——即便無法找到理論依據(jù)來說明化學(xué)反應(yīng)的簡單性,也不必因此認(rèn)為化學(xué)反應(yīng)是無可救藥的復(fù)雜(hopelessly complicated)。雖然化學(xué)家們通常愿意通過“熵焓互補(bǔ)”等化學(xué)圖像來解釋線性自由能關(guān)系,但是這種線性關(guān)系背后有更加本質(zhì)的數(shù)學(xué)內(nèi)涵。假定反應(yīng)活性fr是由取代基性質(zhì)σ唯一決定的函數(shù),那么只要這個函數(shù)關(guān)系不是“無可救藥的
圖3. Hammett測定的常見取代基的σ參數(shù)(左)、部分有機(jī)反應(yīng)的ρ值(中)以及第一幅線性自由能關(guān)系圖(右)。圖片來源:J. Am. Chem. Soc. 1937, 59, 96.
因此,如果某種線性自由能關(guān)系對一類有機(jī)反應(yīng)成立,則意味著在該類反應(yīng)中存在一定的取代基性質(zhì),對反應(yīng)動力學(xué)起著確定性作用。對于哈米特的σ參數(shù)而言,它所刻畫的取代基性質(zhì),大體上可以理解為誘導(dǎo)效應(yīng)與一部分共軛效應(yīng)的加和。哈米特在建立σ參數(shù)的過程中沒有考慮苯甲酸鄰位(o)的取代基,正是因為他意識到,鄰位取代基的位阻效應(yīng)對苯甲酸的電離平衡有不可忽視的影響。把它們排除在外,也就拆分了位阻效應(yīng)與誘導(dǎo)/共軛效應(yīng),達(dá)成了用最簡單的一元線性函數(shù)描述反應(yīng)速率常數(shù)變化規(guī)律的目的。
哈米特的開創(chuàng)性工作引領(lǐng)了將有機(jī)化學(xué)參數(shù)化、定量化的第一波歷史潮流。他的追隨者們提出了種類繁多的取代基參數(shù),有的專門刻畫取代基的位阻效應(yīng)或者共軛效應(yīng),有的專門面向某種特定反應(yīng)類型,還有的專門用于描述溶劑的性質(zhì)……這些取代基參數(shù)為有機(jī)反應(yīng)的機(jī)理研究提供了嶄新的工具。有了它們,有機(jī)化學(xué)家就能夠使用動力學(xué)實驗(通常是測定一系列相似反應(yīng)的速率常數(shù)之比)彌補(bǔ)譜學(xué)表征手段的不足。透過哈米特方程中ρ值的正負(fù)和大小,能夠窺探反應(yīng)中難以分離鑒定的瞬態(tài)中間體的結(jié)構(gòu)特征。例如著名的“非經(jīng)典碳正離子”,最早就是由美國加州大學(xué)洛杉磯分校的溫斯坦(S. Winstein)等人,在2-降冰片基苯磺酸酯的溶劑解反應(yīng)的動力學(xué)實驗中觀察到反常結(jié)果,從中推斷出來的。以哈米特方程為代表的線性自由能關(guān)系,在今天仍是有機(jī)化學(xué)專業(yè)高年級本科生和研究生課程的必修內(nèi)容。對于整日在通風(fēng)櫥前“搬磚”的有機(jī)化學(xué)研究生來說,如果你能親手測出一條類似圖3的哈米特圖(Hammett plot),那一定是一個令人愉悅的美好時刻!
在線性自由能關(guān)系這一研究領(lǐng)域,中國科學(xué)家也做出了杰出的貢獻(xiàn)。中國科學(xué)院上海有機(jī)化學(xué)研究所蔣錫夔先生領(lǐng)導(dǎo)的物理有機(jī)化學(xué)研究團(tuán)隊,于20世紀(jì)80年代至90年代在國際上
計國楨先生姓氏拼音的縮寫)。自由基是有機(jī)反應(yīng)中的一類常見中間體,和碳正離子、碳負(fù)離子、單線態(tài)卡賓等閉殼層中間體不同,自由基物種具有未成對電子,因此存在閉殼層物種不具備的自旋離域效應(yīng)。如何定量評價取代基性質(zhì)對自由基自旋離域效應(yīng)的影響,是物理有機(jī)化學(xué)與自由基化學(xué)交叉前沿的重要科學(xué)問題。蔣錫夔等人巧妙地使用雙參數(shù)線性自由能關(guān)系對此給出了答案。
蔣錫夔出身金陵名門,自幼接受了良好的教育。從上海圣約翰大學(xué)畢業(yè)后,他于1948年赴美留學(xué),1952年獲得華盛頓大學(xué)博士學(xué)位。1955年蔣錫夔放棄美國企業(yè)的高薪職位,沖破重重阻撓回到新中國?;貒螅群笤谥袊茖W(xué)院化學(xué)研究所和上海有機(jī)化學(xué)研究所工作。在美國凱勞格公司(The M. W. Kellogg Company)工作期間,蔣錫夔發(fā)現(xiàn)三氟氯乙烯可以與三氧化硫反應(yīng)生成β-磺內(nèi)酯,推翻了多氟乙烯不能發(fā)生親電反應(yīng)的傳統(tǒng)認(rèn)知。這一反應(yīng)為后來一系列含氟功能分子的合成奠定了基礎(chǔ)。得益于在含氟烯烴化學(xué)領(lǐng)域的深厚積累,蔣錫夔在60年代領(lǐng)導(dǎo)了我國氟橡膠的研究工作,制備了多種氟橡膠產(chǎn)品,打破了西方國家對這一關(guān)鍵軍用物資的封鎖,為我國的國防工業(yè)做出了貢獻(xiàn)。在氟橡膠的研制過程中,蔣錫夔發(fā)現(xiàn)三氟苯乙烯在加熱條件下會發(fā)生二聚反應(yīng),生成二苯基六氟環(huán)丁烷,并且反應(yīng)經(jīng)歷了1,4-雙自由基中間體。蔣錫夔從這個源自應(yīng)用研究的發(fā)現(xiàn)出發(fā),依靠敏銳的學(xué)術(shù)洞察力和堅持不懈的努力,做出了國際公認(rèn)的基礎(chǔ)研究成果。
圖4. (左)蔣錫夔先生關(guān)于自由基自旋離域參數(shù)σ?JJ的第一篇論文;(右)蔣錫夔先生(右二)和助手們討論工作,右一為計國楨先生。圖片來源:《化學(xué)學(xué)報》,1984年,第42卷第6期,599頁(左);參考文獻(xiàn)29(右)
長期以來,學(xué)術(shù)界對于如何區(qū)分極性效應(yīng)和自旋離域效應(yīng)對自由基反應(yīng)活性的影響,一直存在爭議。文獻(xiàn)已報道的取代基參數(shù)都無法正確描述自旋離域效應(yīng)的貢獻(xiàn)。蔣錫夔意識到,三氟苯乙烯的二聚反應(yīng)是研究取代基性質(zhì)對自由基反應(yīng)活性影響規(guī)律的絕佳平臺。他提出了在同一個反應(yīng)體系中完全拆分極性效應(yīng)和自旋離域效應(yīng)的方法。首先記錄對位帶有
得到國際物理有機(jī)化學(xué)同行的廣泛認(rèn)可。2002年,蔣錫夔領(lǐng)銜的科研項目《物理有機(jī)化學(xué)前沿領(lǐng)域兩個重要方面——有機(jī)分子簇集和自由基化學(xué)的研究》榮獲國家自然科學(xué)獎一等獎。這是該獎項連續(xù)空缺四年后再度頒發(fā),也是有機(jī)化學(xué)基礎(chǔ)理論研究成果首次問鼎國家最高科技獎勵。
多者異也:擁抱無形的方程
哈米特方程之所以在有機(jī)化學(xué)中被廣泛使用,不僅因為它的數(shù)學(xué)形式簡單,更在于它將復(fù)雜的反應(yīng)動力學(xué)問題歸因于符合化學(xué)思維的單一變量,為化學(xué)家理解和調(diào)控反應(yīng)活性提供了信心和依據(jù)。沿著這條思路,如果化學(xué)知識告訴我們,某類反應(yīng)的動力學(xué)行為受兩個獨(dú)立因素共同影響,那么建立雙參數(shù)回歸方程就是非常自然的選擇,正如我們在自由基自旋
(19)式中的下標(biāo)F/x/a/R分別代表場效應(yīng)、誘導(dǎo)效應(yīng)、極化效應(yīng)和共振效應(yīng)。但是,這種處理方式會讓我們陷入進(jìn)退兩難。因為增加參數(shù)必然會犧牲方程的化學(xué)圖像,降低模型的可解釋性(正如在阿倫尼烏斯公式確立之前,眾多k ~ T關(guān)系式所遇到的問題),同時又會帶來“過擬合”的風(fēng)險:即使最終結(jié)果在數(shù)值上非常準(zhǔn)確,也可能很難分辨所擬合的方程究竟是正確描述了科學(xué)規(guī)律,抑或僅僅記錄了有偏數(shù)據(jù)樣本造成的假象。
關(guān)于數(shù)值擬合,著名物理學(xué)家戴森(F. Dyson)晚年曾講過一個有趣的故事。1953年,戴森還是康奈爾大學(xué)一名年輕的理論物理學(xué)者。他利用贗標(biāo)量介子理論計算了質(zhì)子與介子的散射截面,結(jié)果與費(fèi)米(E. Fermi)的實驗數(shù)值非常吻合。戴森喜不自禁,連忙前往芝加哥,向這位前輩展示自己的結(jié)果。不料費(fèi)米幾乎沒看遞上來的手稿,他友好地請戴森坐下,平靜地說:“理論物理有兩種計算方法。一種是我更喜歡的:計算過程擁有清晰的物理圖像。另一種擁有精確且自洽的數(shù)學(xué)形式。而你的計算兩邊都不沾?!?/p>
戴森在錯愕之余還是壯著膽子問費(fèi)米,為什么贗標(biāo)量介子理論不是自洽的數(shù)學(xué)形式。得到解答后,絕望之下戴森又問,他的計算值和實驗值嚴(yán)絲合縫,這又怎么講?費(fèi)米反問:“你在計算中引入了多少個任意參數(shù)?”戴森回答說四個,費(fèi)米接著講了一句有名的話:“我的朋友馮?諾依曼(J. von Neumann)曾說,他用四個參數(shù)就能擬合出一頭大象,五個參數(shù)就能讓大象的鼻子動起來!”
戴森聽懂了言外之意,在結(jié)束這項工作后就改變了研究方向。后來他回憶:“短短幾分鐘,費(fèi)米禮貌而無情地摧毀了我和學(xué)生們埋首多年的研究計劃。要不是他,我們可能還要在歧路上徒勞徘徊數(shù)年?!迨旰蠡厥淄?,我們可以清楚看到費(fèi)米是對的。解釋強(qiáng)相互作用的關(guān)鍵發(fā)現(xiàn)是夸克。介子和質(zhì)子由夸克組成。在蓋爾曼(M. Gell-Mann)發(fā)現(xiàn)夸克之前,任何關(guān)于強(qiáng)相互作用的理論都不可能是充分的。費(fèi)米對夸克一無所知,在夸克發(fā)現(xiàn)前就已去世。但早在20世紀(jì)50年代,費(fèi)米已經(jīng)意識到當(dāng)時的介子理論缺少了關(guān)鍵拼圖。物理直覺告訴他,贗標(biāo)量介子理論不可能正確。因此正是費(fèi)米的直覺,而不是理論與實驗的不符,把我和我的學(xué)生從死胡同里救了出來。”
圖5. 2010年有人實現(xiàn)了用四個復(fù)參數(shù)擬合出大象的形象,用第五個復(fù)參數(shù)使大象的鼻子搖晃。圖片來源:Am. J. Phys. 2010, 78, 648.
也許是在模型的可解釋性和數(shù)值擬合的有效性兩方面都遇到了“瓶頸”,以線性自由能關(guān)系為基礎(chǔ),將有機(jī)反應(yīng)動力學(xué)特性參數(shù)化、定量化的研究熱潮在20世紀(jì)80至90年代趨于沉寂。多參數(shù)線性自由能方程并沒有給物理有機(jī)化學(xué)帶來新的突破。在眾多的哈米特型定量構(gòu)效關(guān)系中,最受化學(xué)家青睞的仍然是形式最為簡單的(15)式,畢竟能夠?qū)?shù)學(xué)關(guān)系“翻譯”成合理的化學(xué)圖像是最令人放心的。但是有機(jī)反應(yīng)的動力學(xué)行為終究是一個復(fù)雜性難題,單變量線性方程注定無法滿足所有場合的需要,破解這一困局必須引入新的思路。1977年諾貝爾物理學(xué)獎獲得者安德森(P. W. Anderson)在評價凝聚態(tài)物理時有一句名言:“多者異也(More is different)”。這句話的本意是說物質(zhì)結(jié)構(gòu)存在不同的層次,每個層次都會涌現(xiàn)出獨(dú)特的性質(zhì)和規(guī)律。物質(zhì)世界的復(fù)雜性隨著結(jié)構(gòu)尺度的擴(kuò)大而提升,所以還原論(reductionism)哲學(xué)并不能保證建構(gòu)主義(constructionism)的成功:即使萬物運(yùn)行的現(xiàn)象可以被約化為少數(shù)基本粒子的規(guī)律,我們也無法僅從這些規(guī)律出發(fā)重建出整個宇宙。以這個觀點看待本征復(fù)雜的化學(xué)動力學(xué)問題,我們是否可以探索一條在某種程度上不同于物理有機(jī)化學(xué)傳統(tǒng)的道路——放棄對直觀化學(xué)圖像的期待,不再追求簡明解析的數(shù)學(xué)關(guān)系;同時盡可能多地引入變量,將反應(yīng)活性fr寫成一系列性質(zhì)參數(shù){σ}的函數(shù)
并把選取{σ}和確定f的數(shù)學(xué)形式等任務(wù)都交給數(shù)據(jù)擬合。這個想法初看起來頗令人不安,畢竟“搖晃鼻子的大象”還歷歷在目。況且歷史上阿倫尼烏斯公式和哈米特方程的成功都是通過擺脫對數(shù)據(jù)的盲目擬合,在清晰的化學(xué)圖像指引下實現(xiàn)的。不借助這些指引,有機(jī)反應(yīng)動力學(xué)的規(guī)律真的能從復(fù)雜的數(shù)據(jù)關(guān)系和“無形的方程”中自動涌現(xiàn)出來嗎?
J. N. Gray (1944~2012)
2007年1月,在美國加利福尼亞州山景城召開的美國國家研究理事會計算機(jī)科學(xué)與電訊委員會會議上,供職于微軟公司的著名計算機(jī)科學(xué)家、1998年圖靈獎獲得者格雷(J. N. Gray)發(fā)表了題為“科學(xué)方法的革命”的演講。他在演講中提出,將科學(xué)研究分為四類范式——依次為經(jīng)驗(實驗)科學(xué)、理論科學(xué)、計算科學(xué)和數(shù)據(jù)科學(xué)。格雷認(rèn)為,科學(xué)研究的旅程起步于觀察和記錄自然現(xiàn)象,為了獲得更加精確和普適的結(jié)果,人們從實驗現(xiàn)象中抽象出簡化模型,通過數(shù)學(xué)方程構(gòu)建出科學(xué)理論。當(dāng)科學(xué)理論的復(fù)雜性上升到人腦無法應(yīng)付的程度時,利用計算機(jī)進(jìn)行大規(guī)模計算就成為與受控實驗和理論推導(dǎo)并立的又一種探索自然的途徑。隨著計算機(jī)算力和算法的不斷升級,通過海量數(shù)據(jù)的收集代替?zhèn)鹘y(tǒng)的經(jīng)驗觀察,借助大規(guī)模計算補(bǔ)充人類的思考,有望產(chǎn)生遠(yuǎn)超經(jīng)驗范式的理論歸納能力,這就是格雷倡導(dǎo)的數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)的“第四范式”。在計算機(jī)科學(xué)家的身份之外,格雷還是一名航海愛好者。在山景城會議的半個月之后,格雷獨(dú)自駕駛帆船出海,計劃于靠近舊金山海岸的法拉隆群島拋灑母親的骨灰,但是未能返航。持續(xù)數(shù)月的搜尋沒有找到格雷和他的帆船的任何蹤跡,五年后他被加州地方法院宣告合法死亡。山景城的演講成為格雷留給世界的學(xué)術(shù)“遺言”,而第四范式下的科學(xué)研究正在他的身后蓬勃發(fā)展。
2016年,谷歌旗下的DeepMind公司推出人工智能圍棋程序AlphaGo。它將蒙特卡洛樹搜索算法和深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,通過學(xué)習(xí)人類棋譜和“左右互搏”的自我對弈提升實力,在公開比賽中戰(zhàn)勝了當(dāng)時最頂尖的棋手李世乭和柯潔。2018年DeepMind公司又發(fā)布了人工智能蛋白質(zhì)結(jié)構(gòu)預(yù)測程序AlphaFold(AF),并于2020年和2024年上線了其后繼版本AF2和AF3。AF程序?qū)W習(xí)了所有已知蛋白質(zhì)的氨基酸序列、和已通過X射線晶體學(xué)實驗測定的蛋白質(zhì)結(jié)構(gòu),基于Transformer神經(jīng)網(wǎng)絡(luò)預(yù)測氨基酸殘基之間的距離和相互作用,通過多輪迭代給出目標(biāo)蛋白質(zhì)的預(yù)測結(jié)構(gòu),其精度可以與實驗結(jié)果相抗衡。2022年,DeepMind公司宣稱AF2已經(jīng)預(yù)測了超過兩億個蛋白質(zhì)高級結(jié)構(gòu),幾乎覆蓋了所有已知氨基酸序列的蛋白質(zhì)分子。AF團(tuán)隊的領(lǐng)導(dǎo)者哈薩比斯(D. Hassabis)和江珀(J. Jumper)因為在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的工作分享了2024年諾貝爾化學(xué)獎(該獎項的另一名獲得者是美國華盛頓大學(xué)的蛋白質(zhì)設(shè)計專家貝克(D. Baker))。
那么,有機(jī)反應(yīng)動力學(xué)問題呢?應(yīng)當(dāng)注意到蛋白質(zhì)的一級結(jié)構(gòu)是由一維氨基酸序列完全編碼的,其高級結(jié)構(gòu)的形成主要依賴氨基酸殘基之間的非共價相互作用。而有機(jī)反應(yīng)涉及化學(xué)鍵的斷裂和重組,其過程細(xì)節(jié)和影響因素遠(yuǎn)比蛋白質(zhì)折疊復(fù)雜,想要依靠人工智能輕松“拿捏”有機(jī)反應(yīng)動力學(xué)可能不會是一蹴而就的(筆者期待被打臉)。盡管如此,這方面的研究正方興未艾,也屢有成功的結(jié)果見諸頂刊。從某種意義上說,這些研究工作算得上是哈米特將有機(jī)反應(yīng)參數(shù)化、定量化的努力在新時代的傳承和延續(xù),其基本思想都可以用(20)式概括,但是性質(zhì)參數(shù)和函數(shù)形式的取材范圍都大大拓寬了。不僅僅是哈米特參數(shù)σ,所有刻畫分子微觀幾何/電子結(jié)構(gòu)、宏觀理化性質(zhì)的特征,無論是針對基態(tài)還是過渡態(tài)、無論來源于實驗測定還是理論計算,都可以作為描述符使用。在模型方面,從簡單的多元線性回歸到復(fù)雜的貝葉斯優(yōu)化和神經(jīng)網(wǎng)絡(luò)算法,也都能找到用武之地。所擬合和預(yù)測的目標(biāo)也不限于反應(yīng)的動力學(xué)行為,還包括目標(biāo)產(chǎn)物的收率、選擇性,甚至是最優(yōu)反應(yīng)條件。再輔以高通量、自動化設(shè)備提供的高質(zhì)量實驗數(shù)據(jù)……有機(jī)化學(xué)家們正在雄心勃勃地迎接一場關(guān)于合成方法學(xué)研究范式的變革。
圖6. 利用貝葉斯優(yōu)化算法預(yù)測醇的光延(Mitsunobu)反應(yīng)和脫氧氟代反應(yīng)結(jié)果,并發(fā)現(xiàn)多組超越專家經(jīng)驗的最優(yōu)反應(yīng)條件。圖片來源:Nature 2021, 590, 89.
在樂觀的同時仍然需要保持謹(jǐn)慎。不管是以哈米特方程為代表的線性自由能關(guān)系還是面向有機(jī)反應(yīng)動力學(xué)的人工智能模型,本質(zhì)上都屬于不完全歸納法的范疇。它們均試圖從有限的實驗事實中提煉出經(jīng)驗或者規(guī)則,并希望其在未知的樣本上展現(xiàn)出泛化能力。歸納推理的有效性是哲學(xué)史上長期爭論的問題。啟蒙時代的蘇格蘭哲學(xué)家休謨(D. Hume)主張一種“懷疑主義”的立場,認(rèn)為不存在可以遵循的方式去證成歸納推理的任何結(jié)論。二十世紀(jì)初英國哲學(xué)家羅素(B. Russell)更是用農(nóng)場上一只雞的例子指出了單純歸納法的危險。當(dāng)這只雞將農(nóng)夫的腳步聲和給它喂食這兩件事關(guān)聯(lián)起來時,它不會想到下一次農(nóng)夫到來就會把它宰殺。當(dāng)然,休謨也承認(rèn)即便沒有辦法透過理性去證成歸納推理的結(jié)論,人類仍然必須做出并且相信這種推理。也許作為物理有機(jī)化學(xué)的研究者,我們可以暫時不必糾結(jié)于形而上學(xué)的思辨,以開放的態(tài)度看待和使用手邊的一切研究工具。面對不確定的未來,讓我們躬身入局、拭目以待!
參考文獻(xiàn)
[1] E. A. Guggenheim, J. Chem. Educ. 1956, 33, 544.
[2] E. Farber, Chymia 1961, 7, 135.
[3] E. W. Lund, J. Chem. Educ. 1965, 42, 548.
[4] P. W. Andersen, Science 1972, 177, 393.
[5] J. Shorter, J. Chem. Educ. 1980, 57, 411.
[6] M. C. King, Ambix 1981, 28(2), 70.
[7] M. C. King, Ambix 1982, 29(1), 49.
[8] K. J. Laidler, J. Chem. Educ. 1984, 61, 494.
[9] K. J. Laidler, Arch. Rational Mech. 1985, 32, 43
[10] M. H. Abraham, J. Phys. Org. Chem. 1994, 7, 655.
[11] X.-K. Jiang, Acc. Chem. Res. 1997, 30, 283.
[12] F. Dyson, Nature 2004, 427, 297.
[13] J. Quílez, Bull. Hist. Chem. 2006, 31, 45.
[14] G. Nagendrappa, Resonance 2007, 12(5), 21.
[15] J. Mayer, K. Khairy, J. Howard, Am. J. Phys. 2010, 78, 648.
[16] J. Quílez, Found. Chem. 2019, 21, 221.
[17] J. Quílez, Found. Chem. 2021, 23, 85.
[18] B. J. Shields, J. Stevens, J. Li, M. Parasram, F. Damani, J. I. M. Alvarado, J. M. Janey, R. P. Adams, A. G. Doyle, Nature 2021, 590, 89.
[19] E. Callaway, Nature 2022, 608, 15.
[20] M. H. Back, K. J. Laidler, Ed. Selected Readings in Chemical Kinetics. Pergamon Press, 1967.
[21] P. Coffey, Cathedrals of Science: The Personalities and Rivalries That Made Modern Chemistry. Oxford Academy Press, 2008.
[22] T. Hey, S. Tansley, K. Tolle, Eds. The Fourth Paradigm: Data Intensive Scientific Discovery. Microsoft Research, 2009.
[23] N. E. Henriksen, F. Y. Hansen, Theories of Molecular Reaction Dynamics, The Microscopic Foundation of Chemical Kinetics, 2nd Ed. Oxford University Press, 2019.
[24] H. Westheimer, A Biographical Memoir of Louis Plack Hammett, National Academy Press, 1997.
[25] 格雷戈里? D ?沃爾科特、江曉源主編,《A Source Book in Chemistry,科學(xué)元典—化學(xué)》,華文出版社,2022年。
[26] 陳敏伯,《科學(xué)通報》,2016年,第79卷第3期,196頁。
[27] 趙凱華著,《定性與半定量物理學(xué)》(第二版),高等教育出版社,2008年。
[28] Ю. И. 索洛維耶夫、H. A. 菲古羅夫斯基著,丁由譯,《阿累尼烏斯傳:生平與活動》,商務(wù)印書館,1965年。
[29] 黎占亭著,《二十世紀(jì)中國著名科學(xué)家書系——蔣錫夔》,金城出版社,2008年。
致謝
作者感謝中國科學(xué)院上海有機(jī)化學(xué)研究所游書力院士、黎占亭研究員、中國科學(xué)院物理研究所曹則賢研究員、中國科學(xué)院大連化學(xué)物理研究所田文明研究員、美國范德比爾特大學(xué)楊中悅教授對本文的寶貴意見。
作者簡介
鄭超博士,中國科學(xué)院上海有機(jī)化學(xué)研究所研究員,國家自然科學(xué)基金委員會優(yōu)秀青年科學(xué)基金項目獲得者。研究方向為物理有機(jī)化學(xué)與手性合成。
特 別 提 示
1. 進(jìn)入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關(guān)注公眾號,回復(fù)四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權(quán)說明:歡迎個人轉(zhuǎn)發(fā),任何形式的媒體或機(jī)構(gòu)未經(jīng)授權(quán),不得轉(zhuǎn)載和摘編。轉(zhuǎn)載授權(quán)請在「返樸」微信公眾號內(nèi)聯(lián)系后臺。