欧美伊人久久大香线蕉综合,国产精品午夜福利不卡120

作者：李寶珠

編輯：三羊

封面圖來源：Google DeepMind

DeepMind 用算力堆出奇跡？被夸上天的 AlphaGeometry 含金量有多高

近日，谷歌 DeepMind 的 Alpha 系列再添新成員——AlphaGeometry，依舊聲勢浩大，「里程碑」、「史詩級」、「逼近人類」等贊美之詞溢出屏幕。那么，這個號稱奧數(shù)能力金牌級的 AI 系統(tǒng)到底有多少含金量呢？

AlphaGeometry 由谷歌 DeepMind 團隊和紐約大學的研究人員共同研發(fā)，**將神經(jīng)語言模型 (neural language model) 與符號引擎 (symbolic deduction engine) 相結(jié)合，**能夠解決復雜的幾何問題，并且水平接近人類。

在對 30 道國際奧林匹克數(shù)學競賽 (IMO) 幾何題的基準測試中，在給定時間內(nèi) AlphaGeometry 解決了其中的 25 道題，之前 SOTA 的「吳方法」解決了 10 道，而人類 IMO 金牌得主平均可以解決 25.9 個問題。

誠然，自 AlphaGo 面世以來，伴隨著多次面向不同學科的革新性突破，「DeepMind 出品，必屬精品」的定位逐漸在人們心中扎根。但同時，業(yè)內(nèi)也不乏理性、辯證的聲音——算力替代智力固然可喜，但實際應用價值更加重要。所以，借著 AlphaGeometry 的發(fā)布，我們想淺談一下，這到底是算力優(yōu)勢下的狂歡，還是 AI for Science 的探路。

值得一提的是，**我們采訪到了北京大學智能學院教授林宙辰，針對相關(guān)學術(shù)問題進行了探討與學習。**林宙辰教授曾先后在南開大學、北京大學、香港理工大學攻讀數(shù)學和應用數(shù)學專業(yè)，而后又回到了北京大學數(shù)學學院攻讀博士學位，開始進入人工智能領(lǐng)域。（點擊查看林宙辰教授專訪）

表達與計算量：AI for Math 的兩大挑戰(zhàn)

林宙辰教授表示：“過去，數(shù)學定理的「表達」與大規(guī)模的計算量是 AI 進行數(shù)學定理證明的兩大挑戰(zhàn)?！?/strong>

“首先，作為十分抽象化、且高度依賴邏輯推理的學科，數(shù)學擁抱 AI 的第一步就是要解決「表達」問題，將數(shù)學定理表達為計算機可以計算的方式是后續(xù) AI 應用的基礎。”

“AlphaGeometry 所針對的幾何問題，「表達」的難度屬于數(shù)學中較低的一種，解析幾何、代數(shù)幾何的出現(xiàn)，其實已經(jīng)實現(xiàn)了通過數(shù)值來表示幾何形狀和幾何對象間的關(guān)系，加之吳文俊院士在 20 世紀 70 年代所提出的「數(shù)學機械化」，也在一定程度上為平面幾何定理與機器語言之間構(gòu)建了連接橋梁?！?/p>
“其次，吳文俊院士提出的「吳方法」以及傳統(tǒng)的Gr?bner基等方法，已經(jīng)從理論上解決了平面幾何定理證明的問題，但是卻囿于算力，換言之，由于存儲量、計算量大，尤其是在面對比較難的平面幾何問題時，操作空間會呈指數(shù)級增長，所以過往的很多方法都難以處理高難度問題?！?/p>
“計算量大的問題對于「財大氣粗」的 DeepMind 而言顯然不是主要障礙，主要困難在于如何避免操作空間指數(shù)級增長，此時機器學習方法可以幫上忙?！?/p>
具體而言，AlphaGeometry 基于 1 億個合成數(shù)據(jù)進行訓練，無需人類演示即可自主應對復雜的幾何學挑戰(zhàn)，并生成人類可閱讀的證明。

如下圖所示，以我國中小學生最熟悉的「等腰定理」為例，想要證明 ∠ABC=∠BCA，需要先手動將問題轉(zhuǎn)化為計算機語言，進而將其輸入到 AlphaGeometry。

AlphaGeometry 通過運行符號推演引擎啟動證明搜索，該引擎從定理前提中「窮盡」地推演出新的陳述，直到定理得到證明或新的陳述被用盡。如果符號推演引擎未能找到證明，語言模型就會構(gòu)建一個輔助點，增加可證明的條件，進而重新開始通過符號引擎搜索證明。如此循環(huán)，直到找到解決方案。

解決方案將會被自動解析為人類可閱讀的語言，所以還能夠進行驗證、評估。

值得一提的是，AlphaGeometry 使用了合成數(shù)據(jù)進行模型訓練，解決了相關(guān)數(shù)據(jù)庫匱乏的問題。

研究人員通過在各種隨機定理前提上使用現(xiàn)有的符號引擎，利用 10 萬個 CPU 運行了 72 小時后，獲得了大約 5 億個合成的定理證明示例，進行形式規(guī)范化及去重后，最終得到了 1 億個定理證明示例，其中有 900 萬個示例涉及至少一個輔助構(gòu)造，許多證明步驟超過 200 步，是國際奧林匹克數(shù)學競賽幾何題平均證明長度的 4 倍。

合成數(shù)據(jù)生成過程

為了對比測試 AlphaGeometry 解決實際問題的能力，研究人員嘗試將自 2000 年以來的 IMO 競賽中的幾何問題轉(zhuǎn)化為符號引擎可讀的機器語言，并發(fā)現(xiàn)其中只有 75% 可以成功表達，進而形成了一個由 30 道經(jīng)典幾何問題組成的測試集 IMO-AG-30。

每個問題都有不同的運行時間，這是因為其推導閉包大小各不相同。研究人員發(fā)現(xiàn)，運行時間與問題的難度并不相關(guān)。例如，IMO 2019 P6 比 IMO 2008 P1a 難得多，但要在 IMO 時限內(nèi)求解，所需的并行化時間卻要少得多。

由于語言模型解碼過程會返回 k 個不同的序列，描述 k 個可供選擇的輔助結(jié)構(gòu)，研究人員在 k 個選項上進行集束搜索 (beam search)，使用每個集束的得分作為其值函數(shù)。這種方法具有很強的并行性，在有并行計算資源的情況下，可以大幅提高搜索速度。

研究人員發(fā)現(xiàn)，在 GPU V100 加速語言模型有四個并行副本的情況下，解決所有 25 個問題并保持在規(guī)定時間內(nèi)的最少并行 CPU 數(shù)量如下圖所示：

10 個不同的模型/方法，在 IMO-AG-30 測試集中的表現(xiàn)如下圖所示。有意思的是，GPT-4 在測試中竟一道題都沒有做對。

算力替代智力的背后，應用價值才是重點

最近兩天，網(wǎng)絡上鋪天蓋地的各類報道已經(jīng)將 AlphaGeometry 的成果剖白得淋漓盡致，其影響力無需贅述，所以我們更希望能夠探究，喧鬧過后，AlphaGeometry 能為科研、為 AI 應用發(fā)展帶來哪些實際價值？

對此，林宙辰教授表示：“**目前來看，AlphaGeometry 能夠像 AlphaGo 一樣成為「老師」，在教學方面起到更大的輔助作用。**此外，AlphaGeometry 在模型性能方面的突破不可否認，其更是進一步展示了「大力出奇跡」——強大的算力優(yōu)勢造就了強悍的模型性能，這也在某種程度上進一步為「崇尚」算力的研究人員、企業(yè)增添了信心?！?/p>
不過，正如林宙辰教授所言，在 AI 領(lǐng)域，盡管我們已經(jīng)無數(shù)次見證了「算力替代智力」的有效性，但最終邁向行業(yè)專家的最后1% 的突破還是很難靠 AI 來實現(xiàn)的。

所以，就目前而言，無論是 AlphaGeometry，亦或 GPT 模型等其他 AI 工具，在人們的日常生活以及科研工作中，仍是「亦師亦友」的存在，靈活使用 AI 工具已是大勢所趨，如何將算力造就的「奇跡」應用于實際問題才是人類難以被取代的價值所在。

借古鑒今，AI 工具的快速崛起與計算機的普及有著很多相似之處，例如革命性的工作方式轉(zhuǎn)變，正勢如破竹地替代傳統(tǒng)方法，逐漸成為職場能力的考核標準……但對比之下，AI 工具的局限性也更加凸顯，那就是特異性。

林宙辰教授認為：“目前的 AI 工具缺乏統(tǒng)一性，即使只針對數(shù)學學科，面向數(shù)論和面向幾何學所開發(fā)的 AI 工具就已經(jīng)存在很大差別，更不用提跨學科的AI工具了。AI 工具還沒有像當今的計算機一樣，成為基礎底座，可以方便取用。目前的計算機語言有 C 語言、Java、Python等，完全可以基于其中一種語言解決數(shù)學、物理、化學等多學科的問題，這體現(xiàn)了其通用性，但是 AI 工具則不然，光看 Alpha 系列便可知一二?！?/p>
所以，林宙辰教授認為：“未來，當 AI 工具可以抽象出來可以重用時，AI for Science 才能夠「大行其道」?！?/p>
這也是 HyperAI超神經(jīng)在持續(xù)追蹤 AI for Science 發(fā)展進程時所觀察到的現(xiàn)象，部分課題組或研究團隊會在本學科成員之外，專門招聘一位主攻 AI 的成員，負責開發(fā)研究中需要的 AI工具，而Science 部分則還是交由傳統(tǒng)的科研人員來完成。

毫無疑問，AI 對科研進程的幫助與提升已經(jīng)日益明顯，正在成為新趨勢，但這種 AI+Science 的團隊模式又是否是長久之計呢？

林宙辰教授認為：“未來，一方面需要將 AI 工具的使用門檻降低，達到一定的統(tǒng)一性，使得 Science 人員也能夠針對不同的問題自行組合使用 AI 工具的組件，就像計算機編程一樣；另一方面，Science 人員也需要逐步提升使用 AI工具的能力，才能充分發(fā)揮AI的威力?！?/p>
道阻且長，行之將至。AI for Science 由DeepMind 等大廠引發(fā)，加之國家政策推進，已經(jīng)開始了漫漫征程，其中的荊棘需要科研與產(chǎn)業(yè)界共同肅清，才能夠真正在落地中為人類發(fā)展創(chuàng)造價值。

最后，感謝北京大學智能學院林宙辰教授對筆者撰文提供的幫助與支持。目前林宙辰教授的課題組正在招聘博士研究生，歡迎符合要求的學生將簡歷發(fā)送至：zlin@pku.edu.cn

我信奉的信條是物理學家路德維?！げㄆ澛拿裕簺]有什么比一個好的理論更實用的了。我現(xiàn)在想招數(shù)學能力強（但這并不意味著你必須來自數(shù)學系）、對理論分析非常感興趣的博士研究生，以便與我一起享受如何優(yōu)雅地使用數(shù)學解決實際問題。歡迎發(fā)送簡歷給我。

——林宙辰

AlphaGeometry：DeepMind 大算力再造奇跡，但「算力代替智力」或許并非最優(yōu)解

表達與計算量：AI for Math 的兩大挑戰(zhàn)

算力替代智力的背后，應用價值才是重點

AlphaGeometry：DeepMind 大算力再造奇跡，但「算力代替智力」或許并非最優(yōu)解

算力替代智力的背后，應用價值才是重點