版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

計(jì)算效率提升3000倍!嶗山實(shí)驗(yàn)室等提出海洋環(huán)境智能預(yù)報(bào)大模型「問?!梗阅軆?yōu)于數(shù)值海洋預(yù)報(bào)

HyperAI超神經(jīng)
原創(chuàng)
人工智能說明書,了解 AI 的功效和副作用。
收藏

海洋中活躍著各種時(shí)空尺度的渦旋。其中,空間尺度在 10km 到 100km 量級(jí)的中尺度渦旋是海洋動(dòng)能的主要載體,主導(dǎo)者海水流速、溫度和鹽度的短期變化,并對(duì)大氣過程產(chǎn)生重要的影響。因此,準(zhǔn)確預(yù)測中尺度渦旋不僅對(duì)海洋活動(dòng)和管理至關(guān)重要,而且對(duì)提高天氣預(yù)報(bào)的準(zhǔn)確性也有重要幫助。

過去,海洋學(xué)家主要通過數(shù)值求解大型物理方程組來預(yù)報(bào)未來海洋的變化。在數(shù)值求解的過程中,隨著網(wǎng)格分辨率增加,計(jì)算負(fù)擔(dān)迅速增長,這導(dǎo)致預(yù)測海洋中尺度渦旋需要消耗巨大計(jì)算資源。近年來,人工智能 (AI) 為科學(xué)研究帶來了全新方法和有力工具,在天氣預(yù)報(bào)方面取得了重要進(jìn)展。然而,現(xiàn)有的 AI 大模型仍存在對(duì)海氣相互作用表征不充分,預(yù)報(bào)結(jié)果模糊化等問題,給實(shí)現(xiàn)精細(xì)化海洋環(huán)境預(yù)報(bào)帶來了挑戰(zhàn)。

針對(duì)于此,嶗山實(shí)驗(yàn)室吳立新院士領(lǐng)銜的科研團(tuán)隊(duì),聯(lián)合中國海洋大學(xué)、中國科學(xué)技術(shù)大學(xué)、青島國實(shí)科技集團(tuán)有限公司,通過物理海洋學(xué)與人工智能的深度融合,以海洋動(dòng)力學(xué)理論驅(qū)動(dòng)神經(jīng)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),研制了「問?!埂?全球高分辨率 (1/12°) 海洋環(huán)境智能預(yù)報(bào)大模型。

相關(guān)研究成果以「Forecasting the Eddying Ocean with a Deep Neural Network」為題,在線發(fā)表于 Nature Communications。

研究亮點(diǎn):

* 「問?!勾竽P鸵院Q髣?dòng)力學(xué)理論驅(qū)動(dòng)神經(jīng)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

* 「問?!勾竽P皖A(yù)報(bào)性能優(yōu)于法國麥卡托海洋國際中心發(fā)布的數(shù)值預(yù)報(bào)系統(tǒng)

* 「問?!勾竽P拖噍^于數(shù)值預(yù)報(bào)模型在計(jì)算效率方面提升了 3,000 倍

論文地址:
https://www.nature.com/articles/s41467-025-57389-2

開源項(xiàng)目「awesome-ai4s」匯集了 200 余篇 AI4S 論文解讀,并提供海量數(shù)據(jù)集與工具:
https://github.com/hyperai/awesome-ai4s

數(shù)據(jù)集:將海洋觀測數(shù)據(jù)作為真實(shí)值

該研究使用的數(shù)據(jù)主要包括用于訓(xùn)練模型的海洋和大氣再分析數(shù)據(jù),以及用于評(píng)估模型預(yù)報(bào)能力的觀測數(shù)據(jù)。再分析數(shù)據(jù)包括法國麥卡托海洋國際中心的 GLORYS 全球 1/12° 海洋再分析數(shù)據(jù),和歐洲中期天氣預(yù)報(bào)中心的 ERA5全球 1/4° 大氣再分析數(shù)據(jù)。

區(qū)別于現(xiàn)有AI氣象大模型基本都以再分析數(shù)據(jù)作為初始場來進(jìn)行預(yù)報(bào),該研究嚴(yán)格采用與海洋數(shù)值預(yù)報(bào)系統(tǒng)一致的初始場和強(qiáng)迫場來驅(qū)動(dòng)大模型,并將海洋觀測數(shù)據(jù)作為真實(shí)值,客觀評(píng)估問海大模型與海洋數(shù)值預(yù)報(bào)系統(tǒng)的實(shí)際預(yù)報(bào)能力。

海洋初始場來自法國麥卡托海洋國際中心 GLO12v4 預(yù)報(bào)系統(tǒng),大氣預(yù)報(bào)場來自歐洲中期天氣預(yù)報(bào)中心 IFS HRES 預(yù)報(bào)系統(tǒng),觀測數(shù)據(jù)包括 Argo 測量的溫鹽剖面、衛(wèi)星遙感的海表面高度以及漂流浮標(biāo)測量的海表面溫度和近海表流速。

模型框架:海洋動(dòng)力學(xué)理論驅(qū)動(dòng)神經(jīng)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

現(xiàn)有的 AI 大模型存在對(duì)海氣相互作用表征不充分,預(yù)報(bào)結(jié)果模糊化等問題,給實(shí)現(xiàn)精細(xì)化海洋環(huán)境預(yù)報(bào)帶來了挑戰(zhàn)。通過物理海洋學(xué)與人工智能的深度融合,以海洋動(dòng)力學(xué)理論驅(qū)動(dòng)神經(jīng)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),有效克服了現(xiàn)有 AI 大模型的不足。

「問?!勾竽P蛯K體公式 (bulk formula) 顯式嵌入神經(jīng)網(wǎng)絡(luò),準(zhǔn)確表征了海-氣間的動(dòng)量、熱量和物質(zhì)交換;利用海陸分布掩碼,賦予模型對(duì)地形岸界的感知能力;以海洋狀態(tài)的變化趨勢作為預(yù)報(bào)目標(biāo),使模型更加關(guān)注快變的中小尺度過程;通過優(yōu)化神經(jīng)網(wǎng)絡(luò)超參數(shù),減少下采樣過程中的信息損失,強(qiáng)化對(duì)海洋中小尺度過程的保真能力;使用微調(diào)技術(shù),改善了迭代預(yù)報(bào)過程中的累積誤差。


「問?!勾竽P图軜?gòu)示意圖

實(shí)驗(yàn)結(jié)論:「問?!勾竽P皖A(yù)報(bào)能力優(yōu)于數(shù)值海洋預(yù)報(bào)系統(tǒng)

海洋中小尺度過程非線性強(qiáng),可預(yù)報(bào)性低;且海洋觀測稀疏,同化系統(tǒng)給出的初始場與真實(shí)海洋狀態(tài)存在偏差。因此,很難要求預(yù)報(bào)的中小尺度過程與實(shí)際觀測在位置、強(qiáng)度都上都完全吻合。特別的,由于「雙懲罰」問題的存在,傳統(tǒng)的點(diǎn)對(duì)點(diǎn)誤差指標(biāo),如均方根誤差 (RMSE),并不適用于評(píng)估高分辨率預(yù)報(bào)系統(tǒng)的性能。因?yàn)檫@類指標(biāo)會(huì)使得高分辨率預(yù)報(bào)系統(tǒng)的性能「看起來」不如低分辨率系統(tǒng),即使前者能夠更好地反映真實(shí)海洋的狀態(tài)。


「雙懲罰」問題示意圖,來源:ECMWF

為了公平對(duì)比「問海」大模型與 GLO12v4 數(shù)值預(yù)報(bào)系統(tǒng),該研究采用面向高分辨率預(yù)報(bào)系統(tǒng)的「近鄰」評(píng)估 (neighbourhood evaluation) 方案——將觀測值周圍一定范圍內(nèi)的預(yù)報(bào)值作為觀測位置的集合預(yù)報(bào),評(píng)估其連續(xù)排名概率得分 (CRPS)。2024 年 4 月至 11 月的回報(bào)結(jié)果表明,「問?!勾竽P蛯?duì)于未來 10 天的溫度、鹽度、流速、海平面高度的預(yù)報(bào)性能優(yōu)于 GLO12v4 數(shù)值預(yù)報(bào)系統(tǒng)。與此同時(shí),「問海」大模型相較于數(shù)值預(yù)報(bào)模型在計(jì)算效率方面提升了 3,000 倍,極大地節(jié)省了計(jì)算時(shí)間和能源消耗。

「問?!勾竽P停ㄋ{(lán)線)和法國麥卡托海洋國際中心 GLO12v4 數(shù)值預(yù)報(bào)系統(tǒng)(紅線)在2024年4月至11月期間的預(yù)報(bào)結(jié)果的連續(xù)排名概率得分(CRPS,越低越好)。

(a) 溫度剖面

(b) 鹽度剖面

(c) 海表面溫度

(d) 海平面異常

(e) 15米緯向流速以及

(f) 15米經(jīng)向流速。其中溫鹽剖面展示的為垂向平均的 CRPS。陰影表示使用 bootstrap 方法得到的 50% 置信區(qū)間