版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

機(jī)器學(xué)習(xí)VS數(shù)值天氣預(yù)報(bào),AI如何顛覆天氣預(yù)報(bào)模式?

HyperAI超神經(jīng)
原創(chuàng)
人工智能說(shuō)明書,了解 AI 的功效和副作用。
收藏

數(shù)值天氣預(yù)報(bào)是天氣預(yù)報(bào)的主流方法。它通過(guò)數(shù)值積分,對(duì)地球系統(tǒng)的狀態(tài)進(jìn)行逐網(wǎng)格的求解,是一個(gè)演繹推理的過(guò)程。

然而,隨著天氣預(yù)報(bào)分辨率不斷升高,預(yù)報(bào)時(shí)間逐漸延長(zhǎng),NWP 模式所需要的算力迅速增加,限制了其發(fā)展。另一方面,以人工智能為基礎(chǔ)的數(shù)據(jù)驅(qū)動(dòng)天氣預(yù)報(bào)快速發(fā)展,在部分領(lǐng)域已經(jīng)超越了傳統(tǒng)方法。

現(xiàn)有的機(jī)器學(xué)習(xí)天氣預(yù)報(bào)精度如何?人工智能又將如何改變天氣預(yù)報(bào)?本文對(duì)比了幾大數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)天氣預(yù)報(bào)模型后,對(duì)天氣預(yù)報(bào)的未來(lái)發(fā)展作出了展望。

作者 | 雪菜

編輯 | 三羊

數(shù)值天氣預(yù)報(bào):450 億偏微分方程組

數(shù)值天氣預(yù)報(bào) (NWP, Numerial Weather Prediction) 是天氣預(yù)報(bào)領(lǐng)域的主流方法。早在 20 世紀(jì)初,Abbe 和 Bjerknes 就提出人們可以使用物理定律預(yù)測(cè)天氣,以當(dāng)前的天氣狀況為初值,進(jìn)行積分便可以求解未來(lái)的天氣。但彼時(shí)對(duì)氣象學(xué)的研究還不夠深入,計(jì)算水平也相對(duì)落后,這一設(shè)想未能實(shí)現(xiàn)。

1950 年,普森林頓大學(xué)首次嘗試使用第一臺(tái)電子計(jì)算機(jī)進(jìn)行了天氣后報(bào)。1954 年,在斯德哥爾摩首次實(shí)現(xiàn)了實(shí)時(shí)的天氣預(yù)報(bào)。

在每個(gè)網(wǎng)格單元中求解基于物理定律的微分方程組

直到 20 世紀(jì) 70 年代,超級(jí)計(jì)算機(jī)問(wèn)世,人們方能求解 Abbe 和 Bjerknes 提出的整套方程。1979 年,歐洲中期天氣預(yù)報(bào)中心 (ECMWF) 編制了首份中期天氣預(yù)報(bào),開(kāi)啟了綜合預(yù)報(bào)系統(tǒng) (IFS, Integrated Forecasting System) 的篇章。

然而,Edward N.Lorenz 總結(jié)前人的經(jīng)驗(yàn),提出天氣系統(tǒng)是一個(gè)混沌系統(tǒng),會(huì)因變量的細(xì)微變化而發(fā)生巨大的改變。另一方面,人們對(duì)于氣象系統(tǒng)的初始狀態(tài)也很難完全掌握。為此,學(xué)界使用集合預(yù)報(bào) (Ensemble Forecasting) 以最大限度降低初始參數(shù)和預(yù)測(cè)模型的不確定性,預(yù)測(cè)結(jié)果的集合即為概率預(yù)報(bào)的基礎(chǔ)。

降水概率的集合預(yù)報(bào)示意圖

隨著數(shù)值模型、超級(jí)計(jì)算、數(shù)據(jù)同化和集合預(yù)測(cè)等技術(shù)的發(fā)展,數(shù)值天氣預(yù)報(bào)的精度不斷提高,預(yù)測(cè)時(shí)間也由 3 天、5 天逐漸提升至 7 天甚至 10 天。

南、北半球 (SH, NH) 的天氣預(yù)報(bào)技術(shù)隨時(shí)間的演進(jìn)

目前,歐洲中期天氣預(yù)報(bào)中心的預(yù)報(bào)模式需要對(duì)每一水平層的 200 萬(wàn)個(gè)網(wǎng)格,以 10 分鐘的步長(zhǎng)進(jìn)行 10 天的預(yù)報(bào),每天運(yùn)行 2 次。因此,他們需要在 2.5 小時(shí)內(nèi),完成約 400 億個(gè)網(wǎng)格的運(yùn)算,需要很高的計(jì)算成本。

高昂的計(jì)算費(fèi)用阻礙了數(shù)值天氣預(yù)報(bào)方法的進(jìn)一步發(fā)展。如何在模型分辨率和集合規(guī)模之間找到平衡,成了限制集合預(yù)報(bào)的桎梏。

數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法崛起

近期,數(shù)據(jù)驅(qū)動(dòng) (Data-Driven) 的機(jī)器學(xué)習(xí) (ML, Machine Learning) 在天氣預(yù)報(bào)中展現(xiàn)出了巨大的潛力。2022 年以來(lái),天氣預(yù)報(bào)領(lǐng)域的機(jī)器學(xué)習(xí)模型取得了一系列突破,部分成果可以與歐洲中期天氣預(yù)報(bào)中心的高精度預(yù)測(cè)匹敵。數(shù)據(jù)驅(qū)動(dòng)的天氣預(yù)報(bào)推理依賴于機(jī)器學(xué)習(xí)模型,而非綜合預(yù)報(bào)系統(tǒng) (IFS) 中的物理模型,其預(yù)測(cè)速度較傳統(tǒng)方法提升了幾個(gè)數(shù)量級(jí)。此外,基于機(jī)器學(xué)習(xí)的天氣預(yù)報(bào)是歸納推理的結(jié)果,而非傳統(tǒng)的演繹推理。這種邏輯學(xué)的范式轉(zhuǎn)變改變了天氣預(yù)報(bào)的解釋方式——這些結(jié)果是從以前的數(shù)據(jù)中學(xué)習(xí)而來(lái)的,因此更具說(shuō)服力。

數(shù)據(jù)集:1940 年至今 0.25° 的再分析數(shù)據(jù)

數(shù)據(jù)驅(qū)動(dòng)模型的出現(xiàn)歸功于大規(guī)模、高質(zhì)量的氣象學(xué)開(kāi)放數(shù)據(jù)集。現(xiàn)有的機(jī)器學(xué)習(xí)天氣預(yù)報(bào)模型,訓(xùn)練于歐洲中期天氣預(yù)報(bào)中心的第五代再分析數(shù)據(jù),ERA5 再分析數(shù)據(jù)集。2016 年現(xiàn)版本綜合預(yù)報(bào)系統(tǒng) (IFS) 問(wèn)世時(shí),對(duì) 1940 年至今的天氣數(shù)據(jù)進(jìn)行了再分析,得到了分辨率 0.25° (30 km) 的 ERA5 數(shù)據(jù)集。

FourCastNet:與 IFS 精度相當(dāng)?shù)?DL 模型

2022 年,NVIDIA 發(fā)布了 FourCastNet,基于傅立葉預(yù)測(cè)神經(jīng)網(wǎng)絡(luò),首次進(jìn)行了分辨率為 0.25° 的深度學(xué)習(xí)天氣預(yù)報(bào)。

FourCastNet 架構(gòu)示意圖

在提升分辨率的同時(shí),F(xiàn)ourCastNet 在異常相關(guān)系數(shù) (ACC, Anomaly Correlation Coefficient) 和均方根誤差 (RMSE, Root Mean Squared Error) 方面也沒(méi)有落后傳統(tǒng)的數(shù)值天氣預(yù)報(bào)太多。

FourCastNet 與數(shù)值天氣預(yù)報(bào)的 ACC 和 RMSE 對(duì)比

以節(jié)點(diǎn)小時(shí) (Node-Hour) 為單位,F(xiàn)ourCastNet 的速度大約是傳統(tǒng)數(shù)值天氣預(yù)報(bào)模型的 45,000 倍,加上其在高分辨率下的準(zhǔn)確性,使得超大規(guī)模的集合預(yù)報(bào)成本迅速降低。

GraphCast:基于 GNN 全球中期氣象預(yù)報(bào)

GraphCast 是一種基于圖神經(jīng)網(wǎng)絡(luò) (GNN) 的神經(jīng)網(wǎng)絡(luò),采用「編碼-處理-解碼」配置,共有 3,670 萬(wàn)個(gè)參數(shù)。

編碼器通過(guò)單層 GNN 將輸入網(wǎng)格中的變量映射到內(nèi)部的多網(wǎng)格中。

多網(wǎng)格是一個(gè)空間均質(zhì)的圖,有著全球范圍的高分辨率。多網(wǎng)格通過(guò) 6 次迭代正二十面體(包含 12 個(gè)節(jié)點(diǎn),20 個(gè)面和 30 條邊)形成,每次迭代會(huì)對(duì)網(wǎng)格進(jìn)行精細(xì)化,將單個(gè)三角形劃分為 4 個(gè)較小的三角形,并將其節(jié)點(diǎn)投影至球體上。最終多網(wǎng)格包含 40,962 個(gè)節(jié)點(diǎn),及精細(xì)過(guò)程中所有圖形的邊,形成了包含不同長(zhǎng)度的邊的層級(jí)圖。

處理器使用 16 個(gè)非共享的 GNN 層,在多網(wǎng)格上進(jìn)行消息傳遞。解碼器使用單層 GNN, 將處理器的學(xué)習(xí)特征從多網(wǎng)格映射回到經(jīng)緯度系統(tǒng)中。

GraphCast 的框架

a-c:GraphCast 的輸入-預(yù)測(cè)-迭代過(guò)程;

d-f:GraphCast 的編碼-處理-解碼配置;

g:多網(wǎng)格的精細(xì)化過(guò)程。

對(duì)比歐洲中期天氣預(yù)報(bào)的高分辨率預(yù)報(bào) (HRES),GraphCast 在 ACC 和 RMSE 上均更勝一籌。

GraphCast 和 HRES 的預(yù)測(cè) RMSE (a&b) 和 ACC (c) 對(duì)比

在 32 臺(tái) Cloud TPU v4 設(shè)備上訓(xùn)練 3 周后,GraphCast 對(duì) 1979 年以來(lái)的 ERA5 數(shù)據(jù)進(jìn)行了學(xué)習(xí)。隨后, GraphCast 可以在 60 秒內(nèi)在單臺(tái) Cloud TPU v4 設(shè)備上,生成分辨率 0.25° 間隔 6 小時(shí)的 10 日天氣預(yù)報(bào)。

盤古:基于 ViT 的三維氣象大模型

盤古氣象大模型的輸入輸出均為三維的氣象場(chǎng)。由于氣象場(chǎng)的經(jīng)緯度分布不均勻,盤古氣象大模型使用了三維的 Vision Transformer (ViT) 對(duì)氣象數(shù)據(jù)進(jìn)行處理,精度首次超過(guò)了主流的綜合預(yù)報(bào)系統(tǒng) (IFS)。

三維 Vision Transformer 架構(gòu)

當(dāng)預(yù)測(cè)時(shí)間長(zhǎng)于 3 天時(shí),從 RMSE 來(lái)看,盤古氣象大模型和 IFS 的性能相當(dāng),均優(yōu)于訓(xùn)練集 ERA5。

不同模型的對(duì) T850 和 Z500 的預(yù)測(cè)性能對(duì)比

a&b:分別為不同模型預(yù)測(cè) T850 和 Z500 時(shí)的 RMSE;

c&d:分別為不同模型預(yù)測(cè) T850 和 Z500 時(shí)的活動(dòng)強(qiáng)度;

e&f:分別為不同模型預(yù)測(cè) T850 和 Z500 時(shí)的偏差。

綜上所述,數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)天氣預(yù)報(bào),在預(yù)測(cè)精度上與傳統(tǒng)的數(shù)值天氣預(yù)報(bào)模式接近,然而運(yùn)算設(shè)備和運(yùn)算速度遠(yuǎn)超數(shù)值天氣預(yù)報(bào)模型,說(shuō)明 AI 天氣預(yù)報(bào)在實(shí)際應(yīng)用中有相當(dāng)?shù)臐摿Α?/p>

機(jī)器學(xué)習(xí)和數(shù)值預(yù)報(bào) = 精度 + 速度

在天氣預(yù)報(bào)的內(nèi)部和外部,機(jī)器學(xué)習(xí)都在以驚人的速度不斷發(fā)展。歐洲中期天氣預(yù)報(bào)中心一直在關(guān)注數(shù)據(jù)驅(qū)動(dòng)天氣預(yù)報(bào)的快速崛起,包括 NVIDIA、華為和 Deepmind。

「FourCastNet 是第一個(gè)基于 AI 的分辨率達(dá)到 0.25° 的天氣預(yù)報(bào)系統(tǒng),也是第一個(gè)開(kāi)源的天氣預(yù)報(bào)系統(tǒng)。我們的新版本顯著提高了模型的中期性能和長(zhǎng)期穩(wěn)定性,并希望通過(guò)神經(jīng)算子框架,實(shí)現(xiàn)超分辨率?!筃VIDIA Earth-2 團(tuán)隊(duì)的 Anima Anandkumar 說(shuō)道。

歐洲中期天氣預(yù)報(bào)中心將這些機(jī)器學(xué)習(xí)模型,和穩(wěn)定的數(shù)值模型一起呈現(xiàn)給了用戶,邀請(qǐng)他們從應(yīng)用側(cè)對(duì)系統(tǒng)的操作和性能進(jìn)行評(píng)估。模型的準(zhǔn)確性、可靠性、不確定性和交互性是評(píng)估氣象產(chǎn)品質(zhì)量和有效性的關(guān)鍵因素。

為此,歐洲中期天氣預(yù)報(bào)中心公開(kāi)了 FourCastNet、PGW 和 GraphCast 基于 IFS 初始條件的預(yù)測(cè)結(jié)果。Florian Pappenberger 表示,「開(kāi)放是創(chuàng)新、合作和探索的關(guān)鍵。通過(guò)共享數(shù)據(jù)、方法和結(jié)果,進(jìn)行對(duì)比和分析,就能夠加速科學(xué)發(fā)展,最終造福社會(huì)?!?/p>

三個(gè)氣象 AI 的公開(kāi)數(shù)據(jù)

在歐洲中期天氣預(yù)報(bào)中心的對(duì)比中,可以看到基于 AI 的天氣預(yù)測(cè),在部分性能上已經(jīng)可以與數(shù)值天氣預(yù)報(bào)媲美,將在未來(lái)發(fā)揮著重要作用。然而,這些模型尚沒(méi)有綜合預(yù)測(cè)能力,這是中長(zhǎng)期尺度上提供有價(jià)值預(yù)測(cè)的關(guān)鍵。

開(kāi)放獲取、對(duì)比優(yōu)化、便攜易得,AI 正將自己的優(yōu)勢(shì)滲透進(jìn)入傳統(tǒng)的天氣預(yù)報(bào)當(dāng)中。在將天氣預(yù)報(bào)從超級(jí)計(jì)算機(jī)解放出來(lái)的同時(shí),AI 在極端氣候事件上也有著不俗的表現(xiàn)。相信 AI 能夠同數(shù)值天氣預(yù)報(bào)一起,革新天氣的預(yù)報(bào)方式,為農(nóng)林牧漁、航海航天事業(yè)的發(fā)展貢獻(xiàn)出自己的力量。

參考鏈接:

[1]https://journals.ametsoc.org/view/journals/mwre/29/12/1520-0493_1901_29_551c_tpbolw_2_0_co_2.xml

[2]https://cir.nii.ac.jp/crid/1573668925699683328

[3]https://www.nature.com/articles/nature14956

[4]https://arxiv.org/abs/2202.11214

[5]https://arxiv.org/abs/2212.12794

[6]https://phys.org/news/2023-09-ai-weather-showcase-data-driven.html

[7]https://arxiv.org/abs/2307.10128

—— 完 ——

評(píng)論
內(nèi)蒙古四子王旗
大學(xué)士級(jí)
人工智能在氣象領(lǐng)域的應(yīng)用,不僅將給人們提供更精準(zhǔn)的預(yù)報(bào)服務(wù),還將給氣象行業(yè)甚至整個(gè)大氣科學(xué)帶來(lái)變革。
2023-11-10
天津.諸葛
少師級(jí)
AⅠ基于大數(shù)據(jù),依托自己超級(jí)學(xué)習(xí)能力,正將自己的優(yōu)勢(shì)滲透進(jìn)入傳統(tǒng)的天氣預(yù)報(bào)中,顛覆了我們的傳統(tǒng)認(rèn)識(shí),提升了天氣預(yù)報(bào)的時(shí)效性、準(zhǔn)確性,表現(xiàn)不俗,大有潛力。
2023-11-10
尖刀情懷永遠(yuǎn)跟黨走
大學(xué)士級(jí)
人工智能學(xué)習(xí)和分析數(shù)值天氣預(yù)報(bào),其速度快且精確,是今后數(shù)值天氣預(yù)報(bào)的一個(gè)趨勢(shì)。盡管現(xiàn)在人工智能參與數(shù)值天氣預(yù)報(bào),只是一個(gè)開(kāi)端,隨著人工智能學(xué)習(xí)能力和分析能力的不判提升,結(jié)合衛(wèi)星提供的云圖數(shù)據(jù),其預(yù)報(bào)將更準(zhǔn)確、更快速!
2023-11-10