近年來,隨著OpenAI等頭部AI大模型企業的快速發展及全球算力的大幅提升,AI大模型技術已廣泛應用各個領域,并從辦公、零售、客服、金融、營銷等基礎領域進一步向實體經濟場景不斷拓展。如智能家居、智能交通、智慧城市、工業制造、智慧醫療等行業,AI大模型可以為用戶提供智能交通調度、智慧醫療診斷、智能排產、智慧電網等更加深度的行業解決方案,從更底層的服務與基礎設施層面賦能社會經濟發展。與此同時,在傳統的巨災風險預測預報場景中,如極端天氣預報、洪水預測、臺風路徑預測等領域,仍在大量應用各類基于物理規則的數值模型,基于CPU的串行計算邏輯消耗了大量的計算資源,預測能力也存在明顯瓶頸。
在這樣的背景之下,部分企業、高校、科研機構等開始嘗試將AI大模型技術應用于巨災風險的預測、預警及評估之中,特別是在天氣及氣象的預報預測等領域中,涌現出了一大批具有良好應用效果的模型,如華為Panggu模型、Google DeepMind的DGMR模型、中國氣象局與清華大學聯合研發的NowCastNet模型、中國氣象局風清、風雷、風順模型、復旦大學Fengwu模型、ECMWF的AIFS模型、Google的NeuralGCM模型等等,這些模型總體上達到甚至超越了傳統數值模型的預測效果,同時,由于其基于GPU的并行計算架構,預測所消耗的資源僅為傳統數值模型的成千上萬分之一;此外,在洪水預測、地震波監測等領域,國內國外相關企業與機構也相繼發布了專有的AI大模型,取得了較好的效果。本文以氣象領域AI大模型的主要應用為例,分析AI大模型在巨災風險預測中的應用及發展趨勢。
一、AI大模型進步迅速,能力已接近人類
當前,隨著AI大模型參數規模的不斷增長、算法的不斷改進、算力的不斷增強,AI大模型已具備強大的自然語言處理、圖像/視頻處理、語音識別能力,最新AI大模型已擁有類似于人類的深度思考能力,并在物理、化學、數學等眾多領域媲美甚至超越人類博士生水平。
在由真實世界軟件任務組成的SWE-Bench Verified基準測試中,OpenAI o3模型的準確率為71.7%,這意味著它已經能夠理解、設計和實現復雜的軟件系統。在全球知名編程競賽Codeforces中,o3可以達到2727的分數,超越99.99%的人類水平。
在數學競賽AIEM 2024中,o3準確率達到96.7%。GPQA Diamond(博士級科學考試)是生物學、物理學和化學領域專家編寫的高難度多項選擇題數據集,主要評估人工智能系統在復雜問題上的表現。 而這些領域的博士專家,大約也只能達到專業范圍內的70%準確率,o3拿到了87.7%的鉆石級成績,其表現遠高于人類專家的表現。有觀點認為,隨著AI大模型能力的不斷提升,通往通用人工智能(AGI)之路已無技術障礙。
與此同時,AI大模型在各行各業的應用與滲透也在快速進展中,其中,辦公、零售、科研、醫療、工業制造、金融、氣象等行業已對AI大模型進行了廣泛而深入的探索,取得了良好的效果,根據部分研究機構的判斷,AI大模型有望在未來3-5年內在主要行業內取得良好的成熟度與市場變現能力。
在不斷拓展行業應用的同時,AI大模型的落地場景也正從淺層次的客服對話、文本生成等向供應鏈管理、醫療、質檢等核心業務環節滲透,AI大模型有望成為新型生產力基礎設施,賦能千行百業。
二、AI大模型在氣象領域的應用
短期天氣的預報和中長期氣候變化的預測,是巨災風險管理中的重要領域,包括對臺風路徑、極端降水、短時大風、極端高溫、氣溫變化等的預測,這些預測預報對保險企業及客戶做好風險管理及應對有著重大的現實意義。
(一)傳統的數值天氣預報
數值天氣預報(Numerical Weather Prediction,NWP)是氣象預報的制作不可缺少的重要基礎和手段,其基于大氣科學理論,以大氣運動方程組為基礎,利用超級計算機對大氣狀態進行數值模擬,通過給定初始條件和邊界條件,計算出未來不同時刻的氣象要素值,如溫度、濕度、氣壓、風速等。
1950 年,普森林頓大學首次嘗試使用第一臺電子計算機進行了天氣預報。1954 年,在斯德哥爾摩首次實現了實時的天氣預報。數值預報需要基于天氣初始場,利用大氣運動方程的近似表示進行數量龐大的計算。以歐洲中期天氣預報中心(ECMWF)的預報為例,0.125°*0.125°(間距約15公里)分辨率,垂直方向從地面到中間層(地面以上約80公里)劃分為91層,使用數小時到數天的時間窗,每一個水平層有200萬個個點,以10分鐘為步長進行10天的預報,相應的集合預報中有50個集合成員,每天大約需要有400多億個格點柱的運算需要計算。
目前,傳統的數值天氣預報(NWP)已具有非常好的短期預報準確率,但其本質上還是讓超級計算機去求解非常復雜的方程組來模擬大氣運動,從而預測未來一定時間內的大氣運動狀態和天氣氣象,并在其基礎上進行人工經驗的修正,這種模式仍然存在一定的局限性和面臨諸多挑戰:一是初始場對預測準確性影響大,在NWP方式中,初始場非常重要,要將非常精確的實時天氣初始值輸入到超級計算機中,但由于觀測數據的時空分辨率仍然有限,在一些偏遠地區和海洋區域,觀測站點稀疏,數據獲取困難,這也影響了預報的準確性;二是多因素相互作用影響復雜,在現實中,大氣環境是一個高度復雜的非線性系統,其變化受到多種因素的影響,產生一系列連鎖反應,如太陽輻射、地球自轉、海陸分布、地形地貌等,這些因素的相互作用使得氣象現象具有很強的不確定性,難以完全準確地預測;三是傳統數值預報的成本非常高。全球超過 180 個氣象建模中心采用強大的高性能計算(HPC)基礎設施來運行傳統的數值天氣預報(NWP)模型,其中包括歐洲中期天氣預報中心(ECMWF),該中心運行在983,040個CPU核心上,以及英國氣象局的超級計算機,該計算機采用超過150萬個CPU核心,耗電量為2.7兆瓦特。數值預報每次預報所耗費的時間較長,難以高頻率地進行預測,特別是如果要將分辨率提高,計算時間可能要顯著翻倍。
(二)AI大模型在氣象領域的探索
在天氣預報及氣象預測領域,根據預報/預測周期的長短,可劃分為短臨氣預報、中期天氣預報及次季節/季節尺度預測幾類,不同時間周期的AI大模型具有不同的預報/預測顆粒度,能夠幫助保險公司及承保標的做好風險定價、風險預警、風險防范、風險處置等工作。針對傳統數值模型存在的預測成本高、計算復雜等問題,AI大模型在不同的時間尺度上均進行了嘗試和探索,取得了良好的效果,部分模型已在氣象部門開展業務化運行,為氣象部門做好相關工作提供了有價值的參考。
短臨天氣預報AI大模型
0~2小時的預報稱為臨近預報,2~12小時的預報稱為短時預報,短臨天氣預報主要聚焦在未來數小時內局部區域的降水、暴風等的預測,可以用于巨災風險過程中的風險預警與防災減災,傳統NWP數值天氣預報在2小時內的天氣預報準確率會顯著下降。Google DeepMind等商業公司和牛津大學、清華大學、中山大學等國內外高校近年來將人工智能技術應用于短臨降水預報中,取得了良好的效果,成為短臨降水預報的有效補充手段。
目前,常見的短臨天氣預報AI大模型主要用于對短期內的降水情況進行預報,基于歷史雷達觀測數據進行訓練,分辨率一般較高,空間分辨率可達到1km*1km,時間分辨率可以達到2-6分鐘;在核心算法方面,短臨天氣預報AI大模型大多采用U-Net,另有部分模型采用類似生成式對抗網絡GAN及Transformer的算法。同時,在短臨天氣預報領域,越來越多的模型將數據驅動與物理規律相結合,以求取得更好的預測結果。
以NowCastNet模型為例,2023年,清華大學軟件學院與國家氣象中心、國家氣象信息中心提出NowcastNet極端降水臨近預報大模型,并已在國家氣象中心短臨預報業務平臺(SWAN 3.0)部署上線,將為全國極端降水天氣短臨預報業務提供支撐。NowCastNet使用了來自美國MRMS數據2016年至2021年6年范圍內空間網格分辨率0.01、時間分辨率為10分鐘的雷達觀測資料完成了模型的預訓練,并在中國雷達數據(2019.9.1-2021.3.31)上進行微調訓練,并在2021.4.1-6.30數據上進行測試。
對比同為生成模型的DGMR,以及PredRNN、PySTEPS等方法,評價指標采用CSI和PSD,該方法大幅領先國際上的同類方法,在71%的案例中排名第一,研究成果已在Nature發表。
NowcastNet模型是一個基于物理條件的深度生成模型,包括一個隨機生成網絡和一個確定性演變網絡,其核心是端到端建模降水物理過程的神經演變算子,將物理演變與條件學習相結合,通過神經網絡進行端到端的學習,以最優化預測誤差,從而提高對極端降水的預測性能,NowCastNet首次將降水臨近預報時效延長到了3小時,可以在2048km*2048km的區域產生高分辨率的預報。
2021年5月14日23時40分,中國江淮地區出現強降水過程,湖北、安徽等多個地區發布了暴雨紅色預警,NowcastNet可以準確預測出三個強降水超級單體的變化過程。
2021年12月11日9時30分,美國中部地區突發龍卷風災害,造成89人死亡、676人受傷,NowcastNet可以對強降水的強度、落區和運動形態等給出更清晰、更準確的預報結果。
中期天氣預報AI大模型
中期天氣預報是對未來于4至10天內天氣變化趨勢的預報。傳統的中期天氣預報一般是基于數值預報(NWP)方式開展的,歐洲中期天氣預報中心(ECMWF)、中國氣象局(CMA)、全球預報系統(GFS)等均發布了自己的中期天氣預報產品。近年來,中期天氣預報AI大模型大量涌現,常見的模型包括谷歌DeepMind的GraphCast、華為云的Pangu-Weather(盤古)、阿里巴巴的SwinVRNN、復旦大學開發的Fuxi(伏羲)、上海人工智能實驗室的Fengwu(風烏)、英偉達Nvidia的FourCastNet,以及歐洲中期天氣預報中心(ECMWF)的AIFS模型等,這些模型利用最新的人工智能和機器學習技術,顯著提升了中期天氣預報的準確性和細節層面的分析能力。
數據驅動的基于AI大模型的中期天氣預報是研究非常活躍的應用領域,自2018年以來,眾多研究機構、企業基于不同的AI大模型,推出了自己的天氣預報模型,已實現了與傳統數值預報相當甚至更好的預報準確率與分辨率。
目前,常見的中期AI天氣預報主要用于對5個地表變量+5個大氣變量進行預報,空間分辨率一般為0.25*0.25,部分可以達到0.09*0.09,時間分辨率方面一般為6小時;大多數采用數據驅動作為模型內核,少數模型開始探索將數據驅動與物理規則相結合;在核心算法方面,不同改進形式的Transformer是主流,少數采用GNN作為核心算法,訓練數據方面,大多采用ERA5再分析數據,少數國產模型采用國產CRA-40再分析數據,另有部分模型開始探索使用直接觀測數據進行訓練。
以華為推出的盤古氣象大模型為例,盤古氣象大模型是由華為于2023年提出的一種新的高分辨率全球AI氣象預報系統,盤古氣象大模型借助創新的3DEST(3D Earth-Specific Transformer)網絡結構,精準獲取了地球上每一個經緯度的氣象天氣要素,共訓練了4個模型,分別為1小時間隔、3小時間隔、6小時間隔、24小時間隔模型。為訓練每個模型,研究者使用1979-2017年的ERA5氣象再分析數據進行了訓練,模型共有6400萬個參數量。
盤古氣象大模型是首個精度超過傳統數值預報方法的AI方法,相關研究論文于2023年7月6日登上《Nature》,目前,華為盤古氣象大模型已實現在歐洲中期天氣預報中心(ECMWF)實現業務運行。盤古氣象大模型1小時-7天預測精度均高于傳統數值方法(即歐洲氣象中心的operational IFS),同時,在單個V100 GPU上,僅用1.4秒即可完成對全球的24小時天氣預報,包括位勢、濕度、風速、溫度、海平面氣壓等,預測速度提升10000倍。
盤古氣象大模型的水平空間分辨率達到0.25°×0.25° ,時間分辨率為1小時,覆蓋13層垂直高度,可以精準地預測細粒度氣象特征,并且保留了大量細節幫助人們進一步了解極端天氣。作為基礎模型,盤古氣象大模型還能夠直接應用于多個下游場景。
在對 ERA5 再分析數據的確定性預測中,Pangu-Weather 在所有測試變量上均表現出色。相比世界上最好的數值天氣預報系統 ECMWF 的業務集成預報系統(IFS)和 FourCastNet,Pangu-Weather 的均方根誤差(RMSE)更低,異常相關系數(ACC)更高。例如,在 5 天的 Z500(500 hPa 位勢高度)預報中,Pangu-Weather 的 RMSE 為 296.7,低于 IFS 的 333.7 和 FourCastNet 的 462.5。
在追蹤熱帶氣旋等極端天氣事件方面表現優秀,通過尋找海平面氣壓(MSLP)的局部最小值,算法在追蹤 2018 年的 88 個命名熱帶氣旋時達到了較高的精度。
中期天氣預報是當前氣象領域AI大模型應用研究最為活躍,也是各類AI大模型最多的領域,Google Research的Weather Bench2項目,對主要的中期天氣預報產品進行了評測對比,從地表數據、高空數據兩個方面,對市場上主流模型的預測能力進行了評測對比,從評測結果可以看到,AI大模型預測能力已達到甚至超越傳統數值模型。
次季節/季節氣象預測AI大模型
次季節-季節尺度(Sub-seasonal to Seasonal, S2S)預測是指對未來兩周到兩個月(即15到60天)內的天氣和氣候進行預測。這種預測介于常規的天氣預報和季節預測之間,能夠提供更長時間尺度的天氣變化信息氣象預報,S2S預測面臨很多技術難題,簡單的沿著天氣預報大模型的思路延長預報時長,并不能帶來超過傳統數值預報模式的技巧提升。
2013年WMO聯合世界天氣研究計劃和世界氣候研究計劃聯合發起季節內到季節尺度預測計劃(S2S),目的是在中期天氣預報(兩周)和氣候預測(季度)之間架起一座橋梁,實現天氣氣候一體化的無縫隙預報。S2S也是我國防災減災和氣象服務的一個重大的需求。
常見的次季節-季節尺度氣象AI預測模型主要有微軟的DLWP、谷歌的NeauralGCM和清華大學與中國氣象局聯合研發的風順大模型等。
目前,常見的次季節-季節氣象預測AI大模型一般預測從數周到數月的氣象狀況,部分模型開始探索將數據驅動與物理規則相結合;訓練數據方面,大多采用ERA5再分析數據,少數國產模型采用國產CRA-40再分析數據。
以Google發布的次季節/季節尺度氣象預測AI大模型NeuralGCM為例,NeuralGCM是Google于2024年提出的一種新的將物理建模與人工智能相結合的大氣環流模型,其能夠快速、準確地模擬地球大氣,在模擬效率方面,比傳統模型高出10萬倍。這個模型結合了機器學習和物理方法,能進行中短期的天氣預報以及幾十年的氣候模擬。
對于2-15天的天氣預報,NeuralGCM比最先進的物理模型更加準確;對于氣候尺度的預測方面,NeuralGCM也優于最先進的大氣模型,在對1980-2020年間全球氣溫預測中,NeuralGCM的2.8確定性模型的平均誤差是大氣模型(AIMP)誤差的1/3。在2020年的氣候模擬期間,NeuralGCM還成功預測了熱帶氣旋模式,這些模式與當年在相同區域觀察到的風暴數量和強度相匹配,NeuralGCM是第一個能夠生成此類模式的基于機器學習的模型。
相比于高分辨率的大氣模型X-SHiELD,NeuralGCM的1.4°確定性模型在預測2020年的濕度和溫度數據時誤差減少了15-50%,同時,其1.4°模型比X-SHiELD快3500多倍,這意味著如果研究人員用X-SHiELD模擬一年的大氣,需要20天,而用NeuralGCM只需8分鐘。總體而言,使用NeuralGCM進行氣候模擬的計算成本比X-SHiELD低10萬倍。
三、AI大模型在巨災風險模型中的應用趨勢
當前,AI大模型在巨災風險模型中已得到了廣泛的應用,特別是在氣象領域,涌現出了一大批優秀的模型及研究成果。以氣象領域為例看,AI大模型在巨災風險模型中的應用呈現出以下的趨勢:
(一)廣泛業務化運行。中國氣象局推出的覆蓋短臨期、中期、次季節/季節尺度的天氣預報、氣象預測AI大模型風雷、風清、風順,已于2024年陸續上線業務化運行,ECMWF(歐洲中期天氣預報中心)推出的AI天氣預報模型AIFS的首個業務化運行版本AIFS Single v1.0正式投入運行,與傳統的基于物理過程的集成預報系統(IFS)并行運行。AIFS Single每天與ECMWF基于物理的數值天氣預報 (NWP) 模型并行運行四次,預報結果通過ECMWF的開放數據平臺向公眾開放。
(二)AI大模型與數值模型雙向融合。部分數據驅動的天氣預報AI大模型已開始向模型中引入物理約束,并取得了良好的效果,如NowCastNet、風清、風雷、風順、NeuralGCM等;與此同時,部分數值氣象預報模型也開始將AI大模型的一些算法加入到計算過程中以加速計算過程。數據驅動的AI大模型與傳統數值模型之間有逐步走向融合的趨勢。
(三)對再分析數據的依賴逐步降低。當前,主流的中期天氣預報AI大模型的訓練及推理數據基礎主要依賴于經過同化的各類再分析數據,如ERA5、CRA-40等,這降低了AI大模型的適用場景,部分模型已開始嘗試使用原始數據進行模型的訓練及推理,降低對再分析數據的依賴,這有望進一步擴大AI大模型的應用范圍。
總的來看,近年來,AI大模型技術發展非常迅速,在巨災風險預測領域得到了廣泛的應用,特別是在本文關注的氣象領域,實現了以遠低于原有數值模型的成本實現接近甚至超越原模型的預測效果,這為保險公司更好預測巨災風險、降低災害損害、評估災害損失提供了強有力的工具,具有巨大的發展空間。
參考文獻:
1.REICHSTEIN, Markus, et al. Early warning of complex climate risk with integrated artificial intelligence. Nature Communications, 2025, 16. Jg., Nr. 1, S. 2564.
2.CAMPS-VALLS, Gustau, et al. Artificial intelligence for modeling and understanding extreme weather and climate events. Nature Communications, 2025, 16. Jg., Nr. 1, S. 1919.
3.MCNORTON, Joe Ramu, et al. A global probability‐of‐fire (PoF) forecast. Geophysical Research Letters, 2024, 51. Jg., Nr. 12, S. e2023GL107929.
4.GIRONA, Társilo; DRYMONI, Kyriaki. Abnormal low-magnitude seismicity preceding large-magnitude earthquakes. Nature Communications, 2024, 15. Jg., Nr. 1, S. 7429.
5.CHANTRY, Matthew, et al. AIFS-ECMWF's Data-Driven Forecasting System. In: 105th AMS Annual Meeting. AMS, 2025.
6.RAVURI, Suman, et al. Skilful precipitation nowcasting using deep generative models of radar. Nature, 2021, 597. Jg., Nr. 7878, S. 672-677.
7.CHEN, Kang, et al. Fengwu: Pushing the skillful global medium-range weather foecast beyond 10 days lead. arXiv preprint arXiv:2304.02948, 2023.
8.PATHAK, Jaideep, et al. Fourcastnet: A global data-driven high-resolution weather model using adaptive fourier neural operators. arXiv preprint arXiv:2202.11214, 2022.
9.LAM, Remi, et al. Learning skillful medium-range global weather forecasting. Science, 2023, 382. Jg., Nr. 6677, S. 1416-1421.
10.ANDRYCHOWICZ, Marcin, et al. Deep learning for day forecasts from sparse observations. arXiv preprint arXiv:2306.06079, 2023.
11.KOCHKOV, Dmitrii, et al. Neural general circulation models for weather and climate. Nature, 2024, 632. Jg., Nr. 8027, S. 1060-1066.
12.ZHANG, Yuchen, et al. Skilful nowcasting of extreme precipitation with NowcastNet. Nature, 2023, 619. Jg., Nr. 7970, S. 526-532.
13.BI, Kaifeng, et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature, 2023, 619. Jg., Nr. 7970, S. 533-538.
14.NEARING, Grey, et al. Global prediction of extreme floods in ungauged watersheds. Nature, 2024, 627. Jg., Nr. 8004, S. 559-563.
15.汪海濤, et al. 國內 AI 中期天氣預報大模型進展及面臨的挑戰. Computer Science and Application, 2024, 14. Jg., S. 196.