本發明涉及一種預報方法,尤其涉及一種基于優選物理因子的極端雨強潛勢智能預報方法。
背景技術:
1、極端雨強具有局地性、突發性、致災性強的特點,其成因十分復雜,涉及多尺度因子(天氣尺度系統、中小尺度對流系統、地形作用等)的影響。全球氣候變暖背景下,極端雨強事件頻發,災害影響日益嚴重。
2、目前,數值天氣預報模式(簡稱數值模式)是開展降水預報業務的主要手段。然而,由于數值模式在初始場、物理過程、動力框架等方面存在的諸多限制,導致其對于強降水預報,尤其是極端雨強預報方面表現出明顯不足,具體表現為對極端雨強中心極值的顯著低估,以及對極端雨強落區預報的嚴重偏差,特別是對超過24小時的極端雨強,幾乎沒有預報技巧。
3、再者,傳統的偏差訂正方法,如“頻率匹配”法,是通過將數值模式降水預報的頻率訂正為觀測降水頻率以此來消除數值模式降水預報的系統性偏差。其缺陷在于僅能改正中小量級降水的預報偏差,而無法訂正強降水特別是極端降水的預報偏差。此外,盡管近年來興起的人工智能技術在數值模式降水預報的非線性偏差訂正方面有所進展,但對于小樣本事件(如極端降水)的學習效果仍不佳。
技術實現思路
1、為了解決上述技術所存在的不足之處,本發明提供了一種基于優選物理因子的極端雨強潛勢智能預報方法。
2、為了解決以上技術問題,本發明采用的技術方案是:一種基于優選物理因子的極端雨強潛勢智能預報方法,包括有以下步驟:
3、步驟1、準備用于極端雨強智能預報模型訓練的數值模式預報數據,數據涵蓋地面要素和高空要素;
4、步驟2、準備用于極端雨強智能預報模型訓練的降水觀測數據,降水觀測數據為逐小時網格觀測數據;
5、步驟3、基于步驟1收集的數值模式預報數據,計算基于數值模式的物理診斷量;
6、步驟4、基于數值模式的直接輸出量和步驟3計算的物理診斷量,構建極端雨強智能預報模型的預報因子,獲得預報因子數據集;
7、步驟5、對預報因子進行敏感性分析并進行初步篩選,選擇高敏感性物理量作為極端雨強智能預報模型的預報因子;
8、步驟6、對極端雨強智能預報模型的預報因子進行降維處理,以優化篩選;
9、步驟7、對降水觀測數據構建時空鄰域的模糊匹配觀測標簽;
10、步驟8、構建最佳極端雨強平衡樣本訓練集;
11、步驟9、對最佳極端雨強平衡樣本訓練集進行數據清洗和標準化預處理;
12、步驟10、構建極端雨強智能預報模型并優化關鍵參數,以獲得最優極端雨強智能預報模型;
13、步驟11、應用最優極端雨強智能預報模型進行預報,輸出0-72小時逐3小時的極端雨強的潛勢預報,并進行預報效果評估。
14、作為優選地,步驟1中,所準備數值模式預報數據為數值模式近5年0-72小時預報時效的輸出變量,涵蓋地面要素數據和高空要素數據,包括總降水量、對流性降水量、大尺度降水量、海平面氣壓、地表氣壓、地面2m氣溫、地面2m露點、大氣溫度場、位勢高度場、三維風場;數據的空間分辨率為0.125°,時間分辨率為逐3小時。
15、作為優選地,步驟2中,降水觀測數據為逐小時網格觀測數據,空間分辨率為1km,時間分辨率為1小時。
16、作為優選地,步驟3中,所計算的物理診斷量為各氣壓層的渦度、散度、水汽通量散度、假相當位溫,以及描述大氣層結穩定狀況的k指數、a指數。
17、作為優選地,步驟4中,預報因子數據集的構建過程為:
18、基于步驟1中收集的數值模式各預報時效直接輸出氣象要素,以及步驟3中計算得到的物理診斷量的計算結果,構建各預報時效的極端雨強智能預報模型的預報因子數據集,各預報時效為3小時、6小時、9小時、...、72小時。
19、作為優選地,步驟5中,預報因子敏感性分析與初步篩選過程為:
20、基于步驟2收集的逐小時降水網格觀測數據,和步驟3收集的數值模式物理量零場預報數據,逐格點計算極端雨強與非極端雨強事件發生時對應的物理量的概率密度分布;將均值差異超過一倍標準差的物理量作為極端雨強智能預報模型的預報因子。
21、作為優選地,步驟6中,預報因子的降維處理通過主成分分析創建一組不相關的預測因子,通過試驗保留不同的主成分個數時對模型評分的影響,來選定最終保留的主成分數。
22、作為優選地,步驟7中,降水觀測數據的時空鄰域模糊匹配方法為:
23、首先,基于逐小時降水網格觀測數據,構建逐小時極端雨強的一級原始觀測標簽,即逐小時逐格點判斷是否有>50毫米/小時的觀測降水出現,如果有,則在該小時該格點上將原始觀測標簽記為1,如果無,則即記為0;
24、然后,構建極端雨強的二級觀測標簽,即在滿足一級原始觀測標簽為1的條件下,根據數值模式的預報時效,判斷各時效覆蓋的3小時內是否出現>50毫米/小時觀測降水,如果有,則將二級觀測標簽記為1,如果無,則即記為0;
25、最后,構建極端雨強的三級觀測標簽,即在滿足二級標簽為1的條件下,判斷各時效覆蓋的3小時內目標格點及周圍0.25°范圍內,是否出現>50毫米/小時觀測降水,如果有,則將三級觀測標簽記為1,如果無,則即記為0。
26、作為優選地,步驟8中,最佳極端雨強平衡樣本訓練集的構建方法為:
27、使用隨機下采樣方法,從非極端雨強樣本中分別隨機抽取極端雨強樣本數1倍、2倍、3倍的樣本,構建新的非極端雨強樣本集,所述非極端樣本即:觀測標簽記0的樣本;
28、將極端雨強樣本和新的非極端雨強樣本按不同比例構成多個極端雨強平衡樣本集,不同比例包括1:1、1:2、1:3,并開展模型訓練試驗,確定極端雨強樣本數與非極端雨強樣本的最佳比例,最終構建最佳極端雨強平衡樣本集。
29、作為優選地,步驟11中,基于二分類思想,通過構建特定閾值50毫米/小時下的混淆矩陣,來計算不同的降水預報評價指標,包括風險評分ts、命中率pod、空報率far、以及漏報率mar,計算公式如式7-10所示:
30、風險評分ts=正命中數/(正命中數+虛警數+漏報數)?????(7)
31、命中率pod=正命中數/(正命中數+漏報數)??????????(8)
32、空報率far=虛警數/(正命中數+虛警數)????????(9)
33、漏報率mar=漏報數/(正命中數+漏報數)???????????(10)。
34、本發明公開了一種基于優選物理因子的極端雨強潛勢智能預報方法,解決了現有數值模式對未來3天極端雨強預報中存在的顯著偏差問題,特別是對于降水量級的低估以及落區預報的偏差。通過引入優選的數值天氣預報模式物理因子預報現場與高時空分辨率的降水觀測數據,結合機器學習建模,實現0-72小時(未來三天)逐3小時極端雨強潛勢預報命中率的有效提升。
1.一種基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:包括有以下步驟:
2.根據權利要求1所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟1中,所準備數值模式預報數據為近5年數值天氣預報模式0-72小時預報時效的輸出變量,涵蓋地面要素數據和高空要素數據,包括總降水量、對流性降水量、大尺度降水量、海平面氣壓、地表氣壓、地面2m氣溫、地面2m露點、大氣溫度場、位勢高度場、三維風場;數據的空間分辨率為0.125°,時間分辨率為逐3小時。
3.根據權利要求2所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟2中,降水觀測數據為逐小時網格觀測數據,空間分辨率為1km,時間分辨率為1小時。
4.根據權利要求3所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟3中,所計算的物理診斷量為各氣壓層的渦度、散度、水汽通量散度、假相當位溫,以及描述大氣層結穩定狀況的k指數、a指數。
5.根據權利要求4所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟4中,預報因子數據集的構建過程為:
6.根據權利要求5所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟5中,預報因子敏感性分析與初步篩選過程為:
7.根據權利要求6所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟6中,預報因子的降維處理通過主成分分析創建一組不相關的預測因子,通過試驗保留不同的主成分個數時對模型評分的影響,來選定最終保留的主成分數。
8.根據權利要求7所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟7中,降水觀測數據的時空鄰域模糊匹配方法為:
9.根據權利要求8所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟8中,最佳極端雨強平衡樣本訓練集的構建方法為:
10.根據權利要求9所述的基于優選物理因子的極端雨強潛勢智能預報方法,其特征在于:步驟11中,基于二分類思想,通過構建特定閾值50毫米/小時下的混淆矩陣,來計算不同的降水預報評價指標,包括風險評分ts、命中率pod、空報率far、以及漏報率mar,計算公式如式7-10所示: