現在の気候モデルでは、モデルのグリッドサイズより小さいスケールで発生するプロセスの表現が難しく、不確実性の主な原因となっています。 最近の機械学習 (ML) アルゴリズムは、そのようなプロセス表現を改善する可能性がありますが、MLの外挿では学習していない大きく変化した気候での推定が不十分になる傾向があります。 そこで、Beucler, Tom, et al (2024)では物理的および統計的な気候プロセスの知識を ML アルゴリズムに組み込んだ「気候不変」ML と呼ばれるフレームワークを提案しました。このフレームワークでは広範囲の気候変化に対して高い精度を維持できることを示しました。 これは、地球システムのML データ駆動型モデルに物理的知識を明示的に組み込むことにより、気候変化に関わらずモデルの一貫性、データ効率、一般化可能性を向上できることを示唆しています。
気候が大きく変化する状況において、ML 気候ダウンスケーリングの外挿では誤差が大きくなることが多く報告されています。例えば、寒冷な気候で学習したMLアルゴリズムを温暖気候に適用すると、推定誤差が大きくなるケースが確認されています。これは、気候変化プロセスに対して、MLの外挿法では対応が困難であることを示唆しています。そこで、気候が変わっても変化しないマッピングを定義して、入力/出力データを、異なる気候間で分布がほとんど変わらない入力/出力に変換します。例えば、比湿qの確率密度関数(PDF)は気候が温暖化するにつれて広範囲に拡張します。比湿(q)-相対湿度 (RH) 変換では、比湿度をその飽和値で正規化することにより、過飽和状態を除いて、RHのPDF のほとんどは [0,1] 内にあり、気候が温暖化してもほとんど変化しません。q-RH変換により格子スケールの飽和を捉えることができます。同様に、温度Tに対しては、湿潤静的エネルギー(MSE)保存から、プルーム浮力 (T-buoyancy)に変換、潜熱フラックス(LHF)に対しては、地表付近の水平風の大きさと密度にほぼ比例する LHFΔq (分布は温暖化に伴ってあまり変化しない)に変換します。
本論での気候不変モデルの目的は、 大規模 (約 100 km) の気候状態を表す入力ベクトル x と、解像された対流と〜1 km スケールでの放射輸送と乱流混合による熱力学的特性をグループ化する出力ベクトル y の間の気候不変マッピングを構築(図1参照)し、x ↦ y のマッピングの全体的な構造を固定し、学習および一般化環境 (分布外予測) で y をできるだけ正確に予測することです。
コメント:
気候不変モデルで、物理的、統計的制約を課したマッピングを学習し、正則化手法(過剰適合を防ぐ方法)を併用することにより、実際のデータを使用した場合よりも、上記に示した変換をを行うことにより、サブグリッドでの熱力学的性質の誤差が大幅に低減されることを示しています(論文Fig4, Fig.5)。これは、水惑星シミュレーション(陸地なし)から実際の気候モデルシミュレーションに一般化する場合でも有効に機能することを示しており、ML エミュレータを構築する上で重要な知見を含んでいます。これにより、分布外予測の誤差を抑制し、予測の不確実性を大幅に低減することが期待されます。気候不変変換自体は極めてシンプルであるため、本手法だけでなく様々なML気候ダウンスケーリング手法に適用可能と思われます(正則化には工夫が必要かも)。ただし、降水については対応は難しい?
Beucler, Tom, et al. “Climate-invariant machine learning.” Science Advances 10.6 (2024): eadj7250.