観測データの利用には、 観測期間の長さや将来の気候シナリオの予測変数空間が観測訓練データの分布から大きく外れていることなどの問題があります。観測データ問題では、物理シミュレーションと観測データの両方のトレーニングを統合するハイブリッド ダウンスケーリング戦略が有効かもしれません。 ハイブリッドアプローチの一例は、関連するタスクからの学習または知識を組み合わせる転移学習として知られる技術によるものです。 転移学習はアルゴリズムの精度を向上させるだけでなく、効率、堅牢性、一般化可能性も促進します。 転移学習技術は天気予報と季節予測で成功しています。 転移学習の最近の進歩には、さまざまな予測のための ERA5 再解析 (Hersbach et al., 2020) と CMIP6 気候モデル予測 (Eyring et al., 2016) の両方でトレーニングされた ClimaX 基礎アルゴリズムが含まれます。 タスク。 ClimaX の事前トレーニング済みの基本アルゴリズムは、その後、観察によるダウンスケーリングなど、より具体的なタスクに合わせて微調整されました。
ClimaX (Nguyen et al., 2023) からの洞察を活用すると、RCM シミュレーションは、ML ベースの観測ダウンスケーリング アルゴリズムの効果的な前処理段階として機能できます。 まず、CORDEX などの公的に利用可能なデータセットからの予測変数と予測変数 (疑似観測) を使用して「疑似」PP/SR を実行するアルゴリズムを「事前トレーニング」できます。 微調整として知られる第 2 フェーズでは、PP または SR アプローチを使用して、歴史期間の再解析または観測データセットに基づいてアルゴリズムを再トレーニングします。 ここで、基本アルゴリズムの重みは多くの場合凍結され、トレーニングの第 2 フェーズの初期状態として機能します。アルゴリズムのパフォーマンスと将来の推定能力は、過去の記録で入手可能なものよりも広範囲かつ多様な気象現象にアルゴリズムを適用させることで得られます。 Ham et al., (2019) は、アルゴリズムを最初に CMIP5 シミュレーションで事前トレーニングし、その後観測値を微調整した場合に、エルニーニョ南方振動の予測パフォーマンスが向上したことを発見しました。 彼らは、事前トレーニングに使用される CMIP5 データの量に応じてアルゴリズムのスキルが向上することを発見しました。
https://microsoft.github.io/ClimaX/
https://euro-cordex.net/060378/index.php.en
コメント:
転移学習:別の目的で作成された学習モデルを利用して新たに学習モデルを構築する手法。転移元と転移先のデータの関連性が低い場合は転移のパフォーマンスが低下することもある。
気候ダウンスケーリングに転移学習を実施する狙いは、気候変動を広くカバーしながらバイアス補正することにより、予測精度を向上させることにあると思われます。懸念されることとして、第1フェーズと第2フェーズのそれぞれの学習に強く影響された特性を持つ結果が出力される可能性も想定されます。各フェーズのデータを関連付けて調整できるかが成功の鍵になると思われます。