私たちのレビューでは、次の 3 つの重要な研究課題を中心に、これらの問題と気候ダウンスケーリングのための機械学習手法を批判的に診断しています。
a. 経験的ダウンスケーリングアルゴリズムは、極端な気候を含む現在の気候を適切に再現可能か?
全体として、最近の ML の進歩、特に敵対的生成ネットワーク (GAN) と拡散モデルでは、現在の気候とその極端な状況を再現する際の経験的ダウンスケーリング (観測的ダウンスケーリングと RCM エミュレーションの両方) の従来のアルゴリズムに比べて大幅に改善されました。従来の観察ダウンスケーリング アルゴリズムと RCM エミュレータ アルゴリズムは、より複雑な ML 経験的ダウンスケーリング アルゴリズム (GAN など) よりも単純でより解釈しやすく、一般に必要なトレーニング データが少なくなります。 ただし、その主な制限は、降雨量や地表風場などの変数を予測する場合に気候フィールドから複雑な時空間特徴を学習するのに苦労していることです。現在気候においては、畳み込みニューラル ネットワーク (CNN) が従来の経験的ダウンスケーリング手法よりも優れたパフォーマンスを発揮するということで、コンセンサスが得られています。 CNNは、気候フィールドから複雑な力学を学習することができ、特に風や降雨量などの変動要素について、極端な現象をより適切に解決するのに役立ちます。 CNN は、グリッド セルごとに個別のアルゴリズムを必要とすることが多い従来のアプローチとは異なり、1 つのアルゴリズムで大陸全体など、広範囲の地域にわたるダウンスケールにも容易に適用できます。 ただし、CNN アーキテクチャにも制限があります。 まず、トレーニング パラメーターの数が多いため、トレーニングには大量のデータが必要になることが多く、使用できるトレーニング データが限られている場合には問題が発生する可能性があります。 さらに、従来の統計的ダウンスケーリング アルゴリズムほどではないにせよ、「平均値への回帰」現象に悩まされ、極端な現象が過小評価されたり平滑化されたりする可能性もあります。
コメント:一般に、GANなどの高度な機械学習モデルは、従来型の単純な機械学習モデルと比較して、推定精度が高くなる反面、データハンドリングが複雑で結果の解釈が難しくなる傾向があります。CNNでは、従来のアプローチ*と異なり、例えば降水システム全体の空間分布特性を学習できるため、極端現象を含む複雑な降水パターンを推定できると期待されています。ただし、「平均値への回帰」現象、つまり極端現象のような少数事例を過小評価する問題については、今のところ有効な対策がありません。推定結果を細かく見ると、平滑化されたような(ぼやけた)降水分布になっているケースも多く見られます。
*従来型でも手法によっては、システム全体の空間分布特性を捉えることが可能です。