機械学習を用いたダウンスケーリングでは、目的変数に観測値を用いる方法と数値モデルの出力値を用いる方法があります。観測値を用いる方法では、完全予報 (Perfect prognosis: PP)、超解像 (Super-Resolution: SR)、気象ジェネレーター (Weather generator: WG)、およびモデル出力統計 (Model Output Statistics: MOS) の4 つの方法に分けられます。PPは全球気候モデルスケール (~100 km) の低解像出力値と局所スケールの観測値 ( 降雨量など)の関係性からダウンスケーリング推定値を求めます。通常、説明変数となる全球気候モデル出力値は、複数の要素の組み合わせ(温度、風、湿度など)で構成されます。例えば、降水量を推定する場合、降水に関係がありそうな複数の要素を説明変数として採用します。関係性の説明が比較的容易であり、以前から多くの研究が行われています。SRは、低解像画像と高解像画像の関係性を学習し、低解像画像から高解像画像を推定する手法であり、画像処理技術を応用した方法として医療や衛星画像処理などに一般に広く利用されています。WGは、対象要素の時空間ダイナミクス、相関構造、持続性、自然変動を正確に再現することを目的として、確率統計モデルを用いてモデル予測値などから合成された様々な天気パターンを作成します。MOSは、観測値と全球気候モデルの統計量の関係性を用いて全球気候モデルの出力値を直接バイアス補正します。代表的な手法として分位マッピング法があります。一方、数値モデルの出力値を用いる方法はRCMエミュレータと呼ばれており、力学的ダウンスケーリングで用いる数値モデル(Regional climate model: RCM)の出力値をエミュレート(模倣)することにより、実際に数値モデルを作動させるより遥かに高速でダウンスケーリングを行います。最近では、畳み込みニューラル ネットワーク(CNNs)、 U-Net、 敵対的生成ネットワーク(Generative Adversarial Networks: GAN)、拡散モデル(Diffusion Models)、コンピュータービジョン(computer-vision algorithms) などの高度な深層学習を用いて高精度の推定値を求める試みが行われています。一方で、各手法にそれぞれ問題点や課題があります。
気象庁 ガイダンスの開発と運用
https://www.jma.go.jp/jma/kishou/books/nwpreport/64/chapter3.pdf
Rampal, Neelesh, et al. “Enhancing Regional Climate Downscaling Through Advances in Machine Learning.” Artificial Intelligence for the Earth Systems (2024).