天気予報では数値予報モデルによる予報値が利用されますが、数値予報には解像度などモデルの不完全さに起因する多くの問題点があります。一般に、数値モデルでは計算機資源の制約から高解像度化が難しく、地形が粗く表現されます。降水特性は地形による影響を大きく受けるため、観測された降水分布と数値モデルで再現された降水分布の特性が大きく異なる場合があります。また、対流プロセスを詳細に再現できる非静力学モデルにより降水量の過小評価が大幅に改善されましたが、依然として過小評価傾向が見られるようです。数値予報モデルの予測結果をそのまま扱うのは難しいため、予測値と観測値を統計処理することにより予測値を観測値に翻訳、修正して気象予測情報を広く一般に使えるように加工しています。これをガイダンスと呼んでいます。ガイダンスでの予測手法には、カルマンフィルタやニューラルネットワークが用いられており、それらを最新の数値予報結果に適用することで未来の観測値に相当するガイダンスが作成されます。例えば、地形表現の粗さによって生じる規則的な誤差(系統的誤差)もガイダンスで修正することにより低減しています。予測手法では、一括学習型と逐次学習型があります。一括学習型では過去の数値予報と観測をそれぞれ説明変数と目的変数として予測式を求め、最新の数値予報値を適用してガイダンスを作成します。一括学習型は数値予報モデルが更新された時や観測場所が変更された場合などに過去のデータが使えなくなり、対応ができなくなる問題がありました。モデルの更新に対応するために、カルマンフィルタ及びニューラルネットワークなどを用いた逐次学習型手法が行われるようになりました。逐次学習型ガイダンスの欠点として、予測に比べて実況の降水量が非常に大きかった際に係数が大きく変化し、その後の予測精度が低下するなどの問題が生じます。ガイダンスでは、数年分のデータを使って作成されますが、データ期間にない稀な現象に対しては予測式を適合させることが難しく、記録的な大雨などでは推定が困難であると指摘されています。多くの機械学習手法にも当てはまりますが、学習のサンプル数が足りていない事例に対する予測は、信頼性が低く、誤差が大きくなる傾向があります。また、ガイダンスはモデルの擾乱の位置ずれ、擾乱の発生や強度の外れなどの誤差を修正することができません。この辺りを、最新の機械学習手法で予測できるのか、関心が高まっています。
https://www.jma.go.jp/jma/kishou/books/nwpreport/64/No64_all.pdf
https://www.jma.go.jp/jma/kishou/books/nwptext/51/2_chapter5.pdf