ガイダンスは、数値予報の地上気温や降水量などの予測値を補正してその誤差を軽減したり、数値予報が出力していない天気や発雷確率などを作成することによって、予報作業を支援するために作成されます。数値予報モデルが出力したデータは、予報官や一般のユーザーがただちに理解できる形式ではないために、ユーザーが使いやすい形に加工されます。つまり、1. 数値予報モデルの出力する膨大なデータからユーザーの利用目的に適した領域・要素等を選択し形式を整えてユーザーに提供、2. 数値予報モデルが直接予測しない晴れ、曇りなどの天気カテゴリーや降水確率などの要素を計算、3. 数値予報データに統計的な補正をすることによって、生の数値予報の結果より精度の良い予測値をユーザーに提供することを目的に作成されます。ガイダンスの典型的な作成手順として、1. 過去の数値予報結果とその予報期間に対応する観測データを収集し、予測値と観測値を統計処理することにより、予測値を観測値に翻訳するルール(予測式)を作成し、2. このルール(予測式)を最新の数値予報結果に適用することで未来の観測値(数値モデル補正値)を予測します。
ガイダンスでは、地形などの影響による系統誤差を軽減できます。数値予報モデルの予測が仮に完璧であったとしても、実際の地形との違いから誤差が生じます。例えば、観測される降水は地形効果によって強化されますが、数値予報モデルの地形は実地形よりもなだらかなので、数値予報モデルで予測される降水量は観測よりも少なくなりやすい傾向があります。また、気温や風についても同様にモデルと実際の地形の特性が大きく異なることから、系統誤差が発生します。これらの誤差はガイダンスで軽減することが可能です。ガイダンスの作成手法として、線形重回帰、カルマンフィルター、ニューラルネットワーク(機械学習)、ロジスティック回帰、頻度バイアス補正、係数の層別化、診断的な手法があります。それぞれの手法の特性は以下のようにまとめられます。
線形重回帰:予測式は係数と説明変数の積を足し合わせる形の線形多項式で、過去の数値予報結果と観測値のセットを数年分一括して統計処理して係数の作成を行います。利点として、係数が変化しないためにガイダンスの予測特性をユーザーが経験的に把握しやすい、説明変数を客観的に選択する手法あることで、欠点として、係数決定の為に過去の数値予報結果と観測を多量に準備する必要があり、数値予報モデルの変更に柔軟に対応できないことなどが挙げられます。
カルマンフィルター:現在主流となっている手法で、前回の予測と実況の差を考慮して係数を初期時刻毎に調整(最適化)します。これにより、数値予報モデルの変更(更新)や季節進行による予報特性の変化に柔軟に対応できます。欠点として、係数が最適化により変動し予測特性が変化するため、ガイダンスのユーザーが経験的に予測特性を把握することが難しいこと、ガイダンス開発の初期段階で説明変数や係数の最適化の特性を決めるパラメータを客観的に決める手段が無いことが挙げられます。
ニューラルネットワーク:機械学習手法を用いており、カルマンフィルターなどの線形な予測式では対処が困難な場合でも、取り扱う事ができる点に特徴があります。また、カルマンフィルターのように予測値と実況の差に応じて係数の予測の毎に調整(逐次最適化)を行うことにより、数値予報モデルの予測誤差特性の変化や数値予報モデルの変更にある程度追従することができます。一方で、機械学習手法であるため、予測式が複雑になり、ユーザーが説明変数と予測結果との関係を把握することが困難なこと、予測式が変化するためにユーザーが経験的に予測特性を把握することが困難なこと、また説明変数や中間層の数を客観的に選択する方法がないため、これらを試行錯誤により決める必要があり開発コストが高いことなど、欠点も多くなります。
ロジスティック回帰:実況が現象の有無の2値で表現できる現象の確率を求めたい時などに使われます。気象庁では発雷確率、雲底確率ガイダンスの作成に用いられています。ロジスティック回帰は確率値を扱うのに適した手法であり、非線形な関係であっても対数オッズ比を予測することにより精度の高い予測が可能です。欠点として、線形重回帰のガイダンスと同じように逐次学習ができないために数値予報モデルの変更などに柔軟に対応することが難しいことが挙げられます。
頻度バイアス補正:統計手法では、発生頻度の低い大雨や強風などは実況に対して予測頻度が低くなります。しかし気象予測ではこれらの極端現象を予測することが防災などの観点からは重要であるため平均的な予測誤差が多少悪くなっても発生頻度の低い現象の予測精度を上げたい時に頻度バイアス補正を用いています。具体的には、観測の頻度分布と予報の頻度分布が同じになるように補正を行います。観測と予測に閾値を設定して幾つかのカテゴリーを作り、対応するカテゴリーの現象の発生頻度が等しくなるように(バイアススコアが1となるように)予測の閾値を調整(学習)します。頻度バイアス補正は平均降水量、風、視程ガイダンスなどに用いられています。頻度バイアス補正を用いることにより、強風や大雨などの捕捉率を向上させることができますが、空振り率が増加してしまう欠点もあります。
係数の層別化:数値予報の系統誤差は、場所、対象時刻、予報時間、季節などで変化します。また、説明変数と目的変数の関係も変化するため、一つの予測式で全ての場合に対応する事は困難です。そこでm条件により予測式(係数)を複数使い分けて予測精度の向上させます。これを「係数の層別化」といいます。一方で、予測式を多くすれば、予測式を作成するためのサンプル数が少なくなり精度の高い予測式を作成できなくなる問題も出てきます。どの程度層別化を行うかが重要になります。
診断的な手法:近年では数値予報モデルの予測精度が向上してきたため、厳密な系統誤差の補正をおこなわず、数値予報モデルの出力をそのまま予測値に変換するガイダンスを作成することが可能になりました。例として天気分布予報、視程分布予想、航空悪天GPVの積乱雲頂高度、乱気流指数、着氷指数などがあります。一方、厳密な系統誤差補正をおこなわないため数値予報モデルの予測特性がそのまま反映され、数値予報モデルの変更に伴い予測特性が変化することがユーザーにとって利用しにくいといった欠点もあります。
機械学習手法では、非線形性を持つ対象に対しても精度よく予測できる反面、どのようにルール(予測式)を立てたのか複雑でよく分からないことが問題点として挙げられます。このルールがどのような条件でも成立するのか、成立しなければどこに原因があるのか、さらに精度を向上するにはどのように改善すれば良いかなど、信頼性に対する問題も多くあります。機械学習に制約を加え、予測式の振る舞いを理解することにより、解釈可能性が向上すると思われますが、機械学習のパフォーマンスは低下するかもしれません。
頻度バイアス補正については、例えば降水などは非線形性が強く、実際とモデルの地形では降水特性が大きく異なるため、補正手法としてやや単純すぎるようにも思われます。確かに極端現象の推定は大変困難ですが、従来型の手法と非線形現象に対応できる機械学習を組み合わせて活用することにより、降水特性を補正しつつ量的にも補正できるのではないかと思われます。
https://www.jma.go.jp/jma/kishou/books/nwptext/45/1_chapter5.pdf
https://www.jma.go.jp/jma/kishou/books/nwpreport/64/No64_all.pdf