ガイダンスの概要

ガイダンスは、数値予報の地上気温や降水量などの予測値を補正してその誤差を軽減したり、数値予報が出力していない天気や発雷確率などを作成することによって、予報作業を支援するために作成されます。数値予報モデルが出力したデータは、予報官や一般のユーザーがただちに理解できる形式ではないために、ユーザーが使いやすい形に加工されます。つまり、1. 数値予報モデルの出力する膨大なデータからユーザーの利用目的に適した領域・要素等を選択し形式を整えてユーザーに提供、2. 数値予報モデルが直接予測しない晴れ、曇りなどの天気カテゴリーや降水確率などの要素を計算、3. 数値予報データに統計的な補正をすることによって、生の数値予報の結果より精度の良い予測値をユーザーに提供することを目的に作成されます。ガイダンスの典型的な作成手順として、1. 過去の数値予報結果とその予報期間に対応する観測データを収集し、予測値と観測値を統計処理することにより、予測値を観測値に翻訳するルール(予測式)を作成し、2. このルール(予測式)を最新の数値予報結果に適用することで未来の観測値(数値モデル補正値)を予測します。

ガイダンスでは、地形などの影響による系統誤差を軽減できます。数値予報モデルの予測が仮に完璧であったとしても、実際の地形との違いから誤差が生じます。例えば、観測される降水は地形効果によって強化されますが、数値予報モデルの地形は実地形よりもなだらかなので、数値予報モデルで予測される降水量は観測よりも少なくなりやすい傾向があります。また、気温や風についても同様にモデルと実際の地形の特性が大きく異なることから、系統誤差が発生します。これらの誤差はガイダンスで軽減することが可能です。ガイダンスの作成手法として、線形重回帰、カルマンフィルター、ニューラルネットワーク(機械学習)、ロジスティック回帰、頻度バイアス補正、係数の層別化、診断的な手法があります。それぞれの手法の特性は以下のようにまとめられます。

線形重回帰:予測式は係数と説明変数の積を足し合わせる形の線形多項式で、過去の数値予報結果と観測値のセットを数年分一括して統計処理して係数の作成を行います。利点として、係数が変化しないためにガイダンスの予測特性をユーザーが経験的に把握しやすい、説明変数を客観的に選択する手法あることで、欠点として、係数決定の為に過去の数値予報結果と観測を多量に準備する必要があり、数値予報モデルの変更に柔軟に対応できないことなどが挙げられます。

カルマンフィルター:現在主流となっている手法で、前回の予測と実況の差を考慮して係数を初期時刻毎に調整(最適化)します。これにより、数値予報モデルの変更(更新)や季節進行による予報特性の変化に柔軟に対応できます。欠点として、係数が最適化により変動し予測特性が変化するため、ガイダンスのユーザーが経験的に予測特性を把握することが難しいこと、ガイダンス開発の初期段階で説明変数や係数の最適化の特性を決めるパラメータを客観的に決める手段が無いことが挙げられます。

ニューラルネットワーク:機械学習手法を用いており、カルマンフィルターなどの線形な予測式では対処が困難な場合でも、取り扱う事ができる点に特徴があります。また、カルマンフィルターのように予測値と実況の差に応じて係数の予測の毎に調整(逐次最適化)を行うことにより、数値予報モデルの予測誤差特性の変化や数値予報モデルの変更にある程度追従することができます。一方で、機械学習手法であるため、予測式が複雑になり、ユーザーが説明変数と予測結果との関係を把握することが困難なこと、予測式が変化するためにユーザーが経験的に予測特性を把握することが困難なこと、また説明変数や中間層の数を客観的に選択する方法がないため、これらを試行錯誤により決める必要があり開発コストが高いことなど、欠点も多くなります。

ロジスティック回帰:実況が現象の有無の2値で表現できる現象の確率を求めたい時などに使われます。気象庁では発雷確率、雲底確率ガイダンスの作成に用いられています。ロジスティック回帰は確率値を扱うのに適した手法であり、非線形な関係であっても対数オッズ比を予測することにより精度の高い予測が可能です。欠点として、線形重回帰のガイダンスと同じように逐次学習ができないために数値予報モデルの変更などに柔軟に対応することが難しいことが挙げられます。

頻度バイアス補正:統計手法では、発生頻度の低い大雨や強風などは実況に対して予測頻度が低くなります。しかし気象予測ではこれらの極端現象を予測することが防災などの観点からは重要であるため平均的な予測誤差が多少悪くなっても発生頻度の低い現象の予測精度を上げたい時に頻度バイアス補正を用いています。具体的には、観測の頻度分布と予報の頻度分布が同じになるように補正を行います。観測と予測に閾値を設定して幾つかのカテゴリーを作り、対応するカテゴリーの現象の発生頻度が等しくなるように(バイアススコアが1となるように)予測の閾値を調整(学習)します。頻度バイアス補正は平均降水量、風、視程ガイダンスなどに用いられています。頻度バイアス補正を用いることにより、強風や大雨などの捕捉率を向上させることができますが、空振り率が増加してしまう欠点もあります。

係数の層別化:数値予報の系統誤差は、場所、対象時刻、予報時間、季節などで変化します。また、説明変数と目的変数の関係も変化するため、一つの予測式で全ての場合に対応する事は困難です。そこでm条件により予測式(係数)を複数使い分けて予測精度の向上させます。これを「係数の層別化」といいます。一方で、予測式を多くすれば、予測式を作成するためのサンプル数が少なくなり精度の高い予測式を作成できなくなる問題も出てきます。どの程度層別化を行うかが重要になります。

診断的な手法:近年では数値予報モデルの予測精度が向上してきたため、厳密な系統誤差の補正をおこなわず、数値予報モデルの出力をそのまま予測値に変換するガイダンスを作成することが可能になりました。例として天気分布予報、視程分布予想、航空悪天GPVの積乱雲頂高度、乱気流指数、着氷指数などがあります。一方、厳密な系統誤差補正をおこなわないため数値予報モデルの予測特性がそのまま反映され、数値予報モデルの変更に伴い予測特性が変化することがユーザーにとって利用しにくいといった欠点もあります。


機械学習手法では、非線形性を持つ対象に対しても精度よく予測できる反面、どのようにルール(予測式)を立てたのか複雑でよく分からないことが問題点として挙げられます。このルールがどのような条件でも成立するのか、成立しなければどこに原因があるのか、さらに精度を向上するにはどのように改善すれば良いかなど、信頼性に対する問題も多くあります。機械学習に制約を加え、予測式の振る舞いを理解することにより、解釈可能性が向上すると思われますが、機械学習のパフォーマンスは低下するかもしれません。

頻度バイアス補正については、例えば降水などは非線形性が強く、実際とモデルの地形では降水特性が大きく異なるため、補正手法としてやや単純すぎるようにも思われます。確かに極端現象の推定は大変困難ですが、従来型の手法と非線形現象に対応できる機械学習を組み合わせて活用することにより、降水特性を補正しつつ量的にも補正できるのではないかと思われます。

https://www.jma.go.jp/jma/kishou/books/nwptext/45/1_chapter5.pdf
https://www.jma.go.jp/jma/kishou/books/nwpreport/64/No64_all.pdf

カテゴリー: 数値予報, 機械学習 | コメントする

高解像度降水ナウキャスト

気象庁では、2014 年 8 月より、解像度250m, 5分ごと、30分先までの降水を予報する高解像度降水ナウキャストの運用を開始しました。日本全国20箇所にあるレーダー雨量観測(ドップラーレーダー観測網)の解像度を向上するために機器が更新され、さらに、気象庁・国土交通省・地方自治体が保有する全国の雨量計のデータ、ウィンドプロファイラやラジオゾンデの高層観測データ、国土交通省レーダ雨量計のデータ(XRAIN)も活用し、降水域の内部を立体的に解析しています。従来の降水ナウキャストが2次元で予測するのに対し、高解像度降水ナウキャストでは、予測前半では3次元的に降水分布を追跡する手法で、予測後半にかけて気温や湿度等の分布に基づいて雨粒の発生や落下等を計算する対流予測モデルを用いて予測しています。対流予測モデルにより、積乱雲の発生の予測が可能になりました。観測降水との比較から、以前よりも高い精度で降水を予測できることが示されています。「急な強い雨」については、30 分間積算降水量が 50mm 以上の捕捉率は 7 割であるが、空振りも多い結果になっています。積乱雲の発生予測では、強雨に伴う下降気流、地上気温・水蒸気量の時間変化、弧状微弱エコーの交差を参照し、鉛直 1 次元対流予測モデルで降水量を予測しています。島嶼及び山岳ではアメダス観測点が少なく、山岳では微弱エコーの検出も難しいことから、捕捉率が 1 割以下と低く、さらに改善が必要です。

実際に高解像度ナウキャストで降水の時間変化を見てみると、3次元実況補外の影響が強く、降水分布の時間変化特性としては不自然に見えます。一方で、機械学習によるAIナウキャストでは、見た目では降水セルの時間変化に不自然さは見られません。ただし、降水分布の強弱が小さく全体的にやや平滑化されているように見られます。いずれにせよ、AI降水ナウキャストに代替されるには、既存の手法より精度が高くなることが求められます。気象庁の手法は、降水に不自然さはありますが降水の時間変化特性をよく捉えており、高い予測精度を得られていると推測されます。既存の手法とAI手法が融合することで、降水予測精度をさらに改善できるかもしれません。

https://www.jma.go.jp/jma/kishou/know/kurashi/highres_nowcast.html
https://www.data.jma.go.jp/suishin/jyouhou/pdf/536.pdf
https://www.jma.go.jp/jma/kishou/books/yohkens/20/chapter4.pdf
https://www.nature.com/articles/s41586-021-03854-z

カテゴリー: 機械学習, 気象予報 | コメントする

梅雨前線と線状降水帯

梅雨前線は、春から盛夏への季節の移行期に、日本から中国大陸付近に出現する停滞前線で、一般的には、南北振動を繰り返しながら沖縄地方から東北地方へゆっくり北上します。平年では5月上旬の沖縄から梅雨入りし、7月下旬の東北北部で梅雨明けになります。気象学的には、南西季節風(夏季アジアモンスーン)の流入による水蒸気集中帯が見られること、亜熱帯高気圧の北縁に位置すること、300hPa面の強風軸(亜熱帯ジェット)に対応すること、チベット高気圧(300hPa)の北縁に対応することなどが指摘されています。水蒸気集中帯については、高相当温位線の集中帯の南縁を目安として解析されます(温度の南北傾度が不明瞭な場合)。また、水蒸気集中帯の南側では下層ほど対流不安定が大きくなっています。

初夏から夏にかけて大陸と海洋の熱的コントラストにより、夏季インド・アジアモンスーンが形成され、モンスーン流に伴って日本付近に南西からの大量の水蒸気が輸送されます。チベット高原は熱力学的効果を通じてモンスーンを強化します。チベット高原の上空では高気圧性循環が形成され(チベット高気圧)、上層の強風帯と相互作用して中国南部から日本付近にかけて上空に北から乾燥・寒気移流を形成します。上層の乾燥した冷たい気流と下層のモンスーンに伴う南西からの湿った暖かい気流が交差することにより対流不安定を引き起こし、上層風に対応して降水帯(梅雨)が形成されます。季節進行に伴い、上空の偏西風帯が弱まり強風軸も北上します。上空の乾燥・寒気移流が弱まりに伴って降水帯が北上弱化し、日本付近は太平洋高気圧に覆われる日が多くなります(梅雨明け)。

線状降水帯は、一般的に梅雨前線に対応して形成されることが多く、梅雨前線帯の中でも対流活動が活発な場所(水蒸気輸送帯の南縁付近の下層での対流不安定の大きな場所)で発生しやすいと考えられています。線状降水帯は、「次々と発生する発達した雨雲(積乱雲)が列をなし数時間にわたってほぼ同じ場所を通過または停滞することで作り出される、長さ50~300km程度、幅20~50km程度の線状に伸びる強い降水域」として定義されています。線状降水帯は数値予報モデルでの再現が難しく、発生に必要となる水蒸気の量、大気の安定度、各高度の風など複数の要素が複雑に関係しており、線状降水帯の発生条件や強化、維持するメカニズムはよくわかっていません。広域での形成要因以外に、個々の積乱雲(対流システム)同士の相互作用や、局地的な地形との相互作用など複雑系(カオス的な振る舞い)が顕著になっている可能性も示唆されます。最初の積乱雲がどこに発生するかにより、線状降水帯の形成位置が大きく影響されます。数値モデルでは個々の積乱雲(対流システム)の発生、発達、衰退を正確に再現することが極めて困難であり、再現の難しさの原因の一つになっていると示唆されます。最近の機械学習でも関連した研究が多く行われていますが、少ない観測データで線状降水帯のカオス的特性を正確に認識できるのか、期待したい半面、懐疑的でもあります。一方で、線状降水帯が発生しやすい広域での気象条件はわかっていますので、数値予報から発生しやすい状況であることを把握して、災害リスクを低減することは可能です。気象庁では、線状降水帯による大雨の半日程度前からの呼びかけ、顕著な大雨に関する気象情報が提供されています。大雨警報やキキクル(危険度分布)と合わせて活用することで、より適切な判断、行動が可能になると思われます。

https://www.jma.go.jp/jma/kishou/know/expert/pdf/tenkizu/05_teigi.pdf
https://www.jma.go.jp/jma/kishou/know/yohokaisetu/senjoukousuitai_ooame.html
https://www.metsoc.jp/tenki/pdf/2007/2007_05_0009.pdf
https://www.jstage.jst.go.jp/article/jgeography1889/106/2/106_2_270/_pdf
https://www.jma.go.jp/jma/kishou/know/bosai/kishojoho_senjoukousuitai.html
https://www.jma.go.jp/bosai/risk/#zoom:5/lat:34.234512/lon:136.691895/colordepth:deep/elements:land
https://www.jma.go.jp/jma/kishou/know/bosai/images/arasute_5.png

カテゴリー: 数値予報, 機械学習 | コメントする

アンサンブル予報

大気のカオス的な振る舞いによって、初期条件のわずかな違いで予測の誤差が拡大することが知られています。数値モデルでは観測データの誤差や数値モデルの不完全さにより誤差が生じるため、予報結果に誤差が生じることを避けることができません。予測誤差の拡大は、台風中心の予報円が12時間後、24時間後、48時間後と予報時間が長くなるにつれ大きくなるのをイメージすると分かりやすいかもしれません。誤差が拡大する特徴を把握するために、異なる初期条件を用いた複数の数値予報(アンサンブル予報)が行われます。アンサンブル予報により平均やばらつきの程度といった統計的な情報を用いて気象現象の発生を確率的に評価できます。アンサンブル予報により、各予報値が同じような状態を予測していれば、その状態が発生する可能性が高いと判断でき、逆にぞれぞれがバラバラの状態を予測していれば、予測精度が低い(予測が困難)と判断できます。いずれにせよ、一つの予報結果を信じるよりも、複数の結果から起こりうる事態を考慮して柔軟に対策を立てた方が、結果的に被害を低減できます。集中豪雨など激しい気象現象は時間的・空間的規模が小さく、地形との相互作用や積雲対流システム同士の相互作用により局地的にカオス的な振る舞いが顕著になります。例えば、梅雨前線帯の形成位置、台風の経路、冬季の南岸低気圧の経路、関東平野などで観測される夕立(特に降水量の多い場合を局地的大雨、マスメディアではゲリラ豪雨とも呼ばれる)など深刻な災害を引き起こすような現象も局地的に見れば大きな予測誤差を生じます。そのような現象に対応するために、メソアンサンブル予報が行われています。メソアンサンブルでは、予報時間39時間、アンサンブルメンバー数21、週間アンサンブルでは、予報時間264時間(216時間)、アンサンブルメンバー数51(27)で実施されてます。アンサンブルメンバー数を増やしても予報精度が大きく向上しないことが分かっています。予測時間が長くなると誤差が拡大し日々の天気状況を予測することが困難になります。そのため1ヶ月以上の長期予報では、長期的特性(平年値からの偏差)を予報します。長期予報でもアンサンブル予報が行われますが、3ヶ月予報以上ではアンサンブル予報に加えて、海水温や陸面の土壌水分、温度、積雪などの影響を加味した統計的手法による予測が実施されます。

ECMWF(ヨーロッパ中期予報センター)では、機械学習だけでアンサンブル予報を行うことを計画しています。数値モデルによるアンサンブル予報から得られた特性を機械学習でパターン認識させるのではないかと推測されます。もし実現すれば、計算負荷を低減してより短時間での予報精度が向上し、迅速かつ的確に対応することにより防災、被害の低減が期待されます。また、カオスの振る舞いについての理解も深まるかもしれません。

https://www.jma.go.jp/jma/kishou/know/kisetsu_riyou/method/index.html
https://www.jma.go.jp/jma/kishou/books/nwpkaisetu/latest/1_5.pdf
https://www.jma.go.jp/jma/kishou/know/whitep/1-3-8.html
https://www.jma.go.jp/jma/kishou/know/kisetsu_riyou/method/ensemble.html
https://www.jma.go.jp/jma/kishou/know/yougo_hp/kousui.html
https://www.jma.go.jp/jma/kishou/know/whitep/1-3-4.html
https://www.jma.go.jp/jma/press/0212/19a/ensemble.pdf

カテゴリー: 数値予報, 機械学習 | コメントする

ガイダンス

天気予報では数値予報モデルによる予報値が利用されますが、数値予報には解像度などモデルの不完全さに起因する多くの問題点があります。一般に、数値モデルでは計算機資源の制約から高解像度化が難しく、地形が粗く表現されます。降水特性は地形による影響を大きく受けるため、観測された降水分布と数値モデルで再現された降水分布の特性が大きく異なる場合があります。また、対流プロセスを詳細に再現できる非静力学モデルにより降水量の過小評価が大幅に改善されましたが、依然として過小評価傾向が見られるようです。数値予報モデルの予測結果をそのまま扱うのは難しいため、予測値と観測値を統計処理することにより予測値を観測値に翻訳、修正して気象予測情報を広く一般に使えるように加工しています。これをガイダンスと呼んでいます。ガイダンスでの予測手法には、カルマンフィルタやニューラルネットワークが用いられており、それらを最新の数値予報結果に適用することで未来の観測値に相当するガイダンスが作成されます。例えば、地形表現の粗さによって生じる規則的な誤差(系統的誤差)もガイダンスで修正することにより低減しています。予測手法では、一括学習型と逐次学習型があります。一括学習型では過去の数値予報と観測をそれぞれ説明変数と目的変数として予測式を求め、最新の数値予報値を適用してガイダンスを作成します。一括学習型は数値予報モデルが更新された時や観測場所が変更された場合などに過去のデータが使えなくなり、対応ができなくなる問題がありました。モデルの更新に対応するために、カルマンフィルタ及びニューラルネットワークなどを用いた逐次学習型手法が行われるようになりました。逐次学習型ガイダンスの欠点として、予測に比べて実況の降水量が非常に大きかった際に係数が大きく変化し、その後の予測精度が低下するなどの問題が生じます。ガイダンスでは、数年分のデータを使って作成されますが、データ期間にない稀な現象に対しては予測式を適合させることが難しく、記録的な大雨などでは推定が困難であると指摘されています。多くの機械学習手法にも当てはまりますが、学習のサンプル数が足りていない事例に対する予測は、信頼性が低く、誤差が大きくなる傾向があります。また、ガイダンスはモデルの擾乱の位置ずれ、擾乱の発生や強度の外れなどの誤差を修正することができません。この辺りを、最新の機械学習手法で予測できるのか、関心が高まっています。

https://www.jma.go.jp/jma/kishou/books/nwpreport/64/No64_all.pdf
https://www.jma.go.jp/jma/kishou/books/nwptext/51/2_chapter5.pdf

カテゴリー: 数値予報 | コメントする

降水ナウキャスティング

Google DeepMindなど機械学習ベースのデータ駆動型予測モデル(Precipitation Nowcasting)が急速に広まっており、数値モデルによる予測に匹敵する精度を得られるようになっています。一方で、初期値依存性を考慮したアンサンブル予報は難しく、今後のさらなる研究が求められます。ECMWF(ヨーロッパ中期予報センター)では確率的機械学習予報システムを構築するプロジェクトが開始されました(プロジェクトへの参加者を募集しているそうです)。

気象庁では、降水ナウキャストおよび降水短時間予報が実施されており、警報・注意報や大雨・洪水警報の危険度分布と併せて利用することにより、避難行動や災害対策に活用されています。降水ナウキャストでは、5分間隔で発表され、1時間先までの5分毎の降水の強さを1km四方の細かさで予報します。降水ナウキャストの予測には、レーダー観測、アメダス、高層観測データで得られた降水特性から、予測開始時の降水域の移動の状態がその先も変化しないと仮定して、降水の強さに発達・衰弱の傾向を加味して、降水の分布を移動させ、60分先までの降水の強さの分布を計算しています。この手法は、新たに発生する降水域等を予測に反映することはできませんが、短時間の予測では比較的高い精度の予測を得ることができます。降水ナウキャスト、降水短時間予報ともに、地形の影響等によって降水が発達・衰弱する効果が含められています。降水短時間予報では、6時間先までと7時間から15時間先までの予測が行われます。まず、解析雨量から得られた降水域の移動速度から6時間先までの降水分布を作成します。予測の後半には地形の効果や降水の時間変化特性を考慮した数値予報による予測を加味しています。予報時間が長くなると精度が低下するため、常に最新の予報を得ることが重要になります (基本的な方法はWMOによるナウキャスティング技術ガイドラインにも記載)。7時間先から15時間先までの予測手法は6時間先までの予測手法と異なり、メソモデル(MSM)と局地モデル(LFM)を統計的に処理した結果を組み合わせて降水量分布を予測します。2014年から国土交通省の X バンド MP レーダネットワーク(XRAIN)等を利用した「高解像度降水ナウキャスト」が運用されています。

https://www.ecmwf.int/en/about/media-centre/news/2023/how-ai-models-are-transforming-weather-forecasting-showcase-data
https://www.jma.go.jp/jma/kishou/know/kurashi/kotan_nowcast.html
https://www.jma.go.jp/jma/kishou/know/kurashi/highres_nowcast.html
https://www.data.jma.go.jp/suishin/jyouhou/pdf/398.pdf
https://library.wmo.int/records/item/55666-guidelines-for-nowcasting-techniques

カテゴリー: Uncategorized | コメントする

気候不変機械学習モデル (Climate-invariant machine learning)

現在の気候モデルでは、モデルのグリッドサイズより小さいスケールで発生するプロセスの表現が難しく、不確実性の主な原因となっています。 最近の機械学習 (ML) アルゴリズムは、そのようなプロセス表現を改善する可能性がありますが、MLの外挿では学習していない大きく変化した気候での推定が不十分になる傾向があります。 そこで、Beucler, Tom, et al (2024)では物理的および統計的な気候プロセスの知識を ML アルゴリズムに組み込んだ「気候不変」ML と呼ばれるフレームワークを提案しました。このフレームワークでは広範囲の気候変化に対して高い精度を維持できることを示しました。 これは、地球システムのML データ駆動型モデルに物理的知識を明示的に組み込むことにより、気候変化に関わらずモデルの一貫性、データ効率、一般化可能性を向上できることを示唆しています。

気候が大きく変化する状況において、ML 気候ダウンスケーリングの外挿では誤差が大きくなることが多く報告されています。例えば、寒冷な気候で学習したMLアルゴリズムを温暖気候に適用すると、推定誤差が大きくなるケースが確認されています。これは、気候変化プロセスに対して、MLの外挿法では対応が困難であることを示唆しています。そこで、気候が変わっても変化しないマッピングを定義して、入力/出力データを、異なる気候間で分布がほとんど変わらない入力/出力に変換します。例えば、比湿qの確率密度関数(PDF)は気候が温暖化するにつれて広範囲に拡張します。比湿(q)-相対湿度 (RH) 変換では、比湿度をその飽和値で正規化することにより、過飽和状態を除いて、RHのPDF のほとんどは [0,1] 内にあり、気候が温暖化してもほとんど変化しません。q-RH変換により格子スケールの飽和を捉えることができます。同様に、温度Tに対しては、湿潤静的エネルギー(MSE)保存から、プルーム浮力 (T-buoyancy)に変換、潜熱フラックス(LHF)に対しては、地表付近の水平風の大きさと密度にほぼ比例する LHFΔq (分布は温暖化に伴ってあまり変化しない)に変換します。

本論での気候不変モデルの目的は、 大規模 (約 100 km) の気候状態を表す入力ベクトル x と、解像された対流と〜1 km スケールでの放射輸送と乱流混合による熱力学的特性をグループ化する出力ベクトル y の間の気候不変マッピングを構築(図1参照)し、x ↦ y のマッピングの全体的な構造を固定し、学習および一般化環境 (分布外予測) で y をできるだけ正確に予測することです。

コメント:
気候不変モデルで、物理的、統計的制約を課したマッピングを学習し、正則化手法(過剰適合を防ぐ方法)を併用することにより、実際のデータを使用した場合よりも、上記に示した変換をを行うことにより、サブグリッドでの熱力学的性質の誤差が大幅に低減されることを示しています(論文Fig4, Fig.5)。これは、水惑星シミュレーション(陸地なし)から実際の気候モデルシミュレーションに一般化する場合でも有効に機能することを示しており、ML エミュレータを構築する上で重要な知見を含んでいます。これにより、分布外予測の誤差を抑制し、予測の不確実性を大幅に低減することが期待されます。気候不変変換自体は極めてシンプルであるため、本手法だけでなく様々なML気候ダウンスケーリング手法に適用可能と思われます(正則化には工夫が必要かも)。ただし、降水については対応は難しい?

Beucler, Tom, et al. “Climate-invariant machine learning.” Science Advances 10.6 (2024): eadj7250.

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

グラフニューラルネットワーク(Graph Neural Network:GNN)

最近、気象、気候予測のための機械学習手法として、グラフニューラルネットワーク(GNN)が注目されています。ここでのグラフとは、評価対象(ノード:点)と評価対象の間の関係性(エッジ:線)で表現されるデータ構造を示しています。従来型の深層学習では、画像などデータの集まりを対象としてきましたが、例えばSNSでの人間関係、人口の流れ、物流・交通ネットワークなどデータ間のつながりを扱う複雑な問題については対応が困難でした。そこで、グラフ理論を取り込んで、より多くの現実的な問題に対処するために、GNN が発展してきました。最近、サイエンス誌にGNNを用いた気象予測システムが紹介され話題になりました。メッシュ構造を持つGNNは、数値モデル研究者から直感的に理解しやすい側面があり、物理的制約を反映させやすいことから、数値モデルの代替手法の有力な候補になると想定されます。問題点として、グラフ構造が複雑になることにより解釈可能性が低下することが挙げられます。また、論文の結果を見ると、推定値に不自然な点があるなど、まだ十分に使いこなせておらず、開発の初期段階である印象を強く受けます。しかし、研究が広まり手法が急速に発展することにより、数値モデルの役割の一部を担うことになると想定されます。今後の発展に大いに期待しています。

Lam, Remi, et al. “Learning skillful medium-range global weather forecasting.” Science 382.6677 (2023): 1416-1421.

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

展望: 気候予測における不確実性の定量化の改善

ML ベースの経験的ダウンスケーリング アルゴリズムの最も重要な利点は、RCM と比較した計算効率にあります。 したがって、RCM-GCM マトリックス全体または大規模な初期条件アンサンブルに広く適用することがより簡単になり、将来の気候予測における初期、モデル、シナリオの不確実性の寄与についての理解を向上させることができます。 さらに、局所規模の極端な現象の不確実性を正確に評価するには、対流を許容する RCM の大規模なアンサンブルが必要です。 ただし、GAN などの最新の ML アルゴリズムは有望な代替手段を提供し、RCM の数分の 1 の計算コストで非常に高い空間解像度 (<5km) で RCM をエミュレートできるようになりました。現在、ML には、GCM のような将来のシミュレーションを生成したり、物理ベースの RCM と同様に物理的発見に直接貢献したりする機能がありません。 ML を使用して慎重に設計されたトレーニング アプローチは、既存の CORDEX フレームワークとの連携を強化することと並行して、気候ダウンスケーリングの導入と信頼性を向上させるための有望な道筋を提供します。

コメント:大気カオスによる初期値鋭敏性について、全球気候モデル(GCM)や地域気候モデル(RCM)で予測の不確実性を評価することが可能ですが、機械学習手法単独では基本的に評価困難です。したがって、不確実性を評価するためには、GCMやRCM のアンサンブル予測値を機械学習に適用する必要があります*。機械学習は、GCMやRCM をさらに高解像度化(ダウンスケーリング)して不確実性を評価したい場合に極めて効果的に機能します。一方で、GCMやRCM のように感度実験を実施したり、物理的考察がしにくい面があります。今後は、物理的・統計的制約を加えて解釈可能性を高めると同時に、数値モデルとの連携を強化して予測結果の信頼性を向上させることが課題になると思われます。

*ナウキャスティングも同様で、予測時間が3時間を超える場合は数値予報モデルとの連携(ダウンスケーリング)によるアンサンブル予測(確率予報)が必須になると想定されます。いくつかの事例では機械学習(単独)の予測精度が数値予報(アンサンブル予報)を上回ることもあると思われますが、大気のカオス性を考慮すると全体的にはアンサンブル予報の精度が良くなるでしょう。結果的に、水災害リスク評価が向上し、対策の効果を高めることができると考えられます。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

XAI への期待と不安

現代的な ML アルゴリズム (CNN や GAN など) は、従来のダウンスケーリング手法に比べて解釈しにくくなっています。 この複雑さは意思決定プロセスを曖昧になる可能性があり、ML によって生成された気候予測の採用に課題が生じます。 ML ベースの経験的ダウンスケーリング アルゴリズムの使いやすさ、透明性、解釈可能性を強化するには、主に2 つの戦略が考えられています。それは、説明可能な人工知能 (XAI) または解釈可能な人工知能の統合とML アルゴリズムへの物理的/統計的制約の実装です。また、XAI には、モデルの外挿限界を測定し、主要な物理プロセスの観点からその限界を認識できる可能性があります。

物理的制約と統計的制約を ML アルゴリズムに統合することは依然として困難ですが、より広範囲に使用される可能性があります。 これらはユーザー固有のニーズやダウンスケールされる変数に基づいて調整される場合があります。 有用な統計的制約の例には、将来の気候に対するモデルの外挿能力を向上させるための年間降雨量の保存が含まれます。 さらに、空間平均の保存などの統計的制約により、ML アルゴリズムからの高解像度出力が対応する低解像予測子フィールドと強制的に一致する可能性があり、これによりモデルが GCM に適用されたときに気候変動シグナルを保存できる可能性があります。

コメント:将来的には、出力結果の解析から信頼性の判断までXAIが全てを担うことになると想定されます。さらに物理的、統計的制約を加えることにより解釈可能性が向上すると期待されます。現時点では、XAI の開発は初期段階であり、アルゴリズムの複雑さから開発には困難が伴いますが、サイエンティストの労力を大幅に軽減して高精度で信頼性の高い予測結果を得ることができるようになると思われます。一方で、システムの複雑さから人が介在する余地がほとんどなくなり、XAI が気象、気候予測の全てを担う時代が来るかもしれません。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする