過去気候における評価1 観測データによるクロスバリデーション

観測的ダウンスケーリング手法の最初の評価段階では、手法の本質的な性能を評価するために、訓練データ(再解析と観測)に基づく交差検証を実行します。クロスバリデーションでは、観測データセットのわずかに異なる部分集合またはフォールドを用いてトレーニングを行う一方、毎回独立した小さな部分をテスト用に確保するか、データセットの一部分(通常、時系列の末尾の複数年)のみをテスト用に使用します。これにより、評価はより費用対効果が高くなり、気候変動の影響が小さい、ごく近い将来に外挿するアルゴリズムの能力についての洞察を行うことができます。本質的な性能は、ダウンスケールされた変数のさまざまな側面(限界、時間、空間、極値、プロセスベース)に焦点を当てた評価指標によって測定されます。したがって、このような観測に基づく分布外検定アプローチは、ある変数についてある指標や時間スケールで訓練することで、他の変数でどの程度の効果が得られるかを理解するためにも使用できます(いわゆるmetric transitivityまたはtemporal transitivity)。RCM エミュレーターの場合、トレーニングに使用したシミュレーションの独立したサブセットでクロスバリデーションを行うことができる。

コメント:観測データによるクロスバリデーションは、経験的ダウンスケーリング手法の妥当性を評価するための重要な検証方法です。様々な側面からアルゴリズムの性能を評価することにより、将来予測に適用する前に問題点を見つけ出し、アルゴリズムを改善することができます。また、過去気候に適用して評価を行うことにより、将来予測に対するアルゴリズムの適用妥当性をある程度評価できます。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

地域気候モデルの不確実性

全球気候モデル(GCM) モデルの不確実性に加えて、モデルの不確実性のもう 1 つの重要な要素は、地域気候モデル(RCM) パラメータ化スキームの内部不確実性 (つまり、RCM 内の物理プロセスの不確実性) を定量化することです。 RCM におけるパラメータ化スキームの選択は、極端な降雨量と気候変動シグナルの将来の予測に大きな影響を与える可能性があります 。 ただし、計算上の制約のため、GCM 用の CMIP6 で一般的に生成されるもののような、摂動物理 RCM アンサンブルを生成することは、現在 CORDEX タイプの実験では一般的ではありません。 有望な手段の 1 つは、異なる物理スキームに基づいて比較的短いタイムスライスの RCM シミュレーションを生成し、その後、スキームごとに個別の RCM エミュレーターをトレーニングすることです。 エミュレータ機能が他の GCM に十分に移転可能であれば、これらのエミュレータはそれぞれ、異なる GCM にわたる将来の気候予測に適用できます。 さまざまなパラメータ化スキームに関連付けられたこの将来予測のアンサンブルにより、将来予測の不確実性をよりよく理解できるようになります。 これは、特に将来の異常気象に関連する地域レベルの意思決定において、不確実性の定量化を拡張するための貴重なツールとして機能する可能性があります。

コメント:上記の方法の場合、物理スキーム(積雲対流パラメタリゼーション、雲微物理過程、境界層スキーム、その他)の全ての組み合わせでRCMエミュレータを作成する必要があり、計算効率が低下する可能性があります。まずRCMで再現性の良い物理スキームの組み合わせを見つけ出し、それをRCMエミュレータに採用する方が良いかもしれません。予報精度を向上させるために、できる限り不確実性を低減することも求められています。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

初期条件、モデル、シナリオの不確実性

将来の気候予測の不確実性は、初期条件の不確実性、モデルの不確実性、シナリオの不確実性という 3 つの主な原因から生じます。GCM(全球気候モデル) によって生成される初期条件の不確実性は、通常、CORDEX タイプのダウンスケーリングの取り組みでは考慮されません。 通常、計算上の制限により、単一の GCM メンバーのみをダウンスケールするのが一般的です。 おそらく、地域規模での極端現象の傾向を決定する際に初期条件の不確実性を定量化する必要があることを考えると、これは RCM (地域気候モデル)予測の大きな欠点です。経験的ダウンスケーリング手法により計算コストが大幅に削減されたことにより、さまざまな大規模な初期条件アンサンブルで予測を行うことが可能になり、初期条件の不確実性を定量化することが可能になりました。 CMIP6 やその他の最近のさまざまな取り組みを通じて利用できる多数の初期条件アンサンブルのおかげで、この目的のために豊富な GCM 出力が現在存在しています。 しかし、現在まで経験的ダウンスケーリング コミュニティによって十分に活用されていないようです。ML ベースの経験的ダウンスケーリング アプリケーションでは、通常、各 GCM から単一のアンサンブル メンバーをダウンスケーリングします。

初期条件の不確実性に加えて、RCM の計算コストが高いため、ダウンスケールされた気候予測におけるモデルの不確実性とシナリオの不確実性の寄与を評価する際に課題が生じます。 ここで、モデルの不確実性は、複数の GCM にわたる縮小された将来の気候予測の広がりを指しますが、シナリオの不確実性は、異なる共有社会経済経路 (SSP) に起因する広がりを指します。 各 SSP は、GCM に規定された将来の温室効果ガス排出量に関するさまざまな想定セット (例: 高排出シナリオと低排出シナリオ) に対応します。 ただし、ML ベースの経験的ダウンスケーリング手法は、計算効率が高く、さまざまな GCM に適応できるため、モデルとシナリオを組み合わせた不確実性空間を効果的にナビゲートでき、RCM と比較して広範囲の GCM にわたって汎用性が高くなります。

コメント:基本的に気候予測には大きな不確実性があります。気候変動シナリオ、モデルの不完全さによるもの、自然変動による影響により、予測値が大きく変化します。将来の気候変動に対応するためには、これらの不確実性の幅を精度よく推定する必要があります。複数シナリオ、複数モデル、初期値の違いによるアンサンブル実験を実施することにより、予測の不確実性の幅を(より正確に)推定することが可能です。地域毎に予測の不確実性の幅を推定するにはダウンスケーリングが必要ですが、大量のモデル出力をRCMでダウンスケーリングするには極めて膨大な計算機資源が必要になるため、現状では実施が困難です。しかし、経験的ダウンスケーリングの発展により、地域の不確実性の幅を精度よく予測することが可能になると想定されます。それにより、例えば地域の洪水リスク評価の精度が大幅に向上し、被害を低減するための適切な対策を立てることが可能になるかもしれません。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

転移学習による分布外パフォーマンスの強化

観測データの利用には、 観測期間の長さや将来の気候シナリオの予測変数空間が観測訓練データの分布から大きく外れていることなどの問題があります。観測データ問題では、物理シミュレーションと観測データの両方のトレーニングを統合するハイブリッド ダウンスケーリング戦略が有効かもしれません。 ハイブリッドアプローチの一例は、関連するタスクからの学習または知識を組み合わせる転移学習として知られる技術によるものです。 転移学習はアルゴリズムの精度を向上させるだけでなく、効率、堅牢性、一般化可能性も促進します。 転移学習技術は天気予報と季節予測で成功しています。 転移学習の最近の進歩には、さまざまな予測のための ERA5 再解析 (Hersbach et al., 2020) と CMIP6 気候モデル予測 (Eyring et al., 2016) の両方でトレーニングされた ClimaX 基礎アルゴリズムが含まれます。 タスク。 ClimaX の事前トレーニング済みの基本アルゴリズムは、その後、観察によるダウンスケーリングなど、より具体的なタスクに合わせて微調整されました。

ClimaX (Nguyen et al., 2023) からの洞察を活用すると、RCM シミュレーションは、ML ベースの観測ダウンスケーリング アルゴリズムの効果的な前処理段階として機能できます。 まず、CORDEX などの公的に利用可能なデータセットからの予測変数と予測変数 (疑似観測) を使用して「疑似」PP/SR を実行するアルゴリズムを「事前トレーニング」できます。 微調整として知られる第 2 フェーズでは、PP または SR アプローチを使用して、歴史期間の再解析または観測データセットに基づいてアルゴリズムを再トレーニングします。 ここで、基本アルゴリズムの重みは多くの場合凍結され、トレーニングの第 2 フェーズの初期状態として機能します。アルゴリズムのパフォーマンスと将来の推定能力は、過去の記録で入手可能なものよりも広範囲かつ多様な気象現象にアルゴリズムを適用させることで得られます。 Ham et al., (2019) は、アルゴリズムを最初に CMIP5 シミュレーションで事前トレーニングし、その後観測値を微調整した場合に、エルニーニョ南方振動の予測パフォーマンスが向上したことを発見しました。 彼らは、事前トレーニングに使用される CMIP5 データの量に応じてアルゴリズムのスキルが向上することを発見しました。

https://microsoft.github.io/ClimaX/
https://euro-cordex.net/060378/index.php.en

コメント:
転移学習:別の目的で作成された学習モデルを利用して新たに学習モデルを構築する手法。転移元と転移先のデータの関連性が低い場合は転移のパフォーマンスが低下することもある。
気候ダウンスケーリングに転移学習を実施する狙いは、気候変動を広くカバーしながらバイアス補正することにより、予測精度を向上させることにあると思われます。懸念されることとして、第1フェーズと第2フェーズのそれぞれの学習に強く影響された特性を持つ結果が出力される可能性も想定されます。各フェーズのデータを関連付けて調整できるかが成功の鍵になると思われます。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

現在気候分布外のパフォーマンス向上のための戦略

観測(PP)ダウンスケーリングアルゴリズムが将来気候に対して現在気候分布外で適応可能にするいくつかの戦略を示します。 外挿を強化するために GCM 予測子フィールドのバイアス調整などの戦略を検討しましたが、これらの方法だけでは、将来気候シナリオにおける ML アルゴリズムの制限を克服するには不十分です。 観測ダウンスケーリングアルゴリズムの分布外パフォーマンスを評価することの難しさは、将来に対して直接テストできないことにあります。観測を使用して直接将来を評価することは実現できませんが、将来と過去の両方の気候に対応できるGCM/RCM シミュレーションを利用して分布外テストや実験を実施することは可能です。 このような実験は、観測データに基づいてトレーニングされたダウンスケーリング アルゴリズムにおける潜在的な問題の検出に役立つ疑似現実実験として知られています。 これらの実験の大部分は従来の統計的アプローチで行われており、コンピューター ビジョン アルゴリズムでの実施に焦点を当てたものはほんのわずかです 。このテストでは、ML アルゴリズムが、粗い RCM シミュレーションから RCM 自体に「擬似観測」としてマッピングするようにトレーニングされます。 たとえば、降水量をダウンスケーリングする SR アルゴリズムでは、予測変数として粗大化された RCM 降水量のみが使用されますが、PP の場合、大規模な循環場 (帯状風など) が降水量の予測変数として選択されます。 このトレーニング プロセスは、PP/SR アルゴリズムのトレーニング プロセスとよく似ている必要があることを強調することが重要です。 トレーニングされた擬似 PP/SR アルゴリズムは、同じ GCM からの将来予測に適用され、対応するダウンスケールされた RCM 出力に対してテストされ、将来の気候における「グラウンド トゥルース」参照データが可能になります。 これらの結果は、将来の気候変動シグナルを再現するには、過去のシミュレーションのみのトレーニングでは不十分であることを浮き彫りにしました。たとえば、疑似 PP/SR アルゴリズムは、CORDEX などの公開されているデータセットから実行される RCM 再解析強制シミュレーションまたは歴史シミュレーション上のモデルフレームワークでトレーニングできます。 その適応性を評価するために、RCM シミュレーションから得られた「グラウンド トゥルース」に対して評価を実行して、アルゴリズムを粗大化された GCM およびそれに対応する RCM の範囲に適用できます。

コメント:経験的(観測)ダウンスケーリングアルゴリズムの適用妥当性を評価するために、GCM/RCM シミュレーションの将来気候シナリオを利用した「擬似実験」が行われます。GCM のバイアス除去など適用外の場合やRCMのダウンスケーリング解像度等に制約があるため、評価には注意が必要です。前項で示されたように、海氷面積や積雪面積が大幅に変化し、その変化に対応して気象場が大きく変化する場合は適用が難しくなることも想定されます。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

RCM エミュレータの分布外評価

RCM エミュレーターは、幅広い気候シナリオにわたってダウンスケールできるように十分に汎用化する必要があります。 最近の研究では、将来の気候推定を改善し、気候変動シグナルを再現するために、多様な気候にわたるトレーニングの重要性が指摘されています。 Doury et al., (2022) は、12kmの地表付近の温度について EURO-CORDEX シミュレーション (CNRM-ALADIN63 RCM) の歴史的期間(現在気候)のみでトレーニングされたエミュレーターが、21世紀末温暖化 (2080 ~ 2099 年) を1.3度低く見積もっていることを示しました(代表濃度経路 (RCP) 4.5 シナリオに適用)。RCM エミュレータが力学的ダウンスケーリング(RCM)と同じくらい効果的に気候変動シグナルをどの程度捕捉できるかをさらに調査するには、極端な現象とその推進プロセス (サイクロンなど) に関する詳細な研究を含むさらなる研究が必要です。世紀末の表面の氷の質量バランスなど、降雨量や風などの他の変数をトレーニングするのが難しい場合があります。また、分布外パフォーマンス (GCM-RCM マトリックス全体) は、ダウンスケールされた変数、領域、RCM 構成などの要因に依存する可能性があります。

コメント:現在気候観でトレーニングを実施した経験的ダウンスケーリングでの外挿では、遠未来の推定で大きな誤差を生じてしまうことを示唆しています。遠い将来や温暖化影響が極めて大きい場合は気象パターン自体が大きく変化して機械学習では対応できなくなるのかもしれません。基本的に、海氷面積の変化など、物理過程以外での推定が困難である現象が気象パターンに大きな影響を与えている場合は、予測が難しくなります。また、RCM のバイアスや極端現象が関係する場合はさらに評価が難しいと思われます。どの程度であれば適応可能なのか、詳細な調査が望まれます。

Rampal, Neelesh, et al. “Enhancing Regional Climate Downscaling Through Advances in Machine Learning.” Artificial Intelligence for the Earth Systems (2024).

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

経験的ダウンスケーリングの課題(現在気候の分布外推定2)

一般に、観測データから学習した関係を GCM 内の未観測の気候に適用するアルゴリズムの能力 (過去および将来のシミュレーションなど) を評価します。 多くの場合、将来の気候シナリオにおける気候変数の分布は、アルゴリズムがトレーニングされた観測データと比較して分布から外れていることがよくあります。いくつかの研究では、PPでダウンスケーリングを実行する前にGCM 予測子のバイアス調整を行うと、シミュレーションの歴史的期間にわたってパフォーマンスが向上することが強調されています。 バイアス調整は、GCM の将来の気候変動シグナルを維持しながら、GCM の予測フィールドの季節サイクルを観測データセットと一致させます。 バイアス調整後、現在気候シミュレーション期間中の観測データと比較した場合、CNN アルゴリズムのダウンスケーリング出力は、気候平均およびその他の降雨量および気温特性において、従来の観測ダウンスケーリング アルゴリズムよりもバイアスが小さくなります。 将来の気候条件下で評価した場合、CNN は気温に関する気候変動シナリオに対して最先端の線形モデルよりも優れた推定を行うことがわかっています。 降水量は、親GCM内の気候変動シグナルとより強い一致を示しているためです。 CNNでは、従来のPPなど観測ダウンスケーリングアルゴリズムに対して堅牢で気候変動を学習する能力が向上すると考えられています。

コメント:全球気候モデル(GCM)のバイアス補正は重要ですが、数値モデルの物理的整合性を考慮して行わないと、ダウンスケーリング推定値自体に矛盾が生じます。ある側面からバイアスが大幅に削減された場合でも、別の側面から見ると不自然な値が推定されていることもよくあります。GCM のバイアス補正は慎重に行う必要があります。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

経験的ダウンスケーリングの課題(現在気候の分布外推定)

コンピュータービジョンアルゴリズムのパフォーマンスとアーキテクチャの多くの改善にもかかわらず、ほとんどの研究は、現在の気候条件での評価のみに焦点を当てています。これはアルゴリズムが GCM (歴史的および将来の気候) からの未観測の気候シナリオに適応するには不十分であるためと推察されます。多くの場合、将来の気候シナリオにおける気候変数の分布は、アルゴリズムがトレーニングされた観測データと比較して分布から外れていることがよくあります。SR ダウンスケーリング手法は、GCM による過去および将来の気候条件にわたる堅牢性についてまだ適切に評価されていないことに注意が重要です。 SR ダウンスケーリングのアプローチは、予測変数として GCM からの低解像度の気象場のみに依存する傾向があるため、これは特に重要です。 これらの気象場は、観測値と比較して大きな偏りを持つ可能性があります。ホストGCM で予測された将来の循環場の変化を適切に説明できない可能性があり、その両方が将来の予測の信頼性に悪影響を与える可能性があります。

コメント:基本的に、経験的ダウンスケーリングはデータ駆動型の手法であり、学習データの分布外の推定が困難であると想定されます。経験的ダウンスケーリングの外挿手法で整合性のある気候変動の推定ができるのか、十分な検証が求められます。一方で、分布の裾にあたる極端現象については、再現期間の特性やメカニズムなどがよくわかっていないため評価が難しく、推定誤差が大きくなることが予想されます。GCM のバイアス(ストームトラックの形成位置のずれなど)がダウンスケーリングにも大きな影響を及ぼす可能性があり、慎重に評価する必要があります。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

経験的ダウンスケーリングの課題(物理的一貫性)

ML アルゴリズムは物理法則に準拠していないことが多く、出力に不一致が生じます。 この物理的一貫性の問題は、アルゴリズムに対する信頼を構築するという点と、場合によってはエンドユーザーが物理法則に準拠したデータを必要とする可能性があるため、ダウンスケーリングにおいて問題になる可能性があります。 気候変動においては、出力が物理的/統計的一貫性を維持し、ホスト GCM の気候信号の気候変動信号と一致するアルゴリズムが、現在の気候に優れた複雑なアーキテクチャよりも有益である可能性があります。 ダウンスケーリングにおいては、トレーニングデータの次元が高いため、物理的な制約を作成することが困難になることがよくあります。 ただし、ソフト統計的制約とハード統計的制約の開発などの代替戦略は、いずれも有望な研究手段となる可能性があります。 もう 1 つの可能性は、タスク間でアルゴリズムパラメーターを共有することで解釈可能性とパフォーマンスを向上させることが判明したマルチタスク学習です。 図 5 に示すように、マルチタスク学習には、同じ潜在空間を共有する 2 つのタスクを実行するアルゴリズムのトレーニングが含まれます。このマルチタスク学習を通じて、1 つのタスクに制約を強制することができます (例: 保存則)、制約が他方に適用されない場合でも。 このような制約は、アルゴリズムの安定性を向上させるために天気予報において提案されています。 マルチタスク学習は、ハード制約を使用して実装することもできます。

統計的および物理的制約を ML アルゴリズムに組み込むには、既知の物理法則または統計的関係を確実に遵守するように学習プロセスを変更することが含まれ、それによってさまざまなアプリケーションにおけるアルゴリズムのパフォーマンスと解釈可能性が向上します。 困難ではありますが、これは、気候モデルのサブグリッドプロセスを表すパラメータ化の開発など、気候科学の多くの分野でますます有益であることが証明されています。

統計的または物理的制約を組み込むために一般的に使用される 2 つの戦略があり、通常は「ソフト」制約または「ハード」制約と呼ばれます。 ソフト制約は、MLアルゴリズムのトレーニング中に損失関数に組み込まれます。 たとえば、損失関数は空間平均を保存するようにカスタマイズでき、MLアルゴリズムが対応する低解像度データと一致する高解像度の予測を生成できるようになります。 この制約は、高解像度フィールドと粗解像度フィールド (降水量など) の間の一貫性を保証し、MLアルゴリズムの出力で親GCM からの気候変動信号を保存できる可能性があるため、SRダウンスケーリングで役立つ可能性があります。

コメント:経験的ダウンスケーリング(統計的DSを含む)では物理的整合についてよく議論されています。例えば、保存則を満たすように何らかの制約条件を加えることも検討されています。制約条件を加えることにより、アルゴリズムの安定性を向上できるかもしれないし、特にRCM emulatorでは効果的に機能するかもしれません。しかし、制約条件を加えることにより、観測値から大きくズレることも懸念されます(整合性を保ちつつ全球気候モデル/領域気候モデルのバイアスを補正できるのかなど、特にダウンスケーリングでは適用が難しく問題も多い)。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする

経験的ダウンスケーリングの課題(極端現象)

本論では、c-GANや革新的な損失関数などのアルゴリズムアーキテクチャが、局所的な詳細をより良く解決し、極端な現象を捕捉するのに有望であることを示しました。しかし、さらなる研究がまだ必要です。 ダウンスケーリングにおける改善点の 1 つは、一連のイベントの「記憶」を正確に補足することです。 これは、複数のタイムステップにまたがる気象現象にとって特に重要ですが、現在の研究では見落とされがちです。 重要な複数日にわたる気象現象の例には、大気の川*やサイクロンなどがあります。 既存のダウンスケーリング手法のほとんどは、単一インスタンスで一連のタイムステップをダウンスケーリングするのではなく、各タイムステップを個別に (つまり毎日) ダウンスケーリングするようにアルゴリズムをトレーニングします。 ダウンスケーリングにおけるメモリ効果の組み込みは、時間的関係 (例: LSTM ネットワーク) または時空間関係 (例: LSTM レイヤーと組み合わせたコンピュータービジョンアルゴリズム) を補足できるリカレントアーキテクチャを使用して実現できます。または、コンピュータビジョンに適用される手法である自己回帰的な方法で前のタイムステップを予測子として使用することによって使用されます。

*大気の川(Atmospheric River)低緯度帯から中緯度帯ににかけて形成される数千kmに及ぶ細長い水蒸気輸送帯。日本では梅雨前線付近で下層ジェットに伴って形成される。

コメント:一連の気象イベントのパターンを補足するために、その時空間関係を認識できるLSTMなどの再帰型ニューラル ネットワークが用いられることがあります、例えば、事前の降水イベントの影響が大きい洪水予測等に利用されており、高いパフォーマンスが得られています。ダウンスケーリングでは適用事例は少ないですが、時空間関係を認識することにより時間方向のダウンスケーリングに有効と思われます。ただし、極端現象の補足については、アルゴリズムの改善では対応できない別の大きな問題(不確実性)があります。

カテゴリー: 機械学習, 気候変動, 高解像度 | コメントする