【2024年9月】衛星データ利活用に関する論文とニュースをピックアップ!
2024年9月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。
2024年9月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。
・Applications of Knowledge Distillation in Remote Sensing: A Survey
(データ不足と計算効率の問題を解決する、教師モデルから生徒モデルへの知識蒸留手法)
・FusionRF: High-Fidelity Satellite Neural Radiance Fields from Multispectral and Panchromatic Acquisitions
(パンシャープニングに依存せず、衛星画像の3D再構築を行うFusionRFの手法)
・The local cooling potential of land restoration in Africa
(アフリカの土地回復による植生増加が地表温度を冷却する効果を定量化する手法)
・Advancing forest carbon stocks’ mapping using a hierarchical approach with machine learning and satellite imagery
(機械学習と衛星データを用いて、階層的アプローチで森林炭素ストックを推定する手法)
・A machine learning paradigm for necessary observations to reduce uncertainties in aerosol climate forcing
(機械学習とライダー観測を組み合わせ、エアロゾル特性を高精度に予測し、気候変動の不確実性を減少させる手法)
・Climate-driven global redistribution of an ocean giant predicts increased threat from shipping
(衛星追跡データと気候モデルを用いた、ジンベエザメの将来的な生息地変動と船舶との衝突リスク予測手法)
宙畑の連載「#MonthlySatDataNews」では、前月に公開された衛星データの利活用に関する論文やニュースをピックアップして紹介します。
本記事では、X(旧:Twitter)上で「#MonthlySatDataNews」をつけて投稿された衛星データ利用に関する論文の紹介も行っています。宙畑読者のみなさまも是非ご参加いただけますと幸いです。
2024年9月の「#MonthlySatDataNews」を投稿いただいたのは3人でした!
MODISの植生、アルベド、地表面温度の時系列データを用いて、大陸スケールでの植生-気温関係を明らかにする #MonthlySatDataNews
The local cooling potential of land restoration in Africahttps://t.co/fCOZd3BC7U— たなこう (@octobersky_031) September 11, 2024
数枚の衛星画像のみを学習に使った高品質DSMの生成https://t.co/9Jnn2ZihUj#MonthlySatDataNews
— まぬある (@lTlanual) September 20, 2024
Sentinel-2衛星画像を用いて、汎化性を考慮した農地のセグメンテーション用のベンチマークデータセットを構築
このデーセットを用いて事前学習をしたモデルで学習に用いていないエチオピアの農地を判読し、優れた精度が出ていることを確認https://t.co/BmYEDSnUBQ#MonthlySatDataNews
— ぴっかりん (@ra0kley) September 25, 2024
それではさっそく2024年9月の論文を紹介します。
Applications of Knowledge Distillation in Remote Sensing: A Survey
【どういう論文?】
・本論文は、知識蒸留(Knowledge Distillation, KD)技術を用いて、計算効率の向上やデータ不足の課題に対処する手法を紹介する
【先行研究の課題とは?】
①モデルの複雑さと計算効率のトレードオフ
・深層学習モデルやCNNは、衛星画像の分類や物体検出において高い精度を達成するが、これらのモデルの学習には膨大な計算資源と時間が必要となる
②大規模データセットの必要性
・リモートセンシングの分野において、土地利用データを収集することは物理的な制約やコストの問題で容易ではない
・また、データの不均衡や不足がモデルの性能に悪影響を及ぼし、過学習のリスクが高まる
③ブラックボックス問題
・例えば、災害管理のために洪水のリスクを予測するモデルが、何をもとにその結論に達したのかが説明できない場合、意思決定者がその結果に基づいて行動するのは困難となる
④リアルタイム処理の難しさ
・ドローンを使った災害監視やIoTデバイスでの環境モニタリングのように、エッジコンピューティングが求められるシーンでは、低消費電力かつ高速な推論が必須となるが、従来の大規模なモデルは計算資源を圧迫しすぎるため、運用が難しいという課題がある
【知識蒸留(本研究のアプローチ)とは?】
◾️概要
・知識蒸留は、教師モデル(Teacher Model)と生徒モデル(Student Model)の2つの深層学習モデルを用いた技術である
・教師モデルは、通常、大規模で高性能なモデルであり、複雑なタスクを高い精度でこなす一方、生徒モデルは、軽量で計算コストが低いが、性能も通常は教師モデルより劣る
・知識蒸留では、教師モデルの学んだ知識を生徒モデルに移植し、生徒モデルが少ないパラメータで教師モデルに近いパフォーマンスを達成することを目指す
◾️知識蒸留の特徴
①ソフトターゲットの利用
・教師モデルは、出力として「ソフトターゲット」という確率分布を生成する
・これにより、生徒モデルは「クラス間の関係」や「部分的な確信度」を学び、単純に正解を当てるだけでなく、より細かい知識を取得する
②汎化能力の向上
・生徒モデルは、ソフトターゲットを学習することで、データの特徴やクラス間の関係をより深く理解する
・上記により、未知のデータに対しても適切に対応できるようになり、モデルの汎化性能が向上する
・特に曖昧なデータや稀なデータ(エッジケース)においても、正確な予測が可能となる
◾️知識蒸留の仕組み
①ロジットの生成
・教師モデルと生徒モデルがデータを入力されると、それぞれ「ロジット」と呼ばれる生の出力スコアを生成する
・ロジットは、モデルがまだ確率に変換する前の「直感的な判断」を表す生のスコアとなる
・例えば、3つのクラス(A、B、C)を分類する問題で、教師モデルがロジットを [2.0, 0.5, -1.0] と出力した場合、モデルはAが最も高い確率を持つクラスだと「直感的」に考えていることを意味する
②ソフトマックス関数による確率分布の計算
・次に、ロジットをソフトマックス関数に通すことで、それぞれのクラスに対する確率分布に変換する
・上記は「ソフトターゲット」と呼ばれ、教師モデルが予測するクラス間の関係性やその確信度の度合いを含んでいる
・例えば、教師モデルがAの確率を80%、Bを15%、Cを5%と出力することで、生徒モデルはAが正解であることが濃厚だが、他のクラスも完全には無視できないという判断を学ぶ
③温度パラメータによる調整
・温度パラメータは、ソフトマックス関数の出力確率をどの程度「滑らか」にするかを調整する
・高い温度を設定すると、分布はより滑らかになり、複数のクラスに分散した確率を与え、逆に低い温度にすると、特定のクラスに確率が集中し、他のクラスの確率はほとんど無視されるようになる
・上記により、教師モデルの出力を調整し、生徒モデルが過度に1つのクラスに依存することなく、他のクラスも考慮に入れた学習をできるようにする
◾️損失関数による学習
・知識蒸留のプロセスでは、教師モデルが生徒モデルにソフトターゲットを提供して生徒モデルがそれに基づいて学習を行うが、本学習の際に使われる損失関数には、2つの重要な要素がある
①蒸留損失(Distillation Loss)
・蒸留損失は、教師モデルが生成したソフトターゲット(確率分布)と、生徒モデルが予測したソフトターゲットとの間の違いを測定する
・具体的には、Kullback-Leibler (KL) ダイバージェンスという手法を使って、教師モデルの出力と生徒モデルの出力がどれだけ異なるかを計算する
②ハードターゲット損失(Hard Target Loss)
・一方、通常のモデル訓練と同様に、ハードターゲット損失も計算する
・これは、生徒モデルが実際の正解ラベルに対して、どれだけ正しく予測できたかを測定するものである
・具体的には、標準的なクロスエントロピー損失 (Cross Entropy Loss) を使い、生徒モデルが実際のラベルにどれだけ近いかを評価する
③総合的な損失関数
・全体の損失関数は、蒸留損失(L^KD)とハードターゲット損失(L^CE)の両方を考慮したものであり、上記2つの関数のバランスを調整する
(𝐿=𝛼⋅𝐿𝐶𝐸+(1−𝛼)⋅𝐿𝐾𝐷)
【知識蒸留のアーキテクチャ種類は?】
◾️モデルや入力データの違いに基づく分類
①異種アーキテクチャKD (Heterogeneous KD[Knowledge Distillation])
・異種KDは、教師モデルと生徒モデルのアーキテクチャが大きく異なる場合に適用される手法である
・通常、KDでは教師と生徒のモデルが似た構造を持つことが前提とされるが、異種KDでは、まったく異なるアーキテクチャを使用する
・例えば、教師モデルがレーダーデータと光学データを組み合わせた場合に、生徒モデルはそれを適切に学習し、少ないデータでも高精度な推論を行う
②クロスモーダルKD (Cross-Modal KD)
・より強力なモダリティ(例: 深度マップやポイントクラウド)で訓練されたモデルから、弱いモダリティ(例: RGB画像)で訓練されたモデルに知識を移行する手法となる
◾️知識の種類による蒸留
①Response-based(応答ベース)蒸留
・最終層の出力(クラス確率分布)に焦点を当て、生徒モデルが教師モデルの最終予測に一致するように学習する
②Feature-based(特徴ベース)蒸留
・中間層の特徴表現も生徒モデルに移行することで、教師モデルの特徴を学習させる
③Relation-based(関係ベース)蒸留
・教師モデルが持つサンプル間の相互関係を生徒モデルにも学習させる
・上記により、生徒モデルは、個々の画像の特徴だけでなく、データ全体のパターンやクラス間の依存関係を理解できるようになる
【他手法との違いは?】
①類似手法
[転移学習]
・1つ目の類似手法として転移学習がある
・転移学習とは「異なるタスク間」で知識を再利用することを目的としており、元のタスク(例:画像分類)で訓練されたモデルの重みや特徴を新しいタスク(例:物体検出や医療画像解析)に適用することで、全く異なるタスクでのモデル訓練をスムーズに行うことができ、以前の学習から得た特徴やパラメータを「新しいタスク」に適用するため、再学習のコストも削減可能となっている
・技術的には、 モデルの初期層や中間層を再利用して、新しいタスク用のモデルに適応させる点が特徴的である
・大量のラベル付きデータが存在しないタスクで、事前に訓練されたモデルを再利用して新しいタスクに適用する際に使用されるケースが多い
[モデル圧縮]
・次にモデル圧縮とは、同じモデル内でのパラメータ削減や構造を縮小する手法であり、モデルの層の一部を削除したり、量子化(モデルの精度を下げるがサイズを小さくする技術)したり、プルーニング(不要なニューロンを削除)することで、元のモデルの構造を保持したまま計算効率を改善する
・知識を転写するのではなく、モデル自体をそのまま縮小する形となっている
・技術的には、モデルのパラメータや計算コストをそのまま減らし、同じモデルを軽量化する点が特徴的となっている
・メモリ使用量や計算リソースが限られている環境で、既存のモデルをそのまま縮小して使用したい場合に有効である
②知識蒸留の特徴(類似手法との違い)
・知識蒸留は、「同じタスク内」において、大規模で高精度なモデル(教師モデル)から、より小規模で計算資源の少ないモデル(生徒モデル)に知識を転写する技術である
・技術的には、教師モデルが提供する柔軟で豊かな予測(ソフトターゲット)や特徴マップを生徒モデルに学ばせることで、小さなモデルが大規模モデルと同等の性能を発揮することを目指す点がユニークである
・計算リソースが限られたデバイスや、応答時間が重要なリアルタイムアプリケーションで、高精度を保ちながら効率を改善するために使用される
#教師モデル #生徒モデル #ソフトマックス関数 #温度パラメーター #蒸留損失 #ハードターゲット損失 #損失関数 #転移学習 #知識蒸留 #モデル圧縮
FusionRF: High-Fidelity Satellite Neural Radiance Fields from Multispectral and Panchromatic Acquisitions
【どういう論文?】
・本論文は、従来のパンシャープニング処理に依存せずに、衛星のマルチスペクトル画像とパンクロマティック画像を直接統合して高精度な3D再構築を実現する、FusionRFという新しい手法を提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①パンシャープニングへの依存
・先行研究では、マルチスペクトル画像とパンクロマティック画像のフュージョンに、パンシャープニングという、異なる解像度のデータを組み合わせるための処理が必要であった
・上記処理はアーティファクトやハルシネーションを生じさせやすく、特に、対象データがパンシャープニングアルゴリズムの訓練データから外れると、ノイズが増加し、ニューラルネットワークによる再構築精度が低下するリスクが高まる
②データ依存と汎化能力の問題
・先行のパンシャープニング手法の多くは、畳み込みニューラルネットワーク(CNN)などのディープラーニング手法を使用しており、事前に多くのトレーニングデータから学習することで、マルチスペクトル画像の低解像度問題を補正し、パンクロマティック画像の高解像度情報をフュージョンするため、膨大な量のトレーニングデータが必要である
・また、未知のドメイン(新しい環境やセンサー、照明条件など)への適応が難しいという問題もある
・さらに、パンシャープニング後の画像をそのまま「true」として扱うため、誤ったデータ(ハルシーネーションなど)が再構築プロセスに反映される可能性がある
③高解像度マルチスペクトルデータの不足
・現在の衛星技術では、マルチスペクトル画像はスペクトル分解能を重視しているため、空間分解能が低い
・そのため、モデルのトレーニングや評価に使用できる「高解像度のマルチスペクトルデータ」が存在しないという根本的な問題がある
◾️FusionRFのアプローチ
①概要
・FusionRFは、従来のパンシャープニングの「外部処理」ステップを排除し、シャープニングカーネルを内部に組み込み、マルチスペクトル画像の解像度を内部で補正するため、外部アルゴリズムに頼ることなく、高解像度かつ正確な3D再構築を可能とする
②パンシャープニングなしの画像処理技術
・FusionRFでは、パンシャープニングなしでマルチスペクトル画像とパンクロマティック画像を別々に処理するが、この際、マルチスペクトル画像の解像度が低いという問題を解決するために、シャープニングカーネルという技術を利用する
・シャープニングカーネルとは、マルチスペクトル画像の解像度を補正するために使われるフィルタであり、具体的には、各ピクセルがぼやけている部分を、その周囲のピクセル情報を使って補完し、画像を「自動的に」シャープ化する仕組みとなっている
③モーダルエンベディングによる情報統合
・従来の方法では、パンシャープニングによってマルチスペクトル画像とパンクロマティック画像が一体化されてしまうため、色の情報と解像度の情報が混ざり合ってしまい、データ処理の精度に影響が出ることがあった(特に、色の違いを正確に捉える能力と、細部を捉える能力のバランスを取るのが難しかった)
・FusionRFでは、モーダルエンベディングを使って、マルチスペクトル画像とパンクロマティック画像の特性をそれぞれ別々に学習する
④トランジェントエンベディングによる動的要素の除去
・衛星画像には、車や樹木のように常に動いている物体が写り込むが、従来の方法では、これら動的要素がそのまま再構築されてしまい、静的な建物や地形にノイズが混入し、正確な3Dモデルが得られないことがあった
・FusionRFでは、トランジェントエンベディングという技術を使って、動的な要素(車や木の揺れなど)を無視し、静的な部分(建物や道路など)に集中して再構築を行う
・トランジェントエンベディングとは、画像内の動きのある部分と静的な部分を区別し、動的な要素を除外する仕組みであり、例えば、何度も撮影された同じ場所の画像で、動いているものは無視し、動かないものだけを処理することができる
⑤技術優位性のまとめ
・パンシャープニングを省くことによるリスク軽減(外部の処理で発生するエラーやアーティファクトのリスクを回避する)
・シャープニングカーネルによる高解像度化(自動的に解像度を補正し、外部に依存しない正確な画像処理が可能)
・モーダルエンベディングによる正確な統合(色と解像度を独立して処理し、それぞれの特性を活かした高精度な結果を得る)
・トランジェントエンベディングによる動的要素の除去(動的な要素を排除し、静的な部分に集中することで、より正確な3Dモデルを再構築)
【議論の内容・結果は?】
◾️パンシャープニングとの比較
①評価方法
・Deep Learningベースのパンシャープニング手法であるDRPNN, MSDCNN, PNN, DiCNN, FusionNetと比較する
②評価指標
・評価指標としては、SAM(スペクトル角度マッピング)、ERGAS(相対平均二乗誤差)、PSNR(ピーク信号対雑音比)を使用し、色の正確さや細部の再現度を評価する
※SAM:スペクトル情報の正確さを評価する指標ですあり、具体的には、ピクセル単位で得られるスペクトル(色の分布)のベクトルを比較し、それらのベクトル間の角度を計算する(角度が小さいほど、再構築されたピクセルがオリジナルのスペクトルに近いことを意味する)
※ERGAS:画像全体の平均的な誤差を評価する指標であり、具体的には、再構築された画像のピクセルごとの誤差の平均的な大きさを計算する(値が小さいほど、再構築の精度が高いことを示す)
※PSNR:画像の再現度を評価するための一般的な指標で、再構築された画像の「信号対雑音比」を測定する(値が高いほど、ノイズが少なく、元の画像に対して再構築が精度高く行われていることを意味する)
③評価結果
・ERGAS:FusionRFの2.615が最も低い値を示し、従来手法よりも誤差が少ないことを示した
・PSNR:29.341で、他のモデルよりも高く、画像のシャープさが保たれている
・SAM:FusionRFは4.195で、色の再現性において他のモデルよりも優れている
・以下の画像から、FusionRFは、色の変化や不自然なディテール(たとえば、屋根や駐車場での余分な情報)の発生が少なく、他のモデルよりも元のマルチスペクトル画像に近い結果を得ていることがわかる
◾️シャープさの評価
①評価方法
・ClipIQA、BRISQUE、FM(Fourier-based Frequency Domain Image Blur Measure)といったNo-Reference Image Quality Metricsを使用して、シャープさや視覚的な質を評価する
②評価結果
・シャープニングカーネルを使った場合(FΨ On)、全体的にClipIQAやFMが高く、BRISQUEが低い結果を示している
・例えば、004のシーンではClipIQAが0.442、FMが64.009と高いスコアを示し、BRISQUEは58.778と比較的低く、画像品質が高くシャープな結果であることを示している
・一方で、FΨカーネルを使用しない場合、全体的にスコアが悪化しており、特にClipIQAとFMが大幅に低下し、BRISQUEが上昇しているため、画像のシャープさが低下し、ノイズが増加していることがわかる
・例えば、004のシーンでのClipIQAは0.352に低下し、FMも53.340と、FΨ Onの場合に比べて鮮明度が低い結果となっている
・不均衡なデータセットでFΨカーネルを使用しない場合、最もスコアが悪化している
・シャープニングカーネルを適用することで、元のマルチスペクトル画像よりも視覚的に鮮明な画像が生成されている
・赤い枠で示された部分では、特にディテールがより明確に再現されている
◾️サイト再構築(深度情報の再現)
①評価方法
・再構築された3Dモデルの精度を評価するために、LIDARで得られた深度情報と比較し、平均絶対誤差(MAE)で評価する
②評価結果
・FusionRFの深度誤差は1.595と、従来手法(SatNeRF-8)よりも小さく、再構築の精度が高いことが示されている
・FusionRFの深度マップはLIDARによる地上真値に非常に近く、細部まで再現できており、特に、建物や木のエッジが従来手法に比べて明瞭に描写されている
#パンシャープニング #マルチスペクトル画像 #パンクロマティック画像 #アーティファクト #ハルシネーション #CNN #FusionRF #モーダルエンベディング #トランジェントエンベディング #DRPNN #MSDCNN #PNN #DiCNN #FusionNet #SAM #スペクトル角度マッピング #ERGAS #PSNR #ピーク信号対雑音比 #ClipIQA #BRISQUE #Fourier-based-Frequency -Domain-Image-Blur-Measure #LIDAR #深度情報
The local cooling potential of land restoration in Africa
【どういう論文?】
・本論文は、MODIS衛星データを活用して、アフリカにおける土地回復プロジェクトの植生増加が地表面温度に与える影響を定量化し、地域ごとの冷却効果を予測する手法を提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①空間的・時間的スケールの違いによる影響の複雑性
・植生と気候の関係は、地域によって異なるため、特定のケーススタディの結果を他の地域に適用することが難しい
・例えば、アルベド(反射率)と蒸発冷却のバランスは、緯度、背景気候、地理的条件などによって大きく異なる
・また、短期的な植生変化(季節変動)と長期的な変化(トレンド)では、地表温度への影響が異なるため、短期と長期での分析が分けて行われていない場合、その影響が混在し理解が困難になる
②アフリカの乾燥地帯に関する研究不足
・これまでの研究では、アフリカの乾燥地帯では森林が少なく、実際の土地回復プロジェクトでは草地やサバンナの増緑が主な対象となるが、これらの地域の気候への影響に関する研究が少ない
◾️本研究のアプローチ
①多様なデータセットの利用
・アフリカ全域をカバーするMODIS衛星データを用い、NDVI(植生指数)、LST(地表面温度)、WSA(白空反射率)の関係を広範な乾燥度ゾーン(乾燥地帯、半乾燥地帯、湿潤地域)ごとに解析する
・上記により、非森林地域や乾燥地帯での植生増加が地表面温度に与える影響を評価できる
②地域的・時間的変動の評価
・各地点での植生変化や温度変化が、単なる自然変動ではなく、人為的な土地回復によるものかどうかを正確に判別するために、空間コンテキスト手法を使用する
・具体的には、25kmの半径内のピクセルの平均値を基準にし、地域的な自然変動の影響を排除しつつ、植生変化が地表面温度にどのように影響するかを測定する
③季節性と長期トレンドの分離
・時間的変動を季節性とトレンドに分け、急激な変化(ブレイクポイント)を検出するために、BFASTアルゴリズムを使用する
・上記アルゴリズムにより、土地回復の影響で突然の植生変化や温度変化が起こったかを判別でき、季節的影響と長期的な変化の違いを評価可能とする
④地表面温度への影響の定量的評価
・ 植生指数(NDVI)と地表面温度(LST)の相関関係をピアソン相関係数で定量化し、さらに、観測されたデータを基にランダムフォレスト回帰モデルを使用して、植生増加が気温に与える影響を予測する
・上記により、地域ごとの冷却効果や温暖化効果を数値化する
【議論の内容・結果は?】
◾️植生、アルベド、地表面温度の時間スケールによる関係性
①NDVI(植生指数)とアルベド(WSA)の関係
[16日間のスケール(16日間の中での最大値利用)]
・31%の地域では、NDVIが増えるとWSAが減少する(アルベドが暗くなる)ことが示され、これは南アフリカやサヘル地域で顕著だった
・一方で、29%の地域では、逆にNDVIとWSAの正の相関が見られた(密な植生が近赤外光を反射するためと考えられる)
[季節的スケール]
・季節的スケールでは一部の地域で正の相関が見られ、長期的には負の相関が示された
②NDVIと地表面温度(LST)の関係
[16日間のスケール(16日間の中での最大値利用)]
・79%の地域でNDVIが増加するとLSTが下がる(冷却効果がある)ことがわかった
・ただし、中央アフリカなど一部の地域では正の相関が見られ、植生増加が温暖化効果をもたらす可能性もある
[季節的スケール]
・季節的および長期的な変化でも、同様の冷却効果が観察されたが、地域によっては異なる相関パターンも見られた
③ブレイクポイント(急激な変化点)
・NDVIの急激な変化が起こるタイミングは、WSAやLSTの変化とも一致することが多いが、必ずしもすべての場所で一致するわけではない
・例えば、NDVIのブレイクポイントが現れた後、WSAのブレイクポイントが1年遅れて現れることがある
◾️乾燥度と土地被覆の影響
①NDVIとアルベド(WSA)の関係【図a】
・乾燥した地域(低いAridityIndex値)では、NDVIとWSAの間に強い負の相関が見られ、植生が増えると反射率が低下し、地表が暗くなることがわかる
・反対に、湿潤な地域(高いAI値)では、この相関が弱まり、NDVIが増加してもWSAに大きな変化は見られない
・最大の正の相関係数(最も大きなNDVI–WSAの相関)は、乾燥した半湿潤な地域(AI ≈ 0.5)で観察され、本結果は、植生が高まることで可視光よりも近赤外線の反射が増加することを示唆している
②NDVIと地表面温度(LST)の関係【図b】
・乾燥した地域では、NDVIとLSTの間に強い負の相関があり、植生が増加すると温度が低下することがわかる
・湿潤地域では、この相関が弱く、相関係数は0に近いか、わずかに正の値を示す
・つまり、湿潤な地域では、植生の増加が必ずしも温度低下に寄与しないことが示唆されている
③土地被覆の影響
・森林地帯やサバンナでは、NDVIとWSAの正の相関が観察される一方で、草地、低木地帯、荒地ではNDVIとWSAの負の相関が観察される
・NDVIとLSTの相関では、多くの土地被覆クラスで負の相関が見られるが、常緑広葉樹林では正の相関が観察され、植生の増加が逆に温暖化に寄与する可能性が示されている
◾️植生とエネルギーバランスの関係
①前提
・エディ・コベアンス(EC)データとは、大気と地表間のエネルギーや物質の交換プロセスを測定した結果である
②アリッド(乾燥)地域におけるNDVIとエネルギーバランスの関係
・乾燥地域(スーダン、セネガル)のECデータでは、NDVIが増加すると潜熱フラックス(LE)が増加し、蒸発量が増えることが示されている【図3d】
・同時に、NDVIの増加に伴ってWSAは減少し、より多くの太陽放射が吸収される傾向にある【図3d、図3g】
・しかし、増加したLEが熱の大部分を吸収するため、顕熱フラックス(H)は減少し、結果的に地表温度(LST)が低下する
③セミアリッド(半乾燥)地域における関係
・半乾燥地域(ザンビア、南アフリカ)でも、乾燥地域と同様の冷却効果が確認されたが、NDVIとWSAの関係は弱くなる【図3b、図3e、図3h】
・北アフリカの一部地域では、NDVIとWSAの正の相関が見られることがあり、これはこの地域特有の条件が影響している可能性がある【図1b】
④湿潤地域における関係
・湿潤地域(ガーナ、コンゴ・ブラザヴィル)では、NDVIの増加はLEやLSTに対して顕著な効果をもたらさない【図3c、図3i】
・エネルギーバランスは、LEとHの合計がほぼ一定で、季節的な変化に左右されることが少ないと見られる
◾️ 大規模な土地回復による冷却効果の予測
①WSAとLSTの変化
・調査期間(2001年から2023年)にわたるWSAとLSTの変化は、プロジェクトごとに増加や減少が見られたが、明確なパターンは確認できなかった 【Fig. 4a, b】
②NDVI(植生指数)との関係
・NDVIが増加すると、一般的にWSAとLSTは減少する傾向が見られた
・上記は、植生が増えると表面温度が下がる、つまり冷却効果が生じることを意味する【Fig. 4c, d】
③乾燥度の影響
・乾燥度による違いはほとんどなく、どの乾燥ゾーンでも、NDVIの増加に伴い温度が低下する傾向が確認できた
・このことから、アフリカ全体で植生の増加が温度を下げる効果があることが分かる
④大規模土地回復による冷却効果の予測
・予測によると、半乾燥地域が最も大きな植生増加が見込まれる一方、湿潤地域や非常に乾燥した地域では、緑化の可能性は低いとされる
・NDVIの増加に伴う表面温度の変化を予測した結果、多くの地域で最大-4Kの温度低下が見らたが、ほとんどの地域では温度変化は-1.5Kから+1.5Kの範囲内であった
・ただし、サヘル地域や南部アフリカの乾燥地域、または中央アフリカの熱帯雨林など、特定の地域ではわずかな温暖化が予測された
・つまり、乾燥地域や湿潤地域では植生が増えても、必ずしも温度が下がらない可能性があることを示している
#植生 #気候 #アルベド #蒸発冷却 #アフリカ #MODIS #NDVI #LST #WSA #乾燥地帯 #半乾燥地帯 #湿潤地域 #非森林地域 #地表面温度 #エディ・コベアンス #スーダン #セネガル #潜熱フラックス #ザンビア #南アフリカ #ガーナ #コンゴ
Advancing forest carbon stocks’ mapping using a hierarchical approach with machine learning and satellite imager
【どういう論文?】
・機械学習と衛星データ(Sentinel-2)を活用し、森林の主要な構造特性(樹齢、樹高、基準面積など)を予測するための階層的アプローチを提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①地上調査データへの依存
・森林炭素ストックや森林構造特性の推定に地上のフィールドデータ(インベントリデータ)に大きく依存している
②多様なデータの統合不足
・異なるセンサーのデータ(光学、SAR、LiDARなど)を一貫した方法で統合し、炭素ストック推定に活用するための標準的なプロセスが確立されていない
③予測モデルの複雑性と精度のトレードオフ
・炭素ストックを推定する際、複雑な森林構造や時空間的な変動を考慮する必要があり、予測モデルは精度と解釈性の間でトレードオフが生じている
④スケーラブルな炭素ストック推定手法の欠如
・炭素ストックの推定は、森林構造に基づいた複雑なプロセスであり、さまざまなプール(例:地上バイオマス、土壌、有機物のデブリ)間の質量分布の把握が必要だが、広範囲での推定にはまだスケーラブルな手法が確立されていない
◾️本研究のアプローチ
①使用データ
[インベントリデータ(地上測定データ)]
・インベントリデータは、森林管理単位で収集されたもので、樹齢、樹高、基準面積、優勢樹種など、木材および炭素ストック計算に必要な全ての重要なパラメータが含まれている
・最初はベクトル形式(各森林スタンドの境界が明示された地図データ)となっているが、これをSentinel-2衛星画像の解像度に合わせたラスターデータ(10mのピクセルサイズ)に変換して使用する(本過程では、各ピクセルに対して分類(樹種など)や回帰(樹齢、樹高など)のためのラベルや数値を割り当てる)
・その際、同じ森林スタンド内でも、異なる植生特性(例: 樹種や樹高など)が存在するため、スタンド全体を一つの単位として扱うのではなく、ピクセルごとに詳細なデータを取得することで、植生カバーの多様性を反映させる
[衛星データ]
・主にSentinel-2のマルチスペクトルデータを使用しており、各ピクセルごとに森林スタンドに対応させ、ピクセルレベルでパラメータを予測する
・本データは高解像度でかつ定期的に更新されるデータであり、炭素ストック推定に非常に適している
②機械学習モデルの活用
・森林の優勢樹種や樹齢、樹高、基準面積を予測するために、機械学習モデルを使用する
・回帰タスクでは、樹齢や樹高、基準面積の連続値を予測する
・分類タスクでは、森林の優勢樹種(スプルースやパインなど)を分類する
・予測されたパラメータは、事前に定義された炭素換算式を使用して幹の炭素ストックに変換される(直接炭素ストックを予測するアプローチではなく、まず中間パラメータ(例:樹齢や基準面積)を予測し、それを元に炭素ストックを計算する階層的アプローチとなっており、本アプローチにより、各パラメータの寄与を分離し、結果の解釈性を高めることができる)
※炭素含有係数(以下):樹種ごとに木のバイオマス(木の体積や質量)から炭素量を推定する
※バイオマス変換・拡張係数(Biomass Conversion and Expansion Factors, BCEF)(以下):木材の体積からバイオマス(つまり、生物量、主に木の重量)を推定するために使用する
◾️樹種ごとの森林優勢種分類の結果
・Pine(松)はF1スコア0.85と最も高い結果を示し、モデルがこの樹種の分類に最も成功していることがわかる
・Birch(カバノキ)はF1スコア0.81で次に高い結果を示している
・一方で、Aspen(ヤマナラシ)はF1スコア0.62と、他の樹種と比べてパフォーマンスが低く、この種の分類が最も難しかったことがわかる
・Spruce(トウヒ)のF1スコアは0.70であり、中程度の分類性能を示している
・全体的に見て、モデルは松やカバノキの分類に成功しているが、ヤマナラシやトウヒの分類においては若干の課題があることが示唆されている
(原因としては、スペクトル的類似性による機械学習の精度落ち、森林構造の複雑さなどが考えられる)
◾️森林樹齢推定の結果
・樹齢推定のモデルは、ほぼ安定して良好な精度(平均R²=0.75)を示している
・平均絶対パーセンテージ誤差(MAPE)は0.195であり、全体として19.5%の誤差があることを示した
・夏期の観測データを使用したモデルの精度が高く、特に2019年6月のデータでは精度が向上した
◾️森林樹高推定の結果
・樹高推定のモデルの精度は中程度であり、R²値が0.58に留まっている
・MAPEは0.161で、全体として約16.1%の誤差がある
・樹高推定モデルの精度は樹齢推定ほど高くないものの、誤差が比較的小さいため、環境モニタリングや森林管理においては実用可能なレベルであると考えられる
◾️基準面積の推定結果
・基準面積推定の精度も中程度であり、R²は平均0.56となっている
・樹高推定と同様に、2018年9月のデータではR²が0.47と他よりも低くなっており、秋季データでのモデル性能が低下している
・平均MAPEは0.16で、基準面積の推定誤差は約16%となっている
①Figures 5, 6, 7
・樹齢、樹高、基準面積、それぞれの空間的予測マップを可視化している
・日付ごとのRGB画像と地上真値(Ground Truth)と予測結果の比較が表示されており、予測された空間分布の視覚的評価が行える
②Table 10, Table 11
・木材蓄積量の直接推定と階層的アプローチの比較となっている
・階層的アプローチでは、R²値0.57、MAPE 0.39と、直接推定よりも精度が高い結果が得られている
③Figures 8, 9
・木材量および炭素蓄積量の空間予測マップを示しており、階層的アプローチが視覚的にも精度の高い結果を示している
④Fig. 10
・炭素蓄積量の推定結果に関するマップ
・こちらも階層的アプローチが直接推定よりも安定した予測精度を示しており、今後の森林管理における応用可能性を示唆している
#Sentinel-2 #機械学習 #樹種 #森林優勢種分類 #樹齢 #樹高 #基準面積 #階層的アプローチ #炭素蓄積量
A machine learning paradigm for necessary observations to reduce uncertainties in aerosol climate forcing
【どういう論文?】
・本論文は、機械学習を用いて、ライダー(LiDAR)と再解析データを利用し、エアロゾルの特性を高精度に予測する新しいアプローチを提案する
【技術や方法のポイントはどこ?】
◾️エアロゾルとは
・エアロゾルという大気中の微小粒子は、太陽光を反射したり吸収したりすることで気候を冷却させる要因(太陽光が「光の波」のように大気中を進む際にその経路を変えるフィルターのような役割)の1つである
◾️先行研究の課題
①観測データの不十分さ
・エアロゾルの垂直分布(地表からの高度に応じた分布)に関して、従来の衛星や地上観測では限られた精度しか得ることができない
・原因としては、エアロゾルは地上から見た大気全体に分布しているため、雲や他の大気成分と相互作用する中で、その影響を正確に測ることが難しいことが挙げられる
②物理ベースの推定手法の限界
・従来のリトリーバル手法(観測データからエアロゾルの性質を推定する方法)は、物理モデルに基づいており、これらのモデルは、エアロゾルや大気の中で光がどのように散乱・吸収されるかを数理的に表現するため非常に複雑となる
・また、モデルに含まれるパラメータや初期の仮定が、推定されたエアロゾルの特性に直接的に影響を及ぼすため、エアロゾルの形状や物質組成に関する仮定が誤っていると結果も大きく変わる可能性がある
③エアロゾルの特性観測の限界
[エアロゾル光吸収(ABS)]
・ABS(Aerosol Light Absorption)とは、エアロゾルが太陽光をどれだけ吸収するかを示す(エアロゾルが太陽光を吸収することで、周囲の空気が暖められたり、大気の温度分布が変化し、気候に影響を与える)
・観測が難しい理由としては、エアロゾルが光を吸収する程度は、エアロゾルの種類や大きさ、形状、またそのエアロゾルがどれだけの高さに分布しているかによって変わるため、一律に把握するのが困難なためである
[雲凝結核(CCN)]
・CCN(Cloud Condensation Nuclei)とは、雲の形成を助ける微粒子のことであり、大気中の水蒸気が凝結して水滴を形成する「核」となるもので、雲を作るための「種」とも言える(CCNの量や分布は、雲の形成や持続時間に大きな影響を与え、CCNの多さによって雲がどれだけの水分を持つか、どれくらいの降雨が起こるかが決まる)
・観測が難しい理由としては、CCNは非常に小さな粒子で、またエアロゾル全体の中でCCNとして機能する粒子は一部だけとなっており、エアロゾルの中でも雲を形成する能力を持っている粒子(CCN)を識別し、さらにその大気中での分布を正確に把握することは、従来の観測技術では難しい
◾️本研究のアプローチ
①新規性(データ融合による精度向上)
・LiDARとin situ観測の組み合わせにより、LiDAR単独では取得が難しかった高次のエアロゾル特性(ABSとCCN)を高精度に予測する
・LiDARデータとしては、エアロゾルの後方散乱(Backscatter)、消散(Extinction)、偏光(Depolarization)などの、エアロゾルが光をどれだけ反射してどれだけの量が大気を透過しているかを示すデータを活用する
・in situ観測データとしては、航空機から得られるエアロゾルの光吸収(ABS)や雲凝結核(CCN)に関する直接測定データを利用し、エアロゾルが太陽光をどれだけ吸収しているか、あるいはどれくらいの粒子が雲を形成する可能性があるかを把握する
・上記2つのデータを統合する際には、LiDARとin situデータを1100mの水平距離と45mの垂直距離でコロケーション(同時観測)することで、同じ空間でのデータ比較を可能とし、予測の一貫性を保つ
②機械学習の応用
・物理モデルに依存する従来の推定手法とは異なり、本研究では、フルコネクテッドニューラルネットワーク(FCNN, 全結合層を持つ標準的なNN)を用いた機械学習モデルを適用する
・上記により、ライダーの観測データを効率的に活用し、エアロゾルの光吸収や雲凝結核のような、観測が困難な特性を予測可能にする
③多様なデータセットの活用
・本研究では、複数のキャンペーンから得られた以下のデータを使用し、異なるエアロゾルの種類や気象条件に対応することで、グローバルに適用可能な予測モデルを作成する
– DISCOVER-AQ:都市部や郊外における大気質観測に関するデータ
– ACTIVATE:大西洋西部でのエアロゾルと雲の相互作用を観測したデータ
– ORACLES:アフリカ上空の雲とエアロゾルの相互作用データ
– CAMP2Ex:フィリピン近海におけるエアロゾルとモンスーンの関係を観測したデータ
【議論の内容・結果は?】
◾️エアロゾル特性の高精度予測
・ライダー観測のみを使用した場合、CCNに関しては相対誤差13%、ABSでは21%という非常に低い誤差を達成した
・上記に再解析データ(温度や相対湿度)を追加することで、予測精度がさらに大きく向上し具体的には、CCNの予測精度が相関係数0.93から0.97、ABSでは0.80から0.90まで向上した
#エアロゾル #光吸収 #ABS #雲凝結核 #CCN #DISCOVER-AQ #ACTIVATE #ORACLES:アフリカ上空の雲とエアロゾルの相互作用データ #CAMP2Ex モンスーン #LIDER #ライダー #再解析データ #温度 #相対湿度
Climate-driven global redistribution of an ocean giant predicts increased threat from shipping
【どういう論文?】
・本論文は、衛星追跡データと気候モデルを用いて、ジンベエザメの将来的な生息地変動と船舶との衝突リスクを予測する手法を提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①海に生息する大型動物のモニタリング困難性
・ジンベエザメのような高度に移動性のある海洋メガファウナ(大型動物)は、年間で数百キロメートルから数千キロメートルも移動するため、従来の方法ではその動きを詳細に追跡することが難しい
・上記により、気候変動に伴う分布変化に関する仮説を検証するデータが不足している
②海洋生態系における将来的な生息地の予測不足
・気候変動により将来的に生物がどこに生息するかという予測は、まだ確立されておらず、多くの種については将来の生息地が不明である
・特に、種の分布変化が船舶交通の影響を受ける可能性や、他の人為的な脅威とどの程度関連するかについての理解は限られている
③船舶交通と衝突リスクの影響評価の不足
・気候変動によって、海洋メガファウナの生息地がより人間活動が活発な地域、特に船舶交通が増加している地域に移動する可能性がある
・この場合、衝突リスクがどの程度増加するかは従来の研究では具体的に評価されていない
・また、逆に生息地が移動し、より安全な場所に移ることで脅威が減少する可能性もあるが、これについての量的評価も行われていない
◾️本研究のアプローチ
①衛星タグ追跡データの利用
[衛星データ]
・2005年から2019年の15年間にわたり348頭のジンベエザメを衛星タグで追跡
・各個体から得られた15,508日分のデータが、7つの海洋地域(北大西洋、南大西洋、北西インド洋、南西インド洋、東インド洋、西太平洋、東太平洋)にわたって収集されている
[Argos衛星データシステム]
・動物の追跡や環境データの収集に特化した、非常に高度な衛星ベースのデータ収集システムであるArgos衛星データシステムを利用し、ドップラーシフト計算(移動する物体が発する信号の周波数の変化の計算)により、海洋メガファウナの地理的な位置を詳細に推定
・(ブナデータも統合されており)光レベルや水温、潜水深度のデータも収集し、これらから生息地の位置推定を行う
②多変量の環境変数を利用したモデル
・ジンベエザメの生息地分布を予測するために、28種類の環境変数(水温、塩分、クロロフィル濃度など)を利用して分布モデルを構築
・上記により、特定の地域だけでなく、海洋全体での生息地変動を予測する精度が向上させる
③気候変動シナリオに基づく将来予測
・CMIP6(Coupled Model Intercomparison Project Phase 6)のデータを用いて、3つの気候シナリオ(SSP126、SSP370、SSP585)に基づく将来予測を実施
・上記により、異なる温暖化シナリオ下でジンベエザメの生息地がどのように変化するかを評価する
④複数のモデルを組み合わせた検証手法
・分布モデルには、GAM(Generalized Additive Models)とBART(Bayesian Additive Regression Trees)という異なるアルゴリズムを用いてモデル間の一致度を比較
⑤広域的な船舶交通データとの統合
・Global Fishing Watchの船舶交通データを用いて、ジンベエザメの生息地と船舶の重複度(SCI:Ship Co-occurrence Index)を算出
・上記により、将来の気候シナリオの下でどの地域で船舶との衝突リスクが高まるかを予測する
【議論の内容・結果は?】
①現在のジンベエザメの生息地適性マップ
・2005~2019年のデータに基づき、ジンベエザメの生息に適した地域が熱帯、亜熱帯、温帯の海域で確認された
・特に、北大西洋、東インド洋、東太平洋などにおいて、生息地適性が高いことが示されている
・以下のa, bパネルでは、現在の生息地(2005~2019年)を黄色と青で表し、黄色がジンベエザメに適した地域、青が適していない地域を示している
②将来の生息地変動の予測
・将来の気候変動シナリオ(SSP126, SSP370, SSP585)に基づき、ジンベエザメの生息地は極方向(北半球の場合は北極に向かって、南半球では南極に向かって)に移動すると予測されている
・東太平洋では生息地が縮小し、赤道付近の水域が特に不適となる一方で、南カリフォルニア湾などの新しい地域が生息地として拡大する可能性が示唆された
・以下のc, dパネルでは、将来の生息地適性の変化を示しており、赤が生息地の増加、青が減少を示す例
・例えば、北大西洋では赤(増加)が多く、メキシコ湾付近では青(減少)が見られることから、北大西洋では生息地が増加する一方で、メキシコ湾では減少すると解釈できる
③船舶との衝突リスクの地理的分布
・以下の図4のc~eでは、特定の国や地域における船舶交通の高い地域とジンベエザメの生息地適合性の変動を比較していて、将来の生息地が高い船舶交通ルートに重なるリスクが評価されている
・図4c(米国北太平洋)は、新たに適合性が高まる生息地が混雑した船舶航路に重なることで、衝突リスクが95倍に増加することを示す
・図4d(シエラレオネ北大西洋)は、同様に、ジンベエザメの生息地が増加し、衝突リスクが689%増加することを示す
・図4e(日本東シナ海)では、日本周辺でも272%の衝突リスク増加が予測されている
#大型動物モニタリング #ジンベエザメ #海洋メガファウナ #気候変動 #船舶交通 #衝突リスク #Argos衛星データシステム #CMIP6 #SSP126 #SSP370 #SSP585 #Global-Fishing-Watch #SCI #Ship-Co-occurrence-Index
以上、2024年9月に公開された論文をピックアップして紹介しました。
皆様の業務や趣味を考えた時に、ピンとくる衛星データ利活用に関する話題はありましたか?
最後に、#MonthlySatDataNewsのタグをつけてXに投稿された全ての論文をご紹介します。
Disproportionate impact of atmospheric heat events on lake surface water temperature increases
Applications of Knowledge Distillation in Remote Sensing: A Survey
来月以降も「#MonthlySatDataNews」を続けていきますので、お楽しみに!