【2024年12月】衛星データ利活用に関する論文とニュースをピックアップ!
2024年12月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。
2024年12月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。
・Estimation of internal displacement in Ukraine from satellite-based car detections
(衛星画像を用いて車両数の変化から国内避難民(IDP)を推定する手法)
・Recent methane surges reveal heightened emissions from tropical inundated areas
(大気インバージョンモデルと地上・衛星観測データを統合し、湿地でのメタン排出増加を解析する手法)
・Strategies for detecting land-use change on the River Tea SCI ecological corridor via satellite images
(OBIAとANNを用いた、多解像度データで土地利用変化を高精度に解析する手法)
・Identifying thermokarst lakes using deep learning and high-resolution satellite images
(高解像度衛星画像とDeepLabV3+を用いた、小規模なサーモカルスト湖を高精度で特定する手法)
・Recursive classification of satellite imaging time-series: An application to land cover mapping
(再帰的ベイズ分類(RBC)フレームワークによる、時系列衛星画像を用いた土地被覆分類の精度向上手法)
宙畑の新連載「#衛星論文」では、前月に公開された衛星データの利活用に関する論文やニュースをピックアップして紹介します。
実は、本記事を制作するために、これは!と思った論文やニュースをTwitter上で「#MonthlySatDataNews」「#衛星論文」をつけて備忘録として宙畑編集部メンバーが投稿していました。宙畑読者のみなさまも是非ご参加いただけますと幸いです。
2024年12月の「#MonthlySatDataNews」「#衛星論文」を投稿いただいたのはこの方でした!
Space to Policy: Scalable Brick Kiln Detection and Automatic Compliance Monitoring with Geospatial Data https://t.co/q0biioMjIf #衛星論文
Planetのデータを使ってレンガ窯を検出
インドの大気汚染の8-14%の原因になっているらしい、へえ— たなこう (@octobersky_031) December 8, 2024
それではさっそく2024年12月の論文を紹介します。
Estimation of internal displacement in Ukraine from satellite-based car detections
【どういう論文?】
・本論文は、衛星画像を用いて車両数の変化から国内避難民(IDP)を推定する手法を提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①既存のデータ収集方法の制約
・IDP(国内避難民)の動態は、主に現地調査や電話調査、フィールドワークに依存しており、かつ、複数の独立した調査や目的で収集された断片的なデータに依存し、矛盾が生じやすい
②既存データの限界
[携帯電話]
・オペレーターごとの契約や規制によりデータ取得が困難である
・国ごとに処理や集計方法が異なるため、国際的な汎用性が低い
[SNS]
・一部の人口層に偏る(SNSを利用しない層が排除される)
・プラットフォームごとにデータ仕様やアクセス条件が異なり、透明性が低い
[夜間光データ]
・都市間の広域的な移動は捉えやすいものの、詳細な人口変動は困難である
◾️本研究のアプローチ
①衛星画像を用いた車両検出によるIDP推定の可能性
・衛星画像上で観測可能な車両数の増減が、人口移動の代理指標となる
・車両を利用した避難行動は戦争初期のウクライナでも報告されており、個人または共有車両での移動は大量避難を示す兆候と考えられる
②車両数と人口の非線形関係の活用
・車両数と人口数の関係は必ずしも単純な比例関係ではないが、適切な回帰モデルを用いることで、短期的な人口流動を推定可能と考える
③既存データの限界を補完
・衛星画像による車両検出は、携帯電話やSNSなどの既存データの代替または補完として有用であり、特に以下の点で優位性がある
– 透明性: 衛星画像で車両の存在を直接目視可能で、モデルのブラックボックス性を回避
– 普遍性: 各国の通信規制やSNS利用率に依存せず、グローバルな適用が可能
◾️対象地域
・ウクライナ国内(合計61地域、面積13,496 km²)を対象とする
◾️手法
①ステップ1: 衛星画像の収集
[使用する衛星画像の条件を設定]
・解像度: 0.3~0.5mの超高解像度(Maxar社のWorldview・GeoEyeシリーズ)
・色: RGBカラー画像
・雲被り: 雲覆率が20%以下
・時期: 2019年1月~2022年9月(戦争前・コロナ期・戦争中の比較のため)
[画像の取得とステッチング]
・対象地域の面積の1%以上をカバーする画像を取得する
・日ごとに利用可能な画像が複数ある場合、最もカバー面積が大きい画像を優先する
・画像が分割されている場合はステッチングを行い1枚の画像に統合する
・合計で1009枚の画像をダウンロードする
②ステップ2: 車両検出モデルの構築
[使用モデル]
・CNNベースのSingle Shot Multibox Detectors (SSD) を複数組み合わせたエンコーダデコーダ型アンサンブルモデルを利用する
[検出精度の最適化]
・信頼度しきい値を0.45に設定(F0.5スコア最大値: 0.4776)
・人道支援の文脈では、避難民の正確な推定が重要であるため、誤検出を抑えること(高Precision)は重要な要件となるため、Precisionを重視し、False Positive(誤検出)を抑制する
・Recallは犠牲にしてでもPrecisionを優先する
[評価データセット]
・3000枚の画像、19,000の車両アノテーション を用いた感度分析で最適なしきい値を決定
③ステップ3: データの前処理
[誤検出(False Positives)のフィルタリング]
・建物、道路、公園、河川、農地など、さまざまな地物がタグ形式で記録されているOpenStreetMap(OSM)データベースを活用し、車両が存在しえない場所(例: 河川、森林、農地など)を抽出(タグ付け)
・OSMタグを利用して不適切な検出をフィルタリング
④ステップ4: 空間的・時間的解析
[車両密度の計算]
・各都市における車両の密度変化を時系列で把握し、戦争やコロナ禍などの影響を評価する
・各都市での月ごとの平均車両密度(1 km²あたりの車両数)を計算する
[人口変化の推定]
・車両密度から人口数への変換を行う
・1つ目の手法がRatio法というもので、2019年(基準年)の車両数と人口の固定比率を使用して簡易的に対象年推定する
・もう1つの手法が、GAM法というもので、非線形モデルで、より柔軟に車両数と人口の関係を捉える
・両モデルを併用して、推定範囲の不確実性を補完する
[計算単位]
・各都市の1 × 1 kmグリッドごとに人口変化を推定する
・推定されたグリッドごとの人口を合算し、都市全体の人口動態を計算する
⑤ステップ5: イメージング条件の影響評価
[解析条件]
・解像度、オフナディア角(撮影角度)、太陽高度、雲被り、積雪などが検出精度に与える影響を評価する
・なお、オフナディア角とは、衛星が地上の目標物を撮影する際の角度を表、具体的には衛星が地球の真下を向いて撮影する場合の角度は0度となる
・Generalized Linear Model(GLM)を使用して影響因子を統計解析する
【議論の内容・結果は?】
◾️モデル評価
本研究で使用したアンサンブルモデルの性能は以下の通りとなる。
– Precision: 0.5578
– Recall: 0.3032(車両密度や動態分析結果が過小評価されている)
– F0.5スコア: 0.4776
◾️車両密度の空間・時間的変化
①四半期ごとの変化(図a)
・車両密度が東部から西部へ移動していることを示唆している(時間が経つにつれて西部で車両が増加)
②年間レベルでの変化(図b)
・西部地域で顕著な車両密度の増加が確認できる
・例外として、最東部のLuhanskが+773%となっており、ロシアへの越境移動の可能性が示唆される
◾️車両数と人口の関係
・一般的に、人口が多い地域では衛星画像で観測される車両数も多い
・図a~cのように、都市ごとに異なる関係性が観察され、非線形である場合が多い
・例外の都市として、Oleksandriyaは車両数と人口の明確な関連がほとんど見られず、
理由としては、「駐車場の利用(地下ガレージなど)」「車の所有率の差」「公共交通機関の利用状況」が影響したと考えられる
◾️イメージング条件の影響評価
①解像度
・高解像度(例: 0.3m/ピクセル)の画像ほど車両密度が高く検出された
・解像度が低下すると小型車両の検出が困難になり、密度が低くなる傾向が確認された(図7a)
②積雪
・雪の存在は車両検出に悪影響を与えた
・雪により車両と背景のコントラストが低下し、モデルの識別が困難になった(図7b)
③オフナディア角
・車両密度は小さなオフナディア角(25°付近)で最大化した
・大きなオフナディア角では建物や影による遮蔽が増え、検出精度が低下した(図7c)
④太陽高度
・太陽高度が高いほど車両密度の検出が向上した
・影の長さが短くなることで車両の視認性が向上した(図7d)
⑤雲覆率
・雲が多い画像では車両密度が低い傾向が見られたが、統計的に有意な影響は検出されなかった(図7e)
・理由として、事前に雲覆率20%以下の画像を選別したことが考えられる
#IDP #国内避難民 #Ratio法 #GAM法
Recent methane surges reveal heightened emissions from tropical inundated areas
【どういう論文?】
・本論文は、気候変動の影響を考慮した正確なメタン排出量評価に向け、湿地がメタン排出の主要な発生源であることに着目し、大気インバージョンモデルと地上・衛星観測データを統合することで湿地での季節的・年次的な変化を考慮したメタン排出増加を解析する手法を提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①既存湿地モデルの限界
・湿地は季節や年によってその広さや水の深さが変わるものの、現在のモデルはこの変化を正確に反映できない
・また、植生を介したメタン輸送や酸化プロセスを過小評価している
・特に熱帯湿地では、洪水範囲の変化や(以下に記載している)ラニーニャのような気候変動に伴う排出増加を適切に表現できない
②メタン変動の要因分解の困難さ
・大気中のメタン濃度変化が、排出源の変動(湿地、農業、化石燃料)と分解プロセス(主にOHラジカル)にどの程度起因するかの分離が難しい
④ENSO(エルニーニョ・ラニーニャ現象)の影響考慮
・エルニーニョ・ラニーニャ現象は、太平洋の海面温度の変動に伴って、世界中の気象パターンに影響を与える現象である
・エルニーニョ現象は、熱帯地域で乾燥した条件を作り出し、湿地の水位を下げることで、メタン排出を減少させる
・一方、ラニーニャ現象は湿った条件を作り出し、湿地が拡大するため、メタン排出を増加させる
・エルニーニョ・ラニーニャ現象の影響は地域ごとに異なり、一部の地域では予測通りの応答が見られず、単純にスケールアップして全体像を把握するのが困難である
◾️手法
①ステップ1: 観測データの収集
[地上観測データの収集]
・NOAAやICOSなどが運営する121箇所の地上観測点でのメタン濃度データを使用する
[衛星観測データの収集]
・日本の温室効果ガス観測衛星(GOSAT)のデータを活用する
[観測データの統合]
・地上観測は主に北半球中高緯度をカバーし、衛星観測は熱帯地域など広範囲を補完する
・データの空間ギャップを埋めるため、両方のデータを組み合わせて分析する
②ステップ2: 大気インバージョンモデルの使用
[メタン計算モデルの適用]
・大気中で観測されたメタン濃度を基にして、その排出源を地球表面に「逆算」するためのPYVAR-LMDZ-SACSモデルを利用する(本プロセスを「大気インバージョン」と呼ぶ)
・まず、メタンの過去のデータやモデルを基に排出量分布を仮定(「事前推定値」)する
・地上観測や衛星データから得られる大気中のメタン濃度を入力する
・モデル内で観測値と一致するよう、仮定された排出量を調整します(「事後推定値」)する
[輸送モデルの適用]
・大気中のメタン濃度分布に影響を与える「風」などの物理過程を計算する
・シンプルで計算コストが低いClassicバージョンと、(メタンとその他の)境界層の混合や大規模輸送を精密に再現するAdvancedバージョンがある
[複数インバージョンの実施]
・本研究では以下の組み合わせ位のインバージョンを実行する
– 地上観測 + Classic輸送モデル
– 地上観測 + Advanced輸送モデル
– GSNIES衛星観測 + Classic輸送モデル
– GSNIES衛星観測 + Advanced輸送モデル
– GSUoL衛星観測 + Classic輸送モデル
– GSUoL衛星観測 + Advanced輸送モデル
③ステップ3: ENSOの影響の評価
[ENSOイベントの選定]
・2020~2021年のラニーニャ現象を自然実験として利用し、湿地メタン排出への影響を分析する
・ENSO(エルニーニョ・ラニーニャ現象)は湿地の水位や洪水範囲を変化させ、メタン排出に大きな影響を及ぼすため、気候変動との関連性を評価する上で重要な要素となる
[気象データとの統合]
・GRACE-FO衛星による液体水量(LWE)のデータを使用し、湿地水位変化とメタン排出異常(ΔCH₄)の相関を解析する
【議論の内容・結果は?】
◾️結果1: メタン排出量の全球的増加
・2020年は地表からのメタン排出量が20.3±9.9 Tg CH₄ yr⁻¹増加した
※Tg CH₄ yr⁻¹(テラグラム/年)とは、大気中のメタン排出量を表す単位で、1Tg は1百万トン。大規模な地球システムの排出変動を表すために使用される。
・2021年は24.8±3.1 Tg CH₄ yr⁻¹増加した
・なお、図a,bの影付き部分は、6つのインバージョン結果が一致している領域を示し、結果の信頼性が高い部分を示している
・また、図c,dはGRACE-FO衛星データから得られたLWE(液体水量)の変化を示しており、メタン排出異常(ΔCH₄)とLWEの変化が強く相関し、(ラニーニャ現象による)湿地の水位上昇がメタン排出を増加させる重要な要因であることを示している
◾️トップダウン(TD)推定とボトムアップ(BU)推定の比較
①トップダウン・ボトムアップ推定とは
・トップダウンは、衛星や地上観測で得た大気中のメタン濃度から、その発生源を逆算する方法である
・ボトムアップは、湿地モデルを使って、湿地ごとの排出量を積み上げて計算する方法となる(衛星データは利用せず、別の独自データを使用する)
②比較結果
・以下のe, fでは、トップダウンとボトムアップのメタン排出量変化を8つの熱帯湿地で比較しており、トップダウン推定はボトムアップ推定より一貫して大きな排出増加を示している
・トップダウン推定のエラーバーが大きいことから、大気逆解析の不確実性が存在している一方、ボトムアップモデルは、湿地の動態(洪水範囲や水位変動)や植生を通じたメタン輸送を過小評価している可能性があると考えられる
#メタン排出 #GSNIES衛星 #GSUoL衛星 #ラニーニャ現象 #湿地 #メタン輸送
Strategies for detecting land-use change on the River Tea SCI ecological corridor via satellite images
【どういう論文?】
・本論文は、OBIA(オブジェクトベース画像解析)とANN(人工ニューラルネットワーク)を用いて、多解像度データで土地利用変化を高精度に解析する手法を提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①データと手法の適用範囲の限界
・多くの研究は中解像度センサー(例: Sentinel-2)のみを使用し、広範な土地被覆分類を対象とするが、土地の細分化が激しい地域(例: 河川沿いの植生)では精度が低い
・高解像度データやハイパースペクトルセンサーを利用する手法は存在するが、トレーニングデータの大規模な準備が必要であり、特に小規模かつ複雑な地形では適用が困難となっている
②対象地域への適用不足
・研究対象は、都市環境や農地が多く、河川沿いや大西洋生物地理区(Atlantic Biogeographic Region)のような細分化された地域は十分に探索されていない
◾️本研究のアプローチ
①複数手法の統合的評価
・OBIA(ランダムフォレスト: RF分類器)とANN(ピクセルベース分類)を比較することで、それぞれの手法が異なる地域特性やデータセットに対してどの程度適応可能かを評価する
②長期間データの有効性
・2015年から2023年までの8年間の多時点データを解析することで、LULCCの傾向と変化を定量化し、2031年までの予測を可能にする
③コストと精度のバランス評価
・無料データ(Sentinel-2)と有料データ(PlanetScope)の精度や適用可能性を定量的に比較し、実務的なコストパフォーマンスを明らかにする
◾️手法
①衛星画像の取得
・Sentinel-2(2015–2023年、10枚)
・PlanetScopeおよびRapidEye(2015–2023年、11枚)
・それぞれのデータで冬(植生が最小化する季節)と夏(植生が最大化する季節)の画像を選択
②分類手法
[オブジェクトベース解析(OBIA)]
・OBIAでは、画像を「ピクセル単位」で扱うのではなく、似た特徴を持つ隣接ピクセルをグループ化して「オブジェクト」としてまとめ、これを分類する
・使用するアルゴリズムは、「Large Scale Mean Shift(LSMS)」で、これはピクセルを基にオブジェクト(例えば「森林」「水域」)を定義するものである
・その後、ランダムフォレスト(RF)という機械学習アルゴリズムを使って各オブジェクトを8つのクラス(森林、裸地、農地など)に分類する
・ピクセルの「点」ではなく、意味のある「まとまり」で分類するため、ノイズ(例えば、隣接する異なるクラスが混ざること)を減らし、分類の精度を上げられる
[ピクセルベース解析(ANN)]
・ANN(人工ニューラルネットワーク)では、ピクセル単位でその特徴(例: 色、明るさ)を直接評価し、各ピクセルを分類する
・これは、各ピクセルを一つずつ分析して、どのクラスに属するかを決定する
・トレーニングの際には、各クラス(例えば「水域」「森林」など)ごとに50ポイント程度のピクセルをランダムに選んで学習させる
【議論の内容・結果は?】
◾️Producer’s Accuracy (PA)
・モデルが特定クラスを正確に識別できた割合(誤って他のクラスに分類されるリスク)
・高い精度: 「Eucalyptus」や「Water Courses」で90%以上を記録、特にPlanet Labs + OBIAで高い精度
◾️OBIA分類結果(Sentinel-2とPlanet Labs)
・Sentinel-2 (Fig. 5): 河川域のセグメンテーションが粗く、広葉樹や水域の混同が多い
・Planet Labs (Fig. 6): 高解像度データにより、細分化された植生がより正確に分類されており、特に河川沿い植生の分布が明確
◾️ANN分類結果
・河川沿いの広葉樹がユーカリとして誤分類されるなど、トレーニングサンプルの不足が影響
#OBIA #Sentinel-2 #広葉樹 #PlanetLabs #ANN #河川沿い #広葉樹 #ユーカリ
Identifying thermokarst lakes using deep learning and high-resolution satellite images
【どういう論文?】
・本論文は、高解像度衛星画像とDeepLabV3+を用いて、小規模なサーモカルスト湖を高精度で特定する手法を提案する
【技術や方法のポイントはどこ?】
◾️前提知識
・サーモカルスト湖(Thermokarst lakes)は、主に永久凍土(permafrost)が溶けることによって形成される湖のことである
・永久凍土内の氷が融解することで地面が沈下(thermokarst subsidence)し、その凹地に水が溜まることで形成される
・これらの湖は、北極圏や亜北極圏の地域に多く見られ、地球温暖化の影響でその数や規模が増加していると考えられている
◾️先行研究の課題
①小規模湖の検出の困難さ
・サーモカルスト湖の多くは小規模(0.01km²未満)であり、これらは中解像度衛星画像(例: Sentinel-2)では正確に検出できていなかった
②技術的限界
・中解像度データでは、湖の形状や境界を正確に特定するには解像度が不十分であった
・また、伝統的な分類アルゴリズム(例: ランダムフォレストや閾値ベースの手法)は、複雑な地形や光学的特徴を正確に扱うことが困難だった
・特に複雑な境界や環境条件(雪、湿地、影など)を考慮した分類ができない点が課題となっている
◾️本研究のアプローチ
①高解像度画像で精度向上
・高解像度衛星画像(1.2m*を使用することで、これまで見逃されていた小規模湖を検出できると仮定する
・これにより、従来の中解像度画像による過小評価を補正できる
②深層学習の利用
・従来のアルゴリズム(例: ランダムフォレスト)に代わり、DeepLabV3+モデルを使用することで、ピクセルレベルで湖の境界を正確に特定可能とする
・特に、複雑な形状やノイズが多い環境でも精度を維持できると考える
③マルチソースデータの融合で分類精度向上
・高解像度RGB画像に加え、Sentinel-2の偽色画像(可視光線だけでなく、赤外線などの光の波長を利用して地表の特徴を強調したもの)と、赤外線と可視光の反射率の差を利用して水域を明確に浮き彫りできるMNDWI指数を統合することで、分類精度を向上させる
◾️調査地域
・場所: チベット高原東北部に位置する黄河源流域(永久凍土と季節凍土の移行帯)
・面積: 約 77,600 km²(7.76 × 10⁴ km²)
・標高: 2,671m ~ 6,273m(主に山地や丘陵地帯で、平均斜度は9.5°)
・植生:標高4,800 m以下: アルプス高地草原・草地が支配的、標高4,800 m以上: 植生がまばらな地域
・気候変動の影響:1990年代後半以降に顕著な温暖化傾向が観測されており、永久凍土の急速な劣化が進行中
◾️データセット
①Sentinel-2データ
・解像度: 10 ~ 60 m(マルチスペクトル画像)
・使用データ:バンドB8(近赤外)、B4(赤)、B3(緑)を使用した偽色画像(MNDWIを計算)
②高解像度衛星データ
・解像度: 1.2 m
・使用データ: 2023年10月11日に取得された画像をQGISを用いてダウンロード、ラベリング、モデルのトレーニングデータとして使用(RGB画像として可視光情報を提供)
◾️使用モデル
・ DeepLabV3+: Encoder-Decoder構造で、高精度なセグメンテーションが可能
【議論の内容・結果は?】
◾️サーモカルスト湖の分布
・特定された湖の数: 52,486湖。総面積は279.4 km²で、永久凍土地域全体(52,000 km²)の0.5%を占める
・新たに検出されたサーモカルスト湖の45%以上が、既存のデータセットでは未収録であった)
・湖の規模分布:小規模(0.01 km²未満)の湖が全体の90.9%(47,710湖)、小規模湖の総面積は79.2 km²で、湖全体面積の28.4%を占め、大規模湖(0.01 km²以上)は数は少ないが総面積では大部分を占める
・標高ごとの分布:湖の最大数(22,517湖)は標高4,500–4,700 mで、この範囲の湖が全体の30%を占める一方、総面積では標高4,300–4,500 m(100.6 km²)が最も広い
◾️検出された湖の例
・境界が実際の湖形状と高精度で一致していることを確認した
・雪や影が湖を覆う場合でも、全体的な形状は正確に検出する
#Sentinel-2 #MNDWI # DeepLabV3+ #サーモカルスト湖 #Thermokarst lakes #湖 #永久凍土
Recursive classification of satellite imaging time-series: An application to land cover mapping
【どういう論文?】
・本論文は、時系列衛星画像を用いた土地被覆分類において、再帰的ベイズ分類(RBC)フレームワークを提案する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①ノイズや干渉に対する脆弱性
・衛星画像は雲、反射、照明条件の変化に影響されやすく、特にNDWI, MNDWIなどのスペクトル指標は、山影や雲に対する耐性が弱い
・高度な機械学習手法や深層学習モデルもノイズに対して過度に感度を持つことがある
②時系列データの未活用
・既存手法では、各時点の画像を個別に分類することが多く、上記脆弱性への対策のために時系列データを利用することがない(時間的相関を十分に活用できていない)
・時系列全体を再処理するバッチ処理には、計算コストが大きいという課題がある
◾️データ
①衛星画像
・Sentinel-2 Level-2Aを使用する
・対象バンドは、青 (Blue), 緑 (Green), 赤 (Red), 近赤外線 (NIR), ナローバンドNIR (Narrow NIR), 短波赤外線 (SWIR)である
②対象地域
・オロビルダム(カリフォルニア州, アメリカ):2020年9月1日~2021年9月26日、水位変化の検出と水域分類
・チャールズ川流域(マサチューセッツ州, アメリカ):2020年9月4日~2021年9月26日、都市部の土地利用変化追跡
・アマゾン熱帯雨林(ブラジル):2018年12月3日~2021年12月27日、森林破壊の検出
◾️手法
①用語(前提知識)
・Prior(事前確率): 新しいデータを得る前に、ピクセルがどのクラスに属するかの初期の予測(例: 過去の観測から「この地域は90%が森林、10%が水」と推測する)
・Likelihood(尤度): 新しい観測データが与えられたとき、そのデータが各クラスに属する可能性(例: 「今日の画像では青いピクセルが多いから水である可能性が高い」)
・Posterior(事後確率): PriorとLikelihoodを組み合わせて計算される「更新された予測」(例: 「過去のデータと現在の観測を統合した結果、80%が水、20%が森林と判定」)
・Markov(マルコフ)性(Markov Assumption): 「現在の状態は、直前の状態にだけ依存する」という仮定(例: 今日の森林面積は「昨日の状態」だけを考慮して予測可能)
・ベイズ統計は、観測データを元に「確率(信念)」を更新する仕組み
②前処理とラベル生成
・各ピクセルについて、NDWIやMNDWIなどのスペクトル指標を算出
・計算したスペクトル指標値に基づき、各ピクセルを「水」「土壌」などのクラスに分類する閾値を設定
③モデル
・GMM(生成モデル): 各クラスの分布をガウス分布で表現沿い、入力データ(スペクトル指標値)からクラスを生成的に予測する
・LR(ロジスティック回帰): 入力データに基づきクラス確率を直接予測する判別モデル
・SIC(スペクトル指標分類器): スペクトル指標値をガウス関数に変換し、各クラスの確率を計算する
・DWM(再帰ディープウォーターマップ): DeepWaterMap(深層学習モデル)による分類結果を再帰的に改良するアルゴリズム
・WN: WatNet(深層学習モデル)による分類結果を再帰的に改善するアルゴリズム
④Recursive Bayesian Classification (RBC)フレームワークの上記各モデルへの適用
[手順]
・Priorの計算: 過去の情報から「現在の状態の予測(初期値)」を出す( 例: 「昨日までの観測から、この地域は80%森林、20%水」)
・Likelihoodの計算: 新しい観測データを基に、「各クラスに属する可能性」を計算(例: 「今日の画像では青いピクセルが多い」)
・Posteriorの更新: PriorとLikelihoodを組み合わせて、より正確な予測(Posterior)を出す(例: 「過去のデータと今日の観測から、この地域は90%水、10%森林」)
[具体種類]
・RBCは、以下のどちらの手法を使う場合も「時系列データの観測情報を利用してクラス確率を更新」する
・ただし、クラス確率をどのように計算するかでRBGMとRBDMの2つに分かれる
特徴 | RBGM | RBDM |
---|---|---|
モデルタイプ | 生成モデル(クラスごとのデータ分布を明示的に定義) | 判別モデル(観測データから直接クラス確率を計算 |
必要な情報 | 観測値の分布、クラス遷移確率、事前分布 | 判別モデルの出力(クラス確率)、クラス遷移確率 |
データ要件 | 大量のデータが必要 | 小規模データにも適用可能 |
計算コスト | 尤度計算にコストがかかる | 判別モデルに依存(一般に軽量) |
【議論の内容・結果は?】
◾️site1の結果
・非再帰アルゴリズム(例: SIC, LR, DWM, WN)と比べ、再帰アルゴリズム(例: RSIC, RLR, RDWM, RWN)は一貫して精度の向上を示した
・特定の日付(例: 2021-05-19, 2021-06-13)において、再帰的アプローチによる分類精度の改善が顕著であり、20%以上のバランス分類精度(Balanced Classification Accuracy, BCA)の向上が観察された
・再帰的手法はロバスト性を提供する一方で、急激な変化への即時適応には課題があると考えられる(例: 2021-04-09での一時的な精度低下)
◾️site2の結果
・2021-05-27では、シアノバクテリアの増殖により水域がクロロフィルで希釈され、「水」を「陸」と誤分類する問題が生じていたものの、再帰アルゴリズムはこれに対応し、以下の改善を達成した
– RSIC: +12.77%
– RGMM: +12.4%
– RLR: +8.59%
– RDWM: +9.11%
– RWN: +10.58%
◾️Site3
・非再帰アルゴリズムは雲の影響を受け、特に2020-06-10、2020-08-04、2021-05-26で「森林」と「伐採地」の誤分類が多発した
・再帰アルゴリズム(RSIC, RGMM, RLR)は雲の影響を軽減し、以下の改善を達成した
[2020-06-10]
– RSIC: +7.06%
– RGMM: +14.17%
– RLR: +8.37%
[2021-05-26]
– RSIC: +15.25%
– RGMM: +10.58%
– RLR: +14.7%
・一方で、2020-08-04では、クラス不均衡(森林エリアの圧倒的優位)が影響し、RGMM (-1.6%)とRLR (-1.88%)の精度が低下した
・クラス不均衡や急激な変化への対応にはさらなる最適化が必要であり、データ特性に応じたパラメータチューニングが重要と考えられる
◾️正確性の比較検証
・再帰アルゴリズム(青いボックスプロット)は、非再帰アルゴリズム(黄色のボックスプロット)よりも分布の下限が高く、結果の一貫性が向上していることがわかる
・RGMMは再帰化による変動が最も小さく、一方でRLRやRSICは非再帰アルゴリズムに比べて感度が高い(性能向上幅が大きい)
◾️パラメーター検証
・以下の図は、パラメータ(クラス遷移確率)が分類精度に与える影響を分析したもので、最適なα値を選定するための基準を提供する
・Site1では、α=0.001付近で最大の分類精度を達成、α>0.5では精度が大幅に低下した(不自然に高いクラス遷移(例: 陸地から水域への突然の変化)を想定するためと考えられる)
・Site3では、α=0.03から、α=0.04付近で精度が最大化
#RecursiveBayesianClassification #時系列衛星画像 #土地被覆分類 #NDWI #MNDWI #Sentinel-2 #事前確率 #尤度 #事後確率 #クラス遷移確率 #生成モデル
以上、2024年12月に公開された論文をピックアップして紹介しました。
皆様の業務や趣味を考えた時に、ピンとくる衛星データ利活用に関する話題はありましたか?
来月以降も「#MonthlySatDataNews」「#衛星論文」を続けていきますので、お楽しみに!