宙畑 Sorabatake

機械学習

【2023年6月】衛星データ利活用に関する論文とニュースをピックアップ!

2023年6月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。

宙畑の新連載「#MonthlySatDataNews」では、前月に公開された衛星データの利活用に関する論文やニュースをピックアップして紹介します。

実は、本記事を制作するために、これは!と思った論文やニュースをTwitter上で「#MonthlySatDataNews」をつけて備忘録として宙畑編集部メンバーが投稿していました。宙畑読者のみなさまも是非ご参加いただけますと幸いです。

2023年6月の「#MonthlySatDataNews」を投稿いただいたのは4人でした!

それではさっそく2023年6月の論文を紹介します。

High-resolution mapping of forest structure from integrated SAR and optical images using an enhanced U-net method

【どういう論文?】
・0.5mの分解能の高解像度のXバンド合成開口レーダー(SAR)と光学画像をピクセル単位で分析することで、4つの森林構造属性(高さ、平均高さ、分率被覆、密度)をマッピングする深層学習モデルを提案

【先行研究と比べてどこがすごい?】
・非常に高い空間解像度(50 cm/pixel)を持つSARデータと光学データを使用
・従来の研究では、光学データやSARデータのいずれかを単独で使用して森林構造を推定することが多かったが、本研究では、SARと光学データを組み合わせることで相補的に情報を利用
(SARデータにはスペクトル情報が含まれていないため、解釈性に乏しく、スペックルノイズの影響を受けやすい一方で、光学データは豊富なスペクトル情報(多くの場合、複数のスペクトルバンドで構成されている)を持っているため、相補的にデータを利用することが有効的としている)

・PSE-UNetモデルによる、SARと光学入力(情報)の両方の組み込み
・畳み込み層においてPartial Convolutionと呼ばれる新しいパディングスキームを使用

【技術や方法のポイントはどこ?】
・SAR画像に含まれているスペックルノイズを事前処理
・SARと光学画像の位置合わせのための手動のアフィン変換
・PSE-UNetアーキテクチャの採用
Partial convolutions layer: スペックルノイズのある部分を欠損として認識し、ノイズがない部分だけを正しく畳み込み演算に用いることができるため、スペックルノイズの影響を最小限に抑えながら適切な情報を抽出することができる
Channel attention: ゲート機構というものが、SARデータと光学データそれぞれの特徴を考慮して、それぞれのデータの重要な情報を抽出する。具体的には、SARデータと光学データの入力をチャネルごとに圧縮し、それぞれの重要度を表すスカラー値を計算し、それぞれの入力データにスカラー値をかけることで、重要な情報を強調したり、不要な情報を弱めたりする

【議論の内容・結果は?】
・森林の高さ指標の推定において良好な性能を発揮し、低いRMSE値とMAE値を達成した
・ 森林被覆や密度など予測におけるモデルの性能は、他のモデルと同等であり、ほとんどのモデルが同様のMAE値(真の値と予測値の差の絶対値の平均)となった(細かいディテールを捉え、分数特徴を認識する上で更なる改善が必要であることを示した)
・超高解像度マッピングにおける課題の1つとして、LiDARデータの低い点密度が挙がった(LiDARはレーザー光を使用して地表や樹木の上部に点を取得するため、点の密度が低い場合、樹木の細部まで正確にマッピングすることが困難)
・また、地形の影響も課題の1つであり、地形の傾斜や凹凸がLiDARの測定結果に影響を与えるため、地形の変動がマッピング結果に歪みをもたらす可能性がある
・したがって、超高解像度マッピングでは、LiDARデータの点密度と地形の影響を補完するために、SARデータと光学データの組み合わせが有効と考える

Monitoring the Mauna Loa (Hawaii) eruption of November–December 2022 from space: Results from GOES-R, Sentinel-2 and Landsat-8/9 observations

【どういう論文?】
・GOES-R、Sentinel-2、Landsat 8、Landsat 9の衛星データを用いたマウナロア噴火の発生と溶岩流マッピング手法の提案

【先行研究と比べてどこがすごい?】
・高時間分解能(10分間隔)のSWIRを利用し、大気の影響や曇り条件への依存度を低くし、タイムリーな情報を提供
・MIRデータ(GOES-RのBand 7)を用いた従来の研究に対するSWIR観測の利点活用
・火山監視のための異なる衛星(GOES-R ABI、Sentinel-2 MSI、Landsat-8 OLI)の観測データを組み合わせ
・SWIRとMIRデータの詳細な解析、火山の熱放射パワーを表す指標であるVRP(Volcanic Radiative Power)の推定、時間平均流出率(TADR)の計算、及び定量的な結果と過去の噴火、特に1984年のマウナロア噴火との比較

【技術や方法のポイントはどこ?】
・火山活動に伴う熱異常を検出する正規化ホットスポット指数(NHI)を用いたGOES-R ABIによるSWIRの解析
(この指数は、地表の熱輻射を他の特徴やノイズから分離することにより、火山の熱異常を強調可能)
・SWIRデータは噴火開始の探知、溶岩流の追跡に使用
・Sentinel-2 MSI、Landsat 8-OLI、およびLandsat 9-OLI2を含む複数の衛星データセットを用いた、溶岩流のマッピング、特徴評価(溶岩流の面積や長さ、時間的変化など)
・SWIRとMIRを用いた、VRP値の推定。SWIRデータとMIRデータは、火山活動に伴う熱放射を異なる波長帯域で観測するため、それぞれ異なる情報を提供する。SWIRデータは、高温の溶岩流や火口などの熱的な特徴を検出するのに適しており、MIRデータは火山の熱放射全体をカバーするのに適している。
・VRP値の合計と溶岩サンプルのシリカ含有量に基づいたTADR(Time-Averaged Discharge Rate)の計算。TADRは、火山から噴出する溶岩の平均的な放出量を表す。

【議論の内容・結果は?】
・マウナロアの噴火は2022年11月28日09:10-09:20(UTC)に始まったことを探知(SWIR1とSWIR2とNIRを用いて、大気の最上層部の輝度から判断)
・Sentinel-2 MSI、Landsat 8-OLI、Landsat 9-OLI2データを用いた、亀裂噴出孔から流出する溶岩流のマッピングに成功
・上記データから溶岩流の面積と長さを推定し、溶岩流の範囲に関する定量的な情報を可視化
・SWIRデータから得られたVRPの推定値は、MIRデータから得られた推定値よりも約20%高かったが、これはSWIRデータの空間分解能が高いためと考えられる
・2022年マウナロア噴火のTADR値が計算され、約1000m^3/sに達し、1984年の噴火のVRP値やTADR値と比較したところ、1984年の噴火に匹敵する大きさであった

Monitoring direct drivers of small-scale tropical forest disturbance in near real-time with Sentinel-1 and -2 data

【どういう論文?】
・時間/空間解像度の高い衛星データを用いた、小規模な熱帯林攪乱(林の変化や損失)とその直接的な要因をモニタリングする手法の提案

【先行研究と比べてどこがすごい?】
・主にLandsatに頼っていた従来の研究とは異なり、本研究では、Sentinel-1衛星とSentinel-2衛星を組み合わせて解析
・攪乱の発生場所をマッピングのみではなく、森林攪乱の要因特定への試み
・Landsatのデータを利用することが多く、ルールベースや機械学習の手法が用いられてきた中でのCNNの手法を利用

【技術や方法のポイントはどこ?】
・2018年と2019年のSentinel-1画像から過去の時系列の指標を参照し、SARが地表や植生の構造、密度、水分などによって散乱する中で安定した森林後方散乱指標を作成、2020年と2021年の画像を森林攪乱アラートの作成に利用
・森林攪乱の直接的な要因として、農業、道路開発、択伐、鉱業、およびその他の5つのクラスを定義
・森林攪乱のドライバー(要因)の分類とモニタリングにCNNを使用、VGG-16アーキテクチャに基づいた多クラス画像分類用のモデルを設計
・Sentinel-1データ、Sentinel-2データ、および両センサーの組み合わせのそれぞれでテスト
・テストデータセットに基づいて最も精度の高いモデルを選択し、調査地域の森林攪乱ドライバーマップを作成

【議論の内容・結果は?】
・モニタリングシナリオ、センサーデータ、攪乱後の時間帯の違いにより、モデルの性能にばらつきが見られた
・最も精度が高かったのは、Sentinel-2のデータを6ヶ月の撹乱後期間にわたって合成したものであった
・精度評価では、調査地域全体で最も精度の高かったモデルのMacro-F1スコアは0.861、総合精度は0.897であった。
・Sentinel-1とSentinel-2のデータを組み合わせた場合の分類精度は、Sentinel-2のみを使用した場合の精度より低く、要因の分類にはSentinel-2データが重要であり、雲に覆われた地域ではSentinel-1データの方がより正確であることがわかった

Deformation Monitoring and Analysis of Reservoir Dams Based on SBAS-InSAR Technology—Banqiao Reservoir

【どういう論文?】
・SBAS-InSAR(複数のSARデータを利用して各観測地点間を細かく、そして時間範囲も短く取得した情報から観測対象を分析する手法)を用いた板橋貯水池ダムの表面変形のモニタリングに焦点

【先行研究と比べてどこがすごい?】
・従来の方法では地表面を点ごとに測定するため、データの点密度が低く、広範な範囲の変化を把握することができなかったが、今回の手法では、各観測地点間を細かく、そして時間範囲も短く取得することで、表面変形情報を逆算し、広範な範囲の表面変形を高い解像度で連続的に観測した
・従来の差分合成開口レーダ干渉(DInSAR)技術は、空間および時間の相関の低下や大気の遅延に影響を受けやすく、測定精度が制約されていたが、SBAS-InSARを用いて、大気の遅延や空間の不均一性に対する影響を軽減、観測精度を向上させた

【技術や方法のポイントはどこ?】
・SBAS-InSAR技術(Small Baseline Subset–Synthetic Aperture Radar Interferometry)という、各観測地点間を細かく、そして時間範囲も短く取得したサブセットを用いて変形情報を逆算する手法を採用
・各セット内のSAR画像のベースライン(複数の観測ポイント間の距離または方向の差)は小さく、セット間のベースラインは大きく設定
・各セット内の大気の影響が少ない画像をマスター画像とし、他の画像をスレーブ画像として、ラット位相と地形位相を除去し、位相展開と最小二乗法を使用して変形パラメータを推定し、残差に基づいて大気位相を推定
・位相の変化速度の計算と時間統合により、表面の平均変形速度と累積変形量の推定が行われる
・上記の手法によって得られた結果を光学画像や水位情報と組み合わせて、異なる地域のダムの時間的な変形特性と変形に影響を与える要因を分析
・データセットとしては、Banqiao貯水池の表面変形をモニタリングするために、2020年1月3日から2022年8月20日までに取得された80枚のSentinel-1Aの衛星画像が使用(Cバンドの合成開口レーダー(SAR)データであり、波長は5.6 cmで、方位分解能は20 m、距離分解能は5 m)

【議論の内容・結果は?】
・ダムを含む調査地域の大部分は、-1mm/yから-4mm/yの範囲で安定した変形速度を示した
・一部の地域ではわずかな変形が見られ、速度は-30mm/yに達した
・なお、上記2つのデータと地上データとRMSEは1.1mmであった
・ダム本体は、貯水池の水位の変化と相関して、わずかな変形の変動があった
・斜面部は沈降と隆起を示したが降水と水理侵食によるものと推定される
・河道エリアでは、河川水位と土壌条件の変化に伴う著しい沈下が見られた

Level Sets Guided by SoDEF-Fitting Energy for River Channel Detection in SAR Images

【どういう論文?】
・SoDEF(Self-Organizing Dual Evolutionary Fitting)と呼ばれる提案モデルを用いたSAR画像内の河道検出に関する研究

【先行研究と比べてどこがすごい?】
・領域のグレースケール特性(ピクセルの輝度値)をより正確かつ安定して表現するために、平均と中央値の領域内グレースケールの特性を組み合わせてAFCsを計算し、より正確なセグメンテーション結果が得られた
・エッジ指標関数としてLoG(Laplacian of Gaussian)ベースの方法を使用し、オブジェクトの境界(エッジ)が正確に収束するようにした

【技術や方法のポイントはどこ?】
・様々な種類のSAR画像を使用し、河道の検出実験を実施
・CV、CVGCO、RSFACI、JDF、RDE、WABSPF、FCAHS、AUMLSBMという既存手法と、SoDEFモデルを比較し、検出結果を評価
・検出性能の客観的な分析のために、精度(QA)と誤警報(QFA)の2つの定量的指標を算出

【議論の内容・結果は?】
・SoDEFモデルは、他の実験手法と比較して優れた検出結果を達成(検出精度(QA)は95%を超え、誤警報(QFA)は10%未満)
・SoDEFモデルは異なる入力レベルセット(初期の領域境界を表す数値データ)に対して柔軟性と頑健性を示した

Mercury Prediction in Urban Soils by Remote Sensing and Relief Data Using Machine Learning Techniques

【どういう論文?】
・機械学習技術とリモートセンシングデータを用いた都市土壌中の水銀(Hg)含有量の予測研究

【先行研究と比べてどこがすごい?】
・衛星データと地形属性(地形の形状、勾配、傾斜方向等)を組み合わせた土壌マッピング技術を用いて、都市部におけるHg汚染リスクのある地域を特定する可能性について洞察している点

【技術や方法のポイントはどこ?】
・ロシア(ウファ市)の異なる土地から250の土壌サンプルデータセットを取得
・Hg濃度のモデリングとマッピングには、ランダムフォレスト、XGBoost、Cubist、k最近傍法のなどの機械学習(ML)手法を使用
・衛星画像データと組み合わせて、DEMから勾配、傾斜の向き、平坦な地形などを計算しデータを統合
・衛星画像データと地形属性から得られた共変量(説明変数)を選択し、相関分析や主成分分析などの手法を使用して、Hg予測に寄与する共変量を特定

【議論の内容・結果は?】
・勾配マップ(DEMから算出される勾配)、スペクトル指数、(単体の)Sentinel-2AバンドB11が、Hg含有量の変動を説明する重要な変数として可能性が示唆された
※Hgは土壌中の鉄やアルミニウムの酸化物、粘土鉱物、有機物などに吸着するため、短波赤外線(SWIR)領域の特定の波長を捉えるB11バンドが有効的だった可能性が高い
・ウファにおけるHgの予測値は0.01~0.12 mg/kgの範囲であり、建物が密集している地域、工業施設、工場ではより高いレベルが観測された
・不確実性分析(​​予測値の信頼区間や誤差範囲の推定)では、農地や都市部で不確実性が高いことが示され、このような地域におけるHg含有量の予測には課題があることがわかった

Comparison of Multi-Source Remote Sensing Data for Estimating and Mapping Above-ground Biomass in the West Usambara Tropical Montane Forests

【どういう論文?】
・リモートセンシングデータを用いたタンザニアの西ウサンバラ山脈における地上バイオマス(森林や植物などの生物の地上部分に存在する有機物の総量)推定研究

【先行研究と比べてどこがすごい?】
・Sentinel-2、Landsat 8、ALOS/PALSAR-2、Sentinel-1、PlanetScopeなどの複数のリモートセンシングデータを比較し、最適なデータソースを特定
・光学データのスペクトラルバンド、植生指数など、異なる変数の組み合わせを評価し、AGB(Above-ground Biomass)の予測に最も効果的な変数を特定
・従来の最小二乗法回帰(直線的なデータモデル)に加えて、GAMやXGBといった半パラメトリックおよび非パラメトリック手法を適用することで、非線形な関係を捉え、より正確なAGBの推定を実現

【技術や方法のポイントはどこ?】
・異なるセンサーからのリモートセンシングデータ(PlanetScope、Sentinel-2、Landsat 8、ALOS-2/PALSAR-2、Sentinel-1)を分析のために前処理
・説明変数は、各データソースについてVSURF(変数の重要度を評価し、重要な変数を選択するためのランダムフォレストのアンサンブル学習手法)を用いて選択
・ GAMとXGBを適用して、AGB予測モデルを開発
・モデルの頑健性を評価するために交差検証を実施

【議論の内容・結果は?】
・XGBモデルは、AGB推定においてGAMモデルを上回った
・光学センサーの中では、複数の説明変数を用いたPlanetScopeモデルのrRMSE-69.19%、SARセンサーの中では、テクスチャー変数を用いたALOS-2/PALSAR-2モデルのrRMSE-70.76%が最も低かった(精度が高かった)
・逆に、光学センサーの中では、バンド情報のみを用いたPlanetScopeモデルのrRMSE-74.05%、SARセンサーの中では、複数の説明変数を用いたPlanetScopeモデルのrRMSE-77.67%が最も高かった(精度が低かった)
・テクスチャ変数は、PlanetScopeとALOS-2/PALSAR-2の両モデルの重要な予測因子として可能性を示した
・モデルから生成されたAGBマップは、PlanetScope画像の偽色合成と良い一致を示したが、AGB値が極端な領域ではいくつかの不一致が観測された

Mapping bamboo forest and expansion intensity in China by coupling vegetation phenology and C-band SAR with Sentinel-1 and Sentinel-2 images

【どういう論文?】
・Sentinel-1とSentinel-2のデータを用いた竹林の分類とマッピングに関する研究

【先行研究と比べてどこがすごい?】
・Sentinel-1とSentinel-2データを統合することで、Landsatデータよりも竹林マッピングの能力を向上できた
・竹林マッピングの精度と信頼性を高めるために、スペクトル解析、フェノロジー解析、後方散乱解析を組み合わせた
・Sentinel-1とSentinel-2データの統合は、雲に覆われた竹林と他の植生タイプとの間のスペクトル類似性に関連する課題を克服する可能性を示した

【技術や方法のポイントはどこ?】
①スペクトル分析
・竹林と樹木の分光反射率シグネチャーをフィールド写真を用いて比較
・異なる波長におけるスペクトル吸収の特徴を分析しNDVIを算出
②フェノロジー分析(植物の生育や季節的な変化を時間の経過に沿って調査、パターンや特徴を分析すること)
・落葉樹林と竹林について、Sentinel-2 NDVIの時間プロファイル曲線を作成
・生育期の開始と終了、NDVIの範囲、ピークと谷の期間などのフェノロジーの特徴を比較
③後方散乱解析
・Sentinel-1 SAR画像を用いて竹林の後方散乱特性を解析
・表面散乱、体積散乱、二重バウンス散乱など、SAR信号と植生成分との相互作用を調査
・後方散乱信号に対する地形の影響を軽減するためにラジオメトリック補正を適用
④竹林のマッピング
・分類アルゴリズムを用いて竹林の面積と拡大強度マップを作成し、異なる土地被覆タイプとの関連性を分析

【議論の内容・結果は?】
①スペクトル分析の結果
・竹林は赤色波長に強い吸収を示し、近赤外波長に弱い吸収を示した
・樹木は同様の吸収領域を示したが、赤色エッジ帯域以降の吸収率がより高かった
②フェノロジー分析の結果
・竹林は落葉樹林に比べて成長期が長く、成長期の開始と終了が遅れていた
・各生長サイクルにおけるNDVIの範囲は落葉樹林の方が高かった
③後方散乱分析の結果
・竹林は樹木に比べてVV偏波とVH偏波で後方散乱値が低く、体積散乱が限定的な表面散乱であることを示した
・樹木は表面散乱の増加と二重バウンス散乱の増加を示した
④精度評価の結果
・竹林マッピングアルゴリズムは高い精度を達成し、全体精度(OA)は7つの調査地域にわたって91.1%~97.33%であった

Stripe segmentation of oceanic internal waves in SAR images based on Gabor transform and K-means clustering

【どういう論文?】
・ALOSの合成開口レーダー(SAR)画像を用いた海洋内部波の縞模様のセグメンテーションに焦点をあてた研究
※海洋内部波:一般的に海水の密度が異なる層が重なり合ったときに形成される。さまざまなスケールで存在し、非常に大きなものから非常に小さなものまで、さまざまな形状や特性を持つ。

【先行研究と比べてどこがすごい?】
・ガボールフィルタリングとK-meansクラスタリングの組み合わせを使用して、海洋内部波の明るいストライプと暗いストライプをセグメンテーションした
・ガボールフィルタリングにより、SAR画像から局所的な情報を抽出し、ストライプの特徴を捉えた
・U-Netセグメンテーションなどの先行研究を、IoU(Intersection over Union)値で上回った

【技術や方法のポイントはどこ?】
・入力画像から明縞と暗縞の特徴を抽出するために、ガボールフィルタリングを使用(画像内の異なる方向や周波数の特徴を抽出)
・特徴画像をK-meansアルゴリズムを用いてセグメンテーション
・暗縞の領域に対して最小外接矩形を計算
(最小外接矩形の長辺に沿って、明縞の位置を決定。明縞は暗縞の近くに存在するため、最小外接矩形の長辺に沿って一定の距離を移動することで明縞の位置を推定)
・セグメンテーション結果を、手動抽出およびU-Netセグメンテーション手法と比較

【議論の内容・結果は?】
・セグメンテーションにおいて0.71というIoU値を達成
・SAR画像の明暗縞を正確にセグメンテーションし、U-Netセグメンテーションの性能を上回る有効性を示した
・画質の悪いSAR画像や複雑な縞模様のセグメンテーションの課題に対処する必要がある

Supervised and unsupervised machine learning approaches using Sentinel data for flood mapping and damage assessment in Mozambique

【どういう論文?】
・洪水マッピングにおいて、グローバル(複数の地域や国を対象にして一括で洪水マッピング)とローカル(特定の地域や都市など、限られた範囲の地域に焦点を当てて洪水マッピング)なアプローチの比較を通じて、どちらの手法がより優れているかを評価する研究

【先行研究と比べてどこがすごい?】
・VHまたはVV+VH偏波の有効性を示し、ディープラーニングよりも計算資源や処理時間、データ要件の面で優位性を持つ機械学習アルゴリズムを開発

【技術や方法のポイントはどこ?】
・洪水マッピングでは、教師あり学習および教師なし学習の手法を使用
 (教師あり学習ではSVM、教師なし学習ではK-Meansクラスタリングを使用)
・画像前処理として、S1画像にフォーカルミーンフィルターを適用し、ノイズと斑点を減少させる
・学習データとしてDrivenDataデータセット(13か国での洪水イベントのカバレッジを持つデータセット)から提供されたラベルと、Copernicus EMSの結果を使用
(ローカル実装では約10,000点、グローバル実装では約50,000点の学習データを収集)
・分類後の処理として、ガウシアンフィルタを適用して結果を平滑化し、孤立した画素群を除去
・洪水マッピングの評価は、IoU(Intersection over Union)メトリックを使用

【議論の内容・結果は?】
・VHまたはVV+VH偏波を使用した洪水マッピングの結果がVV単独よりも優れていた
・教師あり学習と教師なし学習の両方の手法がほぼ同等の結果を示したが、教師なし手法の方が分散が小さく、教師あり手法の方が平均IoUが大きかった
・カンボジアやボリビアなどの地域で比較的高い精度を示した地域もあり、全体的に満足のいく性能が得られた
・機械学習アルゴリズムの洪水マッピングへの有効性を示し、ディープラーニングモデルよりも計算資源や処理時間、データ要件の面で優れていることを示した
・土地被覆分類の総合精度も高く、洪水時に影響を受ける土地被覆クラスも特定出来た

最後に、#MonthlySatDataNewsのタグをつけてTwitterに投稿された全ての論文をご紹介します。

来月以降も「#MonthlySatDataNews」を続けていきますので、お楽しみに!

Share

衛生データに無料で触れる Tellusを試してみましょう 登録して使ってみる