宙畑 Sorabatake

トピックス

【2026年1月】衛星データ利活用に関する論文とニュースをピックアップ!

2026年1月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。

2026年1月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。

GlobalBuildingMap — Unveiling the mystery of global buildings
(地球上の全建物を一軒残らず識別する世界最高精度の建物地図「GlobalBuildingMap (GBM)」を構築し、それを用いて「世界の全建物の屋根でどれだけ太陽光発電ができるか」を科学的に算出する)

Impact of the war on forest ecosystem in Ukraine based on Sentinel-2 data
(欧州宇宙機関(ESA)の衛星Sentinel-2と機械学習(Random Forest)を用いて、紛争前(2020年〜2021年)と紛争開始後(2021年〜2022年)の森林変化を定量的に評価する)

Assessing the Utility of Satellite Embedding Features for Biomass Prediction in Subtropical Forests with Machine Learning
(Google AlphaEarth Foundationsモデルが生成する埋め込み特徴量(複数の衛星センサーの情報を64次元の数値ベクトルに圧縮・統合したエンべディング表現)を用いて、従来の多ソースデータ処理を代替し、効率的かつスケーラブルな森林バイオマス推定手法の有効性を検証する)

Generative Algorithms for Wildfire Progression Reconstruction from Multi-Modal Satellite Active Fire Measurements and Terrain Height
(VIIRS衛星の活火災検出データ、GOES衛星由来の着火時刻推定、地形高度データを入力として、条件付きWasserstein GAN(cWGAN)を用いて野火の進行を「火災到達時間(fire arrival time)」として確率的に推定する手法を開発する)

宙畑の新連載「#MonthlySatDataNews」では、前月に公開された衛星データの利活用に関する論文やニュースをピックアップして紹介します。

実は、本記事を制作するために、これは!と思った論文やニュースをX(旧Twitter)上で「#MonthlySatDataNews」「#衛星論文」をつけて備忘録として宙畑編集部メンバーが投稿していました。宙畑読者のみなさまも是非ご参加いただけますと幸いです。

2026年1月の「#MonthlySatDataNews」「#衛星論文」を投稿いただいたのはこの方でした!

それではさっそく2026年1月の論文を紹介します。

GlobalBuildingMap — Unveiling the mystery of global buildings

【どういう論文?】
・本論文は、約80万枚の衛星画像と深層学習を組み合わせ、地球上の建物を一軒単位で識別する従来に比べて高精度・高解像度の全球建物地図 GlobalBuildingMap(GBM) を構築する
・GBMは3m解像度のバイナリラスター(建物/非建物)として配布され、全球の建物総面積を約67万km²と算出、さらに本建物地図と太陽光発電ポテンシャルデータを掛け合わせることで、「全建物の屋根にソーラーパネルを設置すれば2020年の世界エネルギー消費量の1.1〜3.3倍を賄える」という推計を示した

【技術や方法のポイントはどこ?】
◾️先行研究の課題
・これまでの世界地図(GUFやGHSL)は、1辺が12m~30mという大きな正方形のマス目(ピクセル)で地面を塗りつぶしたラスターデータであった
・上記サイズでは、1つのマス目の中に家や路地などがすべて混ざってしまうため、建物だけの正確な面積を測定できず、密集地では複数の家が1つの巨大なコンクリートの塊として記録されていた
・OpenStreetMap (OSM) に関しては、対象地域が欧州に偏っているなどの地域の網羅性の問題があった

◾️本研究のアプローチ
・3m解像度のPlanetScope衛星画像を活用し、個別の建物形状(フットプリント)を特定する

※Zhu, X.X., Li, Q., Shi, Y. et al. GlobalBuildingMap — Unveiling the mystery of global buildings. Sci Data 13, 71 (2026). Source : https://doi.org/10.1038/s41597-026-06578-9

◾️具体手法
①放射補正 (IQRスケーリング)
・統計手法(四分位範囲:IQR)を用いて、画像ごとの明るさの分布を自動調整し、地域による見え方のバラつきを解消する

②データクリーニングと共登録 (Coregistration)
・11.6万組のペアを人間が目視確認し、Sobelフィルタ等を用いて衛星画像と地図のズレをピクセル単位で補正して、AIの学習過程において建物の輪郭がボヤけるのを防ぎ、屋根面積の計算精度を向上させる

③ 特殊な距離ラベル (Truncated Signed Distance)
・AIに建物か地面かを学習させる際、単なる塗り絵(2値)ではなく、建物の中心を頂点とする『山』の形を覚えさせる
・具体的には、AIは画像の中の1点(ピクセル)ごとに、「ここが建物の中心なら10点、離れるほど点数を下げて、境界線は5点、外の地面なら0点」というスコアを付けることで、複数の家が1つの巨大な塊にならず、一軒ずつの屋根面積をバラバラに正しく合計できるする

④4つのモデルによるアンサンブル
・性質の異なる4つの深層学習モデル(Graph CNN, FC-DenseNet, Eff-UNet)の結果を多数決投票(4モデル中2モデル以上が建物と判定したピクセルを建物とする)する

⑤土地被覆フィルタ
・既存の土地被覆地図(FROM-GLC10等)を重ね、非都市部の誤検出を重点的に削減しつつ、都市部の検出漏れを最小化する

※Zhu, X.X., Li, Q., Shi, Y. et al. GlobalBuildingMap — Unveiling the mystery of global buildings. Sci Data 13, 71 (2026). Source : https://doi.org/10.1038/s41597-026-06578-9

【議論の内容・結果は?】
◾️全世界の建物面積
・従来の推計(約20万km2)に対して、GBMの3m解像度で一軒ずつ数え上げた実測値は、従来の手法では捉えきれなかった小規模建物や非正規居住区(インフォーマル集落)を含めて、2.35倍の総面積となる約67万km2となった
・34のテスト都市(学習に使用していない都市)で、OSMデータを基準にF1スコアとIoUを計測した結果が以下の通りとなっており、対WSF/GHSL比較においては全大陸でGBMが高精度(WSF・GHSLは過大評価傾向)、MicrosoftとGoogleの比較に関しては、欧州・アジアではGBMが優位、米国・カナダではMicrosoftが優位となった

#グローバル建物地図 #3メートル解像度 #距離学習 #アンサンブル学習 #建物フットプリント #太陽光発電 #脱炭素 #放射補正

Impact of the war on forest ecosystem in Ukraine based on Sentinel-2 data

【どういう論文?】
・ウクライナでは、2022年2月からの軍事紛争により森林破壊が深刻化しているが、地上での調査は、爆発物の危険や政治的な理由で物理的に困難な状況にある
・本論文は、欧州宇宙機関(ESA)の衛星Sentinel-2と機械学習(Random Forest)を用いて、紛争前(2020年〜2021年)と紛争開始後(2021年〜2022年)の森林変化を定量的に評価する
・結果としては、紛争後に森林消失面積は約2倍(16,261 ha → 35,400 ha)に増加し、特に火災による消失が約2.8倍に急増(4,307 ha → 12,206 ha)したことを明らかにすることができ、さらに、戦線から遠いリヴィウ州でも消失面積が倍増しており、紛争に伴う木材需要の増加や違法伐採の拡大が示唆された

【技術や方法のポイントはどこ?】
◾️先行研究の課題
・ 既存のGlobal Forest Change (GFC)などはLandsat衛星(30m分解能)を使用しており、小規模なダメージを見落とす可能性がある
・森林減少の原因(火災か伐採か)を区別していない
◾️本研究のアプローチ
・10m分解能のSentinel-2を使用する
・NDVI(植生指数)とNBR(焼失比)を併用し、「伐採等による転換」と「火災による焼失」を分離する

◾️手法
①高精度な基準地図の作成
・Sentinel-2(10個の波長帯データ(青、緑、赤、近赤外、短波赤外など))とESA World Cover 2020とCGLS-LC100という既存の世界地図データを使用
・上記を用いて「どこが森林か」および「広葉樹か針葉樹か」を分類するための教師データを作成する

②森林の健康度とダメージの数値化
・植生指数(NDVI & NBR)を Sentinel-2の特定の波長(赤、近赤外、短波赤外)を組み合わせて計算する
・NDVIは葉に含まれるクロロフィルに反応し、森林がどれだけ青々としているか(あるいは伐採されたか)を判定する
・NBRは火災による炭化や水分量の減少に敏感に反応し、火災による消失を特定する

③AIによる変化の種類の自動判定
・上記で作成・算出した森林マスクとNDVI/NBRのデータ、そして機械学習モデル(Random Forest)を用いて、火災の特徴と伐採の特徴を学習、判断させる

※Waśniewski, A., Rynkiewicz, A., Hościło, A. et al. Impact of the war on forest ecosystem in Ukraine based on Sentinel-2 data. Sci Rep 16, 5190 (2026). Source : https://doi.org/10.1038/s41598-026-35744-7

【議論の内容・結果は?】
◾️森林消失面積の急増
・全4地域の消失面積は、2021年(紛争前)の16,261haから2022年(紛争開始後)には 35,400haへと2倍以上に増加した
・非森林への転換、焼失のいずれも増加しているが、特に焼失の伸びが顕著となっており、紛争前は消失全体の26%(4,307ha)だった火災被害が、紛争後は34%(12,206ha)まで割合が増加した
・キーウ州 (Kyiv)が最も深刻な被害を受けており、11,650 ha(森林面積の1.4%)を消失、その半分以上が火災によるものであった
・ハルキウ州 (Kharkiv)の消失率が最も高く、森林の 1.5%(7,175 ha) が失われており、2021年の火災被害はわずか0.5%(655 ha)だったが、紛争後は火災の割合が激増している
・リヴィウ州 (Lviv)は戦線から比較的遠いため、火災の割合は低い(3%)ままだったが、消失面積自体は約2倍に増加した

※Waśniewski, A., Rynkiewicz, A., Hościło, A. et al. Impact of the war on forest ecosystem in Ukraine based on Sentinel-2 data. Sci Rep 16, 5190 (2026). Source : https://doi.org/10.1038/s41598-026-35744-7

・森林か否かの判定(OA)は 96%以上、樹種(広葉樹/針葉樹)の判定も 97%以上 という極めて高い精度を達成した
・消失の検知精度は 83〜89%となっており、特に火災(burnt forest)の検出力(Producer’s Accuracy)は 90% を超えており、軍事活動に伴う火災をほぼ確実に捉えられている

※Waśniewski, A., Rynkiewicz, A., Hościło, A. et al. Impact of the war on forest ecosystem in Ukraine based on Sentinel-2 data. Sci Rep 16, 5190 (2026). Source : https://doi.org/10.1038/s41598-026-35744-7

#Sentinel-2 #RandomForest #NDVI #NBR #針葉樹 #広葉樹 #GFC #火災 #戦争 #森林

Assessing the Utility of Satellite Embedding Features for Biomass Prediction in Subtropical Forests with Machine Learning

【どういう論文?】
・本研究は、Google AlphaEarth Foundationsモデルが生成する埋め込み特徴量(複数の衛星センサーの情報を64次元の数値ベクトルに圧縮・統合したエンべディング表現)を用いて、従来の多ソースデータ処理を代替し、効率的かつスケーラブルな森林バイオマス推定手法の有効性を検証する

【技術や方法のポイントはどこ?】
◾️先行研究の課題と本研究のアプローチ
①光学リモートセンシングの限界
・NDVI(正規化植生指数)やEVI(拡張植生指数)等の植生指標は密な植生では飽和を起こし、大気条件にも影響されるため、高バイオマス域での推定精度が低下する
・本研究では、Embeddingsが雲干渉に頑健、かつ空間的に一貫性を持つ点を活用し、この制約を回避する

②SARデータ単独の不確実性
・レーダーは天候に左右されず森林キャノピーを部分的に透過できるが、単一SARデータセットではバイオマス推定の不確実性が大きい
・本研究では、Embeddingsは内部でSentinel-1(SAR)を含む複数センサーを統合済みである点を活用し、単一センサーの限界を補完する

③多ソースデータ統合のコスト問題
・光学+SAR+LiDAR等の組み合わせは精度向上に寄与するが、データ取得・前処理・計算コストが大きく広域展開が困難である
・Embeddingsは10m解像度で64次元ベクトルとしてすでに統合されており、データ取得・処理の工程を大幅に簡素化できる

◾️データセット
①現地調査データ(目的変数)
・2024年に調査員が森に入り、89カ所の調査地点(プロット)で木を一本ごとに(太さ、高さなどを)計測
・集計した木のサイズから、幹・葉・根の合計重量(バイオマス)を計算
※広葉樹(26)、針葉樹(25)、両方が混ざった混交林(38)と、バランスよく調査を実行

②AlphaEarth Foundations Embeddingsデータ(説明変数)
・Googleの最新AI(Transformer)が、世界中の異なる衛星データを一つにまとめ、10m四方ごとに「64個の数字のセット」に凝縮した特別なデータセット
・含まれる種類の情報として、地表の形(レーダー衛星(Sentinel-1)が捉えた凸凹感)、色( 光学衛星(Sentinel-2など)が捉えた葉の色や緑の濃さ)、高さと構造(宇宙からのレーザー(GEDI)が測った木の背丈)、環境(面の湿り気や気温、さらには重力の変化など)

◾️手法
①概要
・入力を64次元のEmbeddings、出力をバイオマス値(t/ha)の回帰問題(連続値の予測)を解く

②比較アルゴリズム
・Random Forest:多数の決定木(本研究では500本)を用いて予測を行い、それぞれの結果を平均することで最終的な値を決定する手法となっており、個々の決定木は異なるデータの組み合わせで学習されるため、特定のデータやノイズに過度に影響されにくい
・Support Vector Regression(SVR):そのままでは直線で表現できない複雑な関係を、カーネルという関数を用いて、捉えやすい別次元(高次元)へと変換しながら分析する手法であり、データ数が少ない場合でも外れ値に強い予測ができる
・Multi-Layer Perceptron(MLPNN): いくつもの中継地点(隠れ層)を情報が通り抜けながら複雑な特徴を捉えていく形であり、64次元のデータ入力に対して、「ここは重要、ここは無視」といった調整(重み付け)を繰り返し、予測が外れた場合は誤差逆伝播法を用いて精度を高めていくことで、人間では気づけないようなデータ同士の非常に複雑で深い関係性を抽出する
– Gaussian Process Regression(GPR):すべてのデータが一定の確率ルール(ガウス過程)に従っていると考え、データがある場所では正確に、データがない場所では慎重に(不確実性を大きく)予測する

【議論の内容・結果は?】
・4アルゴリズムの全てで交差検証(R²)が極めて低く、最良のGPRでもR²が0.06となっており、広葉樹・混交・針葉樹という構造・環境の大きく異なる森林タイプを混在させたことで、Embeddingsとバイオマスの間の一貫した関係が打ち消されたと解釈できる
・R²が0.06とは、「バイオマスの実測値のばらつきのうちわずか6%しか説明できない」ことを意味し、モデルはほぼ全体平均を出力しているに等しい結果となっており、複数種類の森林構造を包含した単一モデルではEmbeddingの潜在的情報を十分に活用できない(Embeddingの中にある種類ごとの情報を引き出せない)ことがわかった

※Jin, C.; Jiang, X.; Wen, L.; Wu, C.; Xu, X.; Jiao, J. Assessing the Utility of Satellite Embedding Features for Biomass Prediction in Subtropical Forests with Machine Learning. Remote Sens. 2026, 18, 436. Source : https://doi.org/10.3390/rs18030436

#森林バイオマス #Embeddings #GoogleAlphaEarthFoundations #機械学習
#GoogleEarthEngine

Generative Algorithms for Wildfire Progression Reconstruction from Multi-Modal Satellite Active Fire Measurements and Terrain Height

【どういう論文?】
・大気と野火を双方向に結合した最先端モデル(WRF-SFIRE等)でも、1〜2日のシミュレーションで実際の野火進行と乖離が生じるため、衛星観測データをモデルに取り込むデータ同化(Data Assimilation)が不可欠である
・本論文は、VIIRS衛星の活火災検出データ、GOES衛星由来の着火時刻推定、地形高度データを入力として、条件付きWasserstein GAN(cWGAN)を用いて野火の進行を「火災到達時間(fire arrival time)」として確率的に推定する手法を開発する
・推定された火災到達時間は、大気/野火結合モデルの初期状態として利用でき、将来の野火予測の精度向上に寄与する

【技術や方法のポイントはどこ?】
◾️先行研究の課題
・決定論的手法であり不確実性の定量化が不可能であり、新しい観測データごとに再学習が必要
・確率的推定と物理の組み込みを実現したモデルにおいても、訓練データが平坦地形・均一燃料・簡易大気条件の合成された野火に限定されている

◾️本研究のアプローチ
①訓練データの高度化
・2023年にCONUS(米国本土)で発生した実際の140件の野火をWRF-SFIREでシミュレーションし訓練データ化、より現実的で複雑な野火物理を学習させることで推定精度向上を図る

②地形データの条件付け追加
・地形が野火進行に与える影響を推定時に考慮可能にする

③GOES衛星による着火時刻の特定
・静止軌道衛星GOESの5分間隔観測から着火時刻を推定し、時間基準の精度を向上させる

※Bryan Shaddy, Brianna Binder, Agnimitra Dasgupta, Haitong Qin, James Haley, Angel Farguell, Kyle Hilburn, Derek V. Mallia, Adam Kochanski, Jan Mandel, Assad Oberai Generative Algorithms for Wildfire Progression Reconstruction from Multi-Modal Satellite Active Fire Measurements and Terrain Height. Source : https://arxiv.org/abs/2506.10404

◾️データセット
①訓練用データ
・WRF-SFIREによるシミュレーション:(2023年に米国本土(CONUS)で発生した140件の野火事例を基に、48時間の延焼をシミュレート)

②入力データ(推論時に使用)
・VIIRS: 375m解像度の熱異常検知データ、火災の位置特定に使用
・GOES(静止衛星): 5分間隔の高頻度観測により、正確な「発火時刻」の推定に使用

・地形データ(NED): 標高の変化が延焼速度に与える影響を考慮するために入力

③検証用データ(精度の確認)
・NIROPS(航空機赤外線データ): 解像度約6.3m/pixelという極めて高精度な実測の火災境界線、衛星推定の結果が正しいか比較するために使用

【議論の内容・結果は?】
・5件の火災全体で、平均Sørensen-Dice係数(SC)は0.81を記録、特にWilliams Flats火災ではSC 0.88、POD 0.92と極めて高い一致を見せた
※SC(Sørensen-Dice係数)・・・予測と正解が、どれだけピッタリ重なっているかを表す数値
※POD(検知確率)・・・本当に燃えている場所を、どれだけ正確に見つけられたかを表す数値
※FAR(誤報率)・・・燃えていない場所を間違えて「燃えている」と判断していないかをを表す数値(値が小さいほどよい)

Bryan Shaddy, Brianna Binder, Agnimitra Dasgupta, Haitong Qin, James Haley, Angel Farguell, Kyle Hilburn, Derek V. Mallia, Adam Kochanski, Jan Mandel, Assad Oberai Generative Algorithms for Wildfire Progression Reconstruction from Multi-Modal Satellite Active Fire Measurements and Terrain Height. Source :
※Bryan Shaddy, Brianna Binder, Agnimitra Dasgupta, Haitong Qin, James Haley, Angel Farguell, Kyle Hilburn, Derek V. Mallia, Adam Kochanski, Jan Mandel, Assad Oberai Generative Algorithms for Wildfire Progression Reconstruction from Multi-Modal Satellite Active Fire Measurements and Terrain Height. Source : https://arxiv.org/abs/2506.10404

#野火進行推定 #火災到達時間 #衛星データ統合 #VIIRS #GOES #WRF-SFIRE #cWGAN #地形条件付け #不確実性定量化 #データ同化

来月も「#MonthlySatDataNews」を続けていきますので、お楽しみに!