【2025年11月】衛星データ利活用に関する論文とニュースをピックアップ!
2025年11月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。
2025年11月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。
・Predicting human mobility flows in cities using deep learning on satellite imagery
(中解像度(10m〜30m)の衛星画像のみを用いて、都市の「人の移動量」を予測する深層学習モデル「Imagery2Flow」を開発し、過去の移動データが存在しない地域でも、都市の物理的特徴(建物、道路など)から人の動きを推計可能にする・Multiscale neural assimilation scheme for high-resolution sea surface temperature reconstruction from satellite observations
(データ同化(DA)と機械学習(ML)を統合した「4DVarNet」というフレームワークを用いて、高解像度かつ不確実性を定量化する新しいSST再構成手法を開発する)・Low and uneven rural road lighting coverage in Africa
(世界初のSDGs科学衛星「SDGSAT-1」の高解像度夜間光画像を活用し、アフリカ全土(44カ国)の農村部における道路照明の普及率を定量化し、国レベルおよび州・県レベルでの格差を明らかにし、人口分布と照明インフラへのアクセス性の相関を解明する)・Hybrid deep learning and optimization-based land use and land cover classification for advancing sustainable agriculture in Najran city, Saudi Arabia
(VLMに対する指示の出し方を工夫する「階層的プロンプトエンジニアリング(HPE)」を用いて、少ない学習データと計算資源で衛生画像の分類精度を向上させる)
宙畑の連載「#MonthlySatDataNews」では、前月に公開された衛星データの利活用に関する論文やニュースをピックアップして紹介します。
実は、本記事を制作するために、これは!と思った論文やニュースをTwitter上で「#MonthlySatDataNews」「#衛星論文」をつけて備忘録として宙畑編集部メンバーが投稿していました。宙畑読者のみなさまも是非ご参加いただけますと幸いです。
2025年11月の「#MonthlySatDataNews」「#衛星論文」を投稿いただいたのはこの方でした!
Large-scale remote sensing model enables an integrated monitoring approach for high-resolution tracking pest vole populationshttps://t.co/nitrrOFeQ6
植生変化からネズミの生息個体数を推定する試み#衛星論文— たなこう (@octobersky_031) November 30, 2025
それではさっそく2025年11月の論文を紹介します。
Predicting human mobility flows in cities using deep learning on satellite imagery
【どういう論文?】
・都市計画や交通管理、疫病対策や災害対応には、都市内の複雑な人の移動パターンの理解が不可欠である
・更新頻度が高く安価な中解像度(10m〜30m)の衛星画像のみを用いて、都市の詳細な「人の移動量(OD(Origin Destination)フロー)」を予測する深層学習モデル「Imagery2Flow」を開発する
・上記を用いて、過去の移動データが存在しない地域でも、都市の物理的特徴(建物、道路など)から人の動きを推計可能にする
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①従来モデルの限界
・重力モデルなどの古典的な物理モデルは、人口と距離のみを変数とするため、複雑な都市構造や移動パターンを捉えきれず精度が低い
※重力モデル・・・質量(人口)が大きいほど引力が強く、距離が近いほど引き寄せられるという形で推定を行うモデル
②既存の深層学習モデルの限界
・既存のAIモデルは、POI(Point of Interest)データや社会経済データ、モバイル位置情報を入力とするものが多いが、データの地域格差(データが豊富な都心部と乏しい郊外)や発展途上国での入手困難性の問題がある
◾️本研究のアプローチ
・衛星画像から、都市の物理的特徴(土地被覆、建物密度など)を抽出し、グラフニューラルネットワーク(GNN)を用いて地域間の空間的相互作用を学習させ、モバイルデータ等の履歴データやPOIなしでODフローを予測する
◾️データセット
①入力データ(都市の物理的特徴(建物の密集度、緑地、道路網など)の学習用)
・Sentinel-2: 解像度10m
・Landsat-8: 解像度30m
・Landsat-5: 解像度30m(2002年、2010年の過去データ検証用)
②補助データ
・OSRM: 地区間の移動距離(メートル)の計算に使用
・OpenStreetMap (OSM): アブレーション研究(比較実験)にて、衛星画像の代わりにPOI特徴量と比較するために使用
◾️技術的特徴
①空間コンテキストの埋め込み(Self-supervised Learning (SimCLR) + Vision Transformer)
・従来のCNNよりも、ViTを使うことで、画像全体の広範囲な関係性を捉えることができ、より高度な「街の雰囲気」を数値化できる
②空間相互作用の学習(Graph Attention Network (GAT))
・本ステップでは、地図上で隣り合う地域同士を線で結び(グラフ化)、「隣の地域との影響」を計算する
・例えば「隣がただの空き地」であれば無視し、「隣が巨大な駅」ならば移動に強く影響すると判断して、重み付けを変更する
※物理的な距離だけでなく、特徴量空間での類似度も加味して影響度(Attention Weight)を学習するため、「近いけど行かない場所」と「遠いけど行く場所」を区別する能力が向上する
③ODフロー予測器(LightGBM + BMC Loss)
・特徴抽出は深層学習モデルが圧倒的に優れているが、構造化された数値データ(特徴量ベクトル)からターゲット変数(移動人数)を予測する回帰タスクでは、勾配ブースティング決定木(GBDT)系のモデルが高い解釈性と優れた予測精度を期待できるため、LightGBMを採用する
・また、移動データの特性として、特定の主要ルート(例:都心への主要通勤路)にフローが集中し、残りのマイナールートは極めて少ない人数に留まるという「べき乗則(ロングテール分布)」が発生するため、BMC Lossを用いて、バッチ内の他のデータポイントを対照群(ネガティブサンプル)として利用することで、モデルにターゲット値の分布形状そのものを学習させ、稀だが重要な「主要な移動ルート」の予測精度を大幅に向上させる
【議論の内容・結果は?】
◾️性能比較
・提案手法である「Imagery2Flow-LGBM(10m解像度)」が、ほぼ全ての指標で最高性能を記録した
・RMSE(誤差の大きさ)では、既存の高性能モデル(Deep Gravity-V)と比較して、誤差を4.5%〜13.9%削減した
・CPC(予測の正確さを示す重要指標)では、1.3%〜2.6%の向上を達成した
・以下図の2d (人口密度ごとの精度)に記載されているよう、本モデルでは人口が少ない郊外でも高い精度を維持している
◾️課題
・以下はニューヨーク(M1)における予測誤差の分布を示しており、地図上の特定のスポットで誤差(赤色)が大きくなってる
・A地点は 緑地や公園となっており、見た目が複雑で、AIが「人が住んでいる」と誤認したり、逆に無視しすぎたりする場合がある
・B地点はゴルフ場や学校、空港などだが、上空から見ると「広い芝生と建物」に見えるため、「裕福な住宅街」や「オフィス」と見間違えやすく、過大な移動量を予測してしまうことがある
・ C地点は住民の平均年齢が55歳以上の地域などだが、衛星画像からは「建物の立派さ」は判別できても、「住人がリタイアしていて通勤しない」ことまでは見えないため、通勤量を過大評価する傾向がある
#ODフロー #グラフ注意ネットワーク #GraphAttentionNetwork ##ロングテール分布 #移動予測
Multiscale neural assimilation scheme for high-resolution sea surface temperature reconstruction from satellite observations
【どういう論文?】
・海面水温(SST)は気象予測や気候監視においてとても重要な変数だが、赤外放射計などの衛星観測は雲に遮られるため欠損が生じやすく、既存の運用プロダクト(DMI-OIなど)は、統計的な内挿手法を用いているものの、沿岸域で必要される「空間的・時間的な細かさ(粒度)」を十分に再現できていない
※SST (Sea Surface Temperature): 海の表面温度。気候変動監視のほか、漁場の特定などにも使われる。
・本論文では、データ同化(DA)と機械学習(ML)を統合した「4DVarNet」というフレームワークを用いて、高解像度かつ不確実性を定量化できる新しいSST再構成手法を開発する
※データ同化 (DA): シミュレーションモデルと実際の観測データを数学的に組み合わせて、より確からしい状態を推定する手法
【技術や方法のポイントはどこ?】
◾️先行研究の課題
①OIによる「平滑化(スムージング)」問題
・従来の「最適内挿法(OI)」は計算が安定しているものの、平滑化されすぎて細かい変動が消えてしまう
※最適内挿法 (OI): 観測データとその誤差、過去の平均値などを統計的に重み付けして、データがない場所の値を推定する伝統的な手法
・上記に対して、「多重スケール(Multiscale)4DVarNet」を採用し、全体の「粗い近似」と、細かい「偏差(アノマリー)」を分けて学習・再構成する
・まず、全体的な「大まかな温度分布(北は冷たい、南は温かいなど)」だけをAIに出力させ(OIと同様の決定論的な仕組み)、その後、大まかな温度分布と実際の細かい観測データの差(ズレ)を確率的に解く
②不確実性の定量化問題
・初期の4DVarNet(本研究の前バージョン)は、「この場所の温度は15.2℃です」と答えを1つだけ出していたが(決定論的(Deterministic))、本来、雲でデータがない場所の予測には不確実性が存在するはずである
・上記に対して、VAE(変分オートエンコーダー)という、ただデータを圧縮/復元するだけでなく、データの確率分布(ばらつきのルール)を学習する手法を用いて、現在の状況に当てはまるありえそうな海面水温を複数予測する
◾️データセット
①入力データ(観測データ)
[Sentinel-3 SLSTR SST]
・欧州の衛星Sentinel-3に搭載された赤外放射計データ
・モデルの学習および、再構成のベースとなる観測データとして使用
②比較対象(ベースライン)
[DMI-OI (Level 4 SST)]
・デンマーク気象研究所が作成している既存の運用プロダクト
・新手法(4DVarNet)の性能と比較するための基準(ベンチマーク)
③検証用データ
[In-situ observations (HadIOD)]
・漂流ブイ、船舶、係留ブイなどの現場観測データ
④共変量(補助データ)
・緯度経度、陸地マスク、高解像度海底地形(EMODnet)、およびDMI-OIの第一推定誤差分散
【議論の内容・結果は?】
・全領域(北海・バルト海)の年間平均RMSEが、DMI-OIの0.43Kから4DVarNetでは0.41 Kに減少した(特にバルト海などの沿岸域で誤差減少が顕著であり、季節別(特に春と夏)でも一貫して精度が向上している)
・上記のRMSEの改善幅自体は小さいものの、本研究の主眼であった「沿岸域で重要な小スケール構造(渦・前線)を欠損下でも復元できるか」という点に関しては、DMI-OIが再現できる最小スケールが59–69 kmであったのに対し、4DVarNetは33–45 kmまで解像でき(従来の補間手法では平滑化されて消えてしまっていた「小さな渦」や「前線(フロント)」などの海洋現象が、4DVarNetではくっきりと再現されている)、従来OI手法で平滑化されて失われていた粒度を取り戻しつつ、全体精度も改善することに成功した
#4DVarNet #SST #VAE #DataAssimilation #DMIOI
Low and uneven rural road lighting coverage in Africa
【どういう論文?】
・アフリカの特に農村部において実際に道路照明が整備・点灯しているかという現状把握は断片的であり、正確なデータが存在していない
・本論文では、世界初のSDGs科学衛星「SDGSAT-1」の高解像度夜間光画像を活用し、アフリカ全土(44カ国)の農村部における道路照明の普及率を定量化し、国レベルおよび州・県レベルでの格差を明らかにし、人口分布と照明インフラへのアクセス性の相関を解明する
【技術や方法のポイントはどこ?】
◾️先行研究の課題
・現地調査/統計データは、時間とコストがかかり、更新頻度が低く、広域モニタリングに適していない
・従来の夜間光衛星(DMSP/OLS, NPP-VIIRS)は解像度が低く、 500m~1km程度の粗い解像度では農村部の細い道路の光を捉えきることができない
◾️本研究のアプローチ
・SDGSAT-1という、解像度10m(パンクロマティック)および40m(マルチスペクトル)の夜間光観測としては極めて高い解像度を持つ衛星データを使用し、微弱な農村道路の照明と背景ノイズを分離可能にする
【議論の内容・結果は?】
・アフリカ全土の農村道路の平均照明率は3.52%に留まる
・地域格差として、北アフリカは14.65%(化石燃料資源や平坦な地形の恩恵を受け、比較的整備が進んでいる)、中央アフリカは1.28%(紛争や地形的制約により、最も照明環境が悪い)、その他の西/東/南部アフリカはいずれも2.2%未満と低迷している
・国家間格差として、エジプトやアルジェリアは20%以上あるものの、シエラレオネ、ブルンジ、リベリアなどは0.20%以下となっており、西アフリカの経済大国ナイジェリアは、道路網は発達しているが照明率は1.07% と非常に低かった
・また、道路密度(道路の多さ)と照明率(質の高さ)に明確な相関関係は確認できなかった
・「道路は作ったが、電気は通っていない」状態の高密度/低照明 (HDLC)地域のウガンダ、マラウイなどもあれば、「道路は少ないが、主要道路にはしっかり照明がある」
状態の低密度/高照明 (LDHC)地域のアルジェリア、エジプトなどもある
・加えて、照明付き道路からの距離と人口割合には、「距離が離れるほど急激に人口が減る」という強い負の相関(べき乗則)を確認でき、農村人口の 54.10%(過半数)は、照明付き道路から3km以上離れた場所に住んでいることがわかった
#SDGSAT-1 #夜間光データ #NTL #農村道路照明 #インフラ格差 #ブルーミング効果
Hybrid deep learning and optimization-based land use and land cover classification for advancing sustainable agriculture in Najran city, Saudi Arabia
【どういう論文?】
・大規模視覚言語モデル(VLM)はとても強力なものの、衛星データ特有の「細かい分類(似たような住宅地の区別など)」や「撮影条件の変化」に弱いという課題がある
・本論文では、AIへの指示の出し方を工夫する「階層的プロンプトエンジニアリング(HPE)」を用いて、少ない学習データと計算資源で分類精度を劇的に向上させる
【技術や方法のポイントはどこ?】
◾️本研究のアプローチ
①階層的推論
・まず「自然」か「都市」かを判定し、次にその中の詳細(空港、砂漠など)を判定するという2段階の指示を与える
②LoRAの採用
・AIの重みを少しだけ調整する「軽量アダプテーション」技術を使い、家庭用PCレベルの計算資源で高性能化を実現する
◾️データセット
①学習データ
・AID (Aerial Image Dataset):45種類のシーンカテゴリ(空港、ビーチ、砂漠など)
②検証データ
・UC Merced (21種)、WHU-RS19 (19種)、RSSCN7 (7種)
◾️検証手法
・モデル: VLM (Qwen2VL, Qwen2.5VLの7B/72Bモデル) vs CNN (ResNet-50, MobileNetV2)
・手法: フラットなプロンプト (V0) vs 階層的プロンプト (V1/V2)
・学習量: フル学習 vs LoRA(軽量学習)
【議論の内容・結果は?】
◾️Qwen2VL-72Bモデルの結果
・一般的なの指示 (V0): 正解率 29.33%
・階層的指示 (V1): 正解率 52.00%
◾️(最新)Qwen2.5VL-7Bモデルの結果
・一般的な指示 (V0): 90.67%
・階層的指示 (V1): 96.44%
◾️ファインチューニングの結果
・VLM(Qwen2.5VL)とCNN(ResNet-50など)をAIDデータセットで追加学習をした
・訓練データを用意したAIDの全体の1%しか使わなかった場合、従来のCNN (MobileNetV2)の正解率53.44%、従来のCNN (ResNet-50)は28%、本手法 (VLM + HPE)では正解率 が81.44%となり、少量の追加のファインチューニングでも大きな正解率の差が出る形となった
◾️モデルサイズの比較
・7Bモデル(パラメータ数70億・軽量)で正解率96.11%、72Bモデル(パラメータ数720億・重量)で正解率96.56%となっており、10倍の計算コストをかけてモデルを巨大化させても、精度は0.45%しか変わらないことがわかった
#LULC #CNN #ランダムフォレスト #Landsat-8 #半乾燥地域 #サウジアラビア
来月も「#MonthlySatDataNews」「#衛星論文」を続けていきますので、お楽しみに!

