宙畑 Sorabatake

解析・実践・論文紹介

【2026年5月】衛星データ利活用に関する論文とニュースをピックアップ!

2026年5月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。

2026年5月に公開された衛星データの利活用に関する論文の中でも宙畑編集部が気になったものをピックアップしました。

Benchmark Datasets for Satellite Image Time Series Classification: A Review
(2017年から2025年に公開された29の中~高解像度のSITS(Satellite Image Time Series、衛星画像時系列)分類ベンチマークデータセットを体系的に比較分析し、データセット選択の指針と今後の研究の方向性を提示する)

A Survey on SAR Ship Classification Using Deep Learning
(合成開口レーダ(SAR:Synthetic Aperture Radar)画像を用いた船舶分類(船種識別)タスクを対象に、過去の膨大な研究を包括的に分析し、ディープラーニング、主要データセット、画像拡張、学習技術の4つの次元からなる体系的なレビューと標準化された性能比較を行う)

Evaluation of the Potential of Very-High-Resolution Satellite Imagery in Large-Scale Mapping
(モロッコ独自の超高解像度(VHR)地球観測衛星「Mohammed VI A/B」のステレオペア(立体視)画像を対象に、大縮尺(1:10,000および1:5000)の都市・地形図作成における幾何学的精度と都市地物の識別能力を検証し、従来の航空写真測量をコスト・スピード面から代替・補完できるかをシステム的に評価する)

宙畑の連載「#MonthlySatDataNews」では、前月に公開された衛星データの利活用に関する論文やニュースをピックアップして紹介します。

実は、本記事を制作するために、これは!と思った論文やニュースをX(旧Twitter)上で「#MonthlySatDataNews」「#衛星論文」をつけて備忘録として宙畑編集部メンバーが投稿していました。宙畑読者のみなさまも是非ご参加いただけますと幸いです。

2026年5月の「#MonthlySatDataNews」「#衛星論文」を投稿いただいたのはこちらの方でした!

それではさっそく2026年5月の論文を紹介します。

Benchmark Datasets for Satellite Image Time Series Classification: A Review(レビュー論文)

◾️概要
・本論文は、2017年から2025年に公開された29の中~高解像度のSITS(Satellite Image Time Series、衛星画像時系列)分類ベンチマークデータセットを体系的に比較分析し、データセット選択の指針と今後の研究の方向性を提示する

※Zhang, A.; Zhang, Z.; Shi, K.; Tang, P. Benchmark Datasets for Satellite Image Time Series Classification: A Review. Remote Sens. 2026, 18, 1581.
https://doi.org/10.3390/rs18101581

◾️スペクトル(利用バンド)の現状
・欧州のSentinel-2が主役となっており、29のデータセット中24個がSentinel-2を利用している
・主要バンドとしては、赤・緑・青の可視光+近赤外(NIR)だけでなく、植物の分析に重要なレッドエッジ(Red-edge)バンドを20個のデータセットが採用している
・マルチモーダルでの分析が進んでおり、29中13個のデータセットが、光学画像に加えて天候に左右されないSentinel-1(SAR:合成開口レーダー)や、超高解像度な航空画像などを組み合わせている

※Zhang, A.; Zhang, Z.; Shi, K.; Tang, P. Benchmark Datasets for Satellite Image Time Series Classification: A Review. Remote Sens. 2026, 18, 1581.
https://doi.org/10.3390/rs18101581

◾️時間(撮影頻度・長さ)の現状
・撮影間隔が完全に等間隔なデータセットは、全体の31%(9/29)しかない(不規則さがデフォルトとなっている)
・それら(31%)のほとんどが、毎日撮影できる商業用衛星(PlanetScope)を使ったものである
・一般的な無料の公開衛星データ(SentinelやLandsat)ベースのものは、雲で隠れた画像を排除した結果、撮影間隔がバラバラ(不規則)になっている

※Zhang, A.; Zhang, Z.; Shi, K.; Tang, P. Benchmark Datasets for Satellite Image Time Series Classification: A Review. Remote Sens. 2026, 18, 1581.
https://doi.org/10.3390/rs18101581

◾️空間(解像度・地域)の現状
・解像度は10mが標準となっており、21のデータセットが空間解像度を10mに統一して提供している
・また、データセットの約60%が、ヨーロッパ(特にドイツ・フランス)やアメリカなどの温帯の農業地帯に集中しており、熱帯地域や小規模農家が多いアフリカ・東南アジアのデータは極端に不足している

※Zhang, A.; Zhang, Z.; Shi, K.; Tang, P. Benchmark Datasets for Satellite Image Time Series Classification: A Review. Remote Sens. 2026, 18, 1581. https://doi.org/10.3390/rs18101581

◾️カテゴリ(正解ラベル)の現状
・29のデータセットのうち、なんと28個(96.6%)が年に1回しか正解ラベル(これは何の作物か、どういう土地利用か)を提供していない
・また、多くのデータセットはモデルの安定性のために20クラス未満だが、中には160クラスを超える超高精細な分類に挑戦しているものもある

※Zhang, A.; Zhang, Z.; Shi, K.; Tang, P. Benchmark Datasets for Satellite Image Time Series Classification: A Review. Remote Sens. 2026, 18, 1581. https://doi.org/10.3390/rs18101581

◾️データの不規則さ・ノイズへの対応
① 時間特化型(1D CNN / RNN / Transformer)
・本手法は、画像の縦・横のつながり(形や模様)を一切見ない
・画像全体を処理しないため計算が非常に軽く、広大な国土の農業マップを高速に作るのに向いている
・ある1マスのピクセル(または農地ごとの平均値)だけに着眼し、その場所の数字(NDVIなど)が1年間でどう変化したかという1次元の折れ線グラフだけをAIへの入力とする

[1D CNN(畳み込み)レイヤー]
・グラフの一部分の急な傾き(例:収穫による急激な数値の低下)を、小さな窓をスライドさせながら局所的に見つける

[RNNレイヤー]
・「春に数値が上がり、夏にピークを迎え、秋に下がる」などという、時間の前後の流れを1ステップずつ順番に読み解く

[Transformerレイヤー]
・1年間の全データを同時に見渡し、「5月の田植え時期」と「9月の収穫時期」のデータを直接結びつけて(Self-Attention)、「このパターンの変化は米だ」と一発で複雑な作物を特定する

② 時空間セパレート型(2段階アプローチ)
・空間(画像)の処理と、時間(時系列)の処理を別々のAIに任せる、役割分担(2段階)アプローチである
・DynamicEarthNetのように毎日撮影される高頻度なデータで威力を発揮し、畑の形(区画)があらかじめ決まっているEUROCROPSなどのデータでは、畑の形を第1段階できれいに認識できるため、ノイズ(雲)が一部の日に混ざっていても、畑全体の変化の文脈からAIが何の作物かを正しく推測しやすいという強みがある

[第1(空間AI)レイヤー]
・U-NetやResNetといった画像認識AIが、ある1日の衛星画像(1024×1024ピクセルなど)を読み込み、「ここに四角い畑の境界線がある」「ここは質感的に葉が茂っている」といった空間的な特徴を日ごとに作成する

[第2(時間AI)レイヤー]
・その日ごとの要約レポートを時間順に並べ、ConvLSTM(画像が扱えるRNN)などの時間AIに流し込み、四角い畑の模様が、数ヶ月かけて徐々に色づき、ある日突然消えた(収穫された)というような変化を捉える

③ 時空間ハイブリッド型(3D CNN / Spatio-temporal Transformer)
・時間と空間を別々に分けるのをやめ、縦 × 横 × 時間を最初から1つの3次元空間(時空間キューブ)として同時に処理する、最もリッチで最新のトレンドである

※Zhang, A.; Zhang, Z.; Shi, K.; Tang, P. Benchmark Datasets for Satellite Image Time Series Classification: A Review. Remote Sens. 2026, 18, 1581. https://doi.org/10.3390/rs18101581

#SITS #衛星画像時系列 #マルチセンサー融合 #Sentinel2 #SAR #自己教師あり学習 #基盤モデル #土地利用 #精密農業

A Survey on SAR Ship Classification Using Deep Learning(レビュー論文)

◾️概要
・本論文は、合成開口レーダ(SAR:Synthetic Aperture Radar)画像を用いた船舶分類(船種識別)タスクを対象に、過去の膨大な研究を包括的に分析し、ディープラーニング、主要データセット、画像拡張、学習技術の4つの次元からなる体系的なレビューと標準化された性能比較を行う

◾️内容
① バックボーンアーキテクチャ
[光学用モデルの流用(VGGNet, ResNet, DenseNetなど)
・これらは、100万枚以上の一般写真(犬、猫、車など)を集めた巨大データセット「ImageNet」で1位を競い合う中で開発されたものである
・人間の視覚に似た畳み込み(画像の局所的なパターンを見つける処理)を何十層、何百層と深く積み重ねることで、非常に複雑で抽象的な特徴を捉えることができる
・ただし、これらのモデルは、カラー(RGBの3チャンネル)で、輪郭がくっきりした綺麗な写真を学ぶために最適化されており、SAR画像は白黒(1チャンネル)で、後述する砂嵐のような強烈なノイズ(スペックルノイズ)が乗っているため、光学用アーキテクチャをそのまま持ってくると、AIはノイズのザラザラした模様まで重要な特徴だと勘違いして記憶してしまう
・加えて、層が非常に深く学習能力が過剰に高いため、手元にある数少ないSARの訓練画像を画像丸ごと暗記してしまう。結果として、訓練データでのテストは正解率100%になるのに対して、いざ本番で見たことのない新しい船舶の画像を入力すると、全く正解できなくなる過学習(オーバーフィッティング)という現象を強く引き起こしてしまう

[軽量・カスタムモデル(NAS:ニューラルアーキテクチャ探索)]
・人間の研究者が手作業でレイヤーを組み合わせるのではなく、AIにAIの構造を自動設計させる技術(NAS:Neural Architecture Search)を導入した
・数千〜数万パターンの骨格をコンピュータ上で自動的にシミュレーションし、SAR画像を入力したときに、最もノイズに惑わされず、かつ最も少ない計算量で船種を当てられる組み合わせをAI自身に計算させる
・上記により開発されたSBNNやSCMといった searchedモデル(探索されたネットワーク)は、層の深さを3〜5層程度に必要な分だけ削ぎ落とした超軽量なものとなった
・重さ(パラメータ数)は光学用モデルの半分以下(約50万個程度)になり、データが少ない環境でも過学習を起こさない上、スマートフォンのような計算能力が限られた現場端末(エッジデバイス)でも、一瞬で船種を判定できるほどの圧倒的な高速処理が可能となった

②画像拡張(Image Augmentation:データ水増し技術)
・ディープラーニングが本領を発揮するには最低でも数万枚の画像データが必要だが、高解像度な商業SAR衛星(TerraSAR-XやGaoFen-3など )の画像は、1枚購入するだけで数十万円規模のコストがかかることもある上、船の画像は陸上の風景に比べて圧倒的に集めにくいため、手元にある数百〜数千枚の限られた画像を加工して増やすテクニックが不可欠である
・具体的なアプローチとして、船が写っている画像チップを、ランダムに左右・上下にひっくり返したり(反転)、+45度から-45度まで少しずつ傾けたり(回転)、中心から数ピクセルだけ上下左右にズラしたりする(並進移動)
・上記アプローチは、人工衛星が常に真上から船を撮影するわけではなく、斜めから撮ることもあれば、船自体が東を向いていたり、北西を向いていたり、波に揺られて画像の端に写り込んだりするため、上記方法が幾何学的不変性の獲得に寄与する
・また、ガウスフィルタ(Gaussian Filtering)によるノイズ制御を行い、画像の各ピクセルとその周囲の明るさをブレンドして、画像全体をほんの少しだけ滑らかにぼかす数学的な処理を施す
・本ステップは、SAR画像には電波の干渉によって生じるスペックルノイズ(砂嵐のような白黒の斑点雑音)が100%発生するため、解像度が低い画像だと、このノイズが原因で船の輪郭と波の模様の区別がつかないが、ガウスフィルタで画像を少しぼかすことで、逆にトゲトゲした点状のノイズが消え、船全体の大きなシルエットや外見の境界線が浮かび上がってくるため有効である

※C. M. Awais, M. Reggiannini, D. Moroni and E. Salerno, "A Survey on SAR Ship Classification Using Deep Learning," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 19, pp. 18449-18476, 2026, doi:10.1109/JSTARS.2026.3695704.

③学習技術
[特徴量融合(FF:Feature Fusion)]
・AIは背景に写っているたまたま特徴的だった波の形やノイズのパターンを勝手に学習し、それをタンカーの証拠だと勘違いしてしまうため、ディープラーニングが自力で学習する特徴に加えて、人間が従来の数式で計算した手動特徴量(Handcrafted Features)を、AIの最終決定層の直前で物理的に結合して入力する
・例えば、船の「長さ」「幅」「面積」「アスペクト比」(幾何特徴)や、船の輪郭のグラデーションの向きを数値化したHOGなどを、あらかじめ計算して特徴量として利用する
・データの少なさを完全にカバーし、浅いVGG-11などのモデルでも分類精度を3〜7%も底上げすることができる

※C. M. Awais, M. Reggiannini, D. Moroni and E. Salerno, "A Survey on SAR Ship Classification Using Deep Learning," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 19, pp. 18449-18476, 2026, doi: 10.1109/JSTARS.2026.3695704.

[偏波融合(PF:Polarization Fusion)]
・上空から見ると、同じ金属製の巨大な箱に見えるタンカー(油槽船)とバルクキャリア(鉱石や穀物を運ぶ貨物船)は、白黒のSAR画像1枚だけでは形が非常にそっくりとなっており、高確率で誤判定(誤分類)してしまう
・そこで、電波の垂直偏波(V波)と水平偏波(H波)の組み合わせを利用、2枚の異なる画像を、2本の別々のAIの脳(デュアルブランチ)で同時に並行して読み込ませる
※人工衛星から「V」で電波を発して、返ってきた「V」を記録した画像をVV偏波画像と呼ぶ
※一方で、返ってくる途中で船体の複雑な構造(垂直の壁や入り組んだクレーン、マストなど)にぶつかって向きが変わり、返ってきた水平偏波を記録した画像をVH偏波画像と呼ぶ
・一例として、タンカーとバルクキャリアでは、甲板の上にあるパイプラインの複雑さや、荷役クレーンの有無など、金属構造物の立体的な配置が全く異なり、電波の跳ね返り方の違い(VV=表面の平らな反射、VH=構造物による複雑な跳ね返り)を2つの脳で別々に分析し、最後に融合させることで、「一見同じ形に見えるけれど、構造が違う別の船だ」とAIが見分けることができるようになる(3クラス分類でF1スコア86〜89%を安定達成)

※C. M. Awais, M. Reggiannini, D. Moroni and E. Salerno, "A Survey on SAR Ship Classification Using Deep Learning," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 19, pp. 18449-18476, 2026, doi: 10.1109/JSTARS.2026.3695704.

[メトリック学習(Metric Learning)]
・実世界のデータセット(OpenSARShipなど)は、全体の6割以上が貨物船で埋め尽くされており、漁船やタグボートなどのマイナーな船種は数枚〜数十枚しかデータがない

※C. M. Awais, M. Reggiannini, D. Moroni and E. Salerno, "A Survey on SAR Ship Classification Using Deep Learning," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 19, pp. 18449-18476, 2026, doi:10.1109/JSTARS.2026.3695704.

・そこで、AIに対して画像をクラス名(ラベル)に直接分類させる形ではなく、画像を細長い数列(ベクトル)に変換し、「船種が何であれ、同じ種類の船の画像なら、計算上の距離(コサイン類似度やユークリッド距離など)がギュッとゼロに近くなるように集める。違う種類の船であれば限界まで遠くへ引き離す」という距離のルール(物差し)だけを徹底的に訓練させる

※C. M. Awais, M. Reggiannini, D. Moroni and E. Salerno, "A Survey on SAR Ship Classification Using Deep Learning," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 19, pp. 18449-18476, 2026, doi:10.1109/JSTARS.2026.3695704.

・本方法の最大の強みは、たとえデータが3枚しか存在しない不審船(数ショット学習環境)に対しても、「手元にある3枚のデータと距離が一番近いから、この不審船の仲間だ」と正確に判定できるようになることである
・16クラスという絶望的な不均衡環境であっても、F1スコア97.97%(Siamese Net(2021)参照)という驚異的なブレイクスルーがもたらされた

※C. M. Awais, M. Reggiannini, D. Moroni and E. Salerno, "A Survey on SAR Ship Classification Using Deep Learning," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 19, pp. 18449-18476, 2026, doi:10.1109/JSTARS.2026.3695704.

◾️性能を左右するクラス数
・3クラス以下(「バルクキャリア」「コンテナ船」「タンカー」)といった主要3種に絞れば、F1スコア75〜90%(最高97.80%)を安定して叩き出せることができる
・6クラス以上の場合、大半の手法でF1スコアが51〜65%へと急落する(よく似たマイナー船種が、 貨物船などの圧倒的なサンプル数に埋もれてしまうためと考えられる)

※C. M. Awais, M. Reggiannini, D. Moroni and E. Salerno, "A Survey on SAR Ship Classification Using Deep Learning," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 19, pp. 18449-18476, 2026, doi: 10.1109/JSTARS.2026.3695704.

#SAR衛星画像 #合成開口レーダ #船舶分類 #OpenSARShip #FUSARShip #偏波融合 #特徴量融合 #メトリック学習 #クラス不均衡 #マルチスケール #海洋監視

Evaluation of the Potential of Very-High-Resolution Satellite Imagery in Large-Scale Mapping

【どういう論文?】
・本論文は、モロッコ独自の超高解像度(VHR)地球観測衛星「Mohammed VI A/B」のステレオペア(立体視)画像を対象に、大縮尺(1:10,000および1:5000)の都市・地形図作成における幾何学的精度と都市地物の識別能力を検証し、従来の航空写真測量をコスト・スピード面から代替・補完できるかをシステム的に評価する

【技術や方法のポイントはどこ?】
◾️先行研究の課題
①従来の航空写真測量に伴う膨大なコストと運用の難しさ
・都市地図を整備・更新する手段として、長年アナログカメラ(RMK TOP)やデジタルセンサー(ADS, DMC)を積んだ航空機による測量(航空写真測量)が標準とされてきた
・しかし、機材調整、飛行許可、天候待ちなどのロジスティクス負荷が高く、コストと時間が非常にかかる

②VHR衛星画像の大縮尺(1:10,000/1:5000)地図における適合性のエビデンス不足
・WorldViewやPléiadesなどの海外商業衛星の知見はあるものの、モロッコ独自の「Mohammed VI」衛星(50cm解像度)が、国家基準の厳しい誤差許容値(平面・高度)を満たせるのか、また都市計画に必要な微細な構造物がどこまで判読可能かが体系的に実証されていなかった

◾️本研究のアプローチ
①厳密な物理的センサーモデル(Physical Sensor Model)の採用
・通常、衛星画像にはRPC(合理的多項式係数)モデルという簡易的な計算データが付属されており、カメラの仕組みを無視して「写真上のこの位置は、地上ではだいたいこのへん」と数式でザックリ結びつけた、いわば汎用的な地図の自動翻訳機が存在する
・上記は手軽だが、山の斜面など高低差が激しい場所では翻訳ミス(歪み)が大きくなる
・一方、本研究が使用する「物理的センサーモデル」は、衛星のレンズの焦点距離、センサーの並び方、宇宙での正確な位置(軌道暦)や傾き(姿勢角)をすべて数式に組み込んだ「専用の精密オーダーメイド設計図」となる

②マニュアル立体視(3D)視認判読による主題解釈ベンチマーク(基準値)の策定
・立体視とは、3D映画のように、少し離れた2つの角度から撮った写真を左右の目で同時に見ることで、地形や建物の高さを立体的に浮かび上がらせる技術である
・主題解釈能力とは、写っているものが「道路」なのか「ビル」なのか、その正体(主題)を正しく見分ける能力を指す
・つまり、あえてAIによる自動抽出を完全に排除し、熟練の技術者が影や立体感(視差)を頼りに地物を一つずつ目視判読(視認性・完全性・明瞭性の評価)する

【議論の内容・結果は?】
・平面精度(水平方向の位置)において、Mohammed VI衛星画像は一貫してRMSE< 0.5m(すべてのズレを平均した、地図の信頼度を示す数値)を達成し、1:10,000および1:5000の国家地図基準をクリアした
・一方、高度精度(Z方向、垂直)はRMSE 0.25〜0.60mの間で変動し、1:10,000基準は満たすものの、1:5000基準(0.35m)の達成は厳しいという結果になった

※Afa, I.; Labbaci, A.; El Ghazouani, L.; Radoine, H. Evaluation of the Potential of Very-High-Resolution Satellite Imagery in Large-Scale Mapping. Remote Sens. 2026, 18, 1421. https://doi.org/10.3390/rs18091421

#MohammedVI衛星 #地形図作成 #超高解像度衛星画像 #航空写真測量 #幾何学的精度 #TOST等価性試験 #空中三角測量 #都市地物抽出 #GeoAI #大縮尺マッピング #立体視

来月も「#MonthlySatDataNews」「#衛星論文」を更新予定。お楽しみに!