SAR画像を解析する際に理解しておきたい基礎処理【SARデータ解析者への道】
SAR画像を解析する際に理解しておきたい基本処理を紹介します。「SARデータ解析者への道」シリーズの2本目です。
(1)はじめに
SAR(合成開口レーダー)のデータを解析したい!と思った方が、できる限り壁を感じずに解析できるようになる道しるべとなることを目指して更新する宙畑の連載「SARデータ解析者への道」の1本目では、SARの奇跡とも呼べるSARの原理について紹介しました。
2本目となる本記事では、SAR画像を解析する際に理解しておきたい基本処理を紹介します。
ただし、本記事では、厳密な説明は避け、直感的理解に重きをおいている点もあることを、ご承知おきください。
本記事はシリーズものとなっており、第一弾の記事は以下となります。まだ1本目の記事を読まれていない方は、先に以下の記事を読まれるのをオススメします。
レーダーの基礎から学ぶSAR(合成開口レーダー)の原理と奇跡【SARデータ解析者への道】
なお1本目の記事でも紹介した通り、本連載ではオリジナルのお米とあざらしをモチーフにしたキャラクター、こめじゃらし博士と少年こめじゃらしくんが登場します。SARの初学者がつまずきやすい、疑問に思う箇所で少年こめじゃらしくんが現れ、その答えをこめじゃらし博士が教えるというポイントをいくつか設けています。SARを学ぶ上で重要なポイントででてきますので、ぜひ楽しみながら学んでいただけますと幸いです。
(2)SAR画像の基礎処理~画像を解析するうえで知っておきたいベースの理解~
SAR画像の解析を理解するための最初のステップとして、SAR画像の基礎処理です。本記事での基礎処理というのは、SAR画像を解析するにあたって最もベースとなる処理・理解を指しています。
直感的に理解できる光学画像とは異なるSAR画像において、基礎処理についての理解が及んでいないと後述する内容や今後の記事で紹介する内容の理解が追いつかなくなる可能性が高いです。そのため、本記事の内容はしっかりと理解できたと思えるまで読んでいただけますと幸いです。
SARデータは大元となる生データから、いくつかの段階に分けて処理が進められます。解析に用いる際には、解析の内容に合わせて適切な段階のデータを用いる必要があります。本章では、このそれぞれの処理について解析していきます。
1.Single Look Complex(SLC)データの概要と成り立ち
a.SLCデータとは
SAR画像を学び始めると、SLCデータという用語がよく出てきます。
SLCデータとは、Single Look(シングルルック)の形で信号を分離し、後述する圧縮処理を用いて結像したデータのことを指します。
「シングルルックの形で信号を分離……..」と言われても腑に落ちないと思いますが、第一弾の記事で紹介したように、SAR衛星では仮想巨大アンテナを作成し全てのアジマス方向を覆う形で地表を連続的に観測しています。それらの観測の一つをとってシングルルックと言います(下図)。
また、SLCデータの形式は、通常の画像で使われている実数に加えて虚数も含まれる複素数となっています。
※複素数とは、実数と虚数を合わせた数の概念です。詳細は他サイトの「複素数とは?公式や i の 2 乗の意味、計算問題の解き方」や「虚数とは何か?複素数とは何か?が一気に分かりやすくなる記事」をご覧ください。
単に「複素数」と言葉で説明されても理解しづらいと思いますので、実データを実際に確認してみましょう。
Copernicus BrowserからSentinel-1のSLCデータをダウンロードし、pythonで可視化してみました。
左図に対応した右側の数値を見ると、実数+虚数(j)で表示されていることが分かります。
これでSLCデータの形式が複素数というのは、なんとなく理解できたのではないでしょうか。
ここで、「なんで、よくわからない複素数をわざわざ取り扱うの?」と疑問にもたれる方がいるかもしれません。
その理由は、複素数の概念を取り入れることで、SARの電波(信号)としての2つの情報①振幅と②位相を同時に取り扱うことが可能になります。
複素数は実数と虚数を組み合わせて表現されるため、情報を1次元ではなく2次元で扱えるようになります(下図)。
特に、複素数で波を表現すると、波の大きさだけでなく、位相情報(波の位置情報)も持たせることができます(下図)
このように、SLCデータは複素画像であり位相情報を扱えることから、SLCデータは干渉解析で利用されています。
宙畑メモ:干渉解析とは
干渉SARとは、一言でいえば、「電波の位相差を測ることで地表面の変化を知る技術」と言えます。衛星が同じ位置から電波を放射したとき、地表面に変化がなければ、同じ位相が返ってきます。一方、地表面が何らかの理由で変化していれば、それが反射波の位相のずれとして検知されるので、地表面の変化を抽出することができるのです。
【コード付き】地盤の沈降が分かる干渉SAR解析をTellusでやってみた
後述する強度画像になると、複素数の虚数部分は取り除かれて実数のみで構成されることになります。そのため、強度画像では位相情報が必要な干渉解析ができないということになります。
b.生データからSLCデータを生成するプロセス(レンジ圧縮処理とアジマス圧縮処理)
では一通りSLCデータについて紹介したところで、次にその生成プロセスについても紹介します。この生成プロセスを理解することで、SAR画像をより身近に感じることができるようになると思います。
SLCデータは、SAR衛星が受信した生データから生成されています。生データからSLCデータへと変換する際に行われる処理は、レンジ圧縮処理とアジマス圧縮処理となります。
レンジ圧縮処理とは、SAR衛星からレンジ方向に向けてレーダー(送信信号)を発射し、地表面で反射した受信信号に対して送信信号で相関処理を行って、レンジ方向に鋭くて強い信号を生成することです。
相関処理(畳み込み処理と言うこともあります)とは、2つの信号の類似度を算出することです。2つの信号が似ていると高い値を得られ、逆に2つの信号が似ていないと弱い値を得ることになります。
以下にイメージ図を用意しました。2つの似ている信号があるとします。それらの信号を相関処理して得られたものが一番右のグラフとなります。グラフの真ん中に非常に高い値が生成されているのを確認できます。
ついでに、相関が低い信号同士で相関処理を行うと、どのような信号が生成されるのかも確認してみましょう(下図)。左側に2つの信号を用意しました。これらの信号は似ていないことが分かるかと思います。それらの信号を相関処理して得られたものが一番右側の図となります。先ほどとは異なり、真ん中に高い値を持つグラフを生成できていないことが確認できます。
これは、第一弾の記事で紹介した「インパルス応答」と同じ原理です。
レーダーの基礎から学ぶSAR(合成開口レーダー)の原理と奇跡【SARデータ解析者への道】
続いて、アジマス圧縮処理の説明です。アジマス圧縮処理についてはレンジ圧縮処理と同様と考えてもらって大丈夫です。レンジ圧縮処理ではSAR衛星からレンジ方向の受信信号に対して相関処理を行う形でしたが、アジマス圧縮処理ではアジマス方向の受信信号に対して相関処理を行います。
これでレンジ圧縮処理とアジマス圧縮処理の説明は以上ですが、直感的な理解を補助するために下図を用意しました。SAR衛星がレーダーを発射し、地表に当たって、1つの信号のみが返ってきたと考えてください。下図は、その1つの受信信号に対してレンジ方向とアジマス方向に相関処理を行った図です。鋭くて強い値を持つグラフがレンジ方向にもアジマス方向にも生成されているという形です。
では次に、複数の受信信号の場合を考えてみましょう。アジマス方向とレンジ方向での2次元での相関処理をすると、下図になります。
それを振幅方向の軸から俯瞰して見ると画像のようになります。
2.SLCデータから強度画像の作成、後方散乱係数(σ0)への変換
a.SLCデータから強度画像の作成
SLCデータの概要と成り立ちの紹介が終わったところで、SAR画像解析でよく利用される強度画像に焦点を当てたいと思います。
強度画像とは、各ピクセルにおいて、SAR衛星からのレーダーが地表物に当たって反射した強さ(強度)が示されている画像のことです。
地表物に当たって反射していることから、その強さには地表物の反射特性が反映されています。例えば、水面などのなめらかな表面では電波が全反射し、ほとんど衛星に返って来ませんが、森林などの粗い表面の場合、一部の電波が衛星に返ってきます。
また、その強さの値をデジタルナンバーという言葉で表現することもあります。
強度画像は、SLCデータを構成している複素数の絶対値を取ることで作成することができます(下の式)。
複素数は信号(波)とも紐づいていることはお伝えしましたが、その複素数の絶対値を取るということはその信号(波)の振幅情報=強度に変換することになります(複素数ではなくなります)。そのため、強度画像は振幅画像とも呼ばれます(強度画像という呼ばれ方が一般的ですが)。
強度画像を用いると解析では実数を扱うことになるため、データ形式が複素数のSLCデータと比較すると解析しやすくなります。
b.デジタルナンバーから後方散乱係数(σ0)、デシベル(dB)への変換
SLCデータから作成した強度画像のデジタルナンバーは、後方散乱係数(sigma-nought, sigma-zero, σ0)に変換されます。
後方散乱係数とは、画像を構成するピクセルという単位面積レベルで地表の状況を捉えた値を指します。
もう少し分かりやすいように言い換えると、一般的に1つのピクセルには様々な地表物が存在しており、それら地表物の反射特性を足し合わせて数値化したものが後方散乱係数です(下図)。
デジタルナンバーでも地表物の反射特性は反映されているのですが、デジタルナンバーを後方散乱係数へと変換することには理由があります。
デジタルナンバーは、地表物の反射特性以外にもシステムパラメータや撮影角度といった衛星本体の影響を受けていることがあります。そのため、デジタルナンバーのままで解析する場合には、そうした要因を排除できず、異なる撮影条件で撮影された画像同士を比較することは困難となります。
イメージとして、ある1つの画像において、撮影した条件が異なると、明るい画像になったり、暗い画像になったりするということです(下図)。
これでは画像同士を純粋に比較することはできないですよね。こうした画像間のバラつきを統一するため、デジタルナンバーは後方散乱係数へ変換、衛星画像によっては対数尺度であるデシベル単位での変換が行われます。
余談となりますが、画像のバラつきを統一することを校正と呼びます。デジタルナンバーの後方散乱係数への変換にあたっては、各衛星データ提供会社がそれぞれ運用する衛星に対して校正係数、校正式というものを設定していますので、興味がある方はぜひ検索してみてください。
以上が、SAR画像の一連の基礎処理となります。いかがでしょうか。これでSAR画像解析での不安を払拭!ということにはなりませんが、より安心感をもってSAR画像の解析に取り組めるのではないでしょうか。
(3)SAR画像の高次処理~基礎処理に加えて知っておきたいこと~
次は、高次処理へと進みます。ここでは上記の基礎処理をベースに、SAR画像解析にあたって追加でおさえておくべき情報をご紹介します。
まずは、SAR画像の解析にあたって必ず直面するスペックルノイズからです。
1.スペックルノイズの影響とその対応
a.スペックルノイズとは
SAR画像でノイズと一言で言ってもいくつか種類があるのですが、ここでは多くの人が暗に意味する画像に現れるスペックルノイズのみを取り扱います。
スペックルノイズとは、衛星から照射される電波が、単一のピクセル内に存在する多数の地物に当たって散乱し、それらの散乱波が干渉しあって生じる現象のことです。
どういうことかと言うと、先ほどお見せしたように、画像上では認識できないものの、1つ1つのピクセルは様々な地表物で構成されています(下図)。これらの地表物は位置も高さも状態も異なり、ピクセル単位で考えるとランダムに配置されていると考えられます。
そのため、衛星から放たれたレーダー(送信信号)はそれらの地表物に当たって反射します。これらの反射波は互いに干渉し合い、最終的にはそれぞれの反射特性を反映した合成信号として受信されることになります。
したがって、衛星の観測条件が完全に同じ場合、全く同じ地表物で構成される2つのピクセルが存在すると仮定すると、理論上は同一のスペックルノイズが生成されることになります。
しかしながら、実際には隣接するピクセル間でも地表物が完全に同一の形で構成されることはありません(葉や波などの状態は常に変わります)。
そのため、下図のような一見均質に見える場所であったとしても、各ピクセルで異なるスペックルノイズが生じることとなります。この微細な違いが、解析に影響を及ぼすこととなります。
そのため、SAR画像を解析する際には、解析目的に応じて、後述するフィルタリング手法やマルチルック処理を適用することが必要となります。
すでに解析を一度でもしたことがある方は、スペックルノイズの存在の謎に悩まれたかもしれませんが、これでスペックルノイズの謎を多少なりとも紐解くことはできたのではないでしょうか。
b.フィルタリング手法
フィルタリング手法とは、画像の1つ1つのピクセルに対し、個々のピクセルとその周辺にあるピクセルを使って何かしらの処理を施すことです。
様々なフィルタリング手法が既に開発されていますが、一例としてメディアンフィルタを取り上げます。メディアンフィルタでは、画像上の1つ1つのピクセルに対し、個々のピクセルと周辺にあるピクセルを比較して中央値を抽出し、そのピクセルの値を中央値で置き換えます。メディアンフィルタを行うことで、強い・弱いノイズを除去することが可能となります。下の右図は、中心のピクセルに対して縦5×横5の周辺ピクセルを用いてメディアンフィルタを適用した画像になります。
メディアンフィルタ以外の手法としては、下図で示すようなものがあります。フィルタリング手法によって仕組み・期待される効果が異なるため、必要に応じて各人で論文等を読んでいただければと思います。今後、いくつかの分野でフィルタリング手法を用いた解析記事を出す予定ですので、そちらも併せてご確認いただけると幸いです。
c.マルチルック処理
マルチルック処理とは、2以上のルック数で信号を分離して画像を処理することです。単純に、SLCデータはシングルルックの信号をという話でしたが、今回は”マルチ”ルックなので2以上の信号をという話です。
実際の処理内容としては、アジマス方向やレンジ方向に隣接するピクセルに対して何かしらの処理(加算平均など)を行うことになります(複数のピクセルを取り扱うということ)。それにより、スペックルノイズの低減効果が期待されます。ただし、隣接するピクセル同士を一つのピクセルとして扱うことになるので、解像度の低下に繋がります。
SLCデータのマルチルック処理の前と後の画像を下に図示しています。マルチルック処理として、レンジ方向に4ピクセルの加算平均を行っています(アジマス方向は処理なし)。
この2つの画像を見比べてみると、画像の幅が変化しているのに加えて、マルチルック処理後の右図ではスペックルノイズが低減しているのが見て取れるかと思います。一方で、解像度が下がっていることも確認できます。
このように、マルチルック処理は、スペックルノイズ低減の機能を果たします。他方、解像度の低下も副作用として働くことから、多めの複数ピクセルにわたるような大き目の地表物を解析対象とする場合には問題にはなりませんが、1~3というような少なめの複数ピクセルに留まる地表物を解析対象とする場合には注意を払う必要性が生じます。
フィルタリング手法との大きな違いは、解像度が下がるか否かと観測対象物の信号が減衰するかです。大きなマルチルック処理をしてしまう、もしくは複数回行ってしまうと、それだけで解像度が大きく下がることになり、目的とする対象物を検証することが難しくなってしまいます。そのため、解析目的・状況に応じての判断にはなりますが、マルチルック処理はできるだけ避け、フィルタリング手法に工夫を凝らすことをオススメします。具体的な活用事例については、今後の記事で記載したいと思います。
2.SAR画像への地形による影響
a.SAR画像への地形による影響
SAR衛星は、地上を斜め上から観測しています。そのため、SAR画像は地形による影響を受けることになります。その代表的なものとしては「フォアショートニング」「レイオーバー」「シャドウイング」が挙げられます。
①フォアショートニング
フォアショートニングとは、地上の対象物が実際の平面位置よりも衛星に近づく形で画像に写る現象のことです。
フォアショートニングの現象をより分かりやすくお伝えするため、富士山を観測した①フォアショートニング補正前の画像(1枚目)、②フォアショートニング補正後の画像(2枚目)、③光学衛星Sentinel-2の画像(3枚目)で以下にアニメーションにしてみました(雪の影響で少し分かりづらいかもしれませんが)。
1枚目と2枚目の富士山の山頂の位置がずれていること、2枚目と3枚目の富士山の山頂の位置は重なっていること、1枚目と3枚目の富士山の山頂の位置もずれていることが確認できるかと思います。
このように、フォアショートニングを補正せずに画像を解析しようとすると、他のデータ(地図や光学画像)との重ね合わせができなくなります。そのため後述するオルソ補正が必要となります。
フォアショートニングが発生する背景には、SAR画像における物体の位置はSAR衛星から放たれたレーダーに当たった順番になるという性質があります。
例えば、下図において、点Bが画像上で実際の位置に投影されるためには距離R2で衛星に観測される必要があります。しかしながら、高さがあるために距離R1で観測されることとなり、その結果、画像上での位置は点A’に寄った場所(点A’というよりかは衛星に近づく形)となります。
この現象は山などの高い地表物でよく見られますが、そうした場所に限定して発生するわけではなく、ゼロでない高さを持つ地表物は多かれ少なかれ衛星方向に傾いて画像に投影されることになります。
②レイオーバー
レイオーバーとは、フォアショートニングの効果が更に大きくなった形ででファーレンジ(衛星からレンジ方向に離れた場所)にある地表物がニアレンジ(ファーレンジよりも衛星に近い場所)の地表物に覆いかぶさってしまう現象のことです。複数の地表物が覆いかぶさる(重なる)ことで、その場所は周囲よりも散乱が密となるため、後方散乱係数が大きく見えます。
下図では、点A’と点B’の地点が重なる形になっています。
下図を確認すると、頂上が右側(つまり衛星側)に寄っており、頂上よりも右側の斜面(赤丸部分)が周囲よりも白くなっている、つまり後方散乱係数が大きくなっているのが分かります。これがレイオーバー現象です。
③シャドウイング
シャドウイングとは、SAR衛星が斜めから地表を観測することにより、標高が高い地表物の後ろ側が観測されず、画像上で影のように暗く写る現象のことです(下図)。
下図を見ると、SAR衛星の観測方向の反対側にある斜面は周囲よりも暗くなっていることが確認できます。これは、富士山の山頂が邪魔をして、反対側の斜面に衛星からのレーダーが当たらないためです。
上記3つのレーダー特有の歪みの補正はラジオメトリックキャリブレーションと言われます。
b.オルソ補正と勾配補正
こうした地形からの影響を補正する方法として、オルソ補正と勾配補正があります。
オルソ補正は、光学画像でも適用されていますが、斜めから撮影された地表物を真下から撮影されているように位置情報を修正することです。先に掲載していた富士山の画像のうち光学画像の富士山と同じ位置にあったSAR画像は、オルソ補正が施されたものでした。
勾配補正とは、地形からの影響によって生じた後方散乱係数の歪みを正しいものに修正することです。
これらの補正する方法として、DEM(数値標高モデル)を組み合わせることがあります。実際の方法は、今後の記事に載せる予定です。
(4)おまけ(SARの処理レベルとアンビギュイティ)
1.SARの処理レベル
今後の記事では、画像の処理レベルの話も出てくる可能性が高いため、その話もしておきます。
本記事ではSAR画像の処理レベル(プロダクト区分とも言われます)のみ取り扱いますが、SAR画像に限らず衛星画像では、画像に施された処理に基づいてレベルが決まります。
レベルの定義は衛星データ提供会社によって異なるのですが、よく引用されるのはJAXAが運用しているALOS-2-PALSAR-2で定義している以下となります。
生データはレベル0と呼ばれ、本記事のSLCデータは生データに対してレンジ圧縮処理及びアジマス圧縮処理を施しているため、レベル1.1に該当します。他方、本記事の強度画像に関しては、地図投影などの処理を施していないため、レベル1.5とまでは言えず、レベル1.1とレベル1.5の間のレベルとなります。
European Space Agency (ESA)が無償で提供しているSentinel-1のGRD画像は、SLCデータに対してノイズ処理やマルチルック処理を施したレベル1.5のデータとなります。
他にも、QPS-SARを運用する株式会社QPS研究所の場合だと、以下のように定義さています。本記事のSLCデータだとレベル1.1(SLC:Single Look Complex)、強度画像だとレベル1.1(SLA:Single Look Amplitude)という区分になります。
衛星データ提供会社によって処理レベルの定義が異なるのは面白いですよね。衛星データ提供会社は複数あるので、使いたい衛星がある場合には、その組織・会社の処理レベル(プロダクト区分)を予め確認しておくと、スムーズに話ができると思われます。
2.アンビギュイティ(レンジ及びアジマス)
SAR画像を眺めていると、「あれ?海に建物が写っている??」といった現象を見たことありませんか。下図の赤字で囲った部分です。下図では、画像上部に写っている建物が、画像中央より少し下の海にうっすらと写っています。
このように、ある地表物が近隣の地表物にうっすらと写ってしまうゴースト現象のことをアンビギュイティ(レンジ及びアジマス)と言います。
アンビギュイティは、ある地表物の受信信号とその周囲の地表物の受信信号が類似することによって、その2つの受信信号からは2つの地表物を上手く識別できない(つまり曖昧になる)ことによって発生します。必ず生じるわけではないのですが、後方散乱が非常に弱い海面に、後方散乱が非常に強い陸(建物など)が写りこんでしまうことがしばしば見られます。
アンビギュイティが発生するメカニズムは今回の記事では割愛します。この現象によって、これをアンビギュイティなんだと頭の片隅に入れておいていただけると、次に出会った時に困惑することなく「あ、これはアンビギュイティだ」と思えるだけでも安心感があるのではないでしょうか。
(5)最後に
本記事では、SAR画像を解析する際に理解しておきたい基礎処理を紹介しました。今後も引き続き、関連記事を投稿する予定ですので、SAR画像の解析をもっと知りたい!という方がいましたら、定期的に確認していただけると嬉しいです。
疑問・質問などありましたら、Twitter経由などで遠慮なくご連絡ください。