宙畑 Sorabatake

衛星データ

経験・技術不問! PCがあればできる衛星データ解析に携わるレアジョブがある?

衛星データ解析のお仕事というと、とても高度な専門知識を要求されるものだというイメージがありませんか?技術・経験不問の衛星データ解析に携わる求人が衛星データコンペを行うSolafune社より公募されました。

(1)経験不問で衛星データ解析に携わるお仕事!?

タイトルを見て、え!?と思った方は多いのではないでしょうか?衛星データ解析のお仕事というと、とても高度な専門知識を要求されるものだというイメージがありませんか?

実は、すべての業務がそうではありません。以下のように衛星データに関連する「経験不問」のお仕事募集が株式会社Solafuneから登場しています。

実は衛星データ解析のお仕事と言っても、様々な種類があります。今後衛星データを利用したサービス開発が進むにつれて、経験不問なお仕事は増えるかもしれません。

今回は経験不問として募集された「アノテーション」と呼ばれるお仕事の内容についてご紹介します。

(2)アノテーションとは

アノテーション(annotation)といっても様々な種類がありますが、主には「この範囲に自動車が映っています」「この画像には雲が含まれています」「これは犬です」と言った、画像に対して情報を与えるような作業のことです。宇宙分野に限られた単語ではなく、AI分野で利用される単語です。

高度な解析をするには、解析に利用するための素材が必要になります。衛星画像だけがあってもAIを使った解析は難しく、これはこういうデータですよ、という意味付けをしなければ解析はできません。そのため、とても重要な作業となります。

ここでは3種類のアノテーションについて過去に宙畑で実施した例を交えてご紹介します。

1.画像を分類する場合に使うアノテーション

たとえば以下の場合には、雲が映っているか否かを分類したかったため、たくさんある衛星画像を「雲がいない」「雲が映っている」「解析に利用できない」の3つのフォルダに分けました。

この「3つのフォルダに画像を分ける」作業もアノテーションの作業の1つと言えます。要はこのフォルダに入っている画像は雲が映っていますよ、と言った情報を与えているわけです。

この作業を実際にやったことがあるのですが、膨大な枚数があったのでとても大変でした……が、画像をドラッグ&ドロップするだけなので、技術的にはとても簡単です。

2.物体を検出するために使うアノテーション

次にご紹介するのが物体を検出するために使うアノテーションです。物体を検出する必要があるため、画像をフォルダに分けるのではなく、ここにXXが映っていますよ、という情報を与える必要があります。例えば以下の例だと航空機が映っている場所を赤く囲っています。

赤く囲った場所に航空機が映っていますよ、とAIに教えることで、AIは航空機とはこのような情報(形状)のものなのか、と学習することで、様々な衛星画像から航空機を検出できるようになります。

このようなアノテーション作業は光学画像のみならず、SAR画像でもできます。例えば以下はSAR画像の中で橋が映っている場所を黄色く囲った画像になります。

IMG-HH-ALOS2237752900-181018-UBSR2.1GUD.tif_cropped.pngに橋の位置情報を合成して一部を切り抜いた画像 Credit : original data provided by JAXA

3.物体をセグメンテーション(塗りつぶす)するために使うアノテーション

セグメンテーションを使ったデータ解析は宙畑でまだ実施していないため、過去にKaggleのコンペティションで公開されたデータセットでご紹介します。

先ほど雲が映っているかどうかを分類するアノテーションについて紹介しましたが、雲が映っている部分にマスク(塗りつぶす)するアノテーションもあります。以下の画像では、Ground truthに表示されている画像がアノテーションされた画像です。

Source : https://github.com/SorourMo/38-Cloud-A-Cloud-Segmentation-Dataset

他にも、住宅や道路を塗りつぶすようなアノテーション作業があります。1枚の衛星画像の中で漏れなく物体を塗りつぶす作業はなかなかの集中力を必要とするのですが、技術的には塗り絵をするのと同じなので簡単です。

ただし人に抜け漏れなく1人で塗りつぶすのはとても難しいので、複数人で同じ画像のアノテーション作業をすることが多いです。実際に、筆者が過去に実施した際には、3人で同じ画像にアノテーションした結果、見事に3人とも全然違うところを塗りつぶしていました……。

そのときにアノテーションした結果を用いて開発されたアルゴリズムは以下となります。

(3)Solafune社が募集したアノテーション業務とは?

Solafuneは衛星画像を用いたAI系のコンペティションを開催しているスタートアップです。詳しくは以下の記事をご覧ください。

今回Solafune社は、コンペティションで利用する衛星画像に対するアノテーション作業のお仕事をする方を募集しているようです。期間としては6月末まで、単価としては画像1枚あたり200円を想定しているとのこと。衛星画像は1000-2000枚程度あるようです。

特殊な解析環境を準備する必要はなく、Solafune社が開発したサービスを使って、ブラウザベースにアノテーションをつける作業のようです。

(4)Solafune テックリード 光武さんにインタビュー

最後に、Solafuneのテックリード、光武さんに、今回のお仕事について、3つの質問に回答いただきました。

Q.今後もアノテーションの仕事はSolafune社として行う予定はありますか?
A.データ分析を行うにあたってアノテーションしないといけない機会はこれからも必ずあります。なのでアノテーションの仕事は今後もやっていく予定です。

Q.今回募集されているアノテーションの仕事、どんな人に来てほしいですか?
A.アノテーションは難しくはないのですが、データ分析の精度に直結する大事な部分でもあります。なので丁寧な仕事ができる方が嬉しいです。

それから、衛星や宇宙に興味のある方、衛星データに触ってみたいという方に来てほしいですね。

Q.Solafuneの次回コンペについて、参加候補者の方に向けてコメントをお願いいたします。
A.次回のコンペも含めてSolafuneは衛星データというチャレンジングな分野でチャレンジングなコンペを今後も開催していこうと考えています。新しい分野をみなさんと一緒に開拓できるようなコンペを作っていきますので楽しみながらのご参加よろしくお願いいたします。

(5)まとめ

撮影される衛星画像が増えてきていることで、AIを使った衛星データソリューションの開発は今後も増えていくと考えられます。その上で必要となるアノテーションに関するお仕事も、今後、多く登場しそうです。

特殊な環境やスキルをもっていなくても、パソコン1台あればできる衛星画像へのアノテーションのお仕事。皆さまも挑戦してみてはいかがでしょうか?