宙畑 Sorabatake

解析ノートブック

アメリカ民主党支持層は本当に都市部に多い?衛星データで検証してみた

2018年11月6日に行われたアメリカ中間選挙にて「民主党支持層=都市部、共和党支持層=地方」は本当なのか、衛星画像を使って検証チャレンジ!

2018年11月6日に行われたアメリカ中間選挙。トランプ大統領の2年間の実績を問われる重要な選挙でした。

各党の支持層について、トランプ大統領率いる共和党は移民によって雇用を脅かされる恐れのある低学歴層が多く、前大統領であるオバマ氏の所属する民主党は都市部で働くいわゆる高学歴層の支持が高いといわれています。

本記事ではこの「民主党支持層=都市部、共和党支持層=地方」は本当なのか、広域かつ客観的に捉えることのできる衛星画像を使って検証することにチャレンジします!

なお、本記事は衛星画像の利用方法について宙畑編集部が探るシリーズの一つであり、特定の政党について支持をするものではありません。

※本記事は宙畑メンバーが気になったヒト・モノ・コトを衛星画像から探す不定期連載「宇宙データ使ってみた-Space Data Utilization-」の第11弾です。まだまだ修行中の身のため至らない点があるかと思いますがご容赦・アドバイスいただけますと幸いです!

(1) 「民主=都市部」仮説は本当なのか検証してみた結果

Credit : sorabatake,MODIS

まずは、いつもの通り解析が長くなるので検証結果からお伝えします。

州ごとの都市部・自然・畑の様子をまとめた結果が上図です。

ピンク色で塗った部分が都市部、黄土色が畑、緑が自然を表しています。

さらにこれをそれぞれの州毎に割合を出したものがこちらです。

Credit : sorabatake

ご覧いただいくと分かる通り、州単位では「民主党=都市部・共和党=地方」という構図は見て取れません。

Credit : sorabatake,BBC,MODIS

州よりもさらに細かい区分で見ていくと、都市部と民主党支持に多少の相関がありそうなことが分かりました。

上図の左側は民主党支持(青)または共和党支持(赤)を表しています。右側は衛星画像から分析した土地の利用区分(土地被覆分類)です。左側の青い民主党支持のエリアと右側のピンク色の都市部に多少相関があるように見えます。

結論としてはいささか弱いですが、衛星画像解析としてはいろいろと今後に役立ちそうなスキルはいろいろと分かったので、以降で解析の手法についてご紹介していきます。

(2) 2018年アメリカ中間選挙の結果

まずは、アメリカ中間選挙の結果を振り返ってみましょう。

開票の結果、上院は共和党、下院は民主党がそれぞれ多数派となりました。トランプ大統領は共和党所属で、改選前は上院下院ともに共和党が多数派でしたが、下院は民主党に奪還された形となります。

BBCが公開している選挙結果の地図がこちらです。

下院の選挙結果 Credit : BBC
上院の選挙結果 Credit : BBC

青く塗られた箇所がオバマ氏のいる民主党の支持が多い選挙区、赤く塗られた箇所がトランプ氏率いる共和党の支持が多い選挙区です。色の濃さは投票率を示し、色が濃いほど支持が高いことを示します。

地図を眺めていると中央部に赤い共和党支持層が多く、沿岸部に青い民主党が多いことが分かります。上院と下院で選挙結果の異なる選挙区もあるようです。

上院下院ともにどちらかの政党が議席を獲得している州の例は以下の表のとおりです。

ニューメキシコ州やバーモント州では上院下院ともに民主党が議席を獲得しており、ユタ州やネブラスカ州では上院下院ともに共和党が議席を獲得しています。

なお、カリフォルニアやニューヨークなど日本人にも馴染みのある州は、下院の選挙区分が他の州に比べて細かい単位に分かれており、民主党と共産党支持が混在しています。

Credit : sorabatake

(3) 土地の利用のされ方が分かる「土地被覆分類」とは

まず始めに、宇宙からそれぞれの州を観測して、民主党が議席を獲得した州と共和党が議席を獲得した州に、何か違いがあるのか見てみることにしましょう。

今回使うのは衛星画像を使った「土地被覆分類」です。

「土地被覆分類」とは衛星画像(もしくは航空機で撮影した画像)から、その土地がどのように使われているかを示します。都市部や畑、森林などを見分けることができます。詳しくはこちらの記事(衛星データのキホン~分かること、種類、頻度、解像度、活用事例~)をご覧ください。

たとえば、関東地方だとこのように見えます。

関東地方の土地被覆分類 Credit : Google Earth Engine, MODIS

図でピンクの部分が都市部、緑の部分は森林など、黄土色の部分は畑を表しています。

ちなみにアメリカはこんな感じです。

アメリカの土地被覆分類 Credit : Google Earth Engine, MODIS

ピンクの都市部が点在していますね。

大半は緑で示した森林などの自然で、黄土色の畑は国土の半分にも満たないことが分かります。

(4) 土地被覆分類とアメリカ中間選挙結果の関連を調べてみる

ここからが本題です。この「土地被覆分類」を使って、共和党と民主党の支持が多い州と「土地被覆分類」に相関性があるか、見ていきたいと思います。

筆者の拙いアメリカ知識から、今回は「民主党(反トランプ)支持層は都市部に多い」すなわち土地被覆分類の図で「ピンクの割合が多い州は民主党、逆に緑や黄土色が多い州は共和党支持」という仮説を立て、これを検証してみます。

Credit : sorabatake

解析の流れは上図の4STEPに分けられます。

STEP①:アメリカの土地被覆分類のデータを探す・表示する

まず、最近宙畑でよく使っているGoogle Earth Engineのサンプルコードを見てみることにします。Google Earth Engineについてはこちらの記事(衛星画像解析が変わる!? 「Google Earth Engine」の何がすごいのか)をご覧ください。

「土地被覆分類」は英語で「Land cover」なので、この文言が入っているものを探してみると……

Credit : Google Earth Engine

ちょうど Landcover Cleanupというコードがあり、参考になりそうです。

クリックして[Run]でコードを実行してみると、以下のような画像がでてきました。

Credit : Google Earth Engine,MODIS

赤の部分が都市部を示しているようです。

緑(森林など)と茶色(畑やブッシュ)がたくさんの色でぬり分けられており、複雑すぎるので、単純化してみることにします。

色の指定をしているのは以下の部分です。6桁の文字列がカラーコードと呼ばれるもので、それぞれに色が割り当てられています。

元々のコード Credit : Google Earth Engine

人の手が入っている「畑(黄土色)」とそうではない森林やブッシュなどの「自然(緑)」のみに統一してみるとシンプルになりました。

修正後のコード Credit : Google Earth Engine
Credit : Google Earth Engine,MODIS

右上に黄土色の畑が集まっていることが分かりました。

土地被覆分類の画像はこれで使えそうです。

STEP②:アメリカの州の形が分かるデータを探す・表示する

Credit : sorabatake

これにアメリカの州を重ねていきます。

東京五輪マラソンは本当に暑い? 衛星データで過去と比較してみたと同様に、位置情報付きの線の形式はKMLファイルが良さそうです。

そこで、「US state kml」でgoogle検索をしてみます。アメリカの政府系のWEBサイトに良さそうなKMLファイルが見つかりました。

https://www.census.gov/geo/maps-data/data/kml/kml_state.html Credit : U.S. Census Bureau

これをGoogle Earth Engineで読み込むには、「Fusion Table」というアプリを使います。

Fusion TableはGoogle Driveの「新規作成」 > 「+アプリを追加」というボタンから、追加することができます。

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。
Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

Fusion Tableで新しくKMLファイルをインポートします。

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。
Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。
Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

開いてみると、エクセルのようになっています。NAMEの列の州の名前のところが黄色くなってますね。

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

Map of geometoryというタブを確認すると、州ごとの境目が表示されており、どうやらうまく読み込まれたことが分かります。

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

表の方に戻って行を見ていくと、どうやらgeometryという列にKMLファイルの情報が入っているようだということが分かります。加えて、先ほど黄色かったNAMEという部分も位置情報と識別されているようです。

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

NAMEとgeometryの2箇所が位置情報と識別されてしまっているようなので、正しくgeometryの方だけに位置情報を整理します。

「Edit」 > 「Change columns」から、位置情報に紐づいている列を指定します。

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。
Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

先ほど黄色でハイライトされていてNAMEの列がやはり位置情報[Location]扱いになっているので、このタイプをtextに変えるか、削除します。

そうすると、先ほどのKMLファイルの情報が入っているgeometryのみが[Location]という種類になります。

ここまでデータを整形したら、Google Earth Engineで呼び出すIDを調べます。

「File」 >「 About this table」でIdというところに記載された文字列をコピーします。

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。
Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

コピーしたら、コードエディタの上で以下のようにIdを呼び出します。

var g20 = ee.FeatureCollection("ft:1wmbkCSdbcO8FCWR34cNwGcURabLQ4vtvdrew-I8G");

これに地図表示の指示を加えます。

詳細な説明は割愛しますが、枠線だけにする処理です。

// Create an empty image into which to paint the features, cast to byte.

var empty = ee.Image().byte();

// Paint all the polygon edges with the same number and width, display.

var outline = empty.paint({

 featureCollection: g200,

 color: 1,

 width: 3

});

Map.addLayer(outline, {palette: '000000'}, 'edges');

無事、先ほどの土地被覆分類図の上に州境を表示できるようになりました!

Credit : Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

お、それっぽい!

ここ、本質ではないのにものすごく時間かかったなー笑

STEP③:各州の土地被覆の割合を算出する

Credit : sorabatake

本来であれば、この後もGoogle Earth Engine上で解析が進められればよかったのですが、残念ながら今回はこれ以上分からなかったので、インターネットの力を借りていくことにします。

やりたいことは州ごとの色の割合を調べることです。

そこでgoogleで「picture color ratio」と調べてみたところ、一番上に出てきたサイトがこちら。

http://mkweb.bcgsc.ca/color-summarizer/?analyze Credit : 2006-2018 Martin Krzywinski

その名もIMAGE COLOR SUMMARIZER! 便利! コード書かなくても良い!

次に超チカラワザですが、Google Earth Engine上で該当の州をスクショして……

Credit : MODIS,Google および Google ロゴは Google Inc. の登録商標であり、同社の許可を得て使用しています。

スクショしたカリフォルニア州。これだけでも都市部は沿岸に集中し、内陸の方は手付かずの状態であることが分かります。

みんなの味方photoshop(r)で州境の線に沿って図を切り取ります。

Credit : MODIS

不要な部分を切り抜いたカリフォルニア州。photoshop(r)万能すごい。

この画像を先ほど紹介したサイトで読み込ませてみると……

Credit : 2006-2018 Martin Krzywinski

無事、色の割合が出てきました。

ちなみに透明色にした部分(切り取ったカリフォルニア州の余白部分)は「黒」で認識されてしまうようです(……残念)。

州の土地被覆分類とアメリカ中間選挙の結果を比較してみる

Credit : sorabatake

同じ要領で、民主党の支持が多かった州(ニューメキシコ、バーモント、メイン)、共和党の支持が多かった州(ユタ、ワイオミング、ネブラスカ)を一つずつ解析してみます(手作業で50州すべて調べるのは相当時間がかかりそうなので断念しました……)。

結果がこちら!

Credit : sorabatake

今回の解析の仮説は「民主党(反トランプ)支持層は都市部に多い」すなわち土地被覆分類の図で「ピンクの割合が多い州は民主党、逆に緑や黄土色が多い州は共和党支持」だったので、民主党の支持が多い州ではピンク色の都市部が多く、共和党の支持が多い州では黄土色の畑が多いことを予想していたのですが、あまり相関はなさそうなことが分かりました。。。

念のため各州の画像自体も整理して比べてみました。

Credit : MODIS, sorabatake

ネブラスカ州が畑が多いこと以外は、特別な特徴はなさそうです(それにしてもアメリカの州って四角いね)。

考察として、州単位だと大きすぎて各党の支持層の特徴が平均化されてしまうのではないかと思いました。

このまま終わるわけにもいかないので、追加で下院の選挙区が53に分かれているカリフォルニア州について、切り出してみた結果がこちらです。

Credit : BBC,MODIS,sorabatake

厳密に解析したわけではありませんが、ピンク色の都市部と青い民主党支持選挙区に相関があるように見えます。

すなわち、州よりも細かい単位で見ていくと「民主党(反トランプ)支持層は都市部に多い」すなわち土地被覆分類の図で「ピンクの割合が多い州は民主党、逆に緑や黄土色が多い州は共和党支持」が見えてくるということが分かりました。

(5) まとめ

今回はアメリカの選挙結果をキーワードに、衛星データ(土地被覆分類)と選挙結果の相関性について考えてみました。

今回分かったことは、

〇アメリカはほとんどが手付かずの自然
〇今回調べた範囲では、民主党の支持層は都市部に多いように見えたが突っ込んだ解析が必要
〇photoshop(r)万能説ある
〇 州境などを分かりやすくするにはGoogle Earth EngineでKMLファイルをインポートするのが便利

 

一方で反省点は、

〇作業量の観点で3州ずつしかできなかったが民主党の指示が多い州・共和党の支持が多い州はほかにもあり、選んだ3州だけでは判断できない。
〇Google Earth Engineでグラフまで出すのが難しい
→そこまで行ければ50州をすぐに解析できる
〇土地被覆分類以外のデータとの照らし合わせができなかった

→ 今回は土地被覆分類と選挙結果の相関があるかを調査しましたが、他のデータ、たとえば先日宙畑でご紹介した夜間光データや所得データなども併せて、きちんと相関分析をしたら面白そうです。

トランプ大統領の次の選挙までには、もう少し自分の解析技術が上達していれば良いなと思います! 精進します!

「Tellus」で衛星データを触ってみよう!

日本発のオープン&フリーなデータプラットフォーム「Tellus」で、まずは衛星データを見て、触ってみませんか?
★Tellusの利用登録はこちらから