宙畑 Sorabatake

解析ノートブック

QGISで電動アシスト付自転車が売れる町の仮説を立てて実際にその町に行ってみた

「宇宙データ使ってみた-Space Data Utilization-」の第14弾。今回は衛星データを使って電動アシスト自転車が売れる町について解析してみます。

新元号が発表され、いよいよ新年度が始まりました。
忙しいビジネスパーソンはすでに来期を見据え、動き出しているのではないでしょうか?

とりわけ営業職の方は今期の売り上げ目標が設定され、自社のモノやサービスはどういう場所で売ったらよく売れるのか、いわゆるマーケティングに頭を悩ませているところではないでしょうか。

そこで、宙畑ではそんな「マーケティング」に衛星データからアプローチしてみることにしました!今回のターゲットは”電動アシスト付自転車”です。

購入にかかる費用や町の特性など、電動アシスト付自転車を購入するにあたっては様々な要因がありそうです。今回は、どんな街で電動アシスト付自転車がよく購入されるのか、衛星データをはじめとする様々なデータから考えてみます!

※本記事は宙畑メンバーが気になったヒト・モノ・コトを衛星画像から探す不定期連載「宇宙データ使ってみた-Space Data Utilization-」の第14弾です。まだまだ修行中の身のため至らない点があるかと思いますがご容赦・アドバイスいただけますと幸いです!

(1) 電動アシスト付自転車が売れる町の条件(仮説)

Credit : sorabatake

まずはどのような街で電動アシスト付自転車が売れるのか、仮説を立ててみます。

筆者が考えた売れる条件は次の4つです。

①坂道が多い

坂道が多くなればなるほど電動アシスト付自転車が欲しくなるのではないかと考えました。

②年収が高い

近頃安くなってきたとはいえ電動アシスト付自転車の相場は10万円前後と、ママチャリ価格の5倍以上の代物です。

したがって、購入者層はある程度裕福な人なのではないかと予想しました。

③子供が多い

電動アシスト付自転車は前後に子供を乗せることが可能。

したがって、子供が多い町では電動アシスト付自転車を使う人が多いのではないかと推測しました。

④自宅から駅までの距離が遠い

交通の便が良ければ自転車を使う機会も減ると考えられます。したがって、駅までの距離が遠い地域でもよく電動アシスト付自転車が使われるのではないかと思いました。

以上、4点について様々なデータを使いながら、23区それぞれの特性を調べていくことにします!

(2)衛星データから坂道が多い区ランキングを徹底調査!

一つ目の「坂道が多い」について考えていきます。

地図を眺めてみると「〇〇坂」や「〇〇丘」などの地名を見つけることができますが、これだけではどれほどのこう配がある坂なのか、坂の高低差や多さを数値で表現することは難しそうです。

そこで今回は区全体でどのくらい高低差があるのかを調べるために、衛星データから得られる標高データを用いて、標高のばらつきを調査することにします。

「標高のばらつき」は、数学が得意な方であれば”標準偏差”という言葉でピンとくるかもしれません。

区全体が平たんであれば似たような標高のデータが多くなり「標高のばらつき」は小さくなります。一方で、坂が多い町であれば「標高のばらつき」は大きくなるはずです。

標高データについてはJAXAが公開しているAW3D30というデータを使用します。AW3D30のデータはJAXAのホームページやTellusでも公開されています。

まずは23区のAW3D30のデータをダウンロードします。本連載ではおなじみのQGISを使って、データを表示します。

続いて23区の形状を示すデータを探します。googleで「23区 geojson」などど探していくと、以下のサイトが見つかりました。

■ Geoshapeリポジトリ
http://geoshape.ex.nii.ac.jp/city/resource/
Asanobu KITAMOTO, Center for Open Data in the Humanities, CC BY-SA 4.0

今回はこちらからGeoJSONの23区のファイルをダウンロードしました。
GeoJSONは地理空間情報を表現するためのフォーマットのひとつです。詳しくははこちらの記事(【ゼロからのTellusの使い方】衛星データ上に好きな図形(GeoJSON)を重ねてみよう)をご覧ください。

さて、これで材料は揃いました。
AW3Dと千代田区のGeoJSONを重ねてみると以下のようになります。

Credit : Asanobu KITAMOTO, Center for Open Data in the Humanities, CC BY-SA 4.0

緑の部分が低く、黄色~赤になるにしたがって標高が高くなります。
皇居周辺のお堀や丸の内の高層ビルが標高情報からも見て取れますね。

この千代田区のGeoJSONファイルを使って、クッキーの型抜きのように標高データを切り抜いていきます。

QGISの[ラスタ]>[抽出]>[マスクレイヤによるラスタのクリップ]を使用します。

QGISの[ラスタ]>[抽出]>[マスクレイヤによるラスタのクリップ]

入力データに標高のデータを、マスクレイヤに千代田区のGeoJSONファイルを入力します。

[実行]を押すと、以下のように千代田区の形に標高ファイルを切り抜くことができました!
これがアメリカ中間選挙の記事でもやりたかったのですが、ようやく達成!笑

このデータの値のばらつきを計算するには、[レイヤーウィンドウ]の該当のファイルの[プロパティ]

[情報]というところに、くりぬいたデータの統計値が記載されています。

この中で[STATISTICS_STDDEV]という値が、データのばらつき(標準偏差)を示しています。

また、グラフ(ヒストグラム)で標高の分布をみるには[プロセッシング]>[ツールボックス]

[プロセッシングツールボックス]というのが出てくるので[ラスタレイヤのヒストグラム]を選択します。

入力レイヤが正しいことを確認して[実行]

出力は右下のウィンドウにリンクが張られます。

クリックすると以下のようなグラフが出てきます。
横軸が高度、縦軸が出現頻度を表しています。

これを23区全てで実施します。
結果は以下の通りです。

ばらつきが大きいのは中央区、千代田区、港区、新宿区という結果になりました。
しかし、この4区、坂が多い印象はありません。

例えば中央区を見てみると、以下の通りです。

汐留のあたりが赤くなり高くなっていることが分かります。
そう、つまり、標高ではなく高層ビル群をとらえてしまっています。

同様に千代田区は東京駅・秋葉原駅周辺のビルを、港区は品川駅・田町駅・浜松町駅周辺のビルを、新宿区は新宿駅周辺のビルをとらえ、坂道には関係がなさそうなことが見えてきました。

上位4区を飛ばすと、次にばらつきが大きいのは板橋区、品川区、世田谷区となりました。

(3) 東京都のオープンデータから年収の多い区ランキングを調査!

続いて、東京都のオープンデータから年収の多い区ランキングを作っていきます。

東京都のオープンデータは以下で確認できます。
▼東京都オープンデータカタログサイト
http://opendata-portal.metro.tokyo.jp/www/index.html

このサイトで各区の納税義務者数と総所得金額を調査します!、、、がうまく見つからず、諦めてgoogle検索すると以下の資料が見つかりました。

平成 28 年度市町村税課税状況等の調(特別区関係)

Credit : 出典: http://www.soumu.metro.tokyo.jp/05gyousei/gyouzaisei/zei/h28zei/h28tokubetsukukazei/h28t okubetsukukazei.pdf

平成28年度と少し古いデータですが良しとしましょう。

このデータを元に、総所得金額を納税義務者数で割った値で23区を比較すると以下のようになります。

先ほど高層ビル群の影響によって、標高のばらつきが多いとした中央区、千代田区、港区は年収も高いのは面白い相関ですね。

高層マンションに住んでいる人の年収が高いということでしょうか。

(4) 東京都のオープンデータから子供の多い区ランキングを調査!

さらに、大人一人当たりの子供の人数を調査していきます。東京都がまとめている住民基本台帳による東京都の世帯と人口(町丁別・年齢別)より、23区別の年少人口 (0~14歳)の人数を調べ、先ほどの納税義務者数で割ります。

一つ飛びぬけて多いのは江戸川区、次いで港区、足立区、練馬区などの区が多いことが分かりました。

最も少ないのは中野区でした。

(5) 駅の少ない区ランキングを調査!

最後に調査するのは、面積あたりの駅の少なさです。
言い換えれば1駅あたりが受け持つ広さとも言えます。

駅がどこにあるかは、以下のサイトからkmlファイル(位置情報ファイル)を入手しました。
▼周辺便利ナビKMLダウンロードページ
https://www.katapu.net/appli/kmldl/index.php

各区の面積については先ほどの東京都オープンデータカタログサイトから、「市街地面積」という値を使うことにしました。
▼東京都の市街地状況調査報告書(第9回)表 3.1 区市町村別算定結果(特別区)
http://opendata-catalogue.metro.tokyo.jp/dataset/t000017d1700000050/resource/b609032d-f7ec-4ae7-a4da-186467be813f
これらを元に、1駅当たりが受け持つ広さを計算した結果は以下の通りです。

こちらもダントツで駅が少ないのは江戸川区、次いで葛飾区、練馬区となりました。
東京の北の方の区が多い印象ですね。

(6) 4つのデータから電動アシスト付自転車が売れる区を勝手に予想してみた

さて、ここまでご紹介してきた4つのデータを組み合わせて、最も電動アシスト自転車が使われそうな区を予測してみます。

それぞれのデータの単位がバラバラのため、偏差値(数学の言葉では”正規化”と言います)に直してから、4つのデータを合計してみます。

結果は以下の通りです。

港区、千代田区が1位、2位、次いで中央区、江戸川区、世田谷区が高得点となっています。
反対に得点が低かったのは中野区、台東区、豊島区となりました。

TOP5について、どの要素が特に大きかったのかさらに詳しく見ていくことにします。

レーダーチャートを見ていくと、港区や千代田区は年収の高さや坂道の多さに関する点が高く、駅の少なさについては得点が低い、すなわち駅が多いことが分かります。

2章で説明した通り、港区・千代田区・中央区の「坂道の多さ」については高層ビルが混ざってしまっている疑いがあり、厳密であるとは言えませんが、年収が高いことは言えそうです。

4位の江戸川区は上位3区とは異なる挙動を示しており、「年収の高さ」と「坂道の多さ」は低いものの、子供の数が多く、駅がダントツで少ないために4位にランクインしました。

実際、標高データにピンク色の○で駅を表したものが上図です。高低差はあまりないですが、どの駅からも遠いエリア(図中赤丸)が見て取れます。

5位の世田谷区は4項目全てでバランスよく点が入っています。

標高データを見てみると先ほどの江戸川区と比較して、駅の数は多いものの、高低差が多いことが見て取れます。こちらも駅からの距離が遠く、駅までの道のりに高低差がありそうなエリア(図中赤丸)があると言えるでしょう。

その他23区のデータをまとめたものが以下になります

(7) 実際に世田谷の坂に行ってみた(検証)

さて、ここまで机上で解析を進めてきましたが、本当に前章で挙げたエリアで電動アシスト付自転車の需要は多いのでしょうか。

実際に街に繰り出して確認をしてみたいと思います!
せっかくなので、衛星データによって「坂が多い街」認定された世田谷区へ行ってみることにします。

成城通り病院坂。傾斜のきつい坂となっています。 Credit : sorabatake

調査場所は先ほどの図で中央の赤丸付近、成城学園前駅から徒歩15分の成城通り病院坂というところです。

調査時間は出勤の時間帯を狙って、平日の朝、具体的には4月4日(木)の朝7時半から8時半までの1時間、坂を通った自転車の数とその中で電動アシスト付自転車が何台だったかを調査しました!

電動アシスト付自転車で、皆さん坂をスイスイと駆け上がって行かれます。マウンテンバイクの方も多く見かけました。

成城通り病院坂。皆さん坂を上がって駅の方へ向かわれます。 Credit : sorabatake

結果、朝7時半から8時半までの1時間で148台の自転車が通過し、そのうち電動アシスト自転車は77台でした。

全国で見てみると、自転車所有台数のうち、電動アシスト自転車の割合は7.5%とのことで、全国平均を大幅に上回っていると言えそうです。

さらに、成城学園前駅の駐輪場を覗いてみると、、、

成城学園前の駐輪場

ご覧の通り、電動アシスト付自転車がずらり。世田谷、すごいですね。

条件として挙げた子供の数の多さですが、今回調査した電動アシスト付自転車は必ずしもチャイルドシートがついておらず、半々程度であった点は「子供が多ければ電動アシスト付自転車が多い」という仮説との違いであったかなと思います。

(8) まとめ

今回の記事では、衛星データと地上のオープンデータを使って、電動アシスト付自転車が売れそうな街を調査しました。

今回分かったことは

● 衛星データを使うことで地図や表だけでは分からない地理的な情報を得ることができた。

●QGISでシェープファイルを使って画像を切り抜き、切り抜いた画像の統計値をグラフ化できた。

●衛星データと地上データを組み合わせて、さらに深い考察を得ることができた。

一方で反省点としては、

● 標高データは建物を含んでしまい、純粋な地表面の情報を得ることができなかった。

● 保育園の位置情報などを組み合わせれば、さらに精度の高い回答が得られそう。

● 4つの条件の重みを付けるところまでは至らなかった.

今回解析に用いたデータはすべて無料で配布されているデータです。
皆さんも気になるデータを集めて、解析をしてみてはいかがでしょうか!

宙畑のデータ解析記事

宙畑の衛星データ解析記事