35,000RTされた、あの「カフェ路線図」はどうやってできた? にゃんこそばさんに聞くアイデア思考法とデータの魅せ方
様々なオープンデータが世の中にある現代において、データの魅せ方も人それぞれ。そこで、Twitter上でひときわ目立つ素敵なデータビジュアライゼーションをされているにゃんこそばさんに、アイデア思考法と魅せ方のコツを聞いてみました。
企業のDX推進がますます進み、地方自治体からも多種多様なオープンデータが公表される現在、世の中には面白いデータが溢れています。
そして、それらの数多あるデータの中から面白いデータを見つけ出し、キャッチーに可視化し、多くの人の興味を引くのがデータビジュアライゼーションの世界。
データはそのままの状態では人の興味を引くことも使われることもありません。まずは見たくなるものであり、分かりやすいものになった先に、より多くの方に使われるものとなります。
今回、宙畑では、Twitter上で様々なデータを可視化し、ひとつのツイートで3.5万RTを集めるにゃんこそばさんに、データをどのように料理し、楽しむのかのコツを宙畑編集長の中村が伺いました。
(※記事化にあたり発言やその順番は一部加筆・再編集しています)
今回お話を伺ったにゃんこそばさんと、多くの反響があったツイート例
ありそうで無かったので自分で作ってみた。中央線強いな・・・?#カフェ路線図 #間違ってたらコメントください pic.twitter.com/rl7Tppiy94
— にゃんこそば?データ可視化 (@ShinagawaJP) September 28, 2021
(1)Twitterをはじめたのは、自分の作品をどこかに残しておきたい気持ちから
宙畑:普段のお仕事を教えて下さい。普段から地理空間データを扱っているのですか?
にゃんこそばさん:実は本職は、地理空間情報から遠く、社内のDX推進系のプロジェクトマネージャーを任されています。アジャイル開発チームを所管していますが、自分自身はコーディングをしていません。Twitterで投稿している内容は、日曜プログラマーと言いますか、趣味で遊んでいる感じです。
宙畑:地理空間データに触り始めたのは、いつ頃なのでしょうか?
にゃんこそばさん:3年前の2018年から、ちょこちょこ触り始めました。元々地図や町並みに興味があって、小さい頃から道路地図を眺めるのか大好きでした。地図から街の景色を想像して、実際に行って答え合わせをするなど、そんなことをやっていました。
地理空間情報との関わりは、転職が一つの契機になりました。SIから他の業種に飛び込み、いわゆるジオ系の技術に仕事で触れる機会が増えてきました。
そんな環境の中で、デジタルと本業を掛け合わせて何ができるか色々調べていくうちに、オープンデータがこんなにいっぱいあるのかと、GISで遊ぶとこんなに楽しいのかと、自然にのめり込んでいきました。
宙畑:Twitterを始めたきっかけは、何だったのでしょうか?
にゃんこそばさん:こちらも同じ時期で、3年前ですね。最初は本格的にやるつもりはなくて、自分で試しに作った作品を、備忘としてどこかにまとめておきたいと思っていました。HPやブログに管理するとめんどくさそうだったので、とりあえずTwitterに投稿してみようかなと、始めたのがきっかけでした。
宙畑:そうだったのですね!
ツイッターアカウントで面白いデータビジュアライゼーションを発信していくことで、より地理空間データの面白さを伝えていこうという意図が根底にあったのかなと勝手に思っていました。
にゃんこそばさん:そういう計画性は全く無くて、自分の中では1000本ノックのイメージで、様々なデータを地図やグラフにして投稿していました。最初はフォロワー1桁の世界で、壁に向かってつぶやいている感じです。
ただ、気がつけば同じような関心を持つような方とつながり、その中で情報交換をさせていただくことで、逆に自分が勉強させていただき、今に至ります。
宙畑:Twitterを通して、届けたいことや思いは変わってきましたか?
にゃんこそばさん:短期的な目標と長期的な目標があります。
短期的な目標としては、インタラクティブなコンテンツにチャレンジしてみたいです。今は、私が関心のあるテーマを、私なりの切り口で切り取った地図を画像として投稿しています。
それはそれで注目を集める部分はあると思うのですが、ユーザーさんご自身が見たい地域をフォーカスしたりクローズアップしたり、そこから関連するデータや時系列データを、自分で深堀りできるような、インタラクティブなコンテンツにチャレンジしてみたいです。
元々私は、街の姿や、街にどういう人達が住んでいて、どんな仕事があって、その中でどういう人の流れがあるんだろう?ということに興味がありました。
長期的な目標としては、そういった街の生態系をデジタル空間の中で再現したい想いがずっとあります。今は少しずつデータ収集と整備をしている段階です。マンパワー的に壮大な事をいきなりできませんが、ある意味ライフワークの一つとして、コツコツ進めていきたいと思います。
宙畑:オープンデータとはいっても無数にありますよね。どういったところがデータビジュアライズの発想の第一歩になりますか?
にゃんこそばさん:私の実現したいことは、街の流れや、ライフステージのようなものを、数字を使ってデジタル空間の中で再現し、モデルを構築することです。そのために、いろいろなデータを、幅広く興味を持って収集しています。
宙畑:実際に、その中から人の動きに関連するデータを見つける嗅覚をどのように養ったのでしょうか?
にゃんこそばさん:これは経験則で、言語化が大変難しいのですが、公的統計や国勢調査など、数多あるデータについて、それぞれの特徴を知り、ある時点の状態を面としてとらえることです。
そういったデータを実際に使って、可視化作品を作っているうちに、この用途であれば、このデータが使えるだろうというような、頭の中で辞書が出来上がってきます。
例えば、どこからどこに引っ越した、どこからどこに人の流れが集中しているのか、というデータに関しては、最近は交通系のデータやモビリティのデータが出揃ってきている、というように。
また、欲しい情報にアンテナを張って発信や情報収集していると、自然と人づてに情報が集まってくるというのも面白いデータを知る重要なきっかけですね。
宙畑:こういうデータがあればいいなという感覚は、アウトプットを作っていく中で生まれていくのでしょうか?
にゃんこそばさん:私がやっていることって、半分はデータ探しなんですよね。自分が表現したいことに見合ったデータが無いか探したり、近そうな人につながってみたり。そういうことを通じてちょっとずつ自分の辞書を広げてきた感じがします。
こういうデータがあったらいいのになと思っても、無いということはよくあります。私が使っているデータはオープンデータとして公開されているものを原則として使っています。割とこの二年くらい、各自治体さんもオープンデータを広げていこうという取り組みの中で市民の声を聞くようになってきました。
具体的に言うと、オープンデータラウンドテーブルで民間の開発者とか企業の方を呼んでそこで生の声を聞く。それを次年度のデータ整備などにいかしていくサイクルが回り始めています。趣味でデータ可視化をして発表したり、こんなデータがあったらいいなとツイートすると自治体側からご連絡を頂いたりします。
(2)「子供の頃から地図が好き」で得た独自の切り口と俯瞰力
宙畑:データの表現の切り口やバリエーションはどうやって増やしているのでしょうか?
にゃんこそばさん:可視化のアプローチとしては、探求したいテーマに沿ってデータを収集し、そこから得られる示唆をストーリー化していく、というパターンが大半です。一方で、それぞれの可視化作品の中で、必ず一つは技術的に・表現手法として新しいことにチャレンジすることを心がけています。
新しい手法に挑戦してみて、自分が表現したいことにピッタリハマって、ツイートに多くの方が反響をいただくと、これは行けそうだと王道パターンになっていく。こういうサイクルになっています。
駅からの徒歩時間を等高線で表したコンテンツは、このよい例だと思います。
駅からの徒歩時間を等高線で表したら面白くなってきた。物件探しが捗るし、拡大して眺めてるだけでも楽しい。これはよい時間泥棒・・・? pic.twitter.com/MicnFZwaxC
— にゃんこそば?データ可視化 (@ShinagawaJP) April 28, 2021
宙畑:この投稿を見たときは、あっ!こんな表現方法あったかと思ってびっくりしたのと同時に、どうやって作っているんだろうと謎が深まっていました。
にゃんこそばさん:可視化プロセスはほぼQGISで行い、その前段でネットワーク分析をおこなっています。具体的には、国土地理院の基盤地図情報の建物データから各建物に対して最寄りの駅の出口からの最短経路を求め、その最短経路の距離を80mで割った数字を各建物の属性としてもたせる。それを一旦ラスターに変換して等高線になおすといった手間暇がかかる手法を使っています。
宙畑:等高線で表そうというアイディアはどこから生まれたのでしょうか?
にゃんこそばさん:マンションの広告を見ると、駅から何分というデータは必ず載っていますが、これは点でしかわからないじゃないですか。「それぞれ点として表されているデータを面にするにはどうすればいいんだろう?」ということを考えた時に、真っ先に思いついたのが等高線でした。
天気図もそうですよね。いくつかの代表的な観測点が気圧。観測点でとった気圧をもとにコンターを引いて、全体の気圧配置を描いています。ですから全く同じ思想かなとおもっています。
宙畑:一般の人は「徒歩5分」という情報から、点を面にするにはどうすればいいのだろうかという発想が、チラシをみてもそもそも浮かばないと思うのですが……。点を面で表す発想は、にゃんこそばさんの特性として持っているものなのか、経験を重ねた上でそういう考えになったのか、どちらでしょうか?
にゃんこそばさん:文字が読める前から、地図を読んでいたというのが大きいですね。なんでも俯瞰してみる癖がついていました。それぞれ点と考えたらこういう特性なんだけど、地域全体から見たらどうなんだろうということを考えてしまうんですよね。
幼稚園児の時に、家に道路地図が何冊かありまして。親がでかけている間にこっそりと親の部屋に入ってずっと読みふけっていたと聞いています。地図を見ても、当然ながら知らない街です。行ったこと無い街の地図をひたすら眺めて、道路やネットワークのつながりを眺めて、道路を軸に地域の姿を体で覚えるみたいなということをやっていました。
宙畑:幼稚園児の時、どのように地図を見ることを楽しんでいたのでしょうか。
にゃんこそばさん:道路地図というのは繁華街のところに色がついてるんですよね。赤とか。そこに、大きいスーパーや百貨店の文字情報があります。色と文字情報の組み合わせ。そこを見てその街がどんな景色なのかという想像するのが楽しかったんですよね。
だんだん大きくなって行動範囲が広がってくると、実際に行ってみた景色と地図をみて想像した景色を比べると、合っている部分と違っている部分があります。地図からみた街の姿と、実際の訪れてみた目で見た街の姿をかさねていくプロセスが楽しいんですよね。
宙畑:旅行のときなど初めて行くところは地図から眺めるのでしょうか?
にゃんこそばさん:旅行先でホテルをとる時は、街の面白い所や賑わっているところを見られるか想像してから、地図で探しています。
大体新幹線の駅前で予約を取るとおもうんですけど。新幹線の駅前よりも、昔からの商店街や飲み屋街が隣りにあるホテルのほうが、昼も夜も賑わって楽しめる。そういう経験則がありますね。
(3)2つのバズったコンテンツの裏話「あのデータはどうやって産まれた?」
宙畑:実際に切り口のバリエーションが4~5つあると思うのですが、データの可視化を行う際に、どのように適切な切り口を選ばれるのでしょうか?
にゃんこそばさん:伝えたいこととストーリーがあり、そこから表現手法を逆算していくパターンがひとつと、新しい技術要素や見せ方にチャレンジしたいので、あえてこの見せ方縛りをするパターンの半々くらいですかね。
駅からの移動時間を等高線で描画(1290RT)
駅からの徒歩時間を等高線で表したら面白くなってきた。物件探しが捗るし、拡大して眺めてるだけでも楽しい。これはよい時間泥棒・・・? pic.twitter.com/MicnFZwaxC
— にゃんこそば?データ可視化 (@ShinagawaJP) April 28, 2021
宙畑:逆算の事例をにゃんこそばさんが投稿された具体的なデータから教えていただきたいと思います。マンションから徒歩5分という点を面で表そうとすると、真っ先に思いつくのが等高線だったという話でしたよね?
等高線での地図は、他の使い方でも表されていたと思うのですが、コンビニにも応用ができるのではないかということで作られたのでしょうか。
にゃんこそばさん:そうですね。コンビニまで徒歩で行けるエリアは、人が大勢住んでいたり、ある意味生活の利便性が高いエリアなのだろうと考えていました。そこで具体的に、それはどこか気になったので、このデータを可視化してみたというところですね。
宙畑:等高線データが実際に合っているようなデータの表現方法。何か表現したいものはどういう物があっているとおもいますか?
にゃんこそばさん:等高線というのも正しいのですが、GISの世界では等時間線図と呼ばれています。所要時間を等高線風に表すというのは、王道な表現手法のようです。
あとは、地価の分布とか坪単価の分布など、面的に広がっているが、全体を把握しにくいものについて等高線風に表現していくというのはわかりやすいのではないかとおもいます。
中央線カフェ路線マップ(35,000RT)
ありそうで無かったので自分で作ってみた。中央線強いな・・・?#カフェ路線図 #間違ってたらコメントください pic.twitter.com/rl7Tppiy94
— にゃんこそば?データ可視化 (@ShinagawaJP) September 28, 2021
宙畑:続いて、中央線カフェ路線マップは、どのような思考のプロセスを経てここに至ったのでしょうか?
にゃんこそばさん:なんで?と思われるかもしれませんが……実はこれは駅からの等高線の表現とリンクしています。見た目はリンクしていないですが、同じプロセスで作っています。
もともとは、400m圏の線をひきまして、その線の中で、各駅にどのチェーン店が入っているのかをGISで分析していました。例えば、「駅から5分」範囲の等時間線を描画して、カフェのロゴをプロットすると、その中には、色んなブランドがはいっているのがわかり、この駅は便利そうだという見方はできます。
ただ、面的に表現された情報を人が数えるのは面倒で、横並びの比較はしにくいですよね。
そこで、情報を極限まで落として、ネットワーク分析の結果をプロットするにはどうすればいいかと考えている時に、たまたま電車に乗り、そこで路線図を見てアイディアに思い至りました。
宙畑:カフェ以外のチェーン店も調べられていますよね?
にゃんこそばさん:スタバとドトールが入っている駅なら、おそらく100円ショップとかファストフード店とかもあるだろうという仮説を持って、街の賑わいを指標化する一つの試みとしてカフェを題材にしてみました。
各チェーン店も出店分析をした上で、収益を見込めると判断して出店していますよね。各社が色々な思惑をもって出店した結果から、街の賑わいを逆に推測するようなアプローチなんですよ。
(4)投稿するのは10に1つ。クオリティの追求とにゃんこそばさんの自分ルール
納得する基準はどこ?
宙畑:納得するまで試行錯誤を繰り返していますとおっしゃられたのを他メディアで拝見したのですが、納得する基準は、にゃんこそばさんの中でどこにあるのでしょうか?
にゃんこそばさん:納得するというのも大きく2つあります。
1つ目は、読み手によるバイアスがかからないところまで、いかにデータの解像度を高められるか。2つ目は、直感的にわかって刺さりやすい表現や新しい表現手法ができるかです。この2つの軸で試行錯誤しています。
宙畑:データの解像度が荒いという状態は、特にどういったところに気をつけなければならないと考えていますか?
にゃんこそばさん:表現しようとするデータに、他の変数との相関があるパターン、交絡因子があるパターンがすごく多いです。例えば、ある指標の分布を日本地図に分布して、これが日本の姿ですというのは簡単ですが、実はその指標は高齢化率と完全リンクしたもので、単純に高齢化マップになってしまうものってすごく多いです。このような場合は、もう一段集計の粒度を細かくして年齢や、性別や、職業で地域差を見るということを必ず行っています。
主題図は、わかりやすくて拡散もしやすいです。生半可な気持ちで、適当な平均値をとってきても、真相を深掘りしたら全然違う実態でしたとなってしまうと、一度拡散したデータは取り戻せないですしね。
Twitterへの投稿ルール
宙畑:実際に出されているコンテンツは私から見るとすでにわかりやすいと思うのですが、制作したプロトタイプから、実際に投稿されるのはどれくらいの割合なのでしょうか?
にゃんこそばさん:大体10個つくったら、投稿できるレベルのものは1個か2個くらいです。ほぼほぼお蔵入りになっています。別に表現に失敗にしているだけ、ではなくふさわしいデータが見つからなかったり、データの解像度の問題だったりします。これはちょっと誤った先入観を与えてしまうかもしれないと思ったものは、あえて投稿しませんね。
宙畑:10個中1~2個……そのような印象は受けず、投稿頻度が高いなと思っていました。
にゃんこそばさん:新しい作品を投稿するなら月に1,2回あればいいほうです。一つのテーマを掘り下げると副産物として色んなものがでてきます。そういうストックはたまに時期をみて放流しています。
宙畑:作っていく中で様々反応があると思うのですが、Twitterのアナリティクスの数字を見られたりしますか?
にゃんこそばさん:実は、ツイッターのアナリティクスを見てないんですよ。バズり目的ではなく、個人で運営しているアカウントなのでエンゲージメント率にはあまり関心がないと言いますか。メディアの方から取材が多いものについては一般的な興味関心が多いんだろうと考えて、分析の優先順位を上げています。
宙畑:にゃんこそばさんのツイート方法は、まず一個目で気になるデータをどんと出されて、その後に解説スレッドを投稿されています。なにかにゃんこそばさんの中で決められている投稿スタイルがあるのでしょうか?
にゃんこそばさん:4枚までの絵だけでは表現できないことは沢山あります。一つのツイートにすべてのメッセージを含めようとするとどうしても読み手側でバイアスが掛かってしまうことが多いと感じています。私の場合はくどいのかもしれませんが、スレッド形式にすることで、読み手が考えていただくデータは、なるべく抜けもれなく補足しようと考えています。私はフラットに事実関係を整理するまでにあえてとどめています。感情を排してbotのように書き込んでいるというスタイルです。
情報収集方法
宙畑:にゃんこそばさんが情報収集のために定期的に見ているサイトはありますか?
にゃんこそばさん:そうですね。例えば、以下のようなサイトでしょうか。
・東京都オープンデータカタログサイト
・G空間情報センター
・公共交通オープンデータセンター
・e-Stat (国勢調査、経済センサス)など
・海外の地理空間情報関連のSNSやフォーラム(Twitter reddit)
また、災害発生時には、国土地理院(浸水範囲概況図)やSNSを見ています。
データの見方を養うという意味では、海外のカルトグラファーの皆さんと情報交換しています。日本のTwitterだと、私のような分析を行っている人数は多く無いのですが、海外にはそれなりにいます。
特に、アメリカでは顕著です。アメリカって、日本で言う国勢調査にあたるセンサスのデータをいわゆる州よりも、ひとつ小さい群単位で公開しています。日本の市区町村よりも空間的な解像度が高いです。かつアメリカは、国内での地域差が非常に大きい国であるため、地図上にデータを可視化する題材に溢れています。
例えば、4年に一度の大統領選挙の結果をどう表現すると、選挙の特徴がみえてくるのか、多くの人が様々な視点で試行錯誤しています。海外のデータ可視化関係の本を買うと、ほぼほぼ題材が大統領選挙なんですよね。大統領選挙の結果を101個の方法で可視化してみたという本もありますよ。
(5)最後に
にゃんこそばさんから宙畑の読者にひとこと
宙畑:最後ににゃんこそばさんから、宙畑の読者に向けて伝えておきたいことはありますか?
にゃんこそばさん:私がつぶやいているテーマや主題図で、魔法や特殊な技能を使って作られているのではないかと感じている方がすごく多いと思います。
私がやっていることは、無償で公開されているデータ、オープンソースのGISソフトウェアで作っているものばかりですので、ある意味誰でもチャレンジできる世界だと思っています。
ツイートに反響やコメントをいただくのもすごくうれしいんですけど、「私はこんなの作ってみたよ」という声が増えてくると、もっと楽しい世界が待っているのではないかと期待しています。
宙畑:にゃんこそばさんは、2018年からTwitterをはじめられ、本業では全然違うお仕事をなさっているということでした。そういった状況でも素晴らしいアイディアと分析で、主題図を作られていますよね。
このインタビューを読んだ宙畑の読者の方々も、今後自信をもって、データビジュアライズに臨める方も増えるのではないかと思いました。
編集後記
今回の記事では、にゃんこそばさんに、可視化に至るまでの経歴やアイディアの発想、発信までのフローと自分ルールをとことんお伺いしました。
幼少期から地図や町並み好きで俯瞰する癖がついていた、にゃんこそばさんのアイディアの根源に迫るお話を伺えました。
可視化をすることを、ハードルを高く考えすぎず、自分の興味関心に基づいて手を動かしてとにかく見て、外に出してみる。そういう習慣をついてくると、徐々に面白い発想や見せ方が生まれてくる。データを楽しむコツは、自分の中にデータで遊ぶサイクルをつくることにありそうです。
みなさんも、手始めにお住まいの地域を、空の上から眺めてみてみませんか?
今まで気づかなかった、思わぬ発見があるかもしれません!
気づいたことはぜひ!SNSで発信してみてください!
楽しい世界を一緒につくっていきましょう!