宙畑 Sorabatake

ビジネス事例

【オルタナティブデータって何?】投資判断の最前線、新たな経済指標を用いた資産運用事例

機関投資家による投資判断のための手段としての活用を始め、オルタナティブデータの利活用が盛り上がっています。伝統的なデータとの違いといった基礎から利活用事例まで、まとめてご紹介します。

今、機関投資家による投資判断のための手段としての活用を始め、世界的にオルタナティブデータ(Alternative data)の利活用が盛り上がっています。下に示すのは世界的なGoogle検索のトレンドを時系列に確認できるGoogle トレンドにおける「Alternative data」の検索結果です。

ご覧いただくと分かる通り、現在に至るまで検索のトレンドは右肩上がりとなっています。では、実際にオルタナティブデータとはどのようなもので、どのような利活用事例が生まれているのでしょうか。

本記事は、オルタナティブデータ推進協議会の皆様にご協力いただき、オルタナティブデータの基礎から利用事例、展望までをまとめています。

(1)オルタナティブデータとは

オルタナティブデータ推進協議会の言葉をそのまま借りると、オルタナティブデータとは「金融機関や投資家等が資産運用で利用してきた伝統的な経済指標(財務データなど)とは異なる情報源から生成されるデータであり、テクノロジーの発展によって利用可能になったデータも対象」とあります。

「Alternative」を直訳すると「代替の」という意味。オルタナティブデータには、宙畑が普段扱っている衛星データの他、クレジットカードデータ、POSデータなどがあります。つまり、これらのオルタナティブデータは、これまで伝統的に用いられてきたデータに加えて、利活用の拡大が期待されているデータであるとも言えるでしょう。

オルタナティブデータの種類は今後も増えることが想定されていますが、現時点でも以下のようなものが挙げられます。

・POS(Point of Sales)売上データ
・クレジットカード利用情報
・衛星データ
・船舶航行情報
・位置情報/人流データ
・IRテキスト
・NEWS

では、これらのデータがこれまでの伝統的な経済指標などのデータと比較して利活用が期待されているのはなぜか、また、どのような事例が生まれているのかを見ていきましょう。

(2)伝統的な経済指標とその課題

伝統的な経済指標の代表例は、国全体の経済活動を表すGDP(Gross Domestic Product、国民総生産)で内閣府が算出・公表しています。GDPが増えていれば景気が良く、減っていれば景気が悪いという景気の基調判断に用いられます。

この他にも、経済状況を様々な角度から分析するため、個人消費動向は総務省「家計調査」、生産動向は経済産業省「鉱工業生産指数」、雇用動向は総務省「労働力調査」といった政府統計が活用されています。

これらの政府統計は、速報性に欠くという課題があります。例えばGDPは、2022年4-6月期の統計の公表予定は2022年8月15日となっており、「直近値」でも2か月遅れとなります。

新型コロナウイルス感染症の影響のように大きな変化がある状況でも、その情報をタイムリーに把握することはできません。

ちなみに、日本の伝統的な経済指標は政府統計が中心となっていますが、米国では民間統計も活用されています。米国労働省が公表する雇用統計がマーケットに影響を与えるために世界中の市場参加者に注目されていることもあり、その2営業日前に公表される給与計算代行サービス大手であるADP(Automatic Data Processing)社が算出・公表するADP雇用統計も先行指標として伝統的に注目されています。

(3)オルタナティブデータ活用のメリットと伝統的経済指標との比較

伝統的な経済指標には速報性に課題がある一方で、オルタナティブデータは速報性に優れます。個人消費動向を例に挙げると、伝統的な経済指標である総務省「家計調査」は2022年5月分の結果が7月8日に公表されますが、クレジットカードの決済データを基にナウキャスト社が作成している消費指数「JCB消費NOW」(後述事例2参照)では2022年5月分の結果が6月15日に配信されます。

また、オルタナティブデータは高頻度であることもメリットです。月全体の集計値のみの公表である「家計調査」に対し、「JCB消費NOW」は月の前半後半と半月次の情報となっています。新型コロナの感染状況が月の前後半で大きく異なるといった際に、月前半と後半の消費動向を分けて確認することができます。

さらに、高粒度であることもオルタナティブデータの大きな強みです。データが高粒度であるというのは、日本全国の消費額というデータの単位に比べて、業種別の消費額などの細かい”粒”のデータがあるといったことを意味しています。クレジットカードの決済データについても、ある個人が行った1回のお買い物という”粒”が基になるため、業種別、地域別、消費者属性別など、伝統的な経済指標に比べて高粒度なデータを用いた分析ができます。

一方で、政府統計は、得られた結果が適切にマクロな経済状況を代表するように設計されています。

例えば、統計の調査対象がバランスよく日本の縮図となるように標本設計がされているのに対し、オルタナティブデータは民間が収集するデータのため、サンプルの偏りを含む可能性があります。そのため、政府統計が利用可能な期間については、統計としての代表性は政府統計にあると考えられます。

また、一般にオルタナティブデータは蓄積期間が短いため、経済構造の変化等の長期的な時系列の分析を行う場合にも、伝統的な経済統計が向いていると考えられます。

このようにオルタナティブデータの特徴を踏まえつつ、伝統的な経済統計と組み合わせながら活用を進めることで、オルタナティブデータの蓄積も今後進んでいくことが期待されます。

(4)オルタナティブデータの活用事例

■マクロ経済の予測に用いるオルタナティブデータ活用

まずは物価や消費、金融などの動きをもとに経済社会全体を予測するために用いられているオルタナティブデータの活用事例について紹介します。

1.POSデータを活用した消費者物価指数の補完(日経CPINow) 

まずは、消費者物価指数を補完するためにPOSデータが用いられている事例です。

伝統的な消費者物価指数は総務省統計局が月に1回配信をしていますが、本記事を執筆している5月4日現在、最新でわかるデータは3月のデータです。調査方法は調査員による聞き取り調査をベースにしており、指数計算に用いるウエイトは5年に1回の改定。

そのため、伝統的な消費者物価指数には以下3つの課題があると整理できます。

①タイムラグ
更新頻度が低く、調査~配信までのタイムラグが長い

②調査コスト
人的なコストをかけており、回答者負担の観点でも改善の余地がある

③生活実態との乖離
固定ラスパイレス方式で計算される結果として、5年の中での消費生活の変化をリアルタイムで捉えられない(例えばコロナ禍での消費バスケット(一定の財・サービスの数量の集合)と、コロナ後の消費バスケットには大きな乖離があると考えられる)

そこで、ナウキャスト社では、上記の課題を解決する方法として、調査員による聞き取り調査ベースではなく、POSデータをベースとした世界初の日次物価指数、「日経CPINow(旧東大日次物価指数)」を2016年から提供しています。タイムラグは2日で、常時配信データの運営に携わっているものは、2名程度。また、日々の売上データを活用することで、ウエイト(家計の消費支出に占める割合)も毎日変更するトルンクビスト方式を採用しています。

こうしたアプローチを採用することでタイムラグ、調査コスト、生活実感の乖離という3つの課題点に対して大きな改善をもたらしており、食品や日用品などの身の回り商品の値上げが話題となる中で、値上げの実勢を捉えることが可能になっています。

また、メーカー別にそれを分析することで、どのメーカーが値上げができており、どのメーカーが値上げできていないのかを的確に分析することも可能です。

2.クレジットカードデータを活用した消費統計の補完(JCB消費NOW)※入門オルタナティブデータP39,58

消費統計を補完するために用いられるオルタナティブデータの事例です。

伝統的な消費統計には経産省の提供する商業動態統計や特定サービス産業動態統計調査、総務省が提供する家計調査などがあります。こちらも前述の消費者物価指数と同様に、タイムラグや調査コストの問題が共通する課題です。

消費統計に特有の課題としては、①供給側統計では、サービス業やECなどの新興ビジネスに対する消費の実態を捉える統計が不足していること、②需要側統計では、サンプルバイアスがあること(高齢者や専業主婦が回答者の主体になっており、勤労者の消費が十分なサンプルをもって捉えられていない)の2つがあります。

例えば、新型コロナによる感染拡大抑止策は主にサービス消費やECなどへの消費に大きな影響を及ぼしました。現役世代こそが働き方を大きく変えたり、場合によっては勤務内容の変更を余儀なくされるなどの影響を考えると、上述の課題がいかに大きなものかは想像に難くないでしょう。

ナウキャスト社では、こうした課題に対処するため、先にあげた消費統計サービス「JCB消費NOW」として開発、提供しています。前述の日経CPINowと同様に、調査コストが低い形で速報性の高い情報提供ができている上、消費統計の特有課題であるサービス消費やECなどのカバレッジの確保、現役世代のサンプルの確保が可能です。

実際に、本データを用いることで、コロナ禍とその回復期における消費活動の回復がサービス消費、ECも含めて把握可能となっています。また、クレジットカードのカードホルダーの属性情報や加盟店の住所情報を活用し、地域別や地域間の消費活動を把握可能となっており、こうしたデータから、今後想定される「GoTo」などの観光促進施策の効果を把握することにも有用なデータとなるでしょう。

3.衛星データを用いた先物取引予測(石油在庫、農作物の生産量)

従来の原油の在庫や、農作物の生産量に関連するデータは、生産・流通事業者や政府の統計などから入手することが可能でしたが、四半期や年ごとの集計データであり、更新頻度や提供までに時間がかかり、モデル化や相関分析を行っても先物取引の高精度な予測は難しいものでした。

そのような課題に対して、地球観測衛星データをAIによって自動解析することにより、原油の在庫量変化や農作物生産量のモニタリングが可能になってきています。衛星データ解析プラットフォームを提供する米オービタルインサイト社は、高解像度の光学衛星画像を用いてコンビナートに並ぶオイルタンクの浮き屋根にできる影の形を解析することで、オイルタンクの貯蔵量推定を行い、増加量と消費量から原油の流通予測を可能としました。

また、光学衛星では雲に遮られて連続的な情報を得ることは難しいため、天候に左右されず観測可能なSAR(合成開口レーダー)衛星画像の活用も進んでいます。SAR衛星画像を解析する米企業URSA Space Systemsは雨天・曇天が多いアジア地域に関してSAR画像によってオイルタンクの貯蔵量推定を実現し、情報提供を行っています。

また、農作物の生産量予測も衛星データを用いて行われています。2013年から国際協力によるGEOGLAM(Global Agricultural Monitoring)が提供するCropMonitorで、各国の大型衛星による観測データを解析。月次の全世界の穀物類(麦・とうもろこし・米・大豆)の生産状況に関するレポートを発出(前月28日までのものを当月初旬に提供)しており、無料で閲覧することが可能となっています。(https://cropmonitor.org

スペースシフト社では、穀物類に限定せず、より栽培サイクルが早く単位面積あたりの価値が高い生鮮野菜についても、光学衛星およびSAR衛星データをAIによって自動解析することで生育状況や収穫予測を可能にするアルゴリズムを開発。解析された情報は、生産農家に対する情報提供の他、広告代理店による農作物に関連した商品に関するCM出稿計画の立案への活用や、農作物流通商社での不作地域の予測や、豊作地域への調達変更など多方面で活用が進んでいます。

■特定企業の業績予測に用いるオルタナティブデータ活用

マクロ経済の予測に続いて紹介するオルタナティブデータの活用事例は、特定の企業や産業の業績や動向を予測する際に用いるオルタナティブデータの事例です。利用するデータは同じでも、誰が、どのように使うかによって様々な活用の可能性があると分かります。

4.POSデータを活用した企業売上の予測(AlternaData)

まず紹介するのはマクロ経済予測でも登場したPOSデータを利用した事例です。

企業開示の決算情報は多くの場合四半期に1度のみの開示にとどまります。そのため、足元の局面のように「値上げができる会社かどうか」の判別をしようとしても、売上や利益などの情報はわかっても、個別商品の価格やシェアの情報は企業の任意開示にとどまっているため、適切な分析ができない、という課題があります。

ナウキャスト社では、上記の課題に対応するため、日次更新されるPOSデータを活用し、リアルタイムに近い形で各上場企業別の売上を把握ができるサービス「AlternaData」を提供しています。POSデータを活用することで、ビールメーカーやマヨネーズ、食用油など様々なメーカーの売上が把握可能となっており、また、売上のみならず各社の商品別の価格やシェアを把握し、各企業の長期的な競争力や収益性を把握することも可能です。

機関投資家にとってみれば、こうしたデータは個別企業の取材活動をするサポートになり、調査コストの低減につながります。また、ユニークなデータを活用した投資判断を行うことで、投資活動における「アルファ(個別銘柄投資を行う際の超過リターンを得るための源泉のうち、個別銘柄固有の部分に基づくもの)」につなげることも期待できます。

5.TVメタデータを用いた企業株価の予測

特定の企業の業績予測に、マーケティング活動の動向を探るデータを活用するという事例も生まれています。

利用されているのは、エム・データ社が生成する、TV番組とCMの放送実績をテキスト化した「TVメタデータ」です。いつ、どの番組で、誰が、何を、どのように、何秒伝えたか記録し、CMを含め全ての放送量をDB化し銘柄別に集計できるもので、主にマーケティングに活用されてきました。

TVメタデータを企業のマーケティングの活動量として、株価の先行指標、上昇シグナルとするオルタナティブデータ活用が今回の取組みで、TVメタから銘柄別の放送量を時系列の変化で集計すればTV指数としてインデックス化できます。

例えば、図の事例はソニー社のCMと番組露出量を分析したもので、移動平均(一定期間の動きを平均化したもの)を長期と中期の折れ線グラフで重ね、中期線が長期線を上抜けるゴールデンクロスをTVトレンド上昇の開始点(シグナル)とします。

これを上位30銘柄で過去5年のバックテストをしたところ、シグナル出現675回の内、532回(約8割)でシグナルから2週間以内の株価上昇が確認され、TVメタを活用することで株価上昇シグナルを最大で数週前にキャッチできた検証結果でした。

センチメント(特定のブランドや企業に対して、市場全体が抱いている印象や心理状態)に影響を与えるTV情報で、様々な切り口での銘柄発見や投資判断ができ、他のデータと組み合わせた新たな指標化が期待されます。

今後、株アプリや金融情報サービスにTVメタが連携される予定です。

6.テキストデータを用いた銘柄別分析、関連企業分析

上場企業の開示をチェックする投資家にとって、ネガティブな内容や予期せぬ内容の開示を1秒でも早く知りたいという強いニーズがある一方で、決算短信や有価証券報告書のような伝統的な定型フォーマットの開示は作成に時間がかかりすぎて、開示が遅れてしまうという課題があります。

そこで、投資家はよりリアルタイム性のある非定型フォーマットの開示データ(オルタナティブデータ)を取得するニーズが高まっています。

Deep Data Research社は、上場企業や上場企業の所属する業界団体の公式ウェブサイトをクローリングし、一元的な全企業開示データベースを作成しています。

一般的な投資家にとって公式ウェブサイトに張り付いて更新情報をチェックするのは困難ですが、このサービスを利用すれば関心のある内容の開示のみを即時メール通知で確認することができます。

例えば、月次売上レポートや中期経営計画は、株価を変動させる情報として一般的なものですが、開示があったことに気づきにくい情報です。

さらに、月次売上は企業間で比較できる要素があり、Deep Data Research社では、データ抽出・加工を行い、全上場企業月次売上データベースとして提供しています。

他にも、ESGや人事異動に関する開示へのニーズが強く、ESG開示に関しては最近ではよりリアルタイム性のある非定型フォーマットが多くなりつつあります。

7.位置情報データを用いた人流解析による企業動向把握

テクノロジーの進歩に伴い、伝統的な経済指標では捕捉できなかった情報の活用も生まれ始めています。

「人の移動」に関する情報は伝統的には非常に把握しづらく、一部の観光統計で旅行需要の把握をすることや、住民基本台帳人口移動報告を活用することでいわゆる「引っ越し」にかかわる情報を把握することが精一杯でした。

しかし、コロナ禍において関心が高まったのはよりミクロな「オフィス街に人が戻っているか否か」、「歓楽街に人出が回復しているかどうか」、「工場に人が戻っているかどうか」と言った情報。

こうした課題を解決するため、ナウキャスト社は携帯通信会社のKDDIと提携し、オルタナティブデータとして人流データを提供する取り組みを始めています。

人流データを活用することで、よりミクロな地点レベルでの人の動向がリアルタイムに把握でき、アパレル企業や百貨店、アミューズメントパーク、ホテル業などの企業の回復度合いが把握できるほか、観光需要の回復度合いも把握することが可能となっています。

また、単に人流データを活用するのみならず、決済データ等と組み合わせることによって、より多面的に個別企業の動向を把握することが可能となっています。

8.衛星データを用いた企業動向把握(テスラ他、車メーカーの工場生産量把握)

衛星データを解析することによる企業動向把握も、事例が生まれ始めています。

例えば、自動車工場で生産された車両を置く駐車場をモニタリングすることで、リアルタイムな生産状況の把握が可能です。車種ごとに生産される工場が特定できるため、競合他社の生産状況を確認して自社の生産戦略に役立てるほか、投資家にとっては、リアルタイムに各企業の生産状況が把握できるため、業績予測や投資戦略の立案に活用できるデータとなります。

また、自動車業界だけでなく、生産工場の駐車場をモニタリングすることで、従業員の出勤状況から生産状況の把握につなげることができ、様々な工業製品の生産状況や物流状況を把握することで広範囲な産業予測につなげることも可能です。

工業製品のモニタリングに関しては、生産から流通までのサプライチェーン、つまり、原材料(鉄鉱石鉱山)→原料加工工場(製鉄所)→生産工場(自動車工場)→流通(コンテナ・貨物船)など、全体の情報を把握することで、生産の最適化や流通の最適化を通して、環境負荷の少ない持続可能な産業を構築することにつなげることができると期待されています。

■ESG投資判断に用いるオルタナティブデータ活用

近年、企業活動を評価するにあたって、SDGsを達成するために投資をする際の観点であるESG(環境(Environment)、社会(Social)、企業統治(Governance)の頭文字を取ったもの)に注目が集まっています。

そのため、ESG投資の判断を行うためのオルタナティブデータ活用も事例が産まれ始めています。

9.テキストデータを用いたESGの関係性スコアの可視化

ESGに関連したデータは、企業発表に基づくデータや情報を基準にすることが一般的です。信頼性が高いことから、ESGデータが企業発表情報を軸とすることには変わりないでしょう。企業発表自体は統合報告書や有価証券報告書のように、テキストであることから、自然言語処理を用いてESG関連情報を読み取ることが日常的に行われています。

その上で、オルタナティブデータとして、企業関連のニュースなどのテキスト情報をESGに応用することが追加的に行われています。リフィニティブ社のアプローチは、まず、ESGの各エリアにおける専門家の分析や知見を機械学習し、そのアプローチを世界中のニュースやSNSなどを対象として、リアルタイム性をもって分析し、その結果を数値化したデータを配信しています。

このアプローチは、ESGに関連した様々なグローバルの取組みを把握した上で、世界中のテキストデータをオルタナティブデータとして活用し、日常的な分析や取引判断に活かすことができるものとなっています。定期的な企業発表は頻度が低い為、高い頻度で入手できるテキストデータから、各企業のESGに関連した取組みや状況を抜き出して、タイムリーに把握するために有効です。

10.衛星データを用いた企業活動の評価

衛星データの解析結果から、企業のESGに関わる動向についても、様々なセンサーを組み合わせることで、その活動の効果や実情を把握できるようになると考えられています。

例えば、カナダの衛星ベンチャー企業GHGSatは、メタンや二酸化炭素など温室効果ガスの測定を3Uの超小型衛星により観測する技術を開発し、現在3機の衛星を運用しています。1ピクセル25mの地上分解能で1週間おきに全球を観測可能で解析結果は無料でWEBブラウザ上で確認できます。(https://pulse.ghgsat.com

GHGSat: PULSEの閲覧画面

GHGSatの現在の解像度、観測頻度では、工場ごとに排出量を推定することは難しいものの、SAR衛星データの解析による工場の従業員駐車場の車の増減モニタリングデータ、実際の企業活動の状況など、その他のデータと組み合わせることで、より正確に企業のESG対策が適切に行われているか、評価指標を整備することも可能になると考えられています。

またスペースシフト社が開発している、非常に微細な変化をSAR衛星データから抽出する技術を活用することで、人流や車の車種などを特定し、より詳しい企業活動をトラッキングし、環境対策等が適切になされているか評価が可能になります。

(5)日本におけるオルタナティブデータ活用の今

世界ではオルタナティブデータの市場規模は約1700億円を超えていると推計されていますが、日本でのオルタナティブデータの活用は緒に就いたばかりです。

日本におけるレギュレーション上の検討、業界内でのユースケースの発掘や人材育成のロードマップやスキル定義など、個社では乗り越えられない課題について産学が連携して取り組んでいくため、「一般社団法人オルタナティブデータ推進協議会」が2021年2月5日に設立されています。

政府でも、オルタナティブデータの活用を進めています。政府の情報提供として、内閣官房・内閣府「V-RESAS」では、地域経済への影響を適時適切に把握するため、人流データのほか、決済データから見る消費動向や飲食店情報の閲覧数等の情報を公開しています。

政策判断にも活用されており、内閣府「月例経済報告等に関する関係閣僚会議資料」や日本銀行「経済・物価情勢の展望(展望レポート)」では人流データやPOSデータがコロナ禍での景気判断に用いられています。

日本銀行では2022年3月25日に公表した「中期経営計画(2019~2023年度)」の中間レビューにて「日本銀行が行う調査・分析におけるオルタナティブデータの一層の活用も着実に進めていく」ことを掲げており、HPにオルタナティブデータ分析のページも開設されています。

(6)新たなオルタナティブデータとして期待されているもの

今後、新たに活用が期待されているデータとして、都市や生活環境にまつわるデータがあります。都市では人々が生活する中で様々な情報が発生しています。

例えば、人口動態、ごみや水道の利用状況、工事の予定・実績、公共交通の人流、犯罪発生率、など様々な情報をデータとして活用することができるはずです。

もちろんすでに公表されているデータもありますが、粒度やタイミングなどがより細かくタイムリーに提供されるようになると、活用用途は拡大していくでしょう。

集められたデータを活用して、今までは効果が図りにくかった都市の生活にまつわる指標を簡易に計算できるようになると、インパクト投資やソーシャルインパクトボンドなど、都市計画への民間資産の流入が活性化していくものと考えられます。

(7)オルタナティブデータに興味を持った方へ

以上、オルタナティブ推進協議会の皆様にご協力をいただき、オルタナティブデータについて、事例や今後の展望をまとめた内容をご紹介しました。本記事で紹介したオルタナティブデータの活用事例は、実際に活用が進む事例の一部であり、今後も様々な事例が創出されることが期待されています。

本記事をきっかけにオルタナティブデータを活用してみたい!と思われた方は、ぜひオルタナティブデータ推進協議会にお問い合わせしてみてはいかがでしょうか?衛星データを活用したいと思われた方はぜひ宙畑宛てにもご連絡ください。

また、もっとオルタナティブデータについて学びたい!という方は書籍「入門オルタナティブデータ(日本評論社)」がおすすめです。

さらに、オルタナティブデータを実際に扱ってみたいという方には、SIGNATE社が提供するlearningコンテンツ「SIGNATE QUEST」を試してみるのもおすすめです。

ぜひ、オルタナティブデータの利活用を積極的に検討していただければと思います。