新規事業検討者必見!ビジネスサイドからみるデータ分析(分析設計編)
ビジネスにおけるデータ活用が叫ばれて久しいですが、具体的には何から始めたら良いの?どうやって進めたら良い?担当者の疑問を解消します!
1. はじめに
現在、ビジネスシーンはもちろん、様々な場面でデータ活用の必要性が叫ばれています。
データ活用の実践には、データを直接扱うデータ分析担当者だけでなく、データ分析の概要や重要性をビジネス的な側面から理解し協働/管理する担当者の存在も不可欠です。
本記事は、データ分析に関心のある非データ分析担当者の方に衛星データ活用推進の契機としていただくため、基本的なデータ分析の全体像や、衛星データの分析設計の例や衛星データの活用のための観点についてご紹介します。データ分析に精通している方にとっても、ビジネスサイドの観点や衛星データの扱い方などで参考になる部分があるかもしれません。
本記事が衛星データをビジネス活用する際のヒントとなれば幸いです。
2. データ分析の全体像
私たちが暮らす現代社会はデジタル化の一途をたどっています。身近なところでは、ここ数年でショッピングや会議はオンライン上で完結できるようになりました。その一方で、サービスを提供する企業は、利用者の特性や行動から得られる大量のデータを適切に収集し、分析、活用することができるようになりました。
本章では、まずデータの定義を確認したのち、データ分析の目的とその全体像について解説します。
そもそもデータとは、広辞苑第七版によると、「①立論・計算の基礎となる、既知のあるいは認容された事実・数値。資料。与件。②コンピューターで処理する情報。」とされています。また、日本工業規格(JIS)によると、「情報の表現であって、伝達、解釈又は処理に適するように形式化され、再度情報として解釈できるもの。」とされています。
つまりデータは、コンピューターで処理できる事実や数値の情報といえます。その粒度はまちまちで、例えば、ショッピングに伴って発生する取引履歴、SNSへ投稿した内容、業務で利用する表計算ファイルそのもの、さらには紙をスキャンした画像もデータとして定義されます。
①データ分析の目的
データ分析の目的は、一言で表すならば、意思決定のための材料を提供することです。
データは一片だけで見ればただの一事実でしかありません。しかし、データは集められたり、時系列で並べられたり、統計処理を加えられたりすることによってより高度に情報化され、示唆を生み出します。データ分析によって生みだされた示唆は、ビジネスシーンはもとより、あらゆる場面でファクトベースな判断材料として寄与し、活用されるのです。
また、社会のデジタル化に伴って、国内のデータ流通量は年々増加傾向にあります。同時に、企業によるデータ活用は年々進展しており、活用するデータの多様化も進んでいると言えます。
そのため、VUCA時代※の中、高頻度で意思決定を下さざるを得ない昨今の企業は、日々大量化・多様化するデータを適切に分析し、客観的な判断材料を意思決定に合わせて作りだしていく必要があります。データ分析を適切に行う企業とそうでない企業とでは、獲得する情報の量や質、さらには意思決定の質やスピードにも差が生まれ得ることは想像に難くありません。
※VUCA:「Volatility(変動性)」「Uncertainty(不確実性)」「Complexity(複雑性)」「Ambiguity(曖昧性)」の頭文字を並べたもの。複雑性を増す世の中で、将来を見通すことが難しい状況を指す。
それでは、データ分析は具体的にどのような流れで進められるのでしょうか。
②データ分析俯瞰図
データ分析は主に、①課題設定、②詳細設計、③データ準備、④分析・結果活用の4つのプロセスで構成されます。①から④までの分析設計を業務の観点から支え、一連をデータ分析担当者と共に完遂させることが、ビジネスサイドの担当者が果たすべき役割です。
さらに、③データ準備プロセスを支える、データマネジメントという活動が存在します。こちらは後日、データマネジメント編として紹介します。
次章で、データ分析の各プロセスについて解説します。
3. データ分析プロセス
①課題設定
課題設定は、ビジネス課題を解決するために、データ分析で何を導き出すかを決定するプロセスです。
データ分析ではまず、取り組むべきビジネス課題を明らかにします。次に、ビジネス課題を分析可能な単位に分解し、今回の分析でどの論点にフォーカスするか決定します。フォーカスする論点が決まったら、分析によって得られる結果の仮説を構築します。仮説構築の際には、数値的な指標や大小関係などを設け、数的根拠をもった検証結果を導出できるようにしましょう。
ここでのビジネスサイドの担当者の役割は、データ分析担当者の協力を仰ぎつつ、取り組むべきビジネス課題の明確化から仮説構築までを主導することです。真に得たい示唆を導出するために、詳細設計を行うデータ分析担当者に対して、データ分析の背景を十分に説明することが重要です。
②詳細設計
詳細設計では、まず、分析に要するデータに見当をつけます。次に、見当をつけたデータの加工方法やデータ同士の紐づけを設計し、最後に、分析に利用するアルゴリズム候補を挙げます。
ここでのビジネスサイドの担当者の役割は、データ分析担当者が行うデータ選定を支援することです。選ばれるデータが分析に適しているか否かの基準は、明らかにしたい論点によって決まります。本分析で明らかにしたい論点を最も理解しているのはビジネスサイドの担当者です。そのため、選定対象となり得るデータを主体的にデータ分析担当者へ連携し、ビジネス上の意味と紐づけて説明することや、選定されたデータに関するディスカッションを行うことが求められます。
③データ準備
データ準備は、詳細設計に基づいて、分析を実行するためのデータを用意するプロセスです。
まず、データを保有・管理する関係者の協力の下、データ調達を行います。次に、調達したデータを分析しやすいよう、データ分析担当者が加工します。
しかし、実際に提供されたデータは、想定していたデータがそもそも存在しない場合や値に欠損が多く分析に利用できない場合があります。そのため、ときには詳細設計プロセスに戻り、必要なデータや分析方法を再検討したうえで、データ準備プロセスを実施する場合もあります。
ここでのビジネスサイドの担当者の役割は、データ分析担当者が行うデータ準備を支援することです。データ分析を実施する上で、データ提供を社内横断的に依頼することや、データプロバイダからデータを購入するケースは稀ではありません。データ準備のために事務的な作業が発生する場合も多いため、特に管理者となるビジネスサイドの担当者が、手続きや承認等の流れを事前に把握しておくことが、円滑なデータ準備に貢献します。
④分析・結果活用
分析・結果活用は、データ分析を実行し、仮説検証結果を適切に解釈、活用するプロセスです。
まず、詳細設計で選定したアルゴリズムを実装し、データを分析します。次に、分析結果を確認し仮説を検証します。最後に、検証の結果について、論点に対する答えを導き出し、ビジネス上どのような意味があるのかを解釈し、活用します。
検証の結果、必ずしも仮説が立証できるとは限りません。その場合は、あくまで恣意的にならない範囲でアルゴリズムの別候補を試したりデータを再選択したりして再度分析する場合や、仮説が立証できなかったという事実を論点に対する答えとする場合もあります。また、仮説の立証は一度で終わらないケースもあります。その際は、定期的なモニタリングを行う場合や、他の論点の検証結果と組み合わせる場合もあります。データ分析によって何をどこまで明らかにするかは、ビジネス課題や論点、構築した仮説に依存するので、データ分析の都度検討する必要があります。
ここでのビジネスサイドの担当者の役割は、仮説検証結果がビジネス上どのような意味をもつかを適切に解釈することです。ここで得られた解釈こそが、当初設定したビジネス課題の解決に活用することができます。
データ分析のプロセスを改めてまとめると以下の図になります。ビジネスサイドの担当者とデータ分析担当者は各プロセスで役割が異なりますが、いずれのプロセスにおいてもデータ分析の完遂のためには欠かすことのできない存在です。
4. 衛星データ分析プロセス
前章では、基本的なデータ分析プロセスについて、ビジネスサイドの担当者が果たすべき役割と共に解説しました。
本章ではまず、衛星データの特性や衛星データ活用のための観点を確認します。次に、衛星データを分析する場合、どのように分析設計すべきか具体例を挙げながら解説します。併せて、衛星データ分析プラットフォームの機能と役割について紹介します。
①衛星データ活用のための観点
衛星データを活用する上でその特性の理解は不可欠ですが、衛星データには画像や天候データ、測位データなど様々なデータがあります。そこで、衛星データの特性を踏まえて、以下の5つ観点から活用を進めていくことが重要です。
1.観測対象地域のデータは十分に取得できるか
衛星データは基本的には、写真のように、撮影した場所や時間単位で配布されています。データ分析の目的に沿った地域に関するデータが十分に含まれているか、同一地域のデータ量は十分かを確認する必要があります。また、追加のデータ処理の必要性をデータ取得以前に確認する場合もあります。これは、同一地点を含むデータでも、観測している角度や観測範囲が同一ではないケースがあるためです。
2.観測時期・時間は適当か
衛星データは、着目する季節や時間帯によって内容が大きく変化する場合があります。データ分析の目的に沿って、同一時期・時間の複数年度分のデータを活用するのか、特定の事象前後の時間のデータを活用するのかなど、活用するデータの条件を事前検討することが求められます。
3.センサ種類は適当か
衛星データは、人工衛星に搭載されたセンサによって取得されたデータであるため、人工衛星の観測目的を超えるデータを含んでいません。衛星データを扱う際は、データ分析の目的をきちんと達成しうるデータとなっているか、データ取得元であるセンサの仕様という観点からも確認しましょう。センサによっては、日時や天候に左右され観測が困難となるケースや、観測したい対象物を十分に撮影できないケースがあります。観測対象地域や観測時期・時間を考慮し、得たいデータを取得可能か留意する必要があります。
4.適当な前処理がされているか
衛星データには、基本的には空間情報、時間情報、スペクトル情報(光の波長の情報)が含まれています。しかし、データの前処理の度合いやデータフォーマットはプロバイダやセンサの種類等によって異なります。そのため、都度目的に応じたデータの使い分けが重要となります。
※衛星データの前処理の詳細はこちらの記事に記載ありますので、ぜひご覧ください。
5.商用利用は現実的か
衛星データには、著作権が発生する場合があります。特に商用利用の際は、データの利用範囲などの諸条件がデータカタログ等に細かく規定されているので、利用規約に従い、細心の注意を払ってください。また、衛星データの購入には一定の費用がかかるケースがあります。
※衛星データの価格の詳細はこちらの記事に記載ありますので、ぜひご覧ください。
衛星データ活用について検討するタイミングは、②詳細設計プロセスにおけるデータ候補選定時です。ビジネスサイドの担当者は、必ずしも詳細な前処理内容やデータ構造を理解する必要はありませんが、論点を明らかにするために衛星データをどう活用するかを念頭に、データ分析担当者を支援する必要があります。
②プロセスに沿った分析例
上述した分析設計のプロセスと衛星データ活用の観点を踏まえて、簡易的に分析の具体例を挙げます。なお本記事では実際に分析は行っておらず、設定した数値は架空のもので現実の数値とは乖離があることをご留意ください。
1.課題設定
海上運送事業を営む企業における、運航計画策定に関するビジネス課題を考えてみましょう。今回は「将来30年に渡って海上運送にかかる燃料費用を抜本的に削減したい」というビジネス課題のもと、データ分析を行うケースを挙げます。ビジネスサイドの担当者を中心に、定めたビジネス課題に対して、論点出しを行い、仮説を構築します。仮説構築時には、ビジネス課題に沿ってなるべく具体的な数値や大小関係を設けましょう。
今回は「北極海航路を可能な限り利用することで、将来30年に渡って海上運送にかかる燃料費用を抜本的に削減可能か」という論点を設定します。それに対し、「北極海航路が利用可能な場合、その半数以上で北極海航路を利用するという運用を10年後から開始すれば、30年後には累積で燃料費を20%以上削減可能である」という仮説を構築しました。
2.詳細設計
仮説を検証するために、必要なデータや分析に使用するアルゴリズムを検討します。
必要なデータは、会社保有の内部データや、オープンデータやデータプロバイダが保有する外部データを利用できます。衛星データの活用可否は外部データ活用の議論の中で行われます。その後、衛星データ活用のための観点から適切にデータ選定を行い、分析方法まで検討しましょう。
※なお、本分析では北極海航路における航行で、出現する氷床面積や削減可能となる燃料の量について時期や天候ごとの関係性をあぶりだし、将来的にかかる燃料費用を推定する設計を想定しています。
3.データ準備
詳細設計に基づき、データの調達と加工を行います。データの調達ができ次第、基礎集計を行い、想定した分析が実行可能かデータの中身を確認しましょう。ただし、分析に使用する衛星画像は、画像解析専用のソフトウェアを利用しないと内容を把握できない場合があるので、調達したデータのカタログや仕様を確認してください。
4.分析・結果活用
データ準備が完了したら、データ分析を実行します。衛星データのデータ分析は、容量やメモリ消費量といった点でデバイスに大きな負荷をかける場合があります。そのため、扱うPCやサーバの仕様や状態を事前に確認し、十分な空き容量や処理能力を備えておくと円滑に分析を行えます。
分析の実行結果が仮に「北極海航路が利用可能な場合、その半数以上で北極海航路を利用するという運用を10年後から開始すれば、30年後には累積で燃料費を22%以上削減可能である」と出力されたとします。この結果、「北極海航路が利用可能な場合、その半数以上で北極海航路を利用するという運用を10年後から開始すれば、30年後には累積で燃料費を20%以上削減可能である」という仮説が立証できます。よって、分析結果を、ビジネス課題解決に活用できるようになりました。
ただし、本分析例ではあくまで燃料費のみに焦点を当てたと仮定のため、船体の維持費や人件費等は課題設定の段階から考慮していないことにご留意ください。より俯瞰的に北極海航路の費用対効果を測りたい場合は、別論点を設定し追加で分析を実施するか、ビジネス課題を再設定する必要があります。
以上の一連の流れをビジネス担当者の役割と併せてまとめると、以下の図のようになります。
③衛星データプラットフォームが持つ役割
現在、衛星データの活用促進のため、衛星データをワンストップで確認でき、各種処理が容易に行える基盤としての衛星データプラットフォームが様々な組織によって運営されています。今回は日本を代表する衛星データプラットフォームであるTellusを例に、データ分析プロセスにおいてどんな役割を担うのか、Tellusの機能を紹介します。
コンピューティングリソース
Tellusには、データ蓄積のための容量や、分析実行のためのサーバをクラウド環境として提供するコンピューティングリソースがあります。
コンピューティングリソースによって、データ分析担当者は高品質な分析環境を利用することが可能になります。よって、複雑・大量の分析においても、速い処理スピードと安定性を維持するため、④分析・結果活用プロセスの所要時間を短縮可能です。
インターフェース
Tellusには、標準的な開発者向け分析画面やデータの可視化を簡易的に行うインストール不要のOSを提供するインターフェースがあります。
インターフェースによって、Tellusの利用者は容易にデータの確認や分析をすることが可能になります。具体的には、データ分析担当者は、②データ設計プロセス、③データ準備プロセス、④分析・結果活用プロセスにおいて、通常使用しているプログラミング言語(PythonやR)を用い、標準的な開発環境で分析できるようになります。また、ビジネスサイドの担当者も、Tellus搭載のOS上で直感的にデータの確認や分析が可能なため、③データ準備プロセスや、④分析・結果活用プロセスの一部でTellusを活用できます。
マーケット
Tellusには、衛星データをはじめとして、ユーザー間で様々なデータやアルゴリズムを取引する場所を提供するマーケットがあります。
マーケットによって、Tellusの利用者はデータ、アルゴリズム、アプリケーションを取引することが可能になります。データ分析担当者は前処理済みのデータや、あらかじめ加工がしやすい形式にされたデータを取得することで、③データ準備プロセスにおけるデータ処理の手間を削減可能です。
同様に、④分析・結果活用プロセスにおいても、既に構築されたアルゴリズムを取引することでアルゴリズムの実装の手間を省くことが可能です。また、ビジネスサイドの担当者は、取引されるデータのカタログをマーケット上でまとめて閲覧可能なため、衛星データ活用のための観点に基づいた適切な衛星データの選定がワンストップで可能です。
Tellusの機能とその役割を、データ分析プロセスに沿ってまとめると以下になります。データ分析プロセスの観点からも、Tellusはビジネスサイドの担当者とデータ分析担当者の両者にとって、衛星データ活用を後押しする機能を有していることが分かります。
5. まとめ
①ビジネスサイドからできること
本記事では、ビジネスサイドの担当者から見たデータ分析について解説しました。
データ分析はそれ自体が目的ではなくビジネス課題の解決を目的として実施されるべきであるため、特にビジネスサイドの担当者はその視点を忘れずにデータ分析に参画する必要があります。
活用するデータの選び方についても同様です。活用したいデータ起点で分析設計を行うのではなく、明らかにしたい仮説起点で活用可能なデータを選ぶ必要があります。
昨今、衛星データ活用の話題を聞く機会も増えてきました。今後も、データ分析担当者とビジネスサイドの担当者が一丸となり、衛星データ活用を通じて、様々な課題の解決に一層寄与していくことが期待されます。
改めて本記事が、皆様が衛星データをビジネス活用する際のヒントとなれば幸いです。
次回は「ビジネスサイドからみるデータ分析(データマネジメント編)」を予定しています。お楽しみに!
【参考書籍】
・企業ITに人工知能を生かす AIシステム構築実践ノウハウ