ビジネスサイドからみるデータ分析(データマネジメント編)
衛星データを含むデータ分析をする際にビジネスサイドで考慮しておくべき点についてまとめました。後編はデータマネジメントについてご紹介していきます。
1. はじめに
本記事は、前回のビジネスサイドからみるデータ分析(分析設計編)に引き続き、データ分析に関心のあるビジネスサイドの担当者の方に衛星データ活用推進の契機としていただくため、基本的なデータマネジメントの考え方や衛星データマネジメントのポイントについて紹介します。
2. データマネジメントの全体像
私たちが暮らす社会はデジタル化によって日に日に目まぐるしく変化しています。企業は流動性の高い環境下においても、客観的事実となるデータを活用し意思決定を下していかなければなりません。
現状をいち早く察知し今後どのようなアクションをとるかを決定するためにも、企業は保有するデータについて常に活用可能な状態を維持する、データマネジメントを行う必要があります。
データマネジメントとは、国際的な枠組みであるデータマネジメント知識体系ガイドブック第二版によると、データという資産の価値を提供し、管理し、守り、高めるために、それらのライフサイクルを通して計画、方針、スケジュール、手順等を開発、実施、監督することとされています。
①データマネジメントの目的と位置づけ
データを資産としてみなすことは、データ自体に経済的価値を認めることや、経済的価値を生み出す資源とみなすことに繋がります。一方、所有する上でコストやリスクを伴います。
そのため、データという資産の価値を提供し、管理し、守り、高めるための活動として、企業はデータマネジメントを行っていくことが求められているのです。
前回のビジネスサイドからみるデータ分析(分析設計編)で述べたデータ分析俯瞰図では、③データ準備プロセスを支える活動としてデータマネジメントを位置づけています。データ準備プロセスでは、担当者は分析に必要なデータを調達し、分析用に加工する必要がありました。
データマネジメントが適切に実施されていると、分析に要するデータがどこにどのような状態で存在しているかを即座に確認できるようになります。
また、データを常に分析しやすいような品質に保っておくことで、いざというときの加工の手間を最小限に抑えられます。
そのため、データマネジメントを適切に行うことで、データ準備プロセスやデータ分析全体のリードタイムはもちろん、意思決定のスピードやその質をも高めることが可能です。
それでは、データマネジメントには具体的にどのような活動が挙げられるのでしょうか。また、ビジネスサイドの担当者は主にどのような形で活動に関与することが可能なのでしょうか。
②データマネジメントに含まれる諸活動
データマネジメント知識体系ガイドブック第二版によると、データマネジメントは、データガバナンスを中心に、計11の領域から構成されるホイール図として整理されています。ホイール図には、データ整備担当者による各領域に準じたデータマネジメントのための活動が定義されており、その領域は相互に密接に関わりあっています。
以下では、普段分析業務を行わないビジネスサイドの担当者に関連する領域を取り上げ、その内容や役割の解説をします。
データアーキテクチャ
データを資産管理するための理想像を定義する活動です。データがどの業務によって生成されるかといった紐づけから、データが活用されるタイミングまで把握することで、今後のデータ活用の方向性やアーキテクチャ面での管理方針を定めることができます。
ここでのビジネスサイドの担当者の役割は、データと業務を紐づけた、データアーキテクチャを描く支援をすることです。例えば、業務流れ図やデータフロー図が現状/理想のデータアーキテクチャを描く際に活用されます。
現状のデータアーキテクチャが描かれると、生成されたデータがどの組織の誰にどのタイミングで活用されているかが判別できるようになります。
まずはより効率的で理想的なデータアーキテクチャを描くためにも、ビジネスサイドの担当者は、業務の中でどのデータをどのタイミングで活用しているのか、データ整備担当者による現状把握を支援しましょう。
データセキュリティ
個人情報や企業秘密等の漏えいを防ぐべきデータを外部からの侵害から守り、適切なアクセスを確保する活動です。
果たすべき法的/倫理的責任をしっかりと理解し、適切なセキュリティ対策を実践することで情報漏えいを防ぎ、一方で過度な対策による機会損失とならないように気をつける必要があります。
ここでのビジネスサイドの担当者の役割は、企業が定めたデータセキュリティに関する規約に従いながら業務を遂行することはもちろん、現場のどのタイミングで取り扱いに注意が必要なデータが発生し、誰のどのような権限の下でアクセスが許可されるべきかといった情報提供を積極的に行うことです。
企業の内部機密に抵触しうるような、比較的セキュリティ確保の必要性が認識されやすいデータが存在する一方で、都度の契約や取引先との商慣習上で扱うような、現場でないと保護の必要性が認識されにくいデータも存在します。
保護すべき可能性のあるデータについてはその全てと、アクセス制限の内容等をデータ整備担当者に素早く連携/相談しましょう。
ドキュメントとコンテンツ管理
特に非構造化データ管理のための計画、実装、統制に関する活動です。非構造化データとは、データの形式が定義/整理される前のそのままのデータを指し、ワードファイルや画像ファイルが例として挙げられます。
ここでのビジネスサイドの担当者の役割は、現場で無秩序に作成され残置されているようなファイルも含め、管理するべき非構造化データを主体的に洗い出し/検討したのち、非構造化データの取り扱いについてルールを策定し運用することです。
現場起点で多く生成され活用されうる非構造化データは、データ整備担当者による監督が行き届かないケースも多いため、ビジネスサイドの担当者が中心となって、取り扱う非構造化データを一覧可能な台帳を作成/管理する等の対応が必要です。
データウェアハウジングとビジネスインテリジェンス
データ分析やレポートを通じて、データから価値を得られるように計画、実装、統制する活動です。
データウェアハウジングとは、データ分析のためにデータを変換し、データウェアハウスと呼ばれる特定箇所に格納しておくことを指します。ビジネスインテリジェンスとは、データウェアハウジングされたデータを活用したデータ分析のことを指します。
ここでのビジネスサイドの担当者の役割は、どのような意思決定をするためにビジネスインテリジェンスを活用したいのかを定義しておくことです。ビジネスサイドの担当者が意思決定したいことを定めれば、ビジネスインテリジェンスのあり方が定まります。ビジネスインテリジェンスのあり方が定まれば、データウェアハウスに格納するデータのあり方も定めることが可能になります。
メタデータ
高品質かつ統合されたメタデータをアクセス可能にするために計画、実装、統制する活動です。メタデータとは、データに関するデータのことを指し、データが生成された日時や、そのデータ自体が何を意味するのかを定義した説明が例として挙げられます。
ここでのビジネスサイドの担当者の役割は、生成されるデータに対してビジネス上の定義づけを実施し、メタデータ作成の支援をすることです。あわせて、データが組織間やシステム間等を移動する際に、どのデータと共にどのような加工を経たのか変遷を示すメタデータについても作成を支援する必要があります。
ビジネスサイドの担当者がビジネス上の意義をメタデータとして付与することは、データ整備担当者やデータ分析担当者によるデータの内実に関する理解を促進し、概念や用語の統一がなされることでコミュニケーションを円滑化する契機になります。
データ品質
組織内で活用されるデータの品質管理を計画して遂行する活動です。データ整備担当者は、ユーザーの要求水準に見合った品質を担保できるようにデータの品質を測定し、改善を続けていく必要があります。
ここでのビジネスサイドの担当者の役割は、ビジネスサイドの担当者にとっての理想的なデータの品質を定義することです。
データの品質は集計や報告等、その活用目的に応じて、リアルタイム性や正確性等様々な尺度が存在します。理想とされるデータ品質は暗黙化されていることも多いですが、測定基準や品質基準を形式化することによって、データ品質の継続的な管理が可能になります。
本章で紹介したデータマネジメントにおけるビジネスサイドの担当者の役割をまとめると、以下の図のようになります。
データマネジメントにおけるビジネスサイドの担当者の役割
3. 社会から要請されるデータマネジメントのあり方
前章まで、企業がデータマネジメントを行う意義について述べてきました。本章では特にデータセキュリティの観点から、社会から要請されるデータマネジメントのあり方について法的な観点から紹介します。
①海外動向
データセキュリティに関する企業への最も先進的/国際的な規制は、EU加盟国が中心となって制定したGDPR(General Data Protection Regulation)であると言われます。GDPRは基本的人権の保護を目的とし、企業に対して個人の権利を守るためのデータ取り扱いに関する法的要件を定めた規制です。規制対象となるデータの例として、個人を直接的に特定可能なデータには氏名や電話番号が挙げられ、個人を間接的に特定可能なデータには携帯電話やPC端末の識別番号が挙げられます。
データセキュリティに関する規制について、EUと頻繁に比較されるのが中国です。中国ではDSL(Data Security Law)が2021年9月より施行されており、中国におけるデータ収集や処理に関する規定が定められています。DSLでは中国国内のデータや取引のある企業のデータの中でも、安全保障や公共の利益に大きく関わるようなデータについては国が規制可能である旨が記載されています。同時に、中国では個人情報を保護するためのPIPL(Personal Information Protection Law)も2021年11月より施行されています。つまり、DSLを背景としたPIPLの制定によって企業に対して個人情報の取り扱いの枠組みを与えるのと同時に、ときには中国が国としてデータを管理し、主体的に活用していくことをも可能にしたといえます。
また、アメリカにおいても同様、企業によるデータ取り扱い方針を定めた規制が存在します。ただし、アメリカ全土に渡って敷かれた法令自体は存在しないため、本記事ではアメリカで最も多くの人口を有するカリフォルニア州で定められた、California Consumer Privacy Act(CCPA)を紹介します。カリフォルニア州ではかつて大企業によって個人情報が意図しない用途に転用された事件があったこともあり、CCPAは個人が自身の情報をすべて制御可能とすることを目的に制定されています。さらに、目的や対象地域がカリフォルニア圏に限定されていることはもちろん、規制対象となるデータが詳細に示されていること等、より具体化が進んでいる点が特徴です。
②国内動向
日本国内において、企業による個人情報保護が定められた規制は個人情報保護法です。個人情報保護法は個人の権利を保護することを前提に、個人の了解の下で企業が適切に個人情報を活用することを目的とし、現在は三年ごとに見直しを行うことが定められています。
個人情報保護法で規制対象となるデータは、GDPR等とは異なり、あくまで住所や氏名といった個人を直接的に特定可能なデータに限られます。個人情報保護法の下では、個人情報保護委員会によって企業に対して指導や勧告等がなされ、従わない場合には罰金が課されることもあります。
GDPR等、データセキュリティに関する規制はその企業の所在地だけでなく取引先にも大きく影響を与えるため、国内企業にもその影響は波及します。そのため、国内企業においては、社会からの要請に応える形でのデータマネジメントとして、展開先や取引先所在地の規制を遵守するために、常に最新情報を収集し理解しておく必要があります。
加えて、個人情報保護法は三年に一度見直されるため、比較的先進的な海外動向を踏まえつつ後手に回らないよう事前に対応を検討しなければなりません。ビジネスサイドの担当者は海外動向や国内動向についてのアンテナを張りつつ、今後現場レベルでどのデータが規制の対象となりうるのか考慮しておくと、改正への対応をより円滑に進めることが可能となります。
4. 衛星データマネジメント
前章までで述べた、ビジネスサイドの担当者に関連するデータマネジメント領域や社会から要請されるデータマネジメントのあり方を踏まえて、本章では衛星データの特性に着目しながら、衛星データマネジメントについて解説します。
①衛星データの特性と主要な活動
衛星データの特性
衛星データは基本的には、空間情報、スペクトル情報(光の波長の情報)、時間情報というメタデータから構成される画像データです。空間情報には、撮影された対象物の分布や被覆の状態に関する情報が含まれています。
撮影された画像内の各画素と緯度経度の対応、さらには標高までも確認可能な場合もあります。スペクトル情報には、撮影された対象物の色等に関する情報が含まれています。画像の解像度にも依存しますが、対象物の色等を緻密に解析することで、対象物の判定や面積等の把握が可能です。時間情報には、対象物が撮影された時刻に関する情報が含まれています。複数枚の画像とそれぞれの撮影時刻の情報をもとに、対象物の一時的な変化や長期的な変化を把握することが可能です。
衛星データマネジメントのポイント
衛星データを資産として継続的に活用する際は、特に2つの観点に留意する必要があります。
1つは、衛星データは非構造化データのひとつであるため、そもそもどのように管理をしていくかを検討したうえで、現場レベルまでマネジメントを浸透させなければいけません。
もう1つは、衛星データは画像データの中でも、空間情報とスペクトル情報、時間情報というメタデータを含むという特徴を持っているため、これらの特徴を一目で確認でき俯瞰的に活用方法を検討できるような仕組みを整備する必要があります。
衛星データ管理台帳による管理
2つの観点を押さえたマネジメントを実施するためには、「衛星データ管理台帳」のような形式で、保有する衛星データの一覧化による管理が有効です。
衛星データ管理台帳は、データ整備担当者主導で、画像1枚単位での起票を前提に基本情報、空間情報、スペクトル情報、時間情報といったメタデータの観点で整理されることが理想的です。
基本情報は、起票者や格納場所、価格というような共通部と、ビジネス部と分析部に分けられます。
ビジネス部では、業務上どのような目的でデータが購入/ダウンロードされたか、現在業務上どのように活用されているか等を記載します。
分析部では、データがどのような分析で用いられているか、どのような前処理を施したデータなのか等を記載します。
空間情報、スペクトル情報、時間情報についても、衛星データが保有する情報が一目で分かるよう台帳上に一覧化しておきましょう。
衛星データ管理台帳を作成することで、保有する衛星データの現状を網羅的に把握し、意図せず活用対象を狭めるリスクや、無用な購入/保管費用が発生するリスクの低減が可能になります。
ビジネスサイドの担当者にとっては、衛星データ管理台帳の中でも特にビジネス部について網羅的に記載/更新をすることが重要です。
これにより、購入/ダウンロードされた衛星データが、業務上どのような目的や方針/規約の下で、どのように活用されているか等を、データ整備担当者らへ正確に情報提供できます。また、ビジネスサイドの担当者が画像を購入/ダウンロードした際は起票から実施することが求められます。
さらに、適切に運用された衛星データ管理台帳の活用によって、どの衛星データがどのように活用されているか、現状を把握することも重要です。これにより、ビジネス課題解決のための衛星データ活用に際する課題や障壁を洗い出し、衛星データ活用の高度化に向けた次のアクションの検討に繋げることができます。
②衛星データプラットフォームが持つ役割
現在、衛星データ活用促進のため、購入/ダウンロード可能な衛星データを一度に確認でき、各種処理を容易に行える基盤としての衛星データプラットフォームが様々な組織によって運営されています。
以下では日本を代表する衛星データプラットフォームであるTellusを例に、衛星データマネジメントにおいて期待される役割をビジネスサイドの担当者の観点から簡易的に解説します。
Tellusには、分析実行のためのクラウド環境やデータ蓄積のためのストレージを提供するコンピューティングリソース機能があります。
ビジネスサイドの担当者は、この機能を衛星データ管理台帳の活用とあわせることで、特にドキュメントとコンテンツ管理やメタデータ領域からのデータマネジメントに役立たせることができます。
具体的には、購入/ダウンロードした衛星データを、Tellusのコンピューティングリソース上に格納し、衛星データ管理台帳にもその旨を記載することで一元管理できるようになります。また、Tellusではデータの仕様が説明されたデータカタログをいつでも閲覧できるので、購入/ダウンロードした各衛星データの仕様書の格納場所を探したり紛失したりすることで発生するコストも抑えられます。
③今後の議論
衛星データマネジメントを実施する上では、衛星データをどのように管理していくことが社会から求められているか、という視点も欠かせません。
上述した一般的なデータマネジメントに求められる企業の姿勢に加え、本節では衛星データマネジメントにおける現状と今後の議論の余地について、一般のカメラ画像/映像や航空画像を例に紹介します。
一般のカメラ画像/映像においては、個人情報保護法によってその活用に制限が課されています。そのためそれらを適切に活用するためには、原則、個人の特定が不可能であることが重要なポイントです。
一方で、航空画像においては、個人の特定が可能な情報が含まれていないとされるため、個人情報保護法等の規制によってその活用に制限が課されていません。ただし、プライバシー保護(個人が知られたくない私的な情報の保護)等の観点では別途取り扱いに留意する必要があります。
同様に衛星データにおいても、現在直接的にその活用を制限するような規制は存在していませんが、プライバシー保護の観点は欠かせません。衛星データは他データと組み合わせて活用することも多いため、データの組み合わせによって表される情報が個人情報となっていないか、あるいはプライバシーを害さないかを把握しておく必要があります。
衛星データを活用する国内企業は、衛星データに関連する規制の最新動向を常に確認し遵守することで社会からの要請に応えていくことが求められます。
ただし、現状は個人情報保護の観点で衛星データ活用を制限するような規制は存在しないため、より高解像度である航空画像の規制の動向等を参考にしながら、今後の衛星データに関連する規制へ備えることが有効です。
また、個人のプライバシーに抵触するような被写体そのものや被写体の空間情報等についてはモザイク処理やデータ削除等、都度適切な処理を実施しなければなりません。
5. まとめ
①ビジネスサイドからできること
本記事では、ビジネスサイドの担当者から見たデータマネジメントについて解説しました。
データマネジメントの目的は、企業が保有するデータを資産として適切に活用し、ビジネス課題に関する意思決定のスピードや質を高めることです。
データマネジメントを実施するためには、業務の中身やその背景に最も深い理解を持つビジネスサイドの担当者による協力が不可欠であり、衛星データもその例外ではありません。ビジネスサイドの担当者は、社会から衛星データをどのように管理することが求められているかを考慮しながら、台帳形式で衛星データの網羅的な管理を支援する必要があります。
そして、衛星データ管理台帳の活用により衛星データマネジメントが適切に実施されることによって、ビジネス課題の解決を目的とした衛星データ活用のさらなる高度化に向けたアクションが検討可能になるのです。
本記事が前記事に引き続き、皆様が衛星データをビジネス活用する際のヒントとなれば幸いです。