組織におけるデータ戦略(1): はじめに把握すべき4つのポイント
組織におけるデータを全体的に最適化するための方法論である「DataOps」を進める上では、データ戦略の構築が重要となります。以下では、4つのポイントに絞ってご紹介します。
(参考元: Atwal, Harvinder “Chapter 2. 2. Data Strategy.” In Practical DataOps: Delivering Agile Data Science at Scale, edited by Atwal, Harvinder. Isleworth, UK: APRESS, 2020.)
目次
- データ戦略の4つのポイント (1) データの重要性が増大
- データ戦略の4つのポイント (2) データライフサイクルを改善する
- データ戦略の4つのポイント (3) タイムスパン
- データ戦略の4つのポイント (4) スポンサーシップ
- まとめ
データ戦略の4つのポイント (1) データの重要性が増大
多くの企業では、「IT戦略」として、複数年のシステム投資、人材投資、リプレース対象となるシステムなどが共有されるとともに、「組織におけるITはどうあるべきか」「特に重要なシステムはどのような方向性で対応するか」「予算の大きなトレンドとその使い道」などが議論されます。
しかし、各業務システムを支えるデータに関しては、「戦略」と呼ばれるような方向性が示されることはほとんどありません。つまり、IT戦略の一部として、データ戦略が盛り込まれることはほとんどないといえます。
Harvard Business Review Analytic Servicesが公表している『マルチクラウド環境におけるより良いエンタープライズデータ戦略を実現するための重要な成功要因』というレポートでは、全世界の185社を対象に、「企業はデータ戦略を持っているか?もしないなら、何が阻害しているか?」というアンケートを実施しました。
その結果、回答の69%が、今後3年間の戦略目標を達成するために、自分の組織には包括的なデータ戦略が必要だと答えているにもかかわらず、組織のデータ分析とデータ管理能力が目標達成に向けて進んでいると答えたのは35%に過ぎないことがわかりました。
IDCが作成した調査レポート『データを再考する』によると、データ戦略を成功させるためには「データの生成者と、データ利用者をつなぐ手法であるDataOpsを組み込む必要がある」と考察しています。しかし、企業全体でDataOpsを導入できていると回答した企業は平均でわずか10%と、データ戦略への取り組みは不十分であると報告しています。
組織は、データ領域に限定した戦略を明確に打ち出し、DataOpsの体制を整えることで、データ連携、データ統合、データ品質の向上、データ分析、データの効率的な管理について、正しい方向性に進むことが可能となります。
- 参考記事:データ移行の戦略とベストプラクティス
データ戦略の4つのポイント (2) データライフサイクルを改善する
データライフサイクルとは、データの誕生(データの取得または生成)からデータの死(アーカイブおよび削除)に至るまで、データの単位が通過する段階を指します。
データ戦略を構築する上では、データライフサイクルを改善する必要があります。単にデータがデータライフサイクルに従って、収集、保存、プロセス、使用、使用終了(または削除)という手順を示すだけではなく、現状のデータライフサイクルにはどのような問題があり、どうすれば改善できるか(将来のデータライフサイクルはどうあるべきか)を戦略に含む必要があります。
データの利用や管理に関する教育サービスを展開しているDataversityによると、データ戦略をデータライフサイクル全体に渡って適用する方法として、以下5点を挙げています。
- データ戦略を通じてデータ文化を構築:最高データ責任者(CDO)を採用
- データ活動の測定とテスト、およびKPIの設定
- 強力なデータ基盤のサポート
- DataOpsのような相互運用性の重視
- 利用事例を通じたデータライフサイクルとの整合
データ戦略の4つのポイント (3) タイムスパン
データ戦略は継続的なアプローチですが、期限を設定して取り組むべきです。理想的には2年から5年程度に設定することで、「戦略が短すぎて、短期的な目標に集中しすぎてしまう」リスクや、「戦略が長すぎて、未来予測が不確実になり、途中で目標が変更された結果、労力やリソースの多くが無駄になる」リスクを回避できます。
中朝的なデータ戦略を確実に進めるためには、定期的な測定とレビューが必要です。レビューは、組織が目標を実現する方法を変えたり、優先順位を変えたり、あるいは完全に別の方向に軸足を移す機会にもなります。
データ戦略の4つのポイント (4) スポンサーシップ
データ戦略とは、データリソースを組織のミッションを達成するための成果に変える、非常に効率的なプロセスにつながる組織全体の目標の集合体です。
データ戦略を構築、実施していく上で、CIO (最高情報責任者)やCDO (最高データ責任者)といった、IT部門におけるトップ層にその必要性を認識してもらい、支援してもらう(スポンサーシップを得る)ことが必要です。
CIOやCDOなどとの定期的なレビューを設定し、フィードバックをもらい、それを日々の活動に活かすことで、信頼を得ることが重要です。
同様に、データのユーザーであるビジネス部門からのスポンサーシップも有効です。日々データを利用するビジネスユーザーと関わることで、データ戦略とその進捗について共有するだけでなく、ビジネス現場の情報を収集したり、必要なタイミングでビジネス部門からの支援が得られます。
- 参考記事:DataOpsチームを作る
まとめ
データ戦略の4つのポイントとして、データの重要性の理解、データライフサイクルの改善、データ戦略の適切な期間の設定、支援者(スポンサーシップ)を持つことについて記載しました。ここでも、DataOpsのようなデータの利用者とデータの提供者との間のやりとりを円滑にする手法が重要であることがわかります。
DataOps/クラウド型ETLサービスであるReckoner は、ユーザーにとって利用しやすいインターフェースおよび信頼度の高いインフラ環境において、データエンジニアリング/ETLチームメンバーからエンドユーザーまで活用が可能なETLツールを提供しており、データ戦略の実行を支援するためのツールです。
また、ETLツールについて詳しく知りたい、ETLツールの選び方を知りたいという方はこちらの「ETLツールとは?選び方やメリットを解説」をぜひご覧ください。
関連記事
関連記事はありません。