【用語集】データマート
データマートとは、データの分析や活用に必要なデータのみを格納した小規模なデータベースのことを指します。
本記事ではデータマートとは何か、そして混同しやすいDWHやデータレイクとの違いについて解説していきます。
目次
データマートとは
データマートは、分析に必要なデータのみを格納した小規模なデータベースのことを指します。販売データや在庫データといった特定のジャンルのみを対象としたデータの持ち方をする場合や、部署や部門といったグループごとのデータを持つ場合など、データの持ち方は様々です。
「データマート」という名称は、「倉庫」と「売り場」の対比から来ています。ここで、スーパーマーケットの倉庫と売り場を考えてみましょう。
「倉庫」には膨大な商品在庫がありますが、購入者が容易に入手可能な形ではありませんし、商品も手に取れるように陳列されていません。
これに対して「売り場」には、膨大な商品在庫が展示されているわけではないですが、購入者が必要な商品が1個から容易に入手でき、簡単に手に取れるように陳列されています。
このイメージをデータに置き換えるとわかりやすいです。
「データの倉庫」(大量のデータが格納されているが、その入手や分析にはひと手間かかる)を意味するデータウェアハウス (DWH)と、「データの売り場」(ユーザーが容易に利用可能な形で、細分化されたデータが提供されている)を意味するデータマートは、このような目的の違いがあります。
なおデータマートは、特定の分野や部署、目的ごとに集めて整えられており、データの分析者がすぐに取り出して使えることを目的に使用されます。
DWH、データレイクとデータマートの違い
では、データの観点で「データレイク」「DWH」について、その違いを掘り下げてみましょう。
データレイクは、構造化データに加えて、音声や動画などの非構造化データを格納できるデータベースです。データの加工などはせず、生のデータをそのままの形式で保存できるのが特徴です。データレイクはデータ分析には向かず、データをとりあえず大量に蓄積しておき、利用する際に加工するというのが一般的な使用用途になります。
- 参考記事:【用語集】データレイク
DWHは、多くのデータベースから取得したデータを、ETLがツールを利用して分析可能な形に加工・整形した大規模なデータベースです。DWHの特徴としては、「データが時系列で保存されている」「データの更新・削除を行わない」「サブジェクトごとにデータが保存されている」などがあります。
つまりデータマートは、DWHやデータレイクに蓄積されたデータをさらに閲覧しやすい状態に加工したデータのみを格納する、小規模なデータ分析用データべースであると言えます。
データマートを設けるメリット
データマートには、以下のメリットがあります。
- 情報源の一元管理
- データアクセスの迅速化
- 部門レベルの迅速な意思決定
- シンプルで迅速な実装
それぞれのメリットを解説しましょう。
情報源の一元管理 (Single Source of Truth, SSOT)
各部門で必要なデータがデータマートとして提供されると、組織はユーザーに対して「データマートから提供されるデータのみを利用して分析を行う」という体制が取れるため、各人で個別にデータソースにアクセスする必要がなくなります。
これにより、データ取得の個人差や取得ミスなどが発生しなくなるため、「組織内の全員が、全く同じデータを参照し、これに基づいた議論や意思決定が行える」環境を構築できます。
こうした環境を「Single Source of Truth (SSOT)」(信頼できる唯一の情報源)と呼びます。
データアクセスの迅速化
データマートの提供により、ユーザーは必要なデータに短時間でアクセスできるようになります。このため、ユーザーは「データにアクセスするための工数」を最小化でき、データの分析により時間を割くことができるようになります。
また、ユーザー自身が好きなデータを抽出できるため、IT部門が各データソースからSQLを用いて手動ならびに定期的にデータを提供する必要がありません。その結果、ユーザーとIT部門それぞれの生産性の向上につながります。
部門レベルの迅速な意思決定
データマートは、細分化された単位でのデータ提供ならびにデータ分析が可能です。よって、「小さな組織単位」、例えば「課」や「支店」といったレベルでのデータ分析を容易にします。これは、現場でのデータ活用推進に直結します。
シンプルで迅速な実装
DWHは、広範囲なデータ分析を行うために、企業レベルで構築を行うため、設計や実装に多くの時間や労力を必要とします。一方でデータマートは、より小さな組織単位や分析単位で必要なデータの集合体であるため、実装に必要となる工数は少なく済みます。このため、現場のニーズに合ったデータ提供をより迅速に実施できます。
データマートはデータドリブン組織文化の醸成に貢献
必要なデータのみがすぐに閲覧分析可能な形で提供されているのは、エンドユーザーにとって高い重要度があります。迅速なデータアクセスが可能なため、意思決定をスピーディーに行えるためです。よって正しいデータマートの提供は、データに基づく意思決定ができるため、データドリブンな組織づくりに貢献します。
しかし、データマートの導入には、ETLツールを活用したデータ基盤の統合が欠かせません。必要なデータを準備できておらず、ユーザー自身の閲覧が困難な場合、ツールを使った分析までたどり着かないためです。
そこでおすすめしたいのが、弊社で提供するクラウド型のETLツールの「Reckoner」です。Reckonerはプログラム不要、GUI上で全てを完結できるため、データフローの構築をスムーズに実現できます。さらに、SaaSでの提供となるため、インフラ構築が不要でサーバー等の管理も必要ありません。
現在Reckonerでは無料トライアルを受け付けているため、これからETLツールを活用してデータマートの活用を検討している企業様はぜひご利用ください。
また、ETLツールについて詳しく知りたい、ETLツールの選び方を知りたいという方はこちらの「ETLツールとは?選び方やメリットを解説」をぜひご覧ください。