データウェアハウスと OLTP / OLAP
日々の業務処理(OLTP)と分析処理(OLAP)の違いを解説します。列指向や ETL/ELT、分析専用のデータウェアハウス(DWH)が担う役割を整理します。
- 1.OLTP は注文・決済などの“日々の細かい更新”、OLAP は“大量データの集計・分析”で、得意な処理が正反対。
- 2.DWH は分析専用の DB。各業務システムのデータを集約し、列指向で大量集計を高速にこなす。
- 3.業務 DB から DWH へデータを移すのが ETL/ELT。先に整えるか、入れてから整えるかの違い。
OLTP と OLAP――目的が正反対
データベースの使い方は、大きく2つの世界に分かれます。
- OLTP(Online Transaction Processing): 注文・決済・在庫更新など、日々の細かい読み書きをさばく業務処理。1件ずつ正確に、速く。
- OLAP(Online Analytical Processing): 「先月の地域別売上は?」のような、大量データの集計・分析。多くの行を一気に読む。
この2つは求められる性質が正反対で、同じDBで両方を最適にこなすのは困難です。だから分析には専用の置き場=データウェアハウスを用意します。
| 観点 | OLTP(業務処理) | OLAP(分析処理) |
|---|---|---|
| 代表的な操作 | 1〜数件の挿入・更新・参照 | 大量行の集計・横断分析 |
| データ単位 | 最新の1件が大事 | 期間・カテゴリでまとめた塊 |
| 速さの基準 | 1リクエストの応答が速い | 大集計が現実的な時間で終わる |
| 扱うデータ量 | 少量を頻繁に | 大量をときどき |
| 例 | ECサイトの注文確定 | 経営ダッシュボードの売上分析 |
データウェアハウス(DWH)とは
データウェアハウス(DWH) は、分析(OLAP)のために最適化された専用のデータベースです。複数の業務システム(販売・会計・Webログなど)のデータを 一か所に集約 し、過去分も含めて横断的に分析できるようにします。
役割を整理すると次のようになります。
- 散らばった業務データを統合し、分析しやすい形に整える。
- 過去データを蓄積し、時系列の比較を可能にする。
- 大量集計に強い構造で、分析クエリを高速化する。
業務 DB を直接分析に使わないのは、重い集計クエリが日々の業務処理の足を引っ張るのを避ける狙いもあります。
なぜ速い?――列指向ストレージ
DWH が大集計に強い理由の一つが 列指向(カラムナ) です。
- 行指向(OLTP 向き): 1行をまとめて保存。「この注文の全項目」を取り出すのが速い。
- 列指向(OLAP 向き): 同じ列の値をまとめて保存。「売上列だけ全行合計」のように 必要な列だけ を読めるので、大集計が速く、圧縮も効きやすい。
「売上を合計する」のに住所や氏名の列まで読む必要はありません。列指向は、その“読まなくていい列を読まない”を徹底できる点が強みです。
列指向は大集計に強い一方、1行の挿入・更新は不得意です(複数の列の保管場所をそれぞれ触る必要があるため)。だから OLTP は行指向、OLAP は列指向、と使い分けます。どちらかが万能なのではなく、処理の性質に合わせて選ぶものです。
ETL と ELT――データの運び方
業務 DB のデータを DWH へ移し、分析できる形に整える処理が ETL / ELT です。3つの工程の順番が違います。
- Extract(抽出): 各業務システムからデータを取り出す。
- Transform(変換): 形式をそろえ、クレンジングや集計をする。
- Load(格納): DWH へ書き込む。
| 方式 | 順番 | 特徴 | 向く場面 |
|---|---|---|---|
| ETL | 抽出 → 変換 → 格納 | 整えてから入れる。DWHに余計な生データを持ち込まない | 変換ルールが固まっている |
| ELT | 抽出 → 格納 → 変換 | まず生のまま入れ、DWHの計算力で後から変換 | 大量データ・クラウドDWH |
近年はクラウド DWH の処理能力が高いため、まず取り込んでから変換する ELT が増えています。生データを残せるので、後から分析方針を変えやすいのも利点です。
DWH のデータは ETL/ELT のバッチで定期的に更新されることが多く、業務 DB の最新状態とは時間差があります。「ダッシュボードの数字が今この瞬間の在庫と一致しない」のは異常ではなく、分析基盤の前提です。リアルタイム性が要る用途は OLTP 側で、傾向把握は DWH で、と役割を分けて考えましょう。
OLTP と OLAP は「日々回す」と「振り返って分析する」という別の仕事です。DWH はその分析側を支える基盤であり、列指向と ETL/ELT がそれを実用的な速度で成り立たせています。
データベース Article
データウェアハウスと OLTP / OLAPを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
データウェアハウス
比較で見る軸
難易度: intermediate / カテゴリ: データベース / タグ数: 4
導入後に効く点
DWH は分析専用の DB。各業務システムのデータを集約し、列指向で大量集計を高速にこなす。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- intermediate
- カテゴリ
- データベース
- タグ数
- 4
判断チェックリスト
- 自社の用途が「データウェアハウス / OLTP」に近いか確認する。
- 強みである「OLTP は注文・決済などの“日々の細かい更新”、OLAP は“大量データの集計・分析”で、得意な処理が正反対。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。