Cloud Service
Amazon Kinesis
ストリーミングデータをリアルタイムに取り込み・処理・配信するサービス群。ログ/クリック/IoTの定番。
中級DEA-C01SAA-C03SAP-C02パフォーマンス効率信頼性コスト最適化
最終更新: 2026-05-31公式ドキュメント ↗
TL;DR要点だけ先に
- 1.絶え間なく流れるログやクリックを届いた端から取り込む川。
- 2.保持期間内なら複数の処理系が各自の位置から読み直せる。
- 3.取り込みはData Streams、S3等への自動配信はFirehose。

解決する課題
- 大量データをリアルタイムに取り込みたい
- 複数の処理系で同じストリームを並行処理したい
- ストリームをS3/Redshift等へ自動ロードしたい
主要概念と用語
- Data Streams: シャードで構成するリアルタイムストリーム
- Data Firehose: S3/Redshift/OpenSearch等へニアリアルタイム配信(マネージド)
- Managed Service for Apache Flink: ストリームのリアルタイム分析
- シャード / パーティションキー / 保持期間
仕様・制限・クォータ
- Data Streamsはシャード単位でスループットが決まる(オンデマンド容量も可)
- 保持期間内はデータを再読み込み可能
- Firehoseはバッファサイズ/間隔で配信
内部の仕組み
Data Streamsはパーティションキーでレコードをシャードに分散し、順序を保って保持します。保持期間内なら複数のコンシューマが各自の位置から読み直せるのが特徴(SQSは取り出すと消える)。Firehoseはシャード管理不要のマネージド配信で、バッファ・変換しつつS3等へ自動ロードします。
Kinesis と SQS
Kinesis=順序付き・再読み込み可能なストリーム(複数コンシューマ)、SQS=取り出すと消えるキュー(1対1)。要件で選ぶ。
設計パターン / ベストプラクティス
- 取り込み=Data Streams、配信=Firehose、分析=Flink
- パーティションキー設計でホットシャード回避
- スループット変動が読めなければオンデマンド容量
- 簡単にS3へ貯めるだけならFirehoseが最小運用
運用・監視・トラブルシュート
- メトリクス:
IncomingRecordsIteratorAgeMilliseconds(遅延)WriteProvisionedThroughputExceeded - スロットルはシャード不足/ホットキーを疑う
- コンシューマ遅延はIteratorAgeで検知
コスト
- Data Streams: シャード時間+PUTペイロード(オンデマンドは取り込み量)
- Firehose: 取り込み量課金。運用は最小
セキュリティ
- 保存時暗号化(KMS)、転送時TLS
- IAMでプロデューサ/コンシューマを制御
Well-Architected の観点
- パフォーマンス効率: リアルタイム取り込み・並行処理
- 信頼性: 保持期間内の再処理・順序保証
- コスト最適化: オンデマンド/Firehoseで運用軽量化
試験で問われるポイント
頻出
- リアルタイム取り込み=Data Streams、自動ロード=Firehose
- Kinesis(再読み込み可・複数コンシューマ)vs SQS(消費で消える)
- ホットシャード回避のキー設計、
IteratorAgeで遅延監視
📝 Kinesis ミニ確認テスト第 1 問 / 全 3 問
大量のストリーミングデータ(ログ/クリック/IoT)をリアルタイムに取り込み処理したい。
関連サービス・比較
| 用途 | サービス | 特徴 |
|---|---|---|
| リアルタイム取り込み | Kinesis Data Streams | 順序/再読込/複数コンシューマ |
| S3等へ配信 | Kinesis Data Firehose | マネージド・最小運用 |
| 疎結合キュー | SQS | 取り出すと消える1対1 |
ハンズオン / CLI例
# オンデマンド容量でストリーム作成 → レコード投入
aws kinesis create-stream --stream-name events \
--stream-mode-details StreamMode=ON_DEMAND
aws kinesis put-record --stream-name events \
--partition-key user-123 --data "$(echo -n '{"click":1}' | base64)"
AWS Service
Amazon Kinesisを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
分析
比較で見る軸
クラウド: AWS / カテゴリ: 分析 / 難易度: intermediate
導入後に効く点
保持期間内なら複数の処理系が各自の位置から読み直せる。
先に潰すリスク
サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。
数字・仕様の読み方
- クラウド
- AWS
- カテゴリ
- 分析
- 難易度
- intermediate
- 関連資格
- DEA-C01 / SAA-C03 / SAP-C02
- 設計柱
- performance / reliability / cost
判断チェックリスト
- 自社の用途が「分析 / performance」に近いか確認する。
- 強みである「絶え間なく流れるログやクリックを届いた端から取り込む川。」が本当に評価軸になるか確認する。
- 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。
他クラウドの同等サービス
役割が近いサービスです。設計の置き換えや比較検討の参考に。