疎結合な非同期処理とは？AWSでの実装パターン

このパターンは？

重い処理や急増するリクエストを、直接同期呼び出しせずにいったん「間に箱を挟んで」捌く構成。SAA最頻出の「疎結合」設計です。

スパイクをバッファして取りこぼさない
失敗をリトライ／DLQで安全に退避
送信側と処理側を独立にスケール

横にスクロール

SNSはイベントを複数のSQSへ分配し、各処理を独立して再試行します。失敗はDLQへ隔離し、キュー深度でワーカーを増減します。

構成

[フロント/Producer]
   │ イベント発生
   ▼
SNS (同報) ──► 複数の SQS ──► ワーカー(Lambda / ECS) ──► DynamoDB / S3
                    │
                    └─ 失敗 ─► DLQ(退避)

別解: EventBridge (内容ベースのルーティング) ──► 各ターゲット

コンポーネントの役割と使い分け

SQS: バッファ。ワーカーがポーリングし、可視性タイムアウト＋DLQで確実に処理
SNS: 1イベントを複数へ同報（ファンアウト）。SNS → 複数SQSが鉄板
EventBridge: イベントの内容でルーティング、SaaS連携やcronも
ワーカー: Lambda（短時間）/ ECS（長時間・常駐）

SNS + SQS ファンアウト

「複数システムに同報」かつ「各処理を確実に」なら SNS→複数SQS。SNSで配り、各SQSがバッファ＆リトライ＆DLQを担います。

設計の勘所

処理は冪等に（標準SQS/SNSは最低1回配信＝重複し得る）
厳密な順序が要るならFIFO
ワーカーはキューの深さでAuto Scaling
大きいペイロードは S3 に置き、メッセージには参照を入れる

Well-Architected の観点

信頼性: バッファ・リトライ・DLQで取りこぼさない
パフォーマンス効率: 送信/処理を独立スケール
コスト最適化: 必要な時だけ処理、スパイクに過剰投資しない

よくある落とし穴

アンチパターン

同期呼び出しのまま重い処理を実行し、フロントがタイムアウト
冪等性を考えず、重複メッセージで二重課金/二重登録
DLQ未設定で、失敗メッセージが無限リトライ or 消失

選び方の早見表

やりたいこと	選ぶもの
バッファして1対1で処理	SQS
1イベントを複数へ同報	SNS(＋複数SQS)
内容で振り分け/SaaS連携/定期実行	EventBridge
順序付き・再読み込み・ストリーム分析	Kinesis

疎結合な非同期処理

このパターンは？

構成

コンポーネントの役割と使い分け

設計の勘所

Well-Architected の観点

よくある落とし穴

選び方の早見表

疎結合な非同期処理を実務で読む

解決すること

比較で見る軸

導入後に効く点

先に潰すリスク

判断チェックリスト

次に確認する観点

この構成で使うサービス