TL

負荷テスト

想定する利用量にシステムが耐えられるかを、擬似的な負荷をかけて検証するテストです。負荷・ストレス・スパイク・耐久など種類を使い分け、ボトルネックを事前に見つけます。

中級負荷テスト性能スケーラビリティテスト最終更新: 2026-06-06
TL;DR要点だけ先に
  • 1.負荷テストは、擬似的なトラフィックをかけてシステムが想定負荷に耐えられるかを本番前に検証する手法。
  • 2.目的別に種類がある:通常想定の負荷テスト/限界を探るストレス/急増のスパイク/長時間のソーク(耐久)。
  • 3.見る指標はスループット・レイテンシ・エラー率・リソース使用率。ボトルネックを特定し、容量計画とSLO達成に活かす。

負荷テストとは

負荷テスト(Load Testing) は、システムに擬似的なトラフィックをかけて、想定する利用量に耐えられるかを検証する 性能テストです。本番でユーザーが殺到してから「捌けませんでした」となるのを避けるため、事前に・安全な環境で 限界や弱点を確かめます。

機能テストが「正しく動くか」を見るのに対し、性能テストは「どれだけ・どれだけ速く・どこまで 動くか」を見ます。セールやキャンペーン、メディア露出でアクセスが増える前に、容量が足りるか・どこが先に詰まるかを把握するのが狙いです。

性能テストの種類

「負荷テスト」は広義には性能テスト全般を指し、目的別にいくつかの型があります。かける負荷のパターンが違う のがポイントです。

種類かける負荷何を知りたいか
ロードテスト(狭義)想定される通常〜ピークの負荷平常時に要件(SLO)を満たせるか
ストレステスト限界を超えるまで増やし続けるどこで壊れるか・限界はどこか
スパイクテスト短時間に急増させる急なアクセス増に耐え、回復できるか
ソーク(耐久)テスト中程度の負荷を長時間かけ続ける時間経過で劣化しないか(メモリリーク等)
  • ロードテスト:想定トラフィックを与え、レイテンシやエラー率が許容範囲に収まるかを確認する基本形。
  • ストレステスト:あえて限界突破まで負荷を上げ、破綻点(どこで・どう壊れるか) と、その際の挙動(綺麗に劣化するか、巻き添えで全滅するか)を見る。
  • スパイクテスト:販売開始やテレビ放映のような 瞬間的な急増 を模す。急増に耐えるか、そして 負荷が引いた後に正常へ戻れるか を確認する。
  • ソークテスト:数時間〜数日、負荷をかけ続け、じわじわ悪化する問題(メモリリーク、接続枯渇、ディスク逼迫)を炙り出す。短時間テストでは見えない不具合が出る。
種類を混同しない

「負荷テストをやった」と言っても、通常負荷で確認したのか・限界を探ったのか・急増を試したのか で意味が全く違います。目的(容量は足りる? 限界はどこ? 急増に耐える?)を先に決め、それに合う型を選びましょう。

見るべき指標

負荷テストの価値は、測る指標を正しく選ぶ ことで決まります。代表的なものは次の通りです。

  • スループット:単位時間あたりに処理できた量(例:requests/sec、RPS)。
  • レイテンシ(応答時間):1リクエストの応答にかかる時間。平均だけでなく p95 / p99(パーセンタイル) を見るのが必須。
  • エラー率:失敗した応答の割合。負荷を上げたときに急増する点が限界の目安。
  • リソース使用率:CPU・メモリ・ディスク I/O・ネットワーク・コネクション数。何が先に枯渇するか がボトルネックのヒント。
平均レイテンシは嘘をつく

「平均応答 200ms」でも、一部のユーザーが 5秒待たされていることは珍しくありません。平均は外れ値に鈍感だからです。p95 / p99(95%・99% のユーザーがこの時間以内)で 遅い側の体験 を必ず確認しましょう。SLO(/devops/sre-slo/)もパーセンタイルで定義するのが基本です。

ボトルネックの見つけ方

負荷テストの最終目的は、合否判定そのものより 「どこが先に詰まるか(ボトルネック)」の特定 にあります。負荷を段階的に上げると、たいていどこか1か所が先に限界を迎えます。

  • レイテンシが急に跳ね上がった、エラー率が立ち上がった 負荷量 を押さえる。
  • そのときの リソース指標 を突き合わせる(DB の CPU が張り付いた、コネクションプールが尽きた等)。
  • 観測には オブザーバビリティ の仕組み(メトリクス・分散トレース)が効く。どのサービス・どのクエリが遅いかを切り分けられる。

ボトルネックを1つ潰すと、次のボトルネックが現れます。負荷テストは 一度きりではなく、改善と再計測を繰り返す 営みです。

実施上の注意

  • 本番に近い環境で:構成やデータ量が本番とかけ離れていると、結果は当てになりません。可能な限り本番相当で行います。
  • CI/CD に組み込む:リリースのたびに性能が劣化していないかを自動で検査する(/devops/ci-cd/)と、性能リグレッション を早期に捕まえられます。
  • 負荷生成側がボトルネックにならないように:テストを打つ側のマシンが先に限界だと、対象システムの限界を測れません。
本番への負荷テストは要注意

本番環境に直接大きな負荷をかけると、実ユーザーを巻き込む障害 になりかねません。実施するなら影響範囲を絞り、関係者へ周知し、いつでも止められる体制で。考え方は カオスエンジニアリング の「爆発半径を絞る」に通じます。

まとめ

  • 負荷テストは 擬似トラフィックで想定負荷への耐性を事前検証 する性能テスト。
  • 目的別に ロード/ストレス/スパイク/ソーク を使い分ける(負荷のかけ方が違う)。
  • 指標は スループット・レイテンシ(p95/p99)・エラー率・リソース使用率。平均だけで判断しない。
  • 真の狙いは ボトルネックの特定と改善の反復。本番相当の環境で、CI に組み込むと効果的。

DevOps/インフラ Article

負荷テストを実務で読む

TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。

解決すること

負荷テスト

比較で見る軸

難易度: intermediate / カテゴリ: DevOps/インフラ / タグ数: 4

導入後に効く点

目的別に種類がある:通常想定の負荷テスト/限界を探るストレス/急増のスパイク/長時間のソーク(耐久)。

先に潰すリスク

用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。

数字・仕様の読み方
難易度
intermediate
カテゴリ
DevOps/インフラ
タグ数
4

判断チェックリスト

  • 自社の用途が「負荷テスト / 性能」に近いか確認する。
  • 強みである「負荷テストは、擬似的なトラフィックをかけてシステムが想定負荷に耐えられるかを本番前に検証する手法。」が本当に評価軸になるか確認する。
  • 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
  • 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
  • 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
  • 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。

次に確認する観点

負荷テスト性能スケーラビリティテスト負荷テスト性能スケーラビリティテスト
参考: 公式情報