TL
ホーム/ HPC・科学技術計算

HPC TRACK

HPC・科学技術計算

MPI・有限要素法・反復法・マルチグリッド・Roofline・エクサスケール… HPCの仕組みを、まず TL;DR でつかみ、そこから数理・原理まで。

18
原理記事
18
TL;DR
TL;DR から、MPI・数値解法・並列計算パターンの原理へ。

Concept Map

原理・深掘り

HPCと科学技術計算の仕組みを、まず TL;DR で要点をつかみ、そこから数理・原理まで。

TL;DR応用

GPUクラスタの相互接続(NVLink・InfiniBand)

GPUを何百枚束ねても性能が伸びない原因は演算ではなく通信にあることが多く、その律速構造をNVLinkとInfiniBandの階層から理解できます。

TL;DR応用

HPCジョブスケジューリング(Slurm)

計算ノードが空くのを待つだけの人と、待ち時間を読んで先回りできる人の差はスケジューラの内部動作を知っているかどうかにある。

TL;DR応用

MPIと集団通信

並列プログラムが遅い原因の大半は通信設計にある。MPIの集団通信アルゴリズムと計算量を押さえれば、ノード数を増やしても性能が伸びない理由が原理から見抜けるようになる。

TL;DR応用

Roofline性能モデル

コードがメモリ律速か演算律速かを見誤ると最適化は空振りします。Rooflineモデルで到達可能性能の天井を事前に見積もれます。

TL;DR応用

エクサスケール計算の課題

電力・信頼性・並列度の壁を理解すると、なぜスパコンが単純な性能競争から脱却したのかが分かります。

TL;DR応用

チェックポイント・リスタート(HPCシミュレーション)

数日〜数週間かかるシミュレーションが障害で全損しなくなる。最適なチェックポイント間隔をMTBFから逆算する式まで押さえます。

TL;DR応用

マルチグリッド法

偏微分方程式の連立一次方程式を解く反復法が格子を細かくするほど遅くなる問題を、複数解像度を往復してO(N)近くまで高速化する原理を解説します。

TL;DR応用

モンテカルロ法(HPC・科学計算)

収束が遅い数値積分でも次元の呪いを回避でき、分散低減と並列乱数設計を押さえれば実用精度に届く理由が分かります。

TL;DR応用

科学シミュレーションの負荷分散

AMRや粒子法で計算量が刻々と偏る問題を、空間充填曲線と動的再分割の原理から理解すると、なぜ性能が突然落ちるのか説明できるようになる。

TL;DR応用

格子ボルツマン法と粒子法

複雑形状の流体解析やメッシュ生成の手間を減らしたい人向けに、格子ボルツマン法とSPH法の内部動作と並列化の勘所を原理から整理します。

TL;DR応用

強スケーリングと弱スケーリング

プロセス数を増やしても速くならない原因を、Amdahlの法則とGustafsonの法則の使い分けで切り分けられるようになります。

TL;DR応用

数値安定性と浮動小数点誤差(HPC文脈)

大規模シミュレーションが「動くのに答えが違う」原因の多くは丸め誤差の蓄積です。原理を押さえれば精度と速度の両取りができます。

TL;DR応用

前処理(プリコンディショニング)

反復法が収束しない・遅い原因は行列の条件数にあり、前処理を選び直すだけで反復回数を桁違いに減らせます。原理から選定基準まで整理。

TL;DR応用

疎行列の格納形式と演算

偏微分方程式や大規模線形代数を密行列のまま扱うと破綻する理由と、CSR/CSC/COOで何がどれだけ削減できるかが分かります。

TL;DR応用

反復法による連立一次方程式の求解(CG・GMRES)

数百万元の連立一次方程式でも、行列を保持せず掛け算だけで解ける理由と、CG・GMRESの使い分け・収束の勘所が分かります。

TL;DR応用

並列FFTアルゴリズム

1兆点規模のフーリエ変換がなぜ通信律速になるのかを、分散転置とall-to-allの原理から解き明かします。

TL;DR応用

有限差分法と有限要素法

偏微分方程式を解く2大数値解法の内部原理を比較し、複雑形状や精度要求に応じてどちらを選ぶべきかが明確になります。

TL;DR応用

領域分割法(並列PDE計算)

偏微分方程式の数値計算がなぜプロセッサ台数を増やしても素直に速くならないのか、通信とアルゴリズムの両面から原理的に理解できる。