パワースペクトル密度の推定
ノイズや振動の周波数分布を安定して読めるようになります。生ピリオドグラムがなぜ暴れるのか、Welch 法の平均化がばらつきをどう抑えるのかを原理から押さえます。
- 1.ランダム信号のスペクトルは決定論的でなく確率分布を持つ。1回の FFT から作るピリオドグラムは、点数 N をいくら増やしても分散が真値の2乗程度から下がらない、漸近的に不偏だが不一致(inconsistent)な推定量になる。
- 2.Welch 法は信号を重なり付きの区間に分割し、各区間のピリオドグラムを平均する。独立に近い K 個を平均すると分散が約 1/K になり、滑らかで信頼できる推定が得られる。代償は区間が短い分だけ周波数分解能が落ちること。
- 3.各区間に窓を掛けるとスペクトル漏れによるバイアスが減るが分解能は広がる。窓・区間長・重複率の選び方は、バイアス・分散・分解能の三つ巴のトレードオフになる。PSD は本質的に自己相関のフーリエ変換(ウィーナー・ヒンチンの定理)である。
「1回の FFT」ではノイズのスペクトルは測れない
正弦波のような決定論的信号なら、フーリエ変換 を1回掛ければスペクトルが求まります。ところがノイズ・振動・通信路の雑音のような ランダム信号 では話が違います。同じ現象を測り直すたびに波形が変わるため、スペクトルもまた測るたびに変動する 確率的な量 になります。求めたいのは1回の実現値ではなく、その 統計的な期待値 ――どの周波数にどれだけの平均パワーが分布するか――であり、これを表すのが パワースペクトル密度(PSD, Power Spectral Density) です。本稿では、素朴なピリオドグラムがなぜ信用できないのか、Welch 法がそれをどう救うのか、窓と区間長のトレードオフまでを原理から追います。
PSD の単位は「単位周波数あたりのパワー」(例: V^2/Hz)で、ある帯域で積分するとその帯域に含まれる平均パワーになります。全周波数で積分すれば信号の総平均パワー(分散)に一致します。この「密度」という性質が、決定論的信号の振幅スペクトルとの決定的な違いです。
ピリオドグラム:素朴な推定量とその破綻
最も直接的な PSD 推定は、N 点の標本 x[0..N-1] の DFT の大きさの2乗を N で割る ピリオドグラム です。
I(f_k) = (1/N) * |X[k]|^2 = (1/N) * |Σ_{n=0..N-1} x[n] · exp(-j 2π k n / N)|^2
一見すると N を増やすほど正確になりそうですが、ここに落とし穴があります。N を増やすと周波数ビンが増える(分解能は上がる)だけで、各ビンの推定値のばらつきは一向に減りません。統計的には、ピリオドグラムは真の PSD に対して漸近的に 不偏(期待値は正しい)である一方、分散が真値の2乗程度に居座り、N を大きくしても 0 に収束しない――すなわち 不一致(inconsistent)な推定量 です。
ガウス性ランダム信号では、各周波数ビンの X[k] の実部・虚部が独立な正規乱数になり、|X[k]|^2 は自由度2のカイ二乗分布に従います。この分布の標準偏差は平均値そのものに等しく、推定値が真値の 0 倍から約2倍まで平均的に散らばることを意味します。N を増やしても、新たに増えるのは「同じくらい暴れる別のビン」だけで、既存ビンの暴れは鎮まりません。生のピリオドグラムをプロットするとギザギザに激しく振動するのはこのためです。
分散を下げる正攻法はただ一つ、多数の推定を平均することです。カイ二乗分布に従う独立な量を K 個平均すれば、自由度が 2K に増え、相対的なばらつき(変動係数)が約 1/√K に縮みます。ここから2つの実用手法が生まれます。
Bartlett 法と Welch 法:分割して平均する
Bartlett 法 は、長さ N の信号を重なりのない K 個の区間(各長さ L = N/K)に分け、各区間のピリオドグラムを求めて単純平均します。
S_Bartlett(f) = (1/K) * Σ_{i=1..K} I_i(f)
区間どうしが独立に近ければ、平均後の分散は約 1/K になり、スペクトルは滑らかになります。ただし各区間の長さが L = N/K に縮むため、周波数分解能 Δf ≈ fs / L は K 倍だけ粗くなります。分散の低減と分解能は真っ向からトレードオフする、というのが核心です。
Welch 法は Bartlett 法を2点で改良した、実務の事実上の標準です。
- 区間を重ねる(オーバーラップ):隣接区間を 50% 程度重ねることで、同じ全長 N からより多くの区間 K を取り出せ、平均の効果(分散低減)を高めます。
- 各区間に窓を掛ける:矩形打ち切りのままだとスペクトル漏れ が大きいので、ハン窓などで端を減衰させてから FFT します。
1. 信号を長さ L の区間に、重複率 D(例 50%)で分割する
2. 各区間 i に窓 w[n] を掛け、修正ピリオドグラムを計算:
I_i(f) = (1/(L·U)) * |Σ_n x_i[n]·w[n]·exp(-j 2π f n)|^2
(U = (1/L) Σ w[n]^2 は窓のパワー正規化係数)
3. K 個の I_i(f) を平均: S_Welch(f) = (1/K) Σ_i I_i(f)
窓を掛けると信号のエネルギーが窓の形の分だけ目減りします。これを補正しないと PSD の絶対値が系統的に小さく出ます。各区間の2乗和を 窓の2乗平均 U = (1/L)·Σ w[n]^2 で割ることで、PSD が正しいパワー密度(V^2/Hz)としてスケールされ、帯域積分が実際の平均パワーに一致します。ここを外すと相対形状は合っても絶対レベルがずれる、という定番の実装ミスになります。
50% 重複が定番なのは、隣接区間の相関が過大にならず(重ね過ぎると平均する K 個が独立でなくなり分散低減が頭打ち)、かつデータを無駄なく使えるバランス点だからです。ハン窓では 50%、ハミング窓では約 65% 付近が経験的な最適とされます。
| 手法 | 区間の重複 | 窓 | 分散低減 | 分解能 |
|---|---|---|---|---|
| ピリオドグラム | 分割しない | なし(矩形) | なし(暴れる) | 最良 Δf = fs/N |
| Bartlett | 重複なし | なし(矩形) | 約 1/K | 粗い fs/L |
| Welch | あり(50%等) | ハン等 | 1/K より良い | 粗い fs/L |
バイアス・分散・分解能のトレードオフ
スペクトル推定の設計は、三つの量の綱引きに帰着します。分解能(近接周波数を分離できる細かさ)、分散(推定のばらつき)、バイアス(期待値の系統的なズレ)です。
区間長 L を長く取れば分解能 fs/L は細かくなりますが、同じ全長 N からは区間数 K が減るため平均が効かず分散が増えます。逆に L を短くすれば K が増えて分散は下がりますが分解能が粗くなる。分解能と分散は L を挟んで直接対立します。
バイアスには2種類あります。ひとつは ローカル・バイアス――窓のメインローブが有限幅を持つため、鋭いスペクトルピークがなだらかに広がってしまう平滑化効果です。もうひとつは リーケージ・バイアス――窓のサイドローブを通じて、離れた強い成分のパワーが弱い成分の帯域へ漏れ込む効果です。矩形窓はメインローブが細い(ローカル・バイアス小=分解能良好)代わりにサイドローブが高く漏れが大きい。ハンやブラックマンはサイドローブが低く漏れに強い(リーケージ・バイアス小)が、メインローブが太く分解能を犠牲にします。窓関数のトレードオフ はここでも同じ構図で効いてきます。
したがって「良い PSD 推定」は一意に決まらず、目的で決まります。近接する2本の線を分離したいなら L を長く矩形寄りの窓に、微弱な広帯域ノイズの底を安定して測りたいなら L を短く K を増やし低サイドローブ窓に、といった具合です。
自己相関との関係:ウィーナー・ヒンチンの定理
PSD のもう一つの顔が、自己相関関数のフーリエ変換に等しいという ウィーナー・ヒンチンの定理 です。定常ランダム信号の自己相関 r[m] = E{ x[n]·x[n+m] }(ラグ m だけずらした自分自身との相関、E{…} は期待値)を用いて、
S(f) = Σ_{m=-∞..∞} r[m] · exp(-j 2π f m)
が成り立ちます。これは PSD が「信号が自分自身とどれだけ似た周期構造を持つか」を周波数で表したものだ、と解釈できることを意味します。自己相関は LTI システム の解析でも中心的な量で、ラグ 0 の値 r[0] は信号の総平均パワー(分散)に一致し、これは PSD を全周波数で積分した値と等しくなります(パーセバルの関係)。
ウィーナー・ヒンチンを推定に使うのが Blackman–Tukey 法 です。標本から自己相関 r[m] を推定し、ラグ窓(大きなラグほど推定精度が落ちるため、そこを減衰させる窓)を掛けてからフーリエ変換して PSD を得ます。ラグの最大値 M を小さくするほど推定は滑らか(低分散)ですが分解能は粗くなり、ここでもトレードオフは不変です。Welch 法(ピリオドグラム平均)と Blackman–Tukey 法(自己相関経由)は、同じ PSD へ異なる経路で到達する双対的な手法です。
まとめ
パワースペクトル密度の推定は「1回の測定では決して求まらない確率量を、平均で安定に推定する」営みです。要点は、(1) ランダム信号のスペクトルは確率分布を持ち、生のピリオドグラムは不偏だが分散が N で減らない不一致な推定量であること、(2) Bartlett/Welch 法は信号を区間分割してピリオドグラムを平均し、独立に近い K 個で分散を約 1/K に抑える一方、区間が短くなる分だけ分解能を犠牲にすること、(3) Welch 法は 50% 前後の重複と窓掛けで平均効率と漏れ耐性を高め、窓のパワー正規化で絶対レベルを合わせること、(4) 設計はバイアス・分散・分解能の三つ巴で目的依存になること、(5) PSD は本質的に自己相関のフーリエ変換(ウィーナー・ヒンチン)であり、Welch と Blackman–Tukey は同じ量への双対的な経路であること、です。まず標本化 で fs と帯域を正しく確保したうえで、目的に応じて区間長・重複・窓を選べば、ノイズや振動のスペクトルを再現性よく読み解けるようになります。
信号処理・制御 Article
パワースペクトル密度の推定を実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
パワースペクトル密度
比較で見る軸
難易度: advanced / カテゴリ: 信号処理・制御 / タグ数: 6
導入後に効く点
Welch 法は信号を重なり付きの区間に分割し、各区間のピリオドグラムを平均する。独立に近い K 個を平均すると分散が約 1/K になり、滑らかで信頼できる推定が得られる。代償は区間が短い分だけ周波数分解能が落ちること。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- advanced
- カテゴリ
- 信号処理・制御
- タグ数
- 6
判断チェックリスト
- 自社の用途が「パワースペクトル密度 / ピリオドグラム」に近いか確認する。
- 強みである「ランダム信号のスペクトルは決定論的でなく確率分布を持つ。1回の FFT から作るピリオドグラムは、点数 N をいくら増やしても分散が真値の2乗程度から下がらない、漸近的に不偏だが不一致(inconsistent)な推定量になる。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。