システム同定
第一原理モデルが立たない対象でも、入出力データから伝達関数を直接推定して制御やシミュレーションに使えます。ARX/ARMAX の構造選択と最小二乗、持続的励振、過適合の見抜き方が原理で腑に落ちます。
- 1.システム同定は入力 u と出力 y の実測データから、対象を再現する数理モデル(多くは離散伝達関数)を推定する手法。物理を組まずに測定だけでモデルを得る点が第一原理モデリングとの決定的な違い。
- 2.ARX は誤差を白色と仮定し予測誤差が回帰係数について線形になるため最小二乗で一発で解ける。有色雑音には ARMAX で雑音多項式 C を足すが、非線形最小二乗(反復)が要る。
- 3.推定が成立する条件が持続的励振で、入力が十分に多くの周波数を含みモデル次数を賄うランクを持つ必要がある。過適合は残差の白色性検定と、別データでの検証(クロスバリデーション)で切り分ける。
物理を組まずにモデルを得る
制御やシミュレーションにはモデルが要りますが、対象の物理を一から立式(第一原理モデリング)できる場面は限られます。反応器の熱物性が未知、モータの機械定数がばらつく、対象が複雑すぎて方程式に落ちない——こうしたとき、入力 u を加えて出力 y を測り、そのデータから対象を再現する数理モデルを逆算するのがシステム同定です。ホワイトボックス(物理式)でもブラックボックス(データのみ)でもなく、測定に基づく点が決定的な違いです。
同定の出力は多くの場合、離散時間の伝達関数か差分方程式です。連続系のラプラス伝達関数ではなくサンプリングされた z 領域の表現を推定するのが実務の主流で、ここはZ変換と離散時間システムの枠組みがそのまま土台になります。この記事では、モデル構造(ARX/ARMAX)、最小二乗推定、励振信号と持続的励振、検証と過適合の見抜き方までを原理から開きます。
モデル構造:ARX と ARMAX
同定はまずモデル構造、すなわち差分方程式の形を決めることから始まります。基本になるのが **ARX(AutoRegressive with eXogenous input)**です。過去の出力(自己回帰 AR)と過去の入力(外部入力 X)で現在の出力を説明します。
ARX: A(q) y[n] = B(q) u[n] + e[n]
A(q) = 1 + a1 q^-1 + ... + a_na q^-na (出力側, na 次)
B(q) = b1 q^-1 + ... + b_nb q^-nb (入力側, nb 次, むだ時間 nk 遅延)
q^-1 : 1サンプル遅延演算子(Z変換の z^-1 に対応)
e[n] : 予測できない残差(雑音)
書き下すと y[n] = -a1 y[n-1] - ... + b1 u[n-1] + ... + e[n] となり、現在の出力が過去の入出力の重み付き和で表されることがわかります。分母 A(q) が極を、分子 B(q) が零点を与える点で、これは帰還構造を持つIIRフィルタとまったく同じ形です。同定とは、この係数 a・b をデータから決める作業に他なりません。
ARX の弱点は雑音の入り方にあります。e[n] が A(q) で割られた形で出力に乗る、つまり雑音が有色(相関を持つ)だと係数推定が偏ります。そこで雑音側にも多項式を与えたのが **ARMAX(AutoRegressive Moving Average with eXogenous input)**です。
| 構造 | モデル式 | 雑音の扱い | 推定 |
|---|---|---|---|
| ARX | A y = B u + e | 白色雑音が A 経由で出力に | 線形最小二乗で一発(凸) |
| ARMAX | A y = B u + C e | 有色雑音を C(q) で整形 | 非線形最小二乗(反復が必要) |
| OE(出力誤差) | y = (B/F) u + e | 雑音は出力に直接加算 | 非線形最小二乗(反復) |
C(q) = 1 + c1 q^-1 + ... を足した ARMAX は雑音の相関を明示的にモデル化でき、係数の偏りを避けられます。代償として推定式が係数について非線形になり、後述の一発解法が使えません。まず ARX で当たりをつけ、残差に相関が残れば ARMAX へが定石です。
最小二乗推定:なぜ ARX は一発で解けるのか
ARX が実務の入口になる最大の理由は、予測誤差が推定パラメータについて線形だからです。パラメータをまとめて θ = [a1 ... a_na, b1 ... b_nb]、過去の入出力を並べた回帰ベクトル φ[n] を次のように置きます。
φ[n] = [ -y[n-1], ..., -y[n-na], u[n-nk], ..., u[n-nk-nb+1] ]ᵀ
1ステップ予測: ŷ[n] = φ[n]ᵀ θ
予測誤差: ε[n] = y[n] - φ[n]ᵀ θ
出力予測 ŷ[n] が θ の線形結合になっているのが要点です。全サンプルの回帰ベクトルを縦に積んだ行列 Φ と出力ベクトル Y を作れば、二乗誤差 Σ ε[n]² を最小化する θ は正規方程式で閉じた形に解けます。
Φᵀ Φ θ = Φᵀ Y
θ̂ = (Φᵀ Φ)^-1 Φᵀ Y (最小二乗解)
これは対象がどんな次数でも凸最適化で一意の最小点に到達する——反復も初期値も局所解の心配も要りません。この解きやすさこそ ARX が同定の標準的な第一手である理由です。
残差 e[n] を平均0・分散一定の独立ガウス雑音と仮定すると、二乗誤差の最小化は最尤推定と一致します。対数尤度が -Σ e[n]² に比例するため、尤度最大=二乗和最小になるからです。最小二乗が「とりあえずの当てはめ」ではなく、白色ガウス雑音の下で統計的に最適な推定だという裏付けがここにあります。逆に雑音が有色ならこの前提が崩れ、ARMAX や重み付き最小二乗が必要になります。
(Φᵀ Φ)^-1 が計算できる、すなわち Φᵀ Φ が正則であることが解の存在条件です。この正則性を実データ側で保証する条件が、次の持続的励振に他なりません。
励振信号と持続的励振
同定は入力が対象を十分に揺さぶって初めて成立します。極端な例として、入力を一定値に保つと出力も定常値に張り付き、どの係数の組でも同じ出力を説明できてしまう——係数が決まりません。数式では Φᵀ Φ がランク落ちして逆行列が存在しない状態です。これを避ける条件が**持続的励振(persistent excitation, PE)**です。
入力 u が「持続的励振の次数 n(order n)」を満たすとは、u の自己相関から作る n×n の行列が正定値(フルランク)になることを指し、実用的には入力パワースペクトルが少なくとも n 本の異なる周波数で非ゼロであることを意味します。パラメータ数 na + nb を推定するには、入力がそれ以上の周波数成分を含んで対象の各モードを励起しなければなりません。周波数成分が足りない入力では、その帯域の挙動がデータに現れず係数が不定になります。
だからこそ同定用の入力は「豊かなスペクトル」を持つよう設計します。代表格が **PRBS(Pseudo-Random Binary Sequence, 疑似ランダム2値信号)**です。2値なのでアクチュエータで正確に再現でき、白色雑音に近い広帯域スペクトルを持ちながら周期的で再現性がある——同定入力の定番です。
同定入力の設計指針:
帯域 : 対象の支配的な時定数・共振を確実に含む周波数まで励起する
振幅 : S/N を確保しつつ非線形域に踏み込まない範囲に収める
種類 : PRBS / マルチサイン / チャープ。単一正弦は PE 次数が低く不可
長さ : 過渡が減衰し十分なサンプル数が貯まるまで印加する
稼働中のプラントを止められず、フィードバック下でデータを取ると難しさが増します。制御器が u を y の関数として決めるため入力と雑音に相関が生まれ、素朴な最小二乗が偏るのです。既存の制御がPID制御で回っている現場での再同定はまさにこれに当たります。外部から既知のテスト信号(設定値やアクチュエータへの摂動)を注入して励振を確保する、あるいは閉ループ専用の手法を使うのが対策です。
検証と過適合:残差を疑う
係数が求まっても、それが対象を正しく捉えたかは別問題です。ここで過適合(overfitting)——モデルがデータの雑音まで暗記し、次数を上げるほど当てはまりは良く見えるのに未知データで外す——を切り分ける必要があります。判断は残差 ε[n] を疑うことから始めます。
第一の検定が残差の白色性です。モデルが対象の説明可能な成分を汲み尽くしていれば、残差は白色雑音(自己相関なし)になるはずです。残差の自己相関にピークが残る、あるいは残差と過去入力に相関があるなら、まだモデル化できる構造が残っている=モデルが不十分(次数不足や構造の誤り)だと判断します。
| 残差の状態 | 示すこと | 対応 |
|---|---|---|
| 白色(自己相関なし) | 説明可能な成分を汲み尽くした | モデル妥当。次数はこれで十分 |
| 自己相関にピーク | 未モデル化ダイナミクスが残存 | 次数を上げる/ARMAX へ |
| 入力と相関 | 入力の効果を取り切れていない | B の次数・むだ時間 nk を見直す |
第二の、そして過適合を最も直接に暴くのが別データでの検証です。同定に使ったデータへの当てはまりは次数を上げれば単調に良くなるため、当てはまり度だけでは過適合を検出できません。そこでデータを推定用と検証用に分け、推定に使っていないデータで予測誤差を評価します(クロスバリデーション)。次数を上げていくと、検証データの誤差はある次数で底を打ち、そこを超えると逆に悪化に転じます。この底が適切なモデル次数です。
別データを取らずに次数を選ぶ指標が AIC / BIC などの情報量規準です。いずれも「残差の二乗和(当てはまりの悪さ)+パラメータ数のペナルティ」の形をとり、当てはまり向上とモデルの複雑化を天秤にかけます。次数を上げれば残差項は減るがペナルティ項が増えるため、規準を最小にする次数が「無駄に複雑でない範囲で最も説明する」モデルになります。BIC はサンプル数に応じてペナルティが重く、より簡素なモデルを選ぶ傾向があります。
状態空間モデルとの接続
差分方程式(伝達関数)だけでなく、状態空間モデルを直接同定する道もあります。入出力データから状態遷移行列などを一括推定する部分空間同定(subspace identification, N4SID など)で、多入力多出力(MIMO)系を次数を明示せず扱いやすいのが強みです。得られる A, B, C, D の枠組みと、可制御性・可観測性・オブザーバ設計へのつながりは状態空間表現と現代制御がそのまま受け皿になります。物理的な意味を一部だけ組み込み、残りをデータで埋めるグレーボックス同定も、既知の構造を状態空間に固定してパラメータだけ推定する形で実装されます。
- ARX と ARMAX:ARX は
A y = B u + e(白色雑音前提)で予測誤差が線形→最小二乗で一発。ARMAX は雑音多項式Cを足し有色雑音に対応するが非線形最小二乗。 - 最小二乗解:
θ̂ = (Φᵀ Φ)^-1 Φᵀ Y。白色ガウス雑音下では最尤推定と一致。Φᵀ Φの正則性が解の存在条件。 - 持続的励振:次数 n のモデルには PE 次数 n(入力が n 本以上の周波数を含む)が必要。単一正弦は不可、PRBS が定番。定値入力はランク落ちで推定不能。
- 検証:残差の白色性検定(自己相関が残れば次数不足)と、別データでのクロスバリデーション(検証誤差が底を打つ次数が最適)で過適合を切り分ける。AIC/BIC も次数選択の指標。
まとめ
システム同定は、物理を組まずに入出力データから対象のモデルを逆算する手法です。要点は、(1) まず ARX でモデル構造を決めると予測誤差が係数について線形になり最小二乗で一意に解ける(白色ガウス雑音下では最尤に一致)こと、(2) 雑音が有色なら雑音多項式 C を加えた ARMAX へ進むが非線形最小二乗が要ること、(3) 推定の成立には持続的励振が不可欠で、モデル次数を賄う周波数成分を持つ PRBS などで対象を十分に揺さぶること、(4) 過適合は残差の白色性と別データでのクロスバリデーションで見抜き、検証誤差が底を打つ次数を選ぶこと。この「構造を決めて最小二乗で解き、励振を確保し、残差で疑う」という流れを押さえれば、伝達関数から状態空間まで、データ駆動のモデリングを同じ骨格で見通せるようになります。
信号処理・制御 Article
システム同定を実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
システム同定
比較で見る軸
難易度: advanced / カテゴリ: 信号処理・制御 / タグ数: 6
導入後に効く点
ARX は誤差を白色と仮定し予測誤差が回帰係数について線形になるため最小二乗で一発で解ける。有色雑音には ARMAX で雑音多項式 C を足すが、非線形最小二乗(反復)が要る。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- advanced
- カテゴリ
- 信号処理・制御
- タグ数
- 6
判断チェックリスト
- 自社の用途が「システム同定 / ARX」に近いか確認する。
- 強みである「システム同定は入力 u と出力 y の実測データから、対象を再現する数理モデル(多くは離散伝達関数)を推定する手法。物理を組まずに測定だけでモデルを得る点が第一原理モデリングとの決定的な違い。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。