バーンインと信頼性スクリーニング(バスタブ曲線)
なぜ良品でも出荷前に高温通電で「焼く」のかを、初期故障を加速して除くバーンインの原理から押さえられます。バスタブ曲線・FIT率・アレニウス加速・DPPM管理まで一気に分かります。
- 1.故障率は時間に対しバスタブ曲線を描き、初期故障(弱い個体が早期に落ちる減少域)・偶発故障(ランダムで一定の底)・摩耗故障(経年で増える上昇域)の3区間に分かれます。バーンインは初期故障区間を出荷前に消化するスクリーニングです。
- 2.バーンインは高温・高電圧で故障を加速し、アレニウス則 AF=exp((Ea/k)(1/Tu - 1/Ts)) と電圧加速で「使用条件の数千時間」を数十時間に圧縮します。実時間ではなく等価動作時間で弱い個体を顕在化させ除去します。
- 3.偶発故障率は FIT(10億デバイス時間あたりの故障数)で表し、信頼性目標は出荷不良 DPPM(百万個あたり不良数)で管理します。過剰バーンインは良品の摩耗寿命を削るため、コストと寿命を見て最適な温度・時間・条件を選びます。
バーンインとは「弱い個体を出荷前にわざと壊して除く」工程
製造テストにパスしたチップでも、その中には「規格は満たすが内部に潜在欠陥を抱え、使い始めて間もなく壊れる個体」が一定割合まぎれ込みます。バーンイン(burn-in)は、こうした初期故障(early life failure / infant mortality)を起こしそうな弱い個体を、高温・高電圧で通電ストレスをかけて出荷前に顕在化させ、選別して除去する信頼性スクリーニング工程です。
ここで重要なのは、バーンインが対象にするのは製造欠陥に由来する初期故障だという点です。欠陥のない良品でも進む経年劣化(/semiconductor/reliability-physics/ で扱う EM・NBTI・TDDB)とは故障の母集団が違います。歩留まりテスト(/semiconductor/yield-defect-density/)が「今ダメな個体」を弾くのに対し、バーンインは「今は通るが早期に落ちる個体」を時間方向に先回りして弾く、という役割分担になります。
製造テストは「現時点の機能・電気的規格」を見ますが、薄い酸化膜の微小な欠陥、わずかなパーティクル、弱い配線箇所などは規格内に収まったまま潜伏します。これらは定格使用でも数日〜数か月で破壊に至りやすく、客先で「初期不良」として現れます。バーンインは使用初期に起きるはずの故障を出荷前に前倒しで起こさせ、母集団から取り除くことで、客先での初期不良率を桁で下げます。
バスタブ曲線 ── 故障率は時間に対し3区間に分かれる
母集団の**瞬間故障率(ハザード率 λ(t)、まだ生き残っている個体が次の単位時間に壊れる確率)を時間に対してプロットすると、浴槽の断面のようなバスタブ曲線(bathtub curve)**になります。これが信頼性工学の出発点です。
バスタブ曲線(瞬間故障率 λ(t) の時間変化)
λ(t)
│\ /
│ \ 初期故障 摩耗故障 /
│ \(減少) (増加)/
│ \____________________/
│ 偶発故障(一定の底)
└───────────────────────────────→ t
①弱い個体が早期に脱落 ③経年劣化で増加
②ランダム故障で一定
① 初期故障期:λ が時間とともに減少(弱い個体から先に壊れる)
② 偶発故障期:λ がほぼ一定(ランダム要因、ここで FIT を定義)
③ 摩耗故障期:λ が時間とともに増加(EM/NBTI/TDDB など経年)
3区間は故障の物理が異なります。初期故障期は潜在欠陥を持つ個体が先に脱落するため故障率が下がり続けます。偶発故障期は欠陥のない良品が外乱(電気的ストレスやランダムなトラップ生成)でランダムに壊れる領域で、故障率がほぼ一定になります。摩耗故障期は経年劣化が支配し故障率が上昇します。これをワイブル分布で表すと、形状パラメータ m が初期故障で m が 1 未満、偶発故障で m が約 1、摩耗故障で m が 1 超、と各区間に対応します。
バーンインの本質は、バスタブ曲線の左側(初期故障期)を出荷前に時間方向で前進させ、客先には「フラットな底(偶発故障期)」から使い始めてもらうことです。つまり製品の動作開始点をバスタブの底にシフトさせる操作です。やりすぎると右側(摩耗故障期)に食い込み、良品の寿命まで削ってしまうため、左肩だけを削る加減が要になります。
加速モデル ── 数千時間を数十時間に圧縮する
初期故障を実時間で待つと数週間〜数か月かかり非現実的です。そこで高温・高電圧で故障物理を加速し、短時間で等価的に長時間ぶんのストレスを与えます。中心になるのが温度加速のアレニウス則です。
温度の加速係数(アレニウス則)
AF = exp( (Ea/k) · (1/Tu - 1/Ts) )
Ea : 活性化エネルギー(eV、故障機構ごとに異なる)
k : ボルツマン定数(8.617e-5 eV/K)
Tu : 使用温度(K)、Ts : バーンイン温度(K)
含意:
Ts を上げる(Tu より高温)ほど AF が大きくなる
AF=100 なら バーンイン1時間 ≒ 使用条件100時間 相当
電圧依存の機構(TDDB やゲート絶縁膜の初期欠陥)には電圧加速を重ね、定格より高い電圧で導電パス形成を早めます。温度と電圧の加速係数を掛け合わせると、使用条件で数千時間ぶんの初期故障ストレスを、バーンイン炉の数十時間に圧縮できます。実際の手順は、ウェハをパッケージに組んだ後(またはウェハ段階で)バーンインボードに載せ、恒温槽で高温に保ちつつ通電・信号印加し、規定時間後に再テストして脱落した個体を除く、という流れです。
温度や電圧を上げすぎると、使用条件では支配的でない故障機構が顔を出します(高電圧で初期故障を狙ったつもりが TDDB で良品まで壊す、高温で別の拡散律速に移る等)。すると加速領域で見えた Ea で使用条件へ外挿しても、初期故障の選別になりません。バーンイン条件は「使用条件と同じ初期故障物理を、機構を変えずに速めるだけ」の範囲に収める必要があります。これは加速試験全般に共通する大原則です。
FIT 率 ── 偶発故障期の故障率を数値で表す
バスタブの底(偶発故障期)の一定故障率を表す業界標準の単位が**FIT(Failures In Time)**です。定義は明確で、FIT = 10億(1e9)デバイス時間あたりの故障数です。
FIT と MTBF の関係(偶発故障期、λ 一定の前提)
1 FIT = 1 failure / 1e9 device-hours
MTBF(平均故障間隔)= 1 / λ
例: λ = 100 FIT = 100 / 1e9 = 1e-7 /h
MTBF = 1 / 1e-7 = 1e7 時間 ≒ 約1141年/台
複数部品のシステム FIT は(直列なら)各部品の FIT を加算
FIT_system = ΣFIT_i
FIT は加法的なので、システム全体の故障率は構成部品の FIT を足し合わせて見積もれます(直列冗長なし系の場合)。「1台あたり1141年」という数字に違和感を覚えるかもしれませんが、これは多数の台が並んだ母集団で単位時間にどれだけ壊れるかを表すもので、1台が必ずその年数もつ意味ではない点に注意が必要です。FIT が定義できるのはあくまで λ がほぼ一定な偶発故障期で、初期故障期や摩耗故障期では λ が時間変化するため単一の FIT では表せません。
「λ=50 FIT のときの MTBF は?」のような換算は試験でよく出ます。FIT を /時間に直す(50 FIT = 50e-9 /h)→ 逆数を取る(MTBF = 1/50e-9 = 2e7 時間)と機械的に解けます。逆に「MTBF 1e6 時間を FIT に」なら λ=1e-6 /h → 1000 FIT。FIT が「1e9 デバイス時間あたり」である定義さえ覚えていれば全部導けます。
DPPM 管理 ── 出荷品質を百万個あたりで管理する
最終的に品質保証で問われるのは「出荷した製品のうち何個が不良か」です。これを**DPPM(Defective Parts Per Million、百万個あたり不良数)**で管理します。車載グレードでは1桁 DPPM、さらにゼロ DPPM を志向するなど、用途ごとに目標値が決まります。
DPPM と FIT は別物です。DPPM は出荷時点で混入する不良の割合(初期故障や潜在欠陥の取りこぼし)、FIT は使用中の偶発故障率を表します。バーンインは前者(出荷 DPPM)を下げ、設計・プロセスの作り込みは後者(FIT)も含めて改善します。両者を分けて測るのが信頼性管理の基本です。
| 指標 | 何を測るか | 単位/定義 | 下げる主な手段 |
|---|---|---|---|
| DPPM | 出荷品の不良割合 | 百万個あたり不良数 | テスト網羅・バーンイン・欠陥低減 |
| FIT | 偶発故障期の故障率 | 1e9 デバイス時間あたり故障数 | 設計マージン・プロセス品質 |
| MTBF | 平均故障間隔(λ一定前提) | 時間 = 1/λ | FIT 低減(λ を下げる) |
| AF | 加速係数(試験→使用換算) | 無次元(時間比) | (外挿に使う、下げる対象ではない) |
ただしバーンインは万能ではなく、コストとのせめぎ合いです。バーンインボード・恒温槽・テスタ時間は高価で、全数バーンインは1個あたりの製造コストを押し上げます。さらに過剰なバーンインは良品の摩耗寿命を削る(バスタブの底を通り越して右肩へ食い込む)副作用があります。そこで近年は、欠陥モニタや/semiconductor/process-variation-corners/ の評価から故障しやすそうなロット・個体だけを選んでバーンインする(バーンイン・イン・テスト/適応バーンイン)、あるいは設計・プロセスを作り込んで初期故障そのものを減らしバーンインレスを目指す方向が進んでいます。配線初期欠陥に効く EM スクリーニング(/semiconductor/electromigration-beol-limits/ の領域)のように、機構ごとに最適なストレスを選ぶのも実務の勘所です。
まとめ
- バーンインは、製造欠陥に由来する初期故障を起こす弱い個体を高温・高電圧で前倒しに顕在化させ、出荷前に除去する信頼性スクリーニング。歩留まりテスト(今ダメな個体)とも経年劣化(良品の wear-out)とも対象が違う。
- 故障率 λ(t) は時間に対しバスタブ曲線を描き、初期故障(減少・ワイブル m が 1 未満)・偶発故障(一定・m が約 1・FIT を定義)・摩耗故障(増加・m が 1 超)の3区間に分かれる。バーンインは左肩(初期故障期)を削る操作。
- 加速はアレニウス則
AF=exp((Ea/k)(1/Tu - 1/Ts))と電圧加速で行い、使用条件の数千時間ぶんを数十時間に圧縮する。機構を変えない範囲に条件を抑えるのが前提。 - 偶発故障率は FIT(1e9 デバイス時間あたり故障数、
MTBF=1/λ)、出荷品質は DPPM(百万個あたり不良数) で管理する。両者は別の量。 - 過剰バーンインは良品寿命を削りコストも高いため、適応バーンインやバーンインレス設計へ。詳細な経年機構は /semiconductor/reliability-physics/、欠陥とコストは /semiconductor/yield-defect-density/ を参照。
半導体 Article
バーンインと信頼性スクリーニング(バスタブ曲線)を実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
半導体
比較で見る軸
難易度: advanced / カテゴリ: 半導体 / タグ数: 6
導入後に効く点
バーンインは高温・高電圧で故障を加速し、アレニウス則 AF=exp((Ea/k)(1/Tu - 1/Ts)) と電圧加速で「使用条件の数千時間」を数十時間に圧縮します。実時間ではなく等価動作時間で弱い個体を顕在化させ除去します。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- advanced
- カテゴリ
- 半導体
- タグ数
- 6
判断チェックリスト
- 自社の用途が「半導体 / 信頼性」に近いか確認する。
- 強みである「故障率は時間に対しバスタブ曲線を描き、初期故障(弱い個体が早期に落ちる減少域)・偶発故障(ランダムで一定の底)・摩耗故障(経年で増える上昇域)の3区間に分かれます。バーンインは初期故障区間を出荷前に消化するスクリーニングです。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。