ダークシリコンとヘテロジニアスコア ─ big.LITTLEと専用化の設計判断

なぜチップ全体を同時に光らせられないのか

微細化が進めば、同じ面積に置けるトランジスタ数は世代ごとに増え続けます。問題は、それを駆動する電力予算が同じようには増えないことです。チップが冷却できる範囲で消費できる電力（TDP）は熱的にほぼ頭打ちで、世代が進んでもさほど上がりません。トランジスタは増えるのに動かせる電力は増えない――この差が広がった結果、定格電圧・定格周波数ではチップ上の全トランジスタを同時に駆動できない領域が常時生じます。この常時オフにせざるを得ないシリコンをダークシリコンと呼びます。

根本原因はDennardスケーリングの終焉です。Dennard則が生きていた時代は、寸法を係数 k で縮小するのに合わせて電圧も下げられたため、面積あたりの電力密度（電力密度＝容量 × 電圧の二乗 × 周波数 × 活動率 ÷ 面積）が一定に保たれました。ところが2000年代半ば、しきい値電圧とそれに伴うサブスレッショルドリーク電流の制約で電源電圧をこれ以上下げられなくなりました。微細化でトランジスタ数（密度）は増えるのに1個あたりの電力が比例して下がらないため、同じ面積に詰め込んだトランジスタを全部オンにすると電力密度が予算を超えてしまうのです。

ダークシリコンの量的な見立て

電力予算が一定で、世代ごとにトランジスタ密度が S 倍に増えるのに対し1個あたり電力が S 倍より緩くしか下がらないと、同時に駆動できる面積割合は世代ごとに縮みます。研究上はプロセス世代を重ねるごとに、定格で同時駆動できるのはチップの一部に留まり、残りの大部分を暗くせざるを得ないと見積もられました。つまりダークシリコンは設計ミスではなく、物理から導かれる制約条件です。設計はこの制約をどう「活用」するかの勝負になりました。

暗いシリコンの使い道 ─ 4つの方向

全部を同時に光らせられないなら、増えたトランジスタを何に使うか。大きく4つの方向があり、現代のSoCはこれらを組み合わせています。

方向	暗いシリコンの使い方	狙い	代償
並べて暗く (dim)	多コアを並べ電圧/周波数を下げて広く薄く動かす	並列度で性能を稼ぐ	並列化できない処理に効かない
使い分け (het)	速いコアと省電力コアを混載し負荷で切替	電力対性能比を最適点に寄せる	スケジューラとソフトの複雑化
専用化 (spec)	アクセラレータを多数置き必要なものだけ点灯	汎用比で桁違いの電力効率	汎用性を失い面積を食う
近しきい値	電圧をしきい値近くまで下げて極省電力で動かす	1演算あたりエネルギー最小化	遅延増大とばらつき悪化

「並べて暗く」は、コアを増やしつつ電圧と周波数を下げ、広い面積を低い電力密度で薄く動かす方針です。ただしアムダール則的な並列化の限界があり、逐次部分が残る処理では頭打ちになります。残る3つ――ヘテロジニアス化、専用化、近しきい値動作――が、ダークシリコン時代の設計判断の中心です。

ヘテロジニアスコア ─ big.LITTLEとP+Eコア

すべてのコアを同じ性能で作る必要はありません。ヘテロジニアスマルチコアは、電力対性能比の異なるコアを同一チップに混載します。Armのbig.LITTLEが代表で、高性能だが電力を食う big コアと、性能は低いが極めて省電力な LITTLE コアを組み合わせ、負荷に応じて使い分けます。AppleのPコア/Eコア、Intelのパフォーマンスコア/エフィシェントコアも同じ思想です。

要点は、コアの電力対性能比が単調でないことにあります。高性能コアは深いアウトオブオーダ実行や広い発行幅を持ち、低負荷時でも最低限のリーク電力と制御オーバーヘッドを消費します。軽い処理にこれを使うのは電力の無駄で、同じ仕事を小さなインオーダ的コアに任せた方が、消費エネルギー（電力 × 時間）が小さくなります。負荷の性質ごとに最適なコアへ仕事を割り当てれば、平均の電力対性能比を最適点に寄せられます。

項目	高性能コア (big/P)	高効率コア (LITTLE/E)
実行方式	深いアウトオブオーダ・広い発行幅	浅いパイプライン・狭い発行幅
得意領域	逐次性能・低レイテンシ要求	バックグラウンド・低負荷の多数並列
1演算エネルギー	大きい	小さい
面積/コア	大きい	小さい

統合方式には段階があります。初期のクラスタ切替はbigクラスタかLITTLEクラスタのどちらか一方だけを使い、移行時に状態を引き継ぎます。次の**インカーネルスイッチ（CPUマイグレーション）は1つのbigと1つのLITTLEを対にして仮想的に1コアと見せます。最終形のグローバルタスクスケジューリング（HMP）**では全コアをOSスケジューラに見せ、各スレッドの負荷を見て最適なコアへ動的に配置します。

ヘテロジニアスがソフトに突きつける難題

コアの性能が一様でないと、スケジューラは「どのスレッドをどのコアに置くか」を間違えると性能も電力も悪化させます。前面のインタラクティブなスレッドをEコアに置けば体感が落ち、軽いバックグラウンド処理をPコアに置けば電力を浪費します。さらにbigとLITTLEで対応する命令セットや機能（特定の拡張命令やキャッシュ構成）が食い違うと、スレッドのコア間移動が破綻します。ヘテロジニアス化のコストの大半は、このソフトウェア側のスケジューリングと一貫性の確保に乗ります。

専用化 ─ アクセラレータという最も暗い使い方

ダークシリコンを最も積極的に活かすのが**専用化（specialization）**です。どうせ全部を同時に光らせられないなら、特定処理に特化したアクセラレータを大量に並べ、必要なものだけを点灯させる。使っていないアクセラレータは暗いままでよく、ダークシリコンの前提と完全に整合します。

専用化が効くのは、汎用コアの電力の多くが演算そのもの以外――命令フェッチ、デコード、リネーム、分岐予測、レジスタアクセス、データ移動――に消えるからです。固定機能のアクセラレータはこの間接費をほぼ削り、データを演算器の間で直接流すデータパスを作れます。結果として、たとえばテンソルコアによる行列積やシストリックアレイは、同じ計算を汎用コアで回すより1演算あたりのエネルギーが桁違いに小さくなります。動画コーデック、暗号、信号処理、ニューラルネット推論が代表的な専用化の対象です。

トレードオフは明確です。専用回路は対象処理にしか使えず、面積を恒久的に占有します。汎用性とのバランスを取るのがFPGAなどの再構成可能アーキテクチャで、配線を書き換えて用途を変えられる代わりに、同じ機能を固定ASIC化した場合より電力・速度で劣ります。

近しきい値動作 ─ 電圧を下げ切る賭け

もう一つの軸が電圧です。動的電力は電圧の二乗に比例するため、電源電圧を下げれば1演算あたりのエネルギーは大きく下がります。これを極端に推し進め、電源電圧をトランジスタのしきい値電圧のすぐ近くまで下げて動かすのが**近しきい値動作（near-threshold computing）**です。1演算あたりエネルギーが最小になる電圧（最小エネルギー点）はしきい値より少し上にあり、ここで動かすと汎用の定格動作よりエネルギー効率が大きく改善します。

ただし代償が重い。しきい値近傍では、

遅延が急増する：駆動電流が小さくなり回路が遅くなる。周波数を大きく落とす必要がある。
ばらつきが悪化する：製造ばらつきによるしきい値のずれが、駆動電流の差として何倍にも増幅され、最も遅いトランジスタが全体の周波数を縛る。
リークの相対比が上がる：動作電流が小さい分、リーク電流の占める割合が増え、待機が長いと得が消える。

このため近しきい値は単独では使われず、遅くなった分を並列幅で取り戻す設計と組で使われます。多数のコアやレーンを低電圧で並列に回せば、暗かったシリコンを低い電力密度で薄く点灯させながら、スループットを保てます。ダークシリコンの「並べて暗く」の方向と近しきい値は、こうして表裏で噛み合います。

3つの軸はどれか一つではない

ヘテロジニアス化（電力対性能比の異なるコア）、専用化（必要時だけ点灯するアクセラレータ）、近しきい値（電圧を下げ切る）は排他ではありません。現代のSoCはP/Eコアを混載しつつ、GPU・NPU・ISP・コーデックなどの専用ブロックを多数並べ、それぞれを必要時だけ点灯させ、各ブロック内で電圧/周波数を負荷に合わせて調整します。共通する原理は一つ――限られた電力予算を、その瞬間に最も価値の高い処理へ振り向け、残りは暗いままにする、です。

試験のポイント

「ダークシリコンはDennardスケーリング終焉により電力予算が一定なまま密度だけ増えた結果、全トランジスタを定格で同時駆動できない領域が生じる現象」「電力密度は容量・電圧二乗・周波数・活動率に比例し、電圧を下げ切れなくなったのが終焉の原因」「big.LITTLE/P+Eは電力対性能比の異なるコアを負荷で使い分けるヘテロジニアス化」「専用アクセラレータは汎用コアの命令処理間接費を削り桁違いの電力効率を得る代わりに汎用性を失う」「近しきい値は1演算エネルギーを下げるが遅延とばらつきが増える」が頻出です。

まとめ

ダークシリコンは、Dennardスケーリング終焉で電力予算が一定なままトランジスタ密度だけが増えた結果、定格で全トランジスタを同時駆動できなくなった物理的制約である。
対処の軸は、多コアを低電圧で薄く動かす「並べて暗く」、電力対性能比の異なるコアを使い分けるヘテロジニアス化（big.LITTLE／P+Eコア）、必要時だけ点灯する専用アクセラレータ、電圧を下げ切る近しきい値動作の4つ。
ヘテロジニアス化の主コストはスケジューラとソフトウェア側にあり、専用化は汎用性と面積を代償に桁違いの電力効率を得る。
近しきい値は1演算エネルギーを最小化する一方で遅延とばらつきを悪化させ、並列幅で補う設計と組で使われる。共通原理は、限られた電力を最も価値ある処理へ振り向け、残りは暗く保つことにある。

ダークシリコンとヘテロジニアスコア ─ big.LITTLEと専用化の設計判断

なぜチップ全体を同時に光らせられないのか

暗いシリコンの使い道 ─ 4つの方向

ヘテロジニアスコア ─ big.LITTLEとP+Eコア

専用化 ─ アクセラレータという最も暗い使い方

近しきい値動作 ─ 電圧を下げ切る賭け

まとめ

ダークシリコンとヘテロジニアスコア ─ big.LITTLEと専用化の設計判断を実務で読む

解決すること

比較で見る軸

導入後に効く点

先に潰すリスク

判断チェックリスト

次に確認する観点