【特集】

デュアルコア大研究 - アーキテクチャから消費電力まで

1 各社デュアルコアプロセッサ、今回はまとめて総合比較

 
  • <<
  • <

1/10

今年第2四半期、AMDとIntelは共にデュアルコアプロセッサを争うように出荷開始した。時期的にいえば微妙にIntelが先んじており、まずデュアルコアのPentium Extreme Edition 840(以下Pentium XE 840)を発表、次いでPentium D 820~840を出荷開始した。AMDはまずデュアルコア Opteronの出荷開始を発表、次いでAthlon 64 X2の発表と出荷をやはり開始した。リテール品が市場に出回った時期で比較すればIntelの方が多少早く、かつ数量も潤沢だったのに対し、AMDは最初のロットの数量はかなり限られており、モデルによっては今のところ「買いたくても買えない」状況が見られるが、これは両者の生産能力がそのまま反映されてしまうから、AMDが辛いのは仕方ないことであり、さらに言えば今に始まった話でもない。ただそうした状況はどうあれ、両社共にデュアルコア製品の出荷を開始したのは間違いない事実であり、MYCOM PC WEBでもその性能を断片的ながらレポートしている。

ただこれまでのレポートは、いずれも環境が微妙に違うという状況のため、横一列に並べて比較ができないものだったから、読者の方々にとっても分かりにくかったであろうと想像される。そんなわけで今回は、あらためてデュアルコアの特徴をまとめてご紹介すると共に、両者のシングルコア・デュアルコア製品を一気に並べて比較を行ってみたいと思う。

そもそもデュアルコアが導入された動機

さて、最初はここから話をすることにしたい。まずはAMDサイドの話だ。AMDはかなり早い時期から、K8アーキテクチャでデュアルコアを投入する事を考えていた。 K8のアーキテクチャが初めて発表された時、SRQ(System Request Queue)やAPICはすでに2コア分が用意されており、コアを1つ追加するだけで簡単にデュアルコアが実現できる構成になっていたからだ(Photo01)。ではなぜこれまで実装しなかったかというと、それはダイサイズと消費電力の問題があったからだ。デュアルコアの場合、単純にダイサイズが倍になってしまうから、130nm SOIで製造されているAthlon 64やOpteronのままでデュアルコアを作ると、ダイサイズは400平方mm近くなってしまう(SledgeHammerベースのOpteronのダイサイズは193平方mm)。これは8inchウェハーしか持たないAMDにとってはあまりに巨大すぎるダイサイズであって、そうでなくても130nm SOIプロセスのYieldが上がらずに苦しんだAMDにとって、製造は至難の業であろう。またこの130nm SOI世代のプロセッサのTDPは、最大TDPで89Wだったから、倍ということは180W近いTDPになってしまう。これはさすがに消費電力が大きすぎである。

Photo01:MPF2001でFred Weber氏(AMD CTO)が初めてHammerアーキテクチャを発表した時のプレゼンテーションより。SRQからCPU0とCPU1、2つのCPUへのリンクが用意されていることが分かる。

その後、D0 Steppingと呼ばれる90nm SOI第1世代のプロセッサが登場する。Winchesterというコード名の方が適切かもしれないが、このプロセッサではダイサイズが83平方mmまで縮小され(ただしL2キャッシュは512KB)、これならデュアルコアにしてもサイズは200平方mm以下になるから許容範囲と言える。ただし消費電力の方は、このWinchester世代で67Wだから、デュアルコアだと130W強となり、無理すれば作れなくもないが、現実問題としてはちょっと辛いことになる。Athlon 64やOpteronの場合、ソケットに供給できる最大電力は110Wとして定義されていたから、シングルコアで55W以下に抑えないと辛いことになる。Winchester世代の場合、CnQを使って2GHz動作に抑えるとTDPは56Wになるので、この仕組みを使って2GHz動作にすればこのD0 Steppingでもデュアルコアが作れる計算になるが、AMDは敢えてもう一世代見送ったようだ。これに続くE Stepping、つまりAthenes / Troy / Egypt / San Diego / Venice で初めてデュアルコアがインプリメントされる事になった。実はこの世代に関しては、未だに詳細なSpecificationが公開されていない。2.8GHz動作のAthlon 64 FX-57については最大104Wという数字が示されているが、これは動作周波数の高い製品だからちょっと参考にならない。本企画のかなり後ろの方で実際に測定した結果も示しているが、このTDPの値自体が相当大きなマージンを持っている感じで、実際の消費電力はかなり低そうである。実際、このE Steppingを使った2.4GHz駆動のデュアルコアが110WのTDPということは、シングルコアの2.4GHzのTDPは55W前後と考えてもそう間違いではない(*1)。ここまで消費電力が下がったからこそ、現実的な性能を持つデュアルコア製品がリリースできた、と考えるべきであろう。

(*1) シングルコア = CPU + L2 Cache + SRQ + XBAR + MCT + DCT
デュアルコア = CPU * 2 + L2 Cache * 2 + SRQ + XBAR + MCT + DCT

となり、SRQ以下のブロックはSingle/Dual共に1個づつだから、厳密にはDualで110W、Singleで60Wとかになってもおかしくはないのだが、SRQ以下がそれほど大きな消費電力になるとも思えないので、全部あわせても5W程度であろう。そう考えれば、Dualで110WならばSingleでは57.5W程度ではなかろうか?

ただ、ここまでの議論では「なぜデュアルコアか」という答えにはなっていない。改めてこの問いに答えると、「これ以上の急速な性能向上には、デュアルコア化が必須だから」ということになる。おなじみのCPU性能を示す計算式は

性能=IPC×動作周波数

ということになるが、IPCに関してはK8アーキテクチャは既に十分高い。以前筆者がレポートした「Geode NX 1500を試す - 低消費電力プラットフォーム徹底比較」の中で、例えばSandra 2005の結果を見比べていただきたいのだが、1GHz動作のAthlon 64(Winchester)とC3 1GHzとEfficeon 1GHzとGeode NX 1500+(1GHz)、Pentium 4 1.4GHz(Prescott)とPentium M 1GHz(Dothan)の数字をちょっと抜き出すと表1の様になっている。Pentium 4のみ1GHz駆動が不可能だったので1.4GHz駆動での結果だが、他は全て1GHz駆動の結果である。Dhrystone/Whetstoneだから、メモリバスの速度の影響もあまり受けにくく、純粋にコア&L2キャッシュの性能で決まる数字だ。これを見ると判るとおり、Athlon 64はALUやFPUの速度では文句なく最高速で、IPCに関しては非常に高いレベルに居る事が判る。となると、これを急速に上げるのは非常に難しい。K7/K8アーキテクチャは、x86命令換算で3命令/Clockを狙った構成になっており、現状はこれに非常に近い。では、実行ユニットを増やせば単純に4命令/Clockが狙えるかといえばそういう簡単なものではない。デコード段の構成を見直す必要がある(場合によっては方法論まで見直す必要がある)だろうし、それで単純に4命令/Clockを狙えるかどうかは微妙である。むしろEfficeonのようなVLIW系のアプローチの方が良いかもしれない。そこまでやっても性能が大して上がらなかったりすると、今度はPower efficiencyが猛烈に悪化するわけで、そのあたりの損得も考える必要がある。

表1

Dhrystone ALU
(MIPS)
Dhrystone FPU
(MFLOPS)
Dhrystone SSE2
(MFLOPS)
Athlon 64 1GHz 4539 1623 1466
C3 1GHz 1576 304 N/A
Efficeon 1GHz 3179 900 900
Geode NX 1500+ 4105 1596 N/A
Pentium 4 1.4GHz 4018 1626 2914
Pentium M 1GHz 4082 1382 1779

またHyper-Threadingに代表されるMulti-Threadingのインプリメントに関しても微妙であろう。Hyper-Threadingが効果的なのは、実行ユニットの利用効率が低いのが前提である。このあたり、割と利用効率が高そうなK8アーキテクチャやPentium Mの場合、MultiThreadingを導入しても却ってオーバーヘッドが増加しそうな勢いであって、効果的かどうかは簡単に断言しづらい。

だからといって周波数を簡単に上げられるかというと、これも難しいだろう。K8アーキテクチャの場合、やっと3GHzが目前まで迫ったというレベルで、このままE Steppingで3GHzに到達できるかどうか怪しい(一応Athlon 64 FX-59という将来製品で3GHzに到達することを予定しているようだが、可能かどうかは最終的に製品が出るか出ないかで判断せざるを得ない)という程度。Intelと違ってメモリコントローラをCPU側に統合しているから、FSBを上げるといった技も使いようがない訳で、せいぜい差別化といえばキャッシュサイズ位のものだ。ただキャッシュサイズも、マルチプロセッサ環境ならばともかく、デスクトップではそれが大きな性能差になるケースはあまりない。要するに製品展開に関して、シングルコアに拘泥すると、性能を急速に上げるようなオプションが見当たらないという事になる。

  • <<
  • <

1/10

インデックス

目次
(1) 各社デュアルコアプロセッサ、今回はまとめて総合比較
(2) 概説(1) - CPUはなぜ"デュアルコア"になったのか?
(3) 概説(2) - 各社ラインナップにおけるデュアルコア製品の位置付けとは?
(4) ベンチマーク環境
(5) ベンチマーク - パフォーマンス(1)
(6) ベンチマーク - パフォーマンス(2)
(7) ベンチマーク - パフォーマンス(3)
(8) ベンチマーク - キャッシュアクセス
(9) ベンチマーク - 消費電力
(10) まとめ

もっと見る

人気記事

一覧

イチオシ記事

新着記事

「Windows 10 Anniversary Update」は8月2日リリース - Microsoftが発表
[02:46 6/30] パソコン
[冬目景]月刊マンガ誌「バーズ」で新連載へ
[00:00 6/30] ホビー
JR東日本、仙石東北ライン上り始発・下り最終が女川駅へ - 8/6直通運転開始
[23:45 6/29] ホビー
「ガンダム名鑑ガム」に第2弾登場、マンダラガンダムの3形態も再現
[23:35 6/29] ホビー
[夏のドラマ見どころ]男の生き様 山田孝之、2年ぶりウシジマ 三上博史は初深夜 フジ日9は中島裕翔
[22:56 6/29] エンタメ