【レポート】

Fall Processor Forum 2004 - AMD、デュアルコアOpteronの性能を公開

引き続き、初日の講演の中からx86関係のレポートを行いたい。まずは初日午前の最初に行われたAMDの発表である。

90nm Dual-Core Opteron

既にIDF Fall 2004に絡めてレポートした通り、AMDはデュアルコアOpteronのデモを9月に公開し、実際のシリコンが動作していることを示したわけだが、このDual Core Opteronに関してもう少し詳細が示された。今回、初めてダイ写真が示されたが、このデュアルコアのダイサイズは130nmのシングルコアOpteronとほぼ同じ程度に収まっており、トランジスタ数は2億500万程度に、TDPは95Wに収まるという数値を示した(Photo02)。ただ、この95Wに関しては「シングルコアとデュアルコアで同じPower Envelopeになる」という言い方をしており、またデュアルコアOpteronの速度はシングルコアより幾分低いものになるという。例えば90nmプロセスのシングルコアOpteronが3GHzで95Wになるとすると、同じTDPのデュアルコアOpteonは単純に考えれば1.5GHzの動作周波数になる訳だが、実際は動作速度が低ければ動作電圧を下げられる(し、純粋に技術的な可能性で言えばトランジスタのスレッショルド電圧を上げる事でリーク削減も可能だ)から、例えば1.5GHzのデュアルコアは95Wを下回る可能性がある。この結果、例えば1.6GHzとか1.7GHzで駆動することも可能なわけだ。このあたり、詳細は一切公開されなかったが、後述するようにちょっとしたヒントはあった。

Photo01:AMD FellowのKevin J. McGrath氏(Manager, AMD Opteron Processor Architecture and RTL)

Photo02:写真が汚くて申し訳ないが、初のデュアルコアのダイ写真である。

ちなみにDesign ChallengeとしてはPhoto03のような項目が挙げられていたが、どれもシビアな問題とは呼びにくい訳で、逆にいえばデュアルコアの開発はきわめて簡単だったと言って差し支えないだろう。実際ファーストシリコンでWindowsやLinuxがあっさり起動した(あくまで「起動した」(booted)で、「稼動した」(worked)でないあたり、何かしら多少はあったのだろうが)というのだから、開発は順調と言って良いのだろう。

ところで90nmコアでの改良であるが、前から噂されていた通りメモリ周りの改良とSSE3の追加が行われていた(Photo04)。メモリ周りは、劇的に改善されるというものでは無いが、それなりに性能の引き上げに貢献するだろう。ただ気になるのは10のSSE3命令とFPU命令の追加とあること。FPUの方はFISTTP命令だろうからいいとして、IntelがSSE3で追加したのは12命令あるわけで、このうち10命令だけということは、ひょっとするとスレッド同期のためのMONITOR/MWAIT命令が落ちている可能性がある。このあたり今回は確認できなかったので、機会を見て確認したいところだ。ただ、デュアルコアのOpteronで実装されている以上、90nm世代のOpteron(やAthlon 64/Athlon 64 FX)も当然これらの機能を搭載していると考えるのが自然だろう。

Photo03:CADの配線の名前付けまで挙げられているが、そもそもデュアルコアを前提に回路を作っていてこんな問題が出てくるほうがおかしいのであって、可能性としてあるのはCADが回路のコピーをするときに配線名の変更機能を持ってなかった(CADの問題)か、デザイナーがうっかりデュアルコアの事を忘れてネーミングしていた(デザイナーの問題)とか、そーいう問題じゃないのか? というのが素朴な感想。

Photo04:ハードウェアプリフェッチは、ページをまたぐ場合の最適化と、プリフェッチデータの取り込みと(不要になったページの)書き出しの干渉を最小化する処理。他にWrite Combinationを同時に4つまでハンドリングできるようになった。ところでSSE3に関しては、この書き方を見るとMWAIT/MONITORをSSE3に含めていないだけで実際には実装されているようにも見える。VIAはC7でMWAIT/MONITORのサポートを表明しており、インプリメントがそう難しいわけではないから、実装されていると考えるのが自然ではあるが。

講演の最後には、ついに実際の性能が示された。SPECfp/SPECint/SPEC JBB/SPECwebの各テストをシングルコアOpteron 2Pと2種類のデュアルコアOpteron 2Pで行った場合の性能の伸びを示したものだが、この通り大幅に性能が伸びている事が判る。もっとも、これは使ったテストがマルチプロセッサに対応したものだからという側面もあるわけで、一般のアプリケーションではまた話は難しくなるだろう。

Photo05:デュアルコアOpteronの性能向上率

さて、先に述べたヒントはこのグラフである。シングルコアOpteronがNと、デュアルコアOpteronはN-5もしくはN-3と表記されている。これは当然モデルナンバーと考えるのが妥当なところだ。例えば現在のラインナップに当てはめてみると、シングルのNがOpteron 250だとすれば、N-5は250の5モデル下にあたるOpteron 240相当、N-3は3モデル下にあたるOpteron 244相当と考えるのが自然だろう。Opteron 240が1.4GHz、244が1.8GHz、250が2.4GHzという計算だ。そうなると問題は「Nはどんな動作速度か?」ということになる。今はまだ試作品ベースの話だから、必ずしも従来の製品と同じ速度とは限らない。仮に上の数字で換算すると、N-3の方は1.8GHz×2:2.4GHz≒1.50、N-5の方は1.4GHz×2:2.4GHz≒1.167となって、特にN-5の方がちょっと数字が合わない。そこでもうちょっとNを幅広くとってみると

N(GHz) N-3(GHz) N-5(GHz) N-3の性能向上率 N-5の性能向上率
2.0 1.4 1.0 40.00% 0.00%
2.2 1.6 1.2 45.45% 9.09%
2.4 1.8 1.4 50.00% 16.67%
2.6 2.0 1.6 53.85% 23.08%
2.8 2.2 1.8 57.14% 28.57%
3.0 2.4 2.0 60.00% 33.33%
3.2 2.6 2.2 62.50% 37.50%
3.4 2.8 2.4 64.71% 41.18%
3.6 3.0 2.6 66.67% 44.44%
3.8 3.2 2.8 68.42% 47.37%
4.0 3.4 3.0 70.00% 50.00%

といった計算になる。この中で数字が大体合いそうなのは、Nが3.2GHzないし3.4GHzの時ではないかと思われる。Opteron 250(2.4GHz)のTDPが89Wだから、この計算だと3.4GHzのシングルコアや2.8GHzのデュアルコアがやはり95WのTDPに収まるか? というと、特にデュアルコア版に関しては非常に難しい気がする。ただ、Opteronには低電圧版があるし、90nmプロセスもMobile向けの低電圧版を最初にリリースした位だから、当然低電圧オプションは有効な気がする。仮にここで使ったデュアルコアサンプルが低電圧版品だとすれば、95Wは不可能な数字ではなさそうだ。この推定が当たっているかどうかは現時点では神(とAMD)のみぞ知るといったところだが、そう外れていない気がする。

人気記事

一覧

イチオシ記事

新着記事