【MPF 2002 レポート】Hammerの性能が公開される

昨年のMicroProcessor Forumで初めて内部構造が明らかにされたAMDのHammerプロセッサだが、今回のMicroProcessor Forumでは、特に内部構造の詳細に触れる話はなかった。その一方、ついにHammerプロセッサの性能が明らかにされることになった。

○SPECint 2000で1200オーバー

昨年同様、AMDのFred Weber氏(Photo01)が行った今年の講演では、まず昨年の内容の簡単なおさらいをしながら64bitプロセッサへの必然性を訴えた後で、パフォーマンスの説明に入った。(Photo02)実は昨年の段階で、シミュレーション上で動かした2GHzのHammerコアのSPECint 2000の値が1400に達するという話があったが、今回は実際に動作しているOpteronプロセッサで実験を行い、SPECint 2000で1202、SPECfp 2000で1170というとてつもなく高い数字を示した。実はSPECint/fpの場合、実際にはBaseとPeakの2つの値がある。SPECint/fpに関して、そのベンチマークのソースコードはSPEC( http://www.spec.org/ )から提供され、これに手を入れることはできない。ところがこれをコンパイルする際のコンパイラには手を入れることが許されている。そこで、コンパイラに手を入れない状態での性能をBase、コンパイラ側をフルに最適化した場合の性能をPeakとして併記するのが普通である。今回の数字がBaseなのかPeakなのかは明らかにされなかったが、仮にPeakとしてもこの数字は驚異的である。既にテストされているシステムの性能は、SPECintが( http://www.spec.org/osg/cpu2000/results/cint2000.html )で、SPECfpが( http://www.spec.org/osg/cpu2000/results/cfp2000.html )でそれぞれ公開されているが、Peakの値を見てもintで1000を超えているのは唯一DellのPrecision WorkStation 340 (Pentium 4/2.8GHz)のみ。fpの方でも1170を超えた数字を出しているのは1GHzのItanium2を搭載したHPのworkstation zx6000とかserver rx5670、1.3GHzのRS6000を搭載したIBMのeServer pSeries 690 Turboなどごく少数であり、確かに飛びぬけて高い性能を発揮していることが判る。

Photo01:AMDのVice President and CTO, Computation Products GroupのFred Weber氏。手にしているのは4枚の1GB DIMMで、たったこれだけで32bitのアドレス空間は埋まってしまう事を力説。サーバーアプリケーションには64bit空間が必要なことを訴えた。
Photo02:キャッシュ構成などが明示されていないので、この数字単体では判断しにくいのも事実。とは言え、画期的な数字ではある

また、動作クロック別のSPECint/fp値の変化も同時に示されており(Photo03,04)、IPC、つまり1クロックあたりの処理性能の向上が相変わらず追求されていることがアピールされた。

Photo03:SPECintの結果の比較。Xeonの方は、上述のSPECのサイトに公表された結果からのピックアップ
Photo04:同様にSPECfpの結果の比較。グラフの傾きがまるで違っているのが判る

○高速なメモリアクセス

Photo05:HTリンク経由だと多少スループットが落ちているが、これはリンクを経由するレイテンシがあるため。HT自体は1.6GHz/16bit/Bi-Directionなので、トータルスループットは6.4GB/secに達しており、直接のボトルネックとはならない

この高速性能を支えるのは、CPU側に統合されたメモリコントローラにあることは間違いない。Opteronの場合、DDR-SDRAMを2チャンネル装備するから、PC2700の場合の帯域は2.7GB/sec×2=5.4GB/secとなる。したがってローカルメモリにアクセスする場合の帯域はマルチプロセッサの場合でも全く同じになる。ただ、厄介なのはHyperTransport(HT)リンク経由で他のプロセッサのローカルメモリをアクセスする場合だが、今回こうした場合でも十分なスループットが確保できていることが公表された。(Photo05)

Photo06:ローカルメモリに対するレイテンシ。DRAMインターフェースがCPUコアと同じ速度で動作する関係で、動作速度が上がるほどレイテンシが下がる傾向にあるのが判る
Photo07:X軸がI/O Load、つまりHTリンク経由でのメモリに対するI/Oトランザクションのデータ量であり、Y軸はProcessor Load、つまりCPUからのメモリアクセスのデータ量である。で、Z軸がおのおのの場合のレイテンシとなる訳だが、大体両方のLoadの合計が3GB/sec以下であれば、ほぼ50~100ns以下のレイテンシを確保できていることが判る

またレイテンシについても、ローカルメモリのレイテンシはPage HitとPage Missの場合で20ns程度の差しかないことも明らかになっている。(Photo06)また、負荷をかけた状態でも、レイテンシがそれほど増加しないことも示された。(Photo07)これに比べるとHTリンク経由でのアクセスは多少レイテンシが増加するが、Dualプロセッサ構成で平均100ns程度(Photo08)、4プロセッサ構成でも130ns程度(Photo09)であることが示されるなど、HTリンク経由のメモリアクセスがかなり高速であることが示された。

Photo08:Probe Missというのは、HTリンク経由で相手側にリクエストを出した際に「そーいうページは無い」という返事をもらうこと。Page Missは、相手にリクエストを出したら持っていたがキャッシュには入ってなかった(のでメモリから読み込む)場合、Page Hitは持っており、しかもキャッシュに入っていた場合である
Photo09:Photo08と見比べてみると、すべての場合で40ns程度数字が増えていることが判る。HTリンクの1ホップ分のレイテンシが40nsと考えてよさそうだ

○サーバーの内部も公開

これまでAMDは、1PのHammer(次世代Athlon)に関してはチップセットやサンプルボードを公開していたが、MPFでは2Pおよび4Pのサンプルボードが示され、また2Pに関してはセッションの後の展示会で内部が公開された。(Photo10~15)

Photo10:2P構成の1Uサーバーのレイアウト
Photo11:4P構成の4Uサーバーのレイアウト。拡張カードもあるので1Uという訳にはいかなかったようだ
Photo12:展示された2Pサーバーの内部構成。PCI-Xスロットを2本装備する 
Photo13:メモリ部の構成。右端のCPUのすぐ脇にあるのはVRM(Voltage Regurator Module:CPUへの電圧供給回路)。その脇に4本(2チャンネル)のDDRメモリスロットがあり、一番左のモジュールはDDRメモリバスのターミネータだそうだ
Photo14:1Uサーバー向けとあって非常に背が低いCPUクーラー。ヒートシンク自体は指で触れても全く熱くない(ちょっと温い程度)。「CPUの発熱が少ないのか?それともこのCPUクーラーが強力なのか?」と聞いたら「両方だ」という返事が
Photo15:ボードの奥。手前のチップセットはAMDのサウスブリッジ、その右上のヒートシンク付のものは同じくAMD製のPCI-Xブリッジ。手前左のLSI LogicのチップはUltra320 SCSIのコントローラ、その上のBroadcomの2つのチップはGbEコントローラとなっている。ただPCI-Xブリッジの周辺にはLatticeやXilinxのFPGAチップがてんこ盛りになっており、まだブリッジチップ1つで解決というところまで集積しきれていないようだ

○ちょっと食い足りないが……

ということで、Hammerに関する公演内容はこれで終わりであり、ちょっとあっけない感はあるが、今回はひたすら性能やメモリレイテンシにフォーカスした内容だったから致し方ないところだ。ただ、明日AMDとのRoundtableの機会があり、そこでもう少し詳細やQ&Aを行えるため、続報をあらためてお届けすることにしたい。

(大原雄介)

【コラム】セカンド・オピニオン 第5回 執筆=高梨遊 64bit Rhapsody Hammerの理想と現実(1)
http://pcweb.mycom.co.jp/news/2002/10/03/04.html

【コラム】PCスクランブル 第12回 執筆=PC Creation AMD Hammerを占う(前)
http://pcweb.mycom.co.jp/news/2002/09/30/04.html

【NewsSpecial】AMD Developers' Conferenceレポート
http://pcweb.mycom.co.jp/news/special/2002/07/31/01.html

【NewsSpecial】MPF 2002 レポート
http://pcweb.mycom.co.jp/news/special/2002/10/16/02.html

AMD
http://www.amd.com/



人気記事

一覧

イチオシ記事

新着記事