【MPF 2002 レポート】Hammerに関するもう少し詳細な解説(1)

  [2002/10/18]
Photo01:最初に話を聞いたのは左側のMark Bode氏(Division Marketing Manager, Desktop Product Marketing, Computation Products Group)、後から助っ人で参入したのが右のJohn Crank氏(Senior Brand Associate, Desktop Prodict Marketing, Computation Products Group)。どちらも筆者にはおなじみ、というかイベントの度に顔を合わせている様な気がする。

すでにMPF 2002のConferenceで発表されたOpteronプロセッサの性能に関してはレポートしてあるが、この最後で触れたとおり、AMDのPress向けRoundtableの中でもう少し細かい話を聞くことが出来たので、まとめてみたい(Photo01)。

○メモリレイテンシに関する考察その1

Photo02は前回のレポートでも紹介したが、1P/2P/4Pにおけるメモリのスループットを示したものだ。LocalとXfireの違いだが、前回も書いたとおりプロセッサに直接接続されたメモリをアクセスするのがLocal、HyperTransport Link経由で他のCPUのメモリアクセスをするのがXfireである(Photo03)。

さて話をPhoto02に戻す。1Pと2Pは判る。2Pの場合、Xfire構成ではややスループットが落ちているが、HTリンク経由の場合はどうしてもレイテンシは大きくなるし、Hammerコアの構造上、相手側のCPUも動くことになるので、スループットが落ちるのは仕方が無い。というよりも、リンクの先に対してもこれだけのスループットが出ることの方がむしろ驚異的と言える。OpteronにおけるHTリンクは16bit幅のBi-Directionで1.6GHz駆動だから6.4GB/secであり、ほぼこのピーク速度が出ることになる。ところが4Pの場合、Localの数字が16GB/sec未満というのが腑に落ちない。これが3Pならば、2.7GB/sec×2×3=16.2GB/secとなって、ここからちょっとオーバーヘッドがあるということで理解しやすいのだが、4Pだとすると話が通らないことになる。

Photo02:前回のレポートでは、会場にプロジェクタで映されたものを撮影して加工したものを利用したが、なかなか綺麗に加工できなかった。今回はその後入手したpdfファイルから編集したものだ。ちなみにこのpdfファイルはここから入手可能。ただし前回のレポートのPhoto03/04/06/08/09は含まれていない。
Photo03:前回のレポートではこのプレゼンテーションを省いたが、HTリンク経由でのメモリアクセスの場合、リンクのトポロジー構成にもよるが、複数リンクを使って同時にメモリアクセスが可能になる。これを同社はXfire(クロスファイア)と呼んでいるが、まぁ確かにCrossfire(十字砲火)という名称にふさわしい動き方である。

が、説明によるとこれは仮にローカルの場合でもHT Link経由でのProbeが発生するため、そのオーバーヘッドがあるためなのだそうだ。Hammerコアの場合、それがローカルメモリか、HTリンクの先のメモリかというのは区別しないので、マルチプロセッサ構成の場合はかならずHT LinkへのProbe(目的のデータを相手が持っているかの問い合わせ)を掛けることになり、このオーバーヘッドがあるために4Pの場合には性能がそれほどあがらないのだそうである。

○メモリレイテンシに関する考察その2

Hammerコアでは、最大8プロセッサという話は以前からアナウンスされているが、「なぜ8プロセッサか」に関する説明はなされたことがない。今回ここについていろいろ突っ込んだ結果、大まかに理由が見えてきた。

以前から紹介されている8プロセッサ構成の場合、すべてのCPUは3ホップ以内で通信可能である。ここでいうホップというのはHT Link経由で隣のCPUに接続することを指しており、一番遠い場合でも2つCPUを経由して3つ目にはたどり着くことになる。

さて、前回のレポートのPhoto06,Photo08,Photo09を見比べていただくと判るが、1ホップあたりのレイテンシはほぼ40nsに相当する。これはPage Hitの場合、あるいはPage Missの場合のグラフが、ホップが増えるたびに40nsづつ平行移動していることから容易に推察できる。となると3ホップの場合のメモリアクセスのレイテンシは、Page Hit時に160~180ns、Page Missでは180~200nsということになるが、これを超えると深刻なパフォーマンスの低下が発生するために、現実問題として3ホップを上限としており、この場合最大でも8プロセッサ構成が限界ということらしい。HT Link自身にはこうしたホップ数の制限はない(最近は見ないが、初めてHammerやHTがアナウンスされた頃のプレゼンテーション資料では、Hammerコアから出たHTリンクの先に、さまざまなI/O Bridgeが4~5個ぶら下がっていた。ただ実際はパフォーマンスの観点からこういう設計はしないようだ)そうで、またHammerプロセッサコアが最大でも8つまでしかプロセッサを認識できないという訳でもないそうだ。

そうなると、将来のHammerでHTリンクが高速になったり、あるいはRoutingの速度が上がった場合にはもっと大量のプロセッサをシームレスに接続できる可能性はあるらしい(*1)。また、現在のHammerコア(というか、Opteron)でも、8プロセッサを1つのグループとして、複数のグループ間を高速なInterconnectあるいはスイッチで接続すれば、もっと巨大なSMP構成を構築することは可能だそうだ。

(*1)このあたりは説明してくれたCrank氏も自信がないそうで、宿題となった(笑)

【MPF 2002 レポート】Hammerに関するもう少し詳細な解説(2)
http://pcweb.mycom.co.jp/news/2002/10/18/31.html
に続きます

(大原雄介)

【NewsSpecial】MPF 2002 レポート
http://pcweb.mycom.co.jp/news/special/2002/10/16/02.html

【MPF 2002 レポート】Hammerの性能が公開される
http://pcweb.mycom.co.jp/news/2002/10/16/25.html



IT製品 "比較/検討" 情報

転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

特別企画 PR

人気記事

一覧

イチオシ記事

新着記事

【レポート】エンジンがついに咆えた! 韓国・新型ロケット「KSLV-II」の開発が正念場に
[10:30 5/25] テクノロジー
伊勢志摩サミット、中部空港に到着する各国首脳をMIRAIとMRJがおもてなし
[10:10 5/25] 趣味
日本ボールドウィンがMSのERPを導入 - データの一元管理を実現
[10:00 5/25] 企業IT
【コラム】どこでもサイエンス 第77回 増やせばワカルDNA - 「PCR」のお話
[10:00 5/25] テクノロジー
ピュア・ストレージ、オールフラッシュファイルストレージを発表
[09:57 5/25] 企業IT

特別企画 PR

求人情報