【レポート】
TSUBAME1.2では、Tesla S1070を170台増設し、2GPUペアを1台のX4600サーバに接続するという構成となる。おおむね、2GPUペアごとにX4600 に接続するが、GPUをもっと使いたいというユーザも出ると予想されるので、4GPUを接続するX4600を22ノード作る予定である。
結果として、
と4種の異なるノードが存在し、計算エンジンとしても、Opteron、Xeon、ClearSpeed、Tesla 10と4種のチップが含まれる構成となる。 なお、ローパワーXeonを使うco-TSUBAMEシステムは設置時期がしばらく後になるので、今回のLINPACK性能測定には間に合わない。
巨大連立一次方程式の解法であるLINPACKで、各ノードに同じ量の計算を分担させると、4GPU付の(1)のノードは早く計算を終わり、(4)のXeonノードの計算が終了するのを待つことになり遊んでしまうので、システムとしてピーク性能は得られない。つまり、このような能力、構成が異なるノードを持つシステムで、高いLINPACK性能を出すためには、全部のノードにその能力に応じた量の処理をバランスよく分担させ各ノードの計算能力を使い切る必要がある。
このTSUBAME1.2のように4種類もの能力の違うノードがあると、どのように分担させるかが難しいと思われるが、チューニングを担当する東工大の遠藤敏夫准教授は、めどがついたと自信を見せている。そしてリーダーの松岡聡教授は、異なる種類のノードが混在するので、1種類のノードで合計170TFlopsのシステムに比べるとどうしてもFlops利用率は下がるが、2008年11月に米テキサス州オースチンで開催されるSC08で発表される次回のTop500では、東大T2Kの83TFlopsを上回り日本一を奪還できるチャンスはあると考えている。
ただし、LINPACKは1つの性能指標であり、色々な性質の実問題を解く性能という点ではTSUBAME1.2がT2Kを上回る場合もあれば、逆の場合もある。しかし、T2Kのような単一種類のノードを持つシステムだけでなく、TSUBAME1.2のような色々なノードを持つスパコンがどのような用途に向き、コストパフォーマンスがどうなるかは興味深い問題であり、このようなシステムの構築と運用は、スパコン全体の進歩に大きく貢献すると思われる。
| スパコン「TOP500」発表 - ペタFLOPS時代に突入、地球シミュレータは49位に [2008/6/19] |
| 国内最速スパコン 東工大「TSUBAME」の飛翔 [2007/1/8] |
| 東工大、国内最速スパコン「TSUBAME」を披露 [2006/7/6] |
| 理研、脳・脊髄形成に必要な神経板湾曲の仕組みを解明 [20:16 5/25] |
| 京大、「慢性閉塞性肺疾患」患者の労作時呼吸困難は鍼治療が有効と実証 [20:08 5/25] |
| 120Hz SHVカメラ用イメージセンサーを使った撮像装置 - SHVフルスペック化へ [18:10 5/25] |
| 京大、視覚による物体認知は前頭前野からのトップダウン信号が重要と確認 [17:45 5/25] |
| 製品数の拡大だけでなくBCPの展開なども含めた総合力で事業の強化を図るTI [17:25 5/25] |
|
エヴァンゲリオンレーシング、今年も鈴鹿8耐出場! 1,000人分の応援席も [00:30 5/27] ライフ |
|
「ガンスリ」10周年で大王付録にヘンリエッタフィギュア [22:22 5/26] ホビー |
|
【特集】クライマックス突入記念! 『Fate/Zero』の舞台裏に迫る!! [22:00 5/26] ホビー |
|
竹宮ゆゆこ×カスカベアキラ「エバーグリーン」1巻刊行 [21:59 5/26] ホビー |
|
最もセクシーな男性「メン・オン・ファイア」21人をAARP誌が発表 [21:30 5/26] エンタメ |
4つの診断で、自分の適性を見つめなおそう!
働くこと・挑戦し続けることへの思いを綴ったインタビュー
あなたにピッタリのアドバイスを読むことができます。
転職に必要な情報が収集できます
企業からアプローチのメッセージが届きます。